使用门槛略高,看看就好。
2020-03-23 21:02:05 Author: mp.weixin.qq.com(查看原文) 阅读量:110 收藏

chineseocr_lite 是一个开源项目,用来实现中文的文字识别,支持竖排文字识别、繁体识别,总模型只有 17M(很小就是了),无需联网,支持 CPU 与 GPU,但需要自己部署。@Appinn

Photo by Annie Spratt on Unsplash

目前绝大多数图片转文字,或者说中文 OCR 系统,都使用了云服务,也就是需要联网使用,这使得服务商有着大量的数据可以进行机器学习,而 chineseocr_lite 就有点厉害了:

超轻量级中文 ocr,支持竖排文字识别, 支持 ncnn 推理 , psenet(8.5M) + crnn(6.3M) + anglenet(1.5M) 总模型仅 17M

虽然说,青小蛙对上面的几个项目不是很熟(第一次见),但测试了一番,识别率还是可以的,这就行了。

如何安装?

chineseocr_lite 是一款需要自行编译、自行部署的开源软件(GitHub 开源),所以…有使用门槛!

必备环境:

  • Python

  • PyTorch(官网)

  • VS2015(Windows 需要)

Linux 与 macOS 直接编译就好,青小蛙在想要不要搞成 Docker 方便大家用…想用的人多么?

注意,上面提到模型很小,但这几个环境装下来一点也不小。

编译也非常简单,只需要先复制源代码,然后跟着编译即可:

git clone https://github.com/ouyanghuiyu/chineseocr_lite.git
cd psenet/pse
rm -rf pse.so
make

如何运行?

pip3 install -r requirements.txt
cd chineseocr_lite ## 进入chineseocr目录
python3 app.py 8080 ## 8080端口号,可以设置任意端口

上面的安装和运行两个步骤,对于新手会有不少的坑,所以你需要善用搜索引擎…总之青小蛙觉得这是一个能挡住 90% 普通用户的项目 🙈

如何使用?

在浏览器上输入 ip:8080 就能打开页面,然后加载图片进行识别了。并且还有 火车票身份证 两个单独识别选项。


文章来源: http://mp.weixin.qq.com/s?__biz=MjM5NDMwMTI2MA==&mid=2651662492&idx=1&sn=a2a3505102f2db412b3887ad9a4e3ecc&chksm=bd705cbf8a07d5a97f05c67ec2065b55e4a117f6814ac61809c80dbb7a5424bdcc82f081c454#rd
如有侵权请联系:admin#unsafe.sh