当前位置:网站首页>一款优秀的中文识别库——ocr
一款优秀的中文识别库——ocr
2022-08-02 09:48:00 【AI浩】
CnOCR 是 Python 3 下的文字识别(Optical Character Recognition,简称OCR)工具包,支持简体中文、繁体中文(部分模型)、英文和数字的常见字符识别,支持竖排文字的识别。自带了20+个训练好的识别模型,适用于不同应用场景,安装后即可直接使用。同时,CnOCR也提供简单的训练命令供使用者训练自己的模型。欢迎加入 交流群。
github地址:https://github.com/breezedeus/cnocr
安装简单
pip install cnocr
各种场景的调用示例
常见的图片识别
所有参数都使用默认值即可。如果发现效果不够好,多调整下各个参数看效果,最终往往能获得比较理想的精度。
from cnocr import CnOcr
img_fp = './docs/examples/huochepiao.jpeg'
ocr = CnOcr() # 所有参数都使用默认值
out = ocr.ocr(img_fp)
print(out)

排版简单的印刷体截图图片识别
针对 排版简单的印刷体文字图片,如截图图片,扫描件图片等,可使用 det_model_name=‘naive_det’,相当于不使用文本检测模型,而使用简单的规则进行分行。
使用 det_model_name=‘naive_det’ 的最大优势是速度快,劣势是对图片比较挑剔。如何判断是否该使用此检测模型呢?最简单的方式就是拿应用图片试试效果,效果好就用,不好就不用。
from cnocr import CnOcr
img_fp = './docs/examples/multi-line_cn1.png'
ocr = CnOcr(det_model_name='naive_det')
out = ocr.ocr(img_fp)
print(out)
识别结果:
更多详见:
https://cnocr.readthedocs.io/zh/latest/
具体的测试,以后再写,先做个记录。
边栏推荐
猜你喜欢

Naive Bayesian Method of Li Hang's "Statistical Learning Methods" Notes

Rust 从入门到精通03-helloworld

8月份的.NET Conf 活动 专注于 .NET MAUI

李航《统计学习方法》笔记之朴素贝叶斯法

HikariCP database connection pool, too fast!

曲折的tensorflow安装过程(Tensorflow 安装问题的解决)

Daily practice of dynamic programming (3)

使用scrapy 把爬到的数据保存到mysql 防止重复

In the whole development of chi V853 board tried to compile QT test

yolov7创新点
随机推荐
cococreator dynamically set sprite
带你认识40G单纤双向光模块-QSFP+ BiDi光模块
STL中list实现
net start mysql MySQL 服务正在启动 . MySQL 服务无法启动。 服务没有报告任何错误。
单机部署flink,创建oracle19c rac的连接表时报错 ORA-12505 ,怎么回事?
Re22:读论文 HetSANN An Attention-based Graph Neural Network for Heterogeneous Structural Learning
The k-nearest neighbor method in the notes of Li Hang's "Statistical Learning Methods"
二维数组零碎知识梳理
基于列表的排队与叫号系统
中国发布丨滴滴因违反网络安全法等被罚80.26亿元!调查细节公布
你认同这个观点吗?大多数企业的数字化都只是为了缓解焦虑
node封装一个图片拼接插件
R语言时间序列数据的平滑:使用KernSmooth包的dpill函数和locpoly函数对时间序列数据进行平滑以消除噪声
The 17th day of the special assault version of the sword offer
AutoJs学习-实现科赫雪花
The god-level Alibaba "high concurrency" tutorial "basic + actual combat + source code + interview + architecture"
The use of thread pool and analysis of ThreadPoolExecutor source code
刷题错题录1-隐式转换与精度丢失
迭代器失效问题
【New Edition】DeepFakes: Creation, Detection and Influence