当前位置:网站首页>一款优秀的中文识别库——ocr
一款优秀的中文识别库——ocr
2022-08-02 09:48:00 【AI浩】
CnOCR 是 Python 3 下的文字识别(Optical Character Recognition,简称OCR)工具包,支持简体中文、繁体中文(部分模型)、英文和数字的常见字符识别,支持竖排文字的识别。自带了20+个训练好的识别模型,适用于不同应用场景,安装后即可直接使用。同时,CnOCR也提供简单的训练命令供使用者训练自己的模型。欢迎加入 交流群。
github地址:https://github.com/breezedeus/cnocr
安装简单
pip install cnocr
各种场景的调用示例
常见的图片识别
所有参数都使用默认值即可。如果发现效果不够好,多调整下各个参数看效果,最终往往能获得比较理想的精度。
from cnocr import CnOcr
img_fp = './docs/examples/huochepiao.jpeg'
ocr = CnOcr() # 所有参数都使用默认值
out = ocr.ocr(img_fp)
print(out)
排版简单的印刷体截图图片识别
针对 排版简单的印刷体文字图片,如截图图片,扫描件图片等,可使用 det_model_name=‘naive_det’,相当于不使用文本检测模型,而使用简单的规则进行分行。
使用 det_model_name=‘naive_det’ 的最大优势是速度快,劣势是对图片比较挑剔。如何判断是否该使用此检测模型呢?最简单的方式就是拿应用图片试试效果,效果好就用,不好就不用。
from cnocr import CnOcr
img_fp = './docs/examples/multi-line_cn1.png'
ocr = CnOcr(det_model_name='naive_det')
out = ocr.ocr(img_fp)
print(out)
识别结果:
更多详见:
https://cnocr.readthedocs.io/zh/latest/
具体的测试,以后再写,先做个记录。
边栏推荐
- 迭代器失效问题
- QT专题:事件机制event基础篇
- R语言ggplot2可视化:使用ggpubr包的ggtexttable函数可视化表格数据(直接绘制表格图或者在图像中添加表格数据)、使用tbody_add_border为表格中的表头添加外侧框线
- 从零开始入门单片机(一):必会背景知识总结
- 【SeaTunnel】从一个数据集成组件演化成企业级的服务
- 第十五章 多线程
- typeinfo类型支持库学习
- js防抖函数和函数节流的应用场景
- R语言ggplot2可视化:基于aes函数中的fill参数和shape参数自定义绘制分组折线图并添加数据点(散点)、使用theme函数的legend.position函数配置图例到图像右侧
- STL中list实现
猜你喜欢
阿里巴巴 CTO 程立:开源是基础软件的源头!
Rust from entry to master 03-helloworld
稳定币:对冲基金做空 Tether 的结局会是什么?
[Must read] Mylander valuation analysis, electrical stimulation products for pelvic and postpartum rehabilitation
DVWA 通关记录 2 - 命令注入 Command Injection
用正向迭代器封装实现反向迭代器
高效时代,电商运营如何靠RPA快速提效?
QT专题:事件机制event基础篇
Using the TCP protocol, will there be no packet loss?
typeinfo类型支持库学习
随机推荐
食品安全 | 鱼肝油不是鱼油,家有宝宝的注意了
HCIA动态主机配置协议实验(dhcp)
李航《统计学习方法》笔记之k近邻法
QT专题:自定义部件
软件测试H模型
node封装一个图片拼接插件
QT专题:事件机制event基础篇
MySql千万级分页优化,快速插入千万数据方法
读博一年后对机器学习工程的思考
带你认识40G单纤双向光模块-QSFP+ BiDi光模块
8月份的.NET Conf 活动 专注于 .NET MAUI
AlterNET Studio用户界面设计功能扩展
STL中list实现
阿里巴巴 CTO 程立:开源是基础软件的源头!
R语言时间序列数据的平滑:使用KernSmooth包的dpill函数和locpoly函数对时间序列数据进行平滑以消除噪声
The god-level Alibaba "high concurrency" tutorial "basic + actual combat + source code + interview + architecture"
yolov7创新点
net start mysql MySQL 服务正在启动 . MySQL 服务无法启动。 服务没有报告任何错误。
用了TCP协议,就一定不会丢包嘛?
刷题错题录1-隐式转换与精度丢失