当前位置:网站首页>一款优秀的中文识别库——ocr
一款优秀的中文识别库——ocr
2022-08-02 09:48:00 【AI浩】
CnOCR 是 Python 3 下的文字识别(Optical Character Recognition,简称OCR)工具包,支持简体中文、繁体中文(部分模型)、英文和数字的常见字符识别,支持竖排文字的识别。自带了20+个训练好的识别模型,适用于不同应用场景,安装后即可直接使用。同时,CnOCR也提供简单的训练命令供使用者训练自己的模型。欢迎加入 交流群。
github地址:https://github.com/breezedeus/cnocr
安装简单
pip install cnocr
各种场景的调用示例
常见的图片识别
所有参数都使用默认值即可。如果发现效果不够好,多调整下各个参数看效果,最终往往能获得比较理想的精度。
from cnocr import CnOcr
img_fp = './docs/examples/huochepiao.jpeg'
ocr = CnOcr() # 所有参数都使用默认值
out = ocr.ocr(img_fp)
print(out)

排版简单的印刷体截图图片识别
针对 排版简单的印刷体文字图片,如截图图片,扫描件图片等,可使用 det_model_name=‘naive_det’,相当于不使用文本检测模型,而使用简单的规则进行分行。
使用 det_model_name=‘naive_det’ 的最大优势是速度快,劣势是对图片比较挑剔。如何判断是否该使用此检测模型呢?最简单的方式就是拿应用图片试试效果,效果好就用,不好就不用。
from cnocr import CnOcr
img_fp = './docs/examples/multi-line_cn1.png'
ocr = CnOcr(det_model_name='naive_det')
out = ocr.ocr(img_fp)
print(out)
识别结果:
更多详见:
https://cnocr.readthedocs.io/zh/latest/
具体的测试,以后再写,先做个记录。
边栏推荐
- ConvNeXt论文及实现
- node制作一个视频帧长图生成器
- Have you ever learned about these architecture designs and architecture knowledge systems?(Architecture book recommendation)
- R语言使用zoo包中的rollapply函数以滚动的方式、窗口移动的方式将指定函数应用于时间序列、设置align参数指定结果数据中的时间标签取自窗口中的位置(参数right指定取自窗口的最右侧)
- 李航《统计学习方法》笔记之朴素贝叶斯法
- Spend 2 hours a day to make up for Tencent T8, play 688 pages of SSM framework and Redis, and successfully land on Meituan
- 要长续航还是更安全?海豹与深蓝SL03对比导购
- Getting Started with SCM from Scratch (1): Summary of Background Knowledge
- SAP 云平台上一种 Low Code Development(低代码开发)解决方案
- 【技术分享】OSPFv3基本原理
猜你喜欢

【Redis】通用命令

Linux系统卸载,安装,升级,迁移clickHouse数据库

Implementation of mysql connection pool

mysql连接池的实现

第十七章 Excel操作

带你认识40G单纤双向光模块-QSFP+ BiDi光模块
![[Must read] Mylander valuation analysis, electrical stimulation products for pelvic and postpartum rehabilitation](/img/25/e16bac4e789cddadffd43ed9e9df7c.jpg)
[Must read] Mylander valuation analysis, electrical stimulation products for pelvic and postpartum rehabilitation

使用scrapy 把爬到的数据保存到mysql 防止重复

Rust 从入门到精通03-helloworld

重磅大咖来袭!阿里云生命科学与智能计算峰会精彩内容剧透
随机推荐
R语言ggplot2可视化:使用ggpubr包的ggbarplot函数可视化水平柱状图(条形图)、使用orientation参数设置柱状图转置为条形图
单机部署flink,创建oracle19c rac的连接表时报错 ORA-12505 ,怎么回事?
【云原生】快出数量级的性能是怎样炼成的?就提升了亿点点
RPA助你玩转抖音,开启电商运营新引擎
cococreator dynamically set sprite
Application scenarios of js anti-shake function and function throttling
AutoJs学习-实现谢尔宾斯基三角
链表的实现
【Redis】通用命令
STL中list实现
瑞吉外卖项目剩余功能补充
LeetCode第三题(Longest Substring Without Repeating Characters)三部曲之一:解题思路
CFdiv2-The Number of Imposters-(两种点集图上染色问题总结)
ConvNeXt论文及实现
R语言ggpubr包的ggline函数可视化分组折线图、add参数为mean_se和dotplot可视化不同水平均值的折线图并为折线图添加误差线(se标准误差)和点阵图、自定义palette设置颜色
二维数组零碎知识梳理
Nodejs3day(express简介,express创建基本Web服务器,托管静态资源,nodemon下载及出现的问题,中间件,编写GET,POST,JSONP接口)
R语言ggplot2可视化:使用ggpubr包的ggbarplot函数可视化堆叠的柱状图(stacked bar plot)、lab.pos参数指定柱状图的数值标签的位置,lab.col参数指定数值标
Verilog的随机数系统任务----$random
The love-hate relationship between C language volatile keyword, inline assembly volatile and compiler