当前位置:网站首页>Python 图片识别 OCR
Python 图片识别 OCR
2020-11-07 20:56:00 【Coxhuang】
文章目录
- Python 图片识别 OCR
- #1 需求
- #2 环境
- #3 安装
- #3.1 macOS
- #3.2 Linux(CentOS)
- #4 使用
- #4.1 python安装pytesseract库
- #4.2 Python代码
- #5 在线案例
Python 图片识别 OCR
#1 需求
- 识别图片中的信息,如二维码
#2 环境
macOS / Linux Python3.7.6
#3 安装
#3.1 macOS
- 安装 tesseract
//只安装tesseract,不安装训练工具 brew install tesseract //安装tesseract的同时安装训练工具 brew install --with-training-tools tesseract //安装tesseract的同时安装所有语言,语言包比较大,如果安装的话时间较长,建议不安装,按需选择 brew install --all-languages tesseract //安装tesseract,并安装训练工具和语言 brew install --all-languages --with-training-tools tesseract
2. 下载语言包
地址 : https://github.com/tesseract-ocr/tessdata
我这里安装的是中文语言包
中文语言包 : https://github.com/tesseract-ocr/tessdata/blob/master/chi_sim.traineddata
然后将下载的中文语言包拷贝到如下路径 :
/usr/local/Cellar/tesseract/4.0.0_1/share/tessdata
3. 查看本地语言包
tesseract --list-langs
#3.2 Linux(CentOS)
- 安装依赖
yum install autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel
2. 安装 leptonica
下载 : wget https://github.com/tesseract-ocr/tesseract/archive/4.1.0.tar.gz
解压安装
tar -xzvf leptonica-1.74.4.tar.gz cd leptonica-1.74.4.tar.gz ./configure --profix=/usr/local/leptonica make sudo make install
3. 安装 tesseract-ocr
wget https://github.com/tesseract-ocr/tesseract/archive/3.04.zip unzip 3.04.zip cd tesseract-3.04/ ./configure make && make install sudo ldconfig
我这里安装的是中文语言包
中文语言包 : https://github.com/tesseract-ocr/tessdata/blob/master/chi_sim.traineddata
然后将下载的中文语言包拷贝到如下路径 :
/usr/local/share/tessdata
#4 使用
#4.1 python安装pytesseract库
pip install pytesseract pip install Pillow
#4.2 Python代码
from PIL import Image import pytesseract # 指定图片路径和识别的语言 data = pytesseract.image_to_string(Image.open('/Users/Documents/1.png'), lang='chi_sim') print(data)
#5 在线案例
地址 :
本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。
版权声明
本文为[Coxhuang]所创,转载请带上原文链接,感谢
https://cloud.tencent.com/developer/article/1744581
边栏推荐
- When tidb and Flink are combined: efficient and easy to use real-time data warehouse
- Win10官方1909版本无法打开windows安全中心中病毒和威胁防护的实时保护解决方案。
- 动态规划——用二进制表示集合的状态压缩DP
- 你可能不知道的Animation动画技巧与细节
- Ac86u KX Online
- Facebook开源框架如何简化 PyTorch 实验
- awk实现类sql的join操作
- Adobe Lightroom /Lr 2021软件安装包(附安装教程)
- Improvement of maintenance mode of laravel8 update
- 洞察——风格注意力网络(SANet)在任意风格迁移中的应用
猜你喜欢
随机推荐
vscode 配置
graph generation model
Web API series (3) unified exception handling
Business Facade 与 Business Rule
一次公交卡被“盗刷”事件带来的思考
Three steps, one pit, five steps and one thunder, how to lead the technical team under the rapid growth?
[random talk] the goal and way of software design
不要把异常当做业务逻辑,这性能可能你无法承受
What magic things can a line of Python code do?
浅谈HiZ-buffer
C language I blog assignment 03
当 TiDB 与 Flink 相结合:高效、易用的实时数仓
利用线程通信、解决缓存穿透数据库雪崩
Huawei HCIA notes
快速上手Git
websocket+probuf.原理篇
The CPU does this without the memory
在 Amazon SageMaker 管道模式下使用 Horovod 实现多 GPU 分布式训练
[original] the influence of arm platform memory and cache on the real-time performance of xenomai
微服务的出现和意义的探索