当前位置:网站首页>深度学习基础篇【4】从0开始搭建EasyOCR并进行简单文字识别
深度学习基础篇【4】从0开始搭建EasyOCR并进行简单文字识别
2022-06-11 01:24:00 【极链AI云】
深度学习基础篇【4】
从0开始搭建EasyOCR
并进行简单文字识别
所谓OCR,全称为“Optical Character Recognition”,即光学字符识别。简单来讲,它就是实现对文本资料的图像文件进行分析识别处理,以获取其中文字及版面信息的技术。
- 语言环境:Python3.7
- 编译器:jupyter notebook
- 深度学习环境:pytorch 1.6
- 深度学习平台:极链AI云
- 显卡(GPU):NVIDIA RTX 2080Ti

目录
01 实例创建
02 准备工作
03 数据预处理
04 构建模型
05 编译
06 训练模型
07 模型评估

01 实例创建
1. 打开极链AI云平台
https://cloud.videojj.com/?source=vx

2. 点击算力租赁

3. 选择合适的显卡
此处我们以NVIDIA RTX 2080Ti为例

4. 深度学习框架搭建
框架选择pytorch,版本1.6
python版本3.7

5. 连接实例
创建完成后,点击jupyterlab连接

6. 打开终端

02 环境搭建
在终端中,输入以下命令使用 pip 安装 EasyOCR 稳定版本
pip install easyocr更多内容请左右滑动

进入GitHub地址
下载目标文件
下载完成后,上传至root文件夹中,输入以下命令解压
pip install unzip # 安装unzipunzip EasyOCR-master
在命令提示符中使用cd命令进入目标文件夹地址,在使用 Python setup.py install 命令进行预安装
cd EasyOCR-masterpython setup.py install
03 使用方法

对该图片进行文字识别
import easyocrreader = easyocr.Reader(['ch_sim','en']) # 只需要运行一次就可以将模型加载到内存中result = reader.readtext('chinese.jpg')
输出将采用列表格式,每个项目分别表示边界框,文本和置信度。

注1:[‘ch_sim’,‘en’]是您要阅读的语言列表。 您可以一次传递几种语言,但并非所有语言都可以一起使用。 英语与每种语言都兼容。 共享公共字符的语言通常相互兼容。
注2:您也可以将OpenCV图像对象(numpy数组)或图像文件作为字节传递,而不是filepath chinese.jpg。 原始图片的网址也是可以接受的。
注3:行reader = easyocr.Reader([‘ch_sim’,‘en’])用于将模型加载到内存中。 这需要一些时间,但只需要运行一次。
还可以将detail设置为0,以简化输出。
reader.readtext('chinese.jpg', detail = 0)

边栏推荐
- Secret
- Colab报错:ImportError: cannot import name ‘_check_savefig_extra_args‘ from ‘matplotlib.backend_bases‘
- Oracle收集统计信息
- 金属有机框架MOF-Al(DIBA),MOF-Zr(DIBA),MOF-Fe(DIBA)包载姜黄素/羧苄西林/MTX甲氨蝶呤/紫杉醇PTX/阿霉素DOX/顺铂CDDP/CPT喜树碱等药物
- InfoQ geek media's 15th anniversary solicitation | in depth analysis of container runtime Technology
- switch case使用枚举类来比较
- ABAP CDs realizes multi line field content splicing
- Koa2 learning notes
- Binary tree sequence traversal
- In the past 10 years, from zero foundation testing to test architect, he has made himself successful
猜你喜欢

JS Part 5

QT database learning notes (II) QT operation SQLite database

Record the actual record of my question brushing

Shader of double sided material

JS basic part hand exercises

环糊精金属有机骨架(β-CD-MOF)装载二巯丁二酸/大黄素/槲皮素/三氯蔗糖/二氟尼柳/奥美拉唑(OME)

叶酸配体的金属有机骨架材料MOFs负载5-氟尿嘧啶,西达本胺,紫杉醇,阿霉素,柔红霉素,布洛芬,喜树碱,姜黄素,藤黄酸等小分子药物

多级介孔有机金属骨架材料ZIF-8负载乳酸氧化酶(LOD)/四氧化三铁(Fe304)/阿霉素DOX/胰岛素/cas9蛋白/甲硝唑/大黄素甲醚

Find - (block find)

腾讯面试官曰Mysql架构的内部模块索引原理及性能优化思路谁会?
随机推荐
3P5 Industrial Engineering Lecture 1-2: Method of Study
QT database learning notes (II) QT operation SQLite database
Analysis of the difficulties in the architecture design of massive chat messages in the live broadcast room
Byte beating client R & D Intern Tiktok side
腾讯测试开发岗面试上机编程题
Secret
金属有机骨架材料Fe-MIL-53,Mg-MOF-74,Ti-KUMOF-1,Fe-MIL-100,Fe-MIL-101)负载异氟醚/甲氨蝶呤/阿霉素(DOX)/紫杉醇/布洛芬/喜树碱
SQL | 返回顾客名称和相关订单号以及每个订单的总价
14: 00 interview, came out at 14:08, the question is really too
Mentality cannot collapse
The annual salary of testers in large factories ranges from 300000 to 8K a month. Roast complained that the salary was too low, but he was ridiculed by netizens?
可扩/减容线程池C语言原理讲解及代码实现
[penetration test tool bee] how to install and use the XSS penetration test tool bee?
Introduction for i-Teams
adb 常用命令解析
421. 数组中两个数的最大异或值
叶酸配体的金属有机骨架材料MOFs负载5-氟尿嘧啶,西达本胺,紫杉醇,阿霉素,柔红霉素,布洛芬,喜树碱,姜黄素,藤黄酸等小分子药物
Jump without refresh - detailed explanation of pushstate and replacestate methods in history
Rewrite: kms activates office2016, 2019 and 2021 with error code: 0xc004f069
Shell learning tutorial (super detailed and complete)