当前位置:网站首页>动手学ocr(一)
动手学ocr(一)
2022-08-02 14:02:00 【weixin_50862344】
文本检测:DBNet
环境:paddle
import matplotlib
from Cython import inline
from paddleocr import PaddleOCR
ocr=PaddleOCR()
#修改图片路径
img_path='D:/computervision/ocr/ppocr_img/imgs/12.jpg'
result =ocr.ocr(img_path,rec=False)
print(f'the predict as follow')
print(result)
import numpy as np
import cv2
import matplotlib.pyplot as plt
image = cv2.imread(img_path)
#下面这句话似乎可有可无的并不影响结构
boxes=[line[0] for line in result]
for box in result:
box=np.reshape(np.array(box),[-1,1,2]).astype(np.int64)
image=cv2.polylines(np.array(image),[box],True,(255,0,0),2)
plt.figure(figsize=(10,10))
#代码此处做了修改
plt.imshow(image)
plt.show()
paddle
- 核心代码
声明PaddleOCR类:
ocr=PaddleOCR()
- 执行预测:
result =ocr.ocr(img_path,rec=False)
- 运行结果

- 其他库解释一下吧
- reshape改变数组形状
- 参数
(1)传入数组
(2)排序方式
一个形状尺寸可以是-1。在这种情况下,值是从数组的长度和剩余的维度推断出来的。
(3)order
‘C’ means C order, ‘F’ means Fortran order
order其实说实话看不太明白,等我看明白了一定补上
2)astype
强制转化数据类型
3)figure
figure(num=None, figsize=None, dpi=None, facecolor=None, edgecolor=None, frameon=True)
- 作用:我的理解是有点像是javafx的scence。
- 参数
num:图像编号或名称,数字为编号 ,字符串为名称
figsize:指定figure的宽和高,单位为英寸;
dpi参数:指定绘图对象的分辨率,即每英寸多少个像素,缺省值为80
facecolor:背景颜色
edgecolor:边框颜色
frameon:是否显示边框
DB文本检测模型
import paddle
import os
import sys
import importlib
# paddleocr_path='D:/computervision/ocr/PaddleOCR-release-2.5/PaddleOCR-release-2.5/ppocr'
# sys.path.append( paddleocr_path )
# os.chdir(paddleocr_path)
# print("当前工作目录"+os.getcwd())
#导入到路径中
from ppocr.modeling.backbones.det_mobilenet_v3 import MobileNetV3
fake_input=paddle.randn([1,3,640,640],dtype='float32')
model_backbone=MobileNetV3()
model_backbone.eval()
outs=model_backbone(fake_input)
print(model_backbone)
for idx,out in enumerate(outs):
print("the index",idx,"shape:",out.shape)
ppocr的路径和当前文件工作路径不同一开始没有找到,用了很多方法也没有用,使用了文章中第2种办法才能读取到文件
边栏推荐
猜你喜欢

关于市场后市的发展预测? 2021-05-23

世界上最大的开源基金会 Apache 是如何运作的?

The bad policy has no long-term impact on the market, and the bull market will continue 2021-05-19

Flask项目的完整创建 七牛云与容联云

logback源码阅读(二)日志打印,自定义appender,encoder,pattern,converter

Kunpeng devkit & boostkit

rhce第三天作业

Object detection scene SSD-Mobilenetv1-FPN

shell脚本“画画”

第十单元 前后连调
随机推荐
政策利空对行情没有长期影响,牛市仍将继续 2021-05-19
drf视图组件
replay视频播放器_怎么让手机音乐跟视频一起放
标量替换、栈上分配、同步消除
VMM是什么?_兮是什么意思
Sentinel源码(一)SentinelResourceAspect
网络安全第一次作业
网络安全第五次作业
C language improvement (3)
此次519暴跌的几点感触 2021-05-21
第五单元 保持状态
专访|带着问题去学习,Apache DolphinScheduler 王福政
微信小程序-最近动态滚动实现
Detailed explanation of stored procedures
MySQL数据库语法格式
HALCON: 对象(object)从声明(declaration)到结束(finalization)
Some impressions of the 519 plummet 2021-05-21
第十五单元 分页、过滤
如何自定义feign方法级别的超时时间
Object detection scene SSD-Mobilenetv1-FPN
