当前位置:网站首页>论文详读《基于改进 LeNet-5 模型的手写体中文识别》,未完待补充
论文详读《基于改进 LeNet-5 模型的手写体中文识别》,未完待补充
2022-08-01 12:54:00 【陈壮实的编程生活】
基本信息
期刊:天津大学学报(自然科学与工程技术版)
IF = 1.152
出版时间:2020年8月
摘要
(1)中文手写体识别困境
中文字符数目繁多、相似性强、字体种类繁多、书写随意、缺乏统一规范等原因,一直是计算机视觉领域中一个具有挑战性的问题。
(2)本文方法
改进经典LeNet-5模型,提出LeNet-Ⅱ模型。
Step1: 利用改进的Inception模块和空洞卷积,设计了一种并行的双路卷积神经网络结构;双路的作用:两路分支可分别提取手写中文图像中不同尺度的特征,获得多个尺度的特征图像。
Step2: 通过对其进行特征融合,可以达到丰富特征图像多样性、提高识别准确率的目的。
Step3: 最后经过全连接层进行分类。
(2)结果
在中文数据集CASIA-HWDB1.1上准确率达到95.21%,高与经典LeNet-5和其他传统算法。
同时,在4幅找人手写的中文文本中的平均识别率也达到了97.30%。
0. 引言
手写中文识别分为:联机手写中文识别 和 脱机手写中文识别。与前者相比,后者没有可利用的笔画时序信息,识别难度更大,准确率更低。本文研究的后者。
1. 经典LeNet-5模型
LeNet-5 模型是一种常用的卷积神经网络,被广泛用于手写体数字识别领域。其模型结构:
1.1 对LeNet-5模型的分析
传统LeNet-5模型适用于手写体数字识别,但对手写中文数字识别的准确率较低。
原因如下:
(1)常用中文字符高达3755个,分类种类过多;
(2)手写中文比数字复杂,特征更多;
(3)LeNet-5 模型输入默认为32*32,不满足要求;
(4)LeNet-5 模型仅有 3 层卷积层,卷积层和池化层采用的卷积核个数都较少,是一个简单的串行网络,不足以提取足够多的特征;
2. LeNet-Ⅱ 模型(即本文模型)
模型结构图:
2.1 模型说明
(1)经典 LeNet-5 模型是一个简单的串行网络,提取汉字特征图像的多样性不足;为此,本文设计了一个并行的双路卷积神经网络,以获得不同尺度的特征图像,增强网络的适应力.
(2)Inception 模块有助于解决由于增加神经网络的层数和宽度所导致的过拟合、梯度弥散、计算复杂度增大等问题.本文重新设计的Inception模块,结构如下:
边栏推荐
- Software designer test center summary (interior designer personal summary)
- 【StoneDB Class】入门第二课:StoneDB 整体架构解析
- 模型运营是做什么的(概念模型数据库)
- 快速理解拉格朗日乘子法
- .NET性能优化-使用SourceGenerator-Logger记录日志
- Beyond Compare 4 试用期到期
- Data Mining-04
- AI目标分割能力,无需绿幕即可实现快速视频抠图
- Programmer's Romantic Tanabata
- formatdatetime function mysql (date sub function)
猜你喜欢
数据湖 delta lake和spark版本对应关系
批量替换Word中的表格为图片并保存
leetcode:1201. 丑数 III【二分 + 数学 + 容斥原理】
库函数的模拟实现(strlen)(strcpy)(strcat)(strcmp)(strstr)(memcpy)(memmove)(C语言)(VS)
【5GC】5G网络切片与5G QoS的区别?
PAT 1163 Dijkstra Sequence(30)
数据挖掘-04
bpmn-process-designer基础上进行自定义样式(工具、元素、菜单)
HMS Core音频编辑服务音源分离与空间音频渲染,助力快速进入3D音频的世界
Qt实战案例(56)——利用QProcess实现应用程序重启功能
随机推荐
AI目标分割能力,无需绿幕即可实现快速视频抠图
SQL函数 SQRT
LeetCode_动态规划_中等_313.超级丑数
28uA待机8米距离低压保护单片机探头太阳能灯人体PIR定制方案
嵌入式开发:创建和使用可移植类型的7个技巧
模型运营是做什么的(概念模型数据库)
Do wildcard SSL certificates not support multiple domains?
批量替换Word中的表格为图片并保存
Dameng replaces the officially authorized dm.key
关于Request复用的那点破事儿。研究明白了,给你汇报一下。
六石编程学:问题要面对,办法要技巧,做不好的功能要想办法
态路小课堂丨浅谈优质光模块需要具备的条件!
如何使用OpenCV测量图像中物体之间的距离
Batch replace tables in Word with pictures and save
Process sibling data into tree data
软件设计师考点汇总(室内设计师个人总结)
kubernetes之DaemonSet以及滚动更新
windows IDEA + PHP+xdebug 断点调试
SQL函数 STR
蔚来又一新品牌披露:产品价格低于20万