当前位置:网站首页>论文详读《基于改进 LeNet-5 模型的手写体中文识别》,未完待补充
论文详读《基于改进 LeNet-5 模型的手写体中文识别》,未完待补充
2022-08-01 12:54:00 【陈壮实的编程生活】
基本信息
期刊:天津大学学报(自然科学与工程技术版)
IF = 1.152
出版时间:2020年8月
摘要
(1)中文手写体识别困境
中文字符数目繁多、相似性强、字体种类繁多、书写随意、缺乏统一规范等原因,一直是计算机视觉领域中一个具有挑战性的问题。
(2)本文方法
改进经典LeNet-5模型,提出LeNet-Ⅱ模型。
Step1: 利用改进的Inception模块和空洞卷积,设计了一种并行的双路卷积神经网络结构;双路的作用:两路分支可分别提取手写中文图像中不同尺度的特征,获得多个尺度的特征图像。
Step2: 通过对其进行特征融合,可以达到丰富特征图像多样性、提高识别准确率的目的。
Step3: 最后经过全连接层进行分类。
(2)结果
在中文数据集CASIA-HWDB1.1上准确率达到95.21%,高与经典LeNet-5和其他传统算法。
同时,在4幅找人手写的中文文本中的平均识别率也达到了97.30%。
0. 引言
手写中文识别分为:联机手写中文识别 和 脱机手写中文识别。与前者相比,后者没有可利用的笔画时序信息,识别难度更大,准确率更低。本文研究的后者。
1. 经典LeNet-5模型
LeNet-5 模型是一种常用的卷积神经网络,被广泛用于手写体数字识别领域。其模型结构:
1.1 对LeNet-5模型的分析
传统LeNet-5模型适用于手写体数字识别,但对手写中文数字识别的准确率较低。
原因如下:
(1)常用中文字符高达3755个,分类种类过多;
(2)手写中文比数字复杂,特征更多;
(3)LeNet-5 模型输入默认为32*32,不满足要求;
(4)LeNet-5 模型仅有 3 层卷积层,卷积层和池化层采用的卷积核个数都较少,是一个简单的串行网络,不足以提取足够多的特征;
2. LeNet-Ⅱ 模型(即本文模型)
模型结构图:
2.1 模型说明
(1)经典 LeNet-5 模型是一个简单的串行网络,提取汉字特征图像的多样性不足;为此,本文设计了一个并行的双路卷积神经网络,以获得不同尺度的特征图像,增强网络的适应力.
(2)Inception 模块有助于解决由于增加神经网络的层数和宽度所导致的过拟合、梯度弥散、计算复杂度增大等问题.本文重新设计的Inception模块,结构如下:
边栏推荐
- 34、树莓派进行人体姿态检测并进行语音播报
- leetcode: 1201. Ugly Number III [Dichotomy + Mathematics + Inclusion and Exclusion Principle]
- Beyond Compare 4 trial period expires
- SQL函数 SQUARE
- Fault 007: The dexp derivative is inexplicably interrupted
- CloudCompare & PCL ICP registration (point to face)
- 安全又省钱,“15岁”老小区用上管道燃气
- How do we do full-link grayscale on the database?
- [Cloud Enjoying Freshness] Community Weekly Vol.73- DTSE Tech Talk: 1 hour in-depth interpretation of SaaS application system design
- Dameng replaces the officially authorized dm.key
猜你喜欢
随机推荐
LeetCode_动态规划_中等_377.组合总和 Ⅳ
Meshlab & Open3D SOR filtering
数据湖 delta lake和spark版本对应关系
bpmn-process-designer基础上进行自定义样式(工具、元素、菜单)
How do we do full-link grayscale on the database?
全链路灰度在数据库上我们是怎么做的?
观察者模式
SAP ABAP OData 服务如何支持创建(Create)操作试读版
formatdatetime函数 mysql(date sub函数)
人像分割技术解析与应用
Do wildcard SSL certificates not support multiple domains?
论文笔记All about Eve: Execute-Verify Replication for Multi-Core Servers
MVVM响应式
如何使用OpenCV测量图像中物体之间的距离
什么是一致性哈希?可以应用在哪些场景?
Why does the maximum plus one equal the minimum
快速幂---学习笔记
一文带你彻底厘清 Isito 中的证书工作机制
8. How does the SAP ABAP OData service support the Create operation
uniapp读取和写入文件








