当前位置:网站首页>Tess4J image character recognition
Tess4J image character recognition
2022-07-29 16:32:00 【big dream who realizes i】
什么是OCR?
**OCR (Optical Character Recognition,光学字符识别)**是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程
| 方案 | 说明 |
|---|---|
| 百度OCR | 收费 |
| Tesseract-OCR | Google维护的开源OCR引擎,支持Java,Python等语言调用 |
| Tess4J | 封装了Tesseract-OCR ,支持Java调用 |
Tess4j案例
①:创建项目导入tess4j对应的依赖
<dependency>
<groupId>net.sourceforge.tess4j</groupId>
<artifactId>tess4j</artifactId>
<version>4.1.1</version>
</dependency>
②:Import Chinese font library, 把tessdataCopy the folder to your own workspace
https://github.com/tesseract-ocr/tessdata
③:编写测试类进行测试
package com.test.tess4j;
public class Application {
public static void main(String[] args) {
try {
//获取本地图片
File file = new File("D:\\26.png");
//创建Tesseract对象
ITesseract tesseract = new Tesseract();
//设置字体库路径
tesseract.setDatapath("D:\\workspace\\tessdata");
//中文识别
tesseract.setLanguage("chi_sim");
//执行ocr识别
String result = tesseract.doOCR(file);
//替换回车和tal键 使结果为一行
result = result.replaceAll("\\r|\\n","-").replaceAll(" ","");
System.out.println("识别的结果为:"+result);
} catch (Exception e) {
e.printStackTrace();
}
}
}
边栏推荐
猜你喜欢
随机推荐
6月阿里遭拒,90天深造357页微服务手册,获京东offer
【深度学习】深度学习刷SOTA的一堆trick
国内EDA领导者芯和半导体完成最新一轮超亿元融资
【Swoole系列3.2】Swoole 异步进程服务系统
win10 校验sha256
MySQL数据库安装配置保姆级教程(以8.0.29为例)有手就行
参与一个rk3399的一起学习班级
ES6 从入门到精通 # 11:Map 数据类型
Tess4J 图片文字识别
mysql的union和union all
Compose要是不 `remember`,相关功能就实现不了了吗?
如何创建NFT(还在创作中ing)
Google Play 政策更新 | 2022 年 7 月
如何在CentOS 8上安装PHP
支持百亿请求的微博广告运维技术实践
微信公众号借助小程序云函数实现支付功能
专访亚信科技张桦:AntDB面向企业核心业务支撑的数据库产品
Unable to open the source file in qt vs2015 "QtWidgets" solution
小学生学程序---百变服装
【服务器存储数据恢复】华为OceanStor某型号存储raid5硬盘故障离线,热备盘同步数据失败导致raid崩溃的数据恢复案例









