当前位置:网站首页>Tess4J 图片文字识别
Tess4J 图片文字识别
2022-07-29 15:35:00 【大梦谁先觉i】
什么是OCR?
**OCR (Optical Character Recognition,光学字符识别)**是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程
| 方案 | 说明 |
|---|---|
| 百度OCR | 收费 |
| Tesseract-OCR | Google维护的开源OCR引擎,支持Java,Python等语言调用 |
| Tess4J | 封装了Tesseract-OCR ,支持Java调用 |
Tess4j案例
①:创建项目导入tess4j对应的依赖
<dependency>
<groupId>net.sourceforge.tess4j</groupId>
<artifactId>tess4j</artifactId>
<version>4.1.1</version>
</dependency>
②:导入中文字体库, 把tessdata文件夹拷贝到自己的工作空间下
https://github.com/tesseract-ocr/tessdata
③:编写测试类进行测试
package com.test.tess4j;
public class Application {
public static void main(String[] args) {
try {
//获取本地图片
File file = new File("D:\\26.png");
//创建Tesseract对象
ITesseract tesseract = new Tesseract();
//设置字体库路径
tesseract.setDatapath("D:\\workspace\\tessdata");
//中文识别
tesseract.setLanguage("chi_sim");
//执行ocr识别
String result = tesseract.doOCR(file);
//替换回车和tal键 使结果为一行
result = result.replaceAll("\\r|\\n","-").replaceAll(" ","");
System.out.println("识别的结果为:"+result);
} catch (Exception e) {
e.printStackTrace();
}
}
}
边栏推荐
猜你喜欢
随机推荐
Qt实战 | 如何获取USB设备信息?
UFLO:5、启动任务并自动完成第一个人工任务
Flink SQL Hudi 实战
微信公众号借助小程序云函数实现支付功能
高通发布全新屏下指纹传感器:识别区域增大77%,识别速度提升50%
Hystri基本介绍和代码简单实现
多线程顺序运行的 4 种方法,面试随便问!
国内EDA领导者芯和半导体完成最新一轮超亿元融资
公司官网建站笔记(六):域名进行公安备案并将备案号显示在网页底部
数商云SCM供应链系统方案服务亮点:生产管理更智能、产业供应链协同管理更便捷
【C语言刷题】Leetcode268丢失的数字
Linux下载安装mysql5.7版本教程最全详解
联想集团宣布在科创板上市!杨元庆:进一步释放联想的价值!
The future trend of the conversation
如果不知道这4种缓存模式,敢说懂缓存吗?
远程桌面工具推荐
数字孪生万物可视 | 联接现实世界与数字空间
qt vs2015中无法打开源文件“QtWidgets”的解决方案
如何破坏单例?我说了好几种方式,面试官:没想到你真会
I/O代码实践









