网站首页 > 精选教程 正文
OCR技术
OCR(Optical Character Recognition),光学字符识别的意思,也被称作文字识别。简单讲就是对图片文件中的文字进行识别和提取的过程。现实生活中使用的场景也非常多,比如文件扫描、车牌号识别、图片内容识别等。图像识别也是人工智能的一个重要领域。
Tess4J
Tesseract是一个开源的OCR引擎,Tess4J则是对Tesseract OCR API的Java JNA封装,使java能够通过调用Tess4J的API来使用Tesseract OCR。Tesseract OCR是支持Tess4J进文件文字识别的基础,Tess4J支持TIFF、JPEG、GIF、PNG、BMP、PDF等格式。Tess4J可直接使用Maven方式引入。
快速体验
环境信息
操作系统:Ubuntu 18.04.6 LTS
JDK:openjdk version "1.8.0_352"
Maven:Apache Maven 3.6.0
1、安装Tesseract
按照官方文档安装Tesseract,Ubuntu系统可以直接通过apt来安装。
sudo apt install tesseract-ocr
sudo apt install libtesseract-dev
2、新建maven工程,引入tess4j依赖。
<dependency>
<groupId>net.sourceforge.tess4j</groupId>
<artifactId>tess4j</artifactId>
<version>5.4.0</version>
</dependency>
3、下载tess4j语言库,下载好后将tessdata文件夹拷贝到maven工程项目代码里,与src目录同级。
4、java调用tess4j实现图像识别,代码如下:
package org.cj.tess4j;
import net.sourceforge.tess4j.ITesseract;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;
import java.io.File;
public class Demo {
public static void main(String[] args) throws TesseractException {
ITesseract instance = new Tesseract();
//指定语言训练模型数据的目录
instance.setDatapath("tessdata");
//指定语言种类, 中文是chi_sim
instance.setLanguage("chi_sim");
File imageFile = new File("images/tess4j/4ocr-1.png");
long startTime = System.currentTimeMillis();
String result = instance.doOCR(imageFile);
System.out.println("识别结果:\n" + result + "\r\n耗时:\n" + (System.currentTimeMillis() - startTime) + "ms");
}
}
5、运行预览
图片内容
识别结果
注意问题
1、运行的时候提示Unable to load library 'tesseract'
提示这个是因为没有安装tesseract,ubuntu环境执行sudo apt install tesseract-ocr安装。
2、运行的时候提示read_params_file: parameter not found: enable_new_segsearch
这里下载的训练数据包是有问题的,在这重新下载tessdata训练数据包。
使用总结
1、Tesseract最大优势就是开箱即用,且拥有大量的语言训练数据。
2、识别的速度慢、耗时长。
3、识别的精度不是很高,甚至有时候会很低,此时就需要自己按需去训练数据包了。
4、依赖语言训练包,官方提供了三种训练数据包,分别是tessdata_fast、tessdata_best、tessdata,这三个训练数据包的差异如下,具体可到官网查阅,推荐使用tessdata_best数据包。
猜你喜欢
- 2024-11-25 干货|一文搞定 uiautomator2 自动化测试工具使用
- 2024-11-25 Java去除PDF文件中的图片
- 2024-11-25 2021 年 Node.js 开发人员学习路线图
- 2024-11-25 Java之base64转化成图片文件
- 2024-11-25 wangEditor 实现ctrl+v粘贴图片并上传、word粘贴带图片
- 2024-11-25 姐姐带我玩转java设计模式(内附照片)- 代理模式
- 2024-11-25 base64转化为图片
- 2024-11-25 Java 给Excel图表设置背景颜色和背景图片
- 2024-11-25 一个支持将html转为PDF、图片,且支持PDF加水印的项目
- 2024-11-25 使用SpringBoot Schedule实现定时任务动态添加、修改、删除等操作
你 发表评论:
欢迎- 04-11Java面试“字符串三兄弟”String、StringBuilder、StringBuffer
- 04-11Java中你知道几种从字符串中找指定的字符的数量
- 04-11探秘Java面试中问的最多的String、StringBuffer、StringBuilder
- 04-11Python字符串详解与示例(python字符串的常见操作)
- 04-11java正则-取出指定字符串之间的内容
- 04-11String s1 = new String("abc");这句话创建了几个字符串对象?
- 04-11java判断字符串中是否包含某个字符
- 04-11关于java开发中正确的发牌逻辑编写规范
- 最近发表
-
- Java面试“字符串三兄弟”String、StringBuilder、StringBuffer
- Java中你知道几种从字符串中找指定的字符的数量
- 探秘Java面试中问的最多的String、StringBuffer、StringBuilder
- Python字符串详解与示例(python字符串的常见操作)
- java正则-取出指定字符串之间的内容
- String s1 = new String("abc");这句话创建了几个字符串对象?
- java判断字符串中是否包含某个字符
- 关于java开发中正确的发牌逻辑编写规范
- windows、linux如何后台运行jar(并且显示进程名)
- 腾讯大佬私人收藏,GitHub上最受欢迎的100个JAVA库,值得学习
- 标签列表
-
- nginx反向代理 (57)
- nginx日志 (56)
- nginx限制ip访问 (62)
- mac安装nginx (55)
- java和mysql (59)
- java中final (62)
- win10安装java (72)
- java启动参数 (64)
- java链表反转 (64)
- 字符串反转java (72)
- java逻辑运算符 (59)
- java 请求url (65)
- java信号量 (57)
- java定义枚举 (59)
- java字符串压缩 (56)
- java中的反射 (59)
- java 三维数组 (55)
- java插入排序 (68)
- java线程的状态 (62)
- java异步调用 (55)
- java中的异常处理 (62)
- java锁机制 (54)
- java静态内部类 (55)
- java怎么添加图片 (60)
- java 权限框架 (55)
本文暂时没有评论,来添加一个吧(●'◡'●)