linux安装tesseract支持tess4j图片识别-创新互联

简介

因公司需求要识别上传图片中的相关信息,因此选择了tees4j实现相关功能,其中直接通过tess4j识别不是很好,所以通过java代码对图片进行了处理之后再用tess4j进行识别,在部署到linux服务器时需要安装tesseract,因此写下这篇文章作为记录。楼主使用的是tesseract-4.1.1版本,下面介绍安装步骤。

创新互联服务项目包括正蓝网站建设、正蓝网站制作、正蓝网页制作以及正蓝网络营销策划等。多年来,我们专注于互联网行业,利用自身积累的技术优势、行业经验、深度合作伙伴关系等,向广大中小型企业、政府机构等提供互联网行业的解决方案,正蓝网站推广取得了明显的社会效益与经济效益。目前,我们服务的客户以成都为中心已经辐射到正蓝省份的部分城市,未来相信会继续扩大服务区域并继续获得客户的支持与信任!1、安装依赖
yum install autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel gcc gcc-c++
2、下载压缩包

建议去官网下载好后上传到服务器,可通过下方传送门下载
leptonica-1.79.0.tar.gz
tesseract-4.1.1.tar.gz
下载好后放在自己定义好的服务器文件夹中

3、安装

统一安装在/usr/local/

3.1、先安装leptonica

执行命令

mkdir  /usr/local/leptonica
tar -xzvf leptonica-1.79.0.tar.gz
cd leptonica-1.79.0
./configure --prefix=/usr/local/leptonica  && make  && make install
3.2、配置leptonica环境变量

执行命令

vim /etc/profile

在文件末尾追加配置

PKG_CONFIG_PATH=$PKG_CONFIG_PATH:/usr/local/leptonica/lib/pkgconfig
export PKG_CONFIG_PATH
CPLUS_INCLUDE_PATH=$CPLUS_INCLUDE_PATH:/usr/local/leptonica/include/leptonica
export CPLUS_INCLUDE_PATH
C_INCLUDE_PATH=$C_INCLUDE_PATH:/usr/local/leptonica/include/leptonica
export C_INCLUDE_PATH
LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/leptonica/lib
export LD_LIBRARY_PATH
LIBRARY_PATH=$LIBRARY_PATH:/usr/local/leptonica/lib
export LIBRARY_PATH
LIBLEPT_HEADERSDIR=/usr/local/leptonica/include/leptonica
export LIBLEPT_HEADERSDIR

应用配置

source /etc/profile
3.3、安装tesserac

执行命令

mkdir /usr/local/tesseract
tar -xzvf 4.1.1.tar.gz
cd tesseract-4.1.1
# 必须先运行autogen.sh文件才会有configuer文件
./autogen.sh
# 编译安装到指定文件夹
./configure --prefix=/usr/local/tesseract  && make && make install
3.4、下载识别库

所有的识别库地址:https://github.com/tesseract-ocr/tessdata
楼主只需要中文识别库,所以下面通过中文识别库举例。
点击下载中文简体语言库chi_sim.traineddata,上传到 /usr/local/tesseract/share/tessdata/目录。
若是java项目中已经使用了识别库,不需要再下载,只需要下一步配置时配置到java中使用的目录地址即可。

3.5、配置tesserac环境变量

执行命令

vim /etc/profile

注:TESSDATA_PREFIX后面的地址是训练库所在的文件目录,楼主是java项目中直接引用了识别库,大家可以根据自己下载进行配置
建议识别库放置地址为 /usr/local/tesseract/share/tessdata,注意同步修改下方TESSDATA_PREFIX的值

PATH=$PATH:/usr/local/tesseract/bin
export PATH
export TESSDATA_PREFIX=/home/api/upload/tessdata  ##注意:该位置是训练库所在文件目录
export PATH=$PATH:$TESSDATA_PREFIX

应用配置

source /etc/profile
3.6、测试安装是否成功

执行命令

tesseract --version

如下即为成功安装
在这里插入图片描述

3.7、测试识别功能

上传如下图所示的图片到服务器
在这里插入图片描述

执行命令
注: chi_sim是指定的识别库的前缀名称,必须指定,可替换为自己需要的字符集名称

tesseract   /home/测试.png  /home/结果  -l chi_sim
cat /home/结果.txt

结果如下
在这里插入图片描述
至此,tesseract就安装完成啦。

你是否还在寻找稳定的海外服务器提供商?创新互联www.cdcxhl.cn海外机房具备T级流量清洗系统配攻击溯源,准确流量调度确保服务器高可用性,企业级服务器适合批量采购,新人活动首月15元起,快前往官网查看详情吧

文章标题:linux安装tesseract支持tess4j图片识别-创新互联
文章分享:https://www.cdcxhl.com/article0/ceisoo.html

成都网站建设公司_创新互联,为您提供移动网站建设外贸建站静态网站定制网站定制开发虚拟主机

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联

绵阳服务器托管