【Linux】- centos部署tesseract

安装相关依赖

sudo yum install autoconf automake  

sudo yum install libjpeg-devel libpng-devel libtiff-devel zlib-devel

 

安装leptonica-1.72

wget http://www.leptonica.com/source/leptonica-1.72.tar.gz

tar -xvf leptonica-1.72.tar.gz

cd leptonica-1.72

执行配置指令 ./configure 

执行编译指令 make

执行安装指令 sudo make install 

至此,leptonica安装完毕

 

安装tesseract

wget https://github.com/tesseract-ocr/tesseract/archive/3.04.00.tar.gz

如不能正常下载,可以网盘下载

https://pan.baidu.com/s/1mj6YTIw  

提取码是:95p5

解压指令 tar xzvf 3.04.00.tar.gz

cd tesseract-3.04.00

分别执行以下指令:

sudo ./autogen.sh

执行配置指令 ./configure

执行编译指令 make

执行安装指令 sudo make install 

执行指令 sudo ldconfig

 

这一步安装可能存在的问题较多,记录如下:

错误1:

【Linux】- centos部署tesseract

缺少包,

执行指令:sudo yum install gcc-c++ 

然后在重新执行 ./configure

 

错误2:

make: Nothing to be done for `all' 

解决:

make clean 清除安装时留下的文件

在运行一下sudo ldconfig

在重新执行安装tesseract 步骤

 

错误3:

make[2]: Nothing to be done for `install-exec-am'.
make[2]: Nothing to be done for `install-data-am'.

解决:

make clean 清除安装时留下的文件

在运行一下sudo ldconfig

重新执行安装tesseract 步骤,其中./configure  改为./configure --prefix=/usr

 

错误4:

make[1]: *** [install-bfd] Error 2
make[1]: Leaving directory `/usr/local/gdb-7.10'

解决:

./configure --prefix=/usr/local/gdb #不要和gdb-version源码相同目录即可。

 

错误5:

ldconfig: Can't create temporary cache file /etc/ld.so.cache~: Permission denied

解决:

export LD_LIBRARY_PATH=/usr/local/lib

 

下载字体

下载安装英文,中文繁体,中文简体 识别库
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/eng.traineddata
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_sim.traineddata 
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_tra.traineddata
如不能下载,请参考上面网盘地址进行下载

将刚刚的文件拷贝到tessdata文件夹下:

sudo cp chi_sim.traineddata /usr/local/share/tessdata
sudo cp eng.traineddata /usr/local/share/tessdata
sudo cp eng.traineddata.part /usr/local/share/tessdata

 

测试

查看版本  tesseract --version

【Linux】- centos部署tesseract

cd tesseract-3.04.00

cd testing

【Linux】- centos部署tesseract

【Linux】- centos部署tesseract

执行  tesseract phototest.tif result -l eng

 【Linux】- centos部署tesseract

再查看testing目录下的文件,发现多了一个result.txt:

【Linux】- centos部署tesseract

打开 cat result.txt

【Linux】- centos部署tesseract

 

 

参考:

1、https://blog.csdn.net/wanght89/article/details/78329546

2、https://blog.csdn.net/nsnv_hunter/article/details/79414752

3、https://blog.csdn.net/pangyunsheng/article/details/79372845

 

原文链接: https://www.cnblogs.com/zheng1076/p/10869293.html

欢迎关注

微信关注下方公众号,第一时间获取干货硬货;公众号内回复【pdf】免费获取数百本计算机经典书籍

    【Linux】- centos部署tesseract

原创文章受到原创版权保护。转载请注明出处:https://www.ccppcoding.com/archives/295203

非原创文章文中已经注明原地址,如有侵权,联系删除

关注公众号【高性能架构探索】,第一时间获取最新文章

转载文章受原作者版权保护。转载请注明原作者出处!

(0)
上一篇 2023年2月15日 下午4:39
下一篇 2023年2月15日 下午4:40

相关推荐