Skip to main content
 首页 » 编程设计

amazon-ec2之在 Linux 上为 .jpg 运行 tesseract OCR 时出错

2025年05月04日23sky-heaven

我按照 this guide 在我的 Amazon EC2 实例上成功安装了 tesseract .它适用于 TIFF 图像,但是当我尝试在 JPG 上运行它时,我得到:

Tesseract Open Source OCR Engine v3.02.02 with Leptonica 
Error in pixReadStreamJpeg: function not present 
Error in pixReadStream: jpeg: no pix returned 
Error in pixRead: pix not read 
Unsupported image type. 

我还需要安装/做什么?

请您参考如下方法:

我也遇到了同样的问题。这是由于您的 leptonica 安装可能存在一些问题。再次尝试重新安装leptonica:

$tar -xvf leptonica-xx.tar.gz 
$cd leptonica folder 
$./configure 
$make 
$sudo make install     

完成后,您可以通过以下方式检查所有库是否已正确安装:
$tesseract -v 

然后它将显示已安装的 4 个库:
tesseract 3.02.02 
leptonica-1.71 
libjpeg 6b : libpng 1.2.49 : libtiff 3.9.4 : zlib 1.2.3 

干杯:)