Tesseract-ocr编译+API调用(c++/python)-白红宇

Tesseract-ocr编译+API调用(c++/python)

阅读量：639 次

发布时间：2019-03-14

本文共 3744 字，大约阅读时间需要 12 分钟。

Tesseract OCR 的编译与调用

在搭建开发环境的过程中， Tesseract OCR 的编译与调用是硬件与软件开发组合中的关键环节。本文将分步 ��述在 Ubuntu 下以及 Windows 环境中的编译过程，并介绍剂定 C++ 与 Python 中的 API 调用方法。

在 Ubuntu 下编译 Tesseract OCR

在 Ubuntu 系统中，使用启发式包关理化工作流程可以方便地安装与编译 Tesseract OCR。

安装必要奤工具

在 Ubuntu Terminal中执行以下命令，安装所需的基础工具：

sudo apt-get update; sudo apt-get install -y cmake build-essential libboost-dev libboost-system-dev libboost-filesystem-dev

安装 Tesseract OCR

使用 Ubuntu 仓库中的安装包安装 Tesseract OCR：

sudo apt-get install -y tesseract-ocr

安装完成后，运行以下命令验证 OCR 能否正确运行：

tesseract

如果窗口弹出，请确认 OCR 系統正确安装。

编译 Leptonica

Leptonica 是 Tesseract OCR 的依赖软件。在同一华 alcoholic 的 Ubuntu 环境中编译：

cd /usr/share/tesseract-ocr/ && mkdir -p buildcd build && cmake ..makemake install

完成以上步骤后， Ubuntu 系统内已经安装并配置好了 Tesseract OCR 系統，包括编译好的库文件与相关生成功能。

在 Windows 环境中编译 Tesseract OCR

在 Windows 系统中， Tesseract OCR 的编建可能 slightly 比 Ubuntu 更为复杂，需要特别关注环境配置与依赖库的问题。

下载并安装 CMake

先下载 CMake 软件并安装可能会提供 CMake GUI 界面来配置建置工作流程：

https://cmake.org/download/

安装 VC++ 工 вы尔除工件

为了正确编译 Tesseract OCR，需要安装 Microsoft Visual Studio（如 VS2015 或 VS2017）。

配置系统 PATH

下载 CMake 后，配置系统 PATH Environment Variable，确保系统可以找到 CMake 与 VC++ 相关的执行文件。

下载并安装 Tesseract OCR

从官方网站或镜像地址下载最新版 Tesseract OCR 并编译：

https://github.com/UB-Mannheim/tesseract/

编译 Tesseract OCR

在 Tesseract 的源码目录中创建 build 文件夹，运行以下命令完成编建：

mkdir buildcd buildcmake ..makemake install

经过上述步骤，可以为 Windows 系統安装完整的 Tesseract OCR 系統，包括二进制库文件与相关应用程序。

Tesseract OCR 的 C++ 调用

在 C++ 中调用 Tesseract OCR API 可以通过 Leptonica 库来实现。以下是使用源码来调用 Tesseract OCR 的具体实现方法。

准备开发环境

确保已经安装编译好的 Tesseract OCR 库文件（如 tesseract库文件），且系统 PATH 中包括 Tesseract 的安装目录。

配置项目标文件

在编译工;:;:;:;: 这里可能会出现一些错锇，需要确认 VS 的功能有无被正确安装，并通过 GUI 配置项目标文件。

编写调用代碼

使用 Tesseract 的 C++ API（如 TessBaseAPI）编写应用程序，调用 OCR 功能。以下是一个简单假設的代碼示例（可可能需要根據实际上下文调整）：

#include 
   
    int main() {    TessBaseAPI* tess = new TessBaseAPI();    if (tess->Init("eng", false)) {        // 初始化 OCR 系统        // 如需 自定义 模型 路径，可 调用 tess->SetTessData("...", true);        // 定义 输入 图像 路径        Pix* image = pixRead("；        // 调用 OCR 函数获取 文本        char* outText = tess->GetUTF8Text(image);        // 定义 输出 文件 路径        tex eradicateFile("OCR结果.txt", outText);        tensor->CleanUp();        delete[] outText;        pixDestroy(image);        return 0;    } catch (const TesseractError& e) {        // 处理 错 锇        std::cerr << e.what() << std::endl;        return 1;    }}

编译産出磁化池程文件
确认代碼编译后，是否有各类移向错锇，或能否正确生產视觉件（如 tesseract400d.lib）。

测试与调试
在 Windows 系統中，可能会遇到一些平台相关错锇，需要确保系统 ENVIRONMENT 和 Tesseract 的编译平台是否匹配。

Python 中的 Tesseract OCR 调用

Python 中使用 pyocr 库可以方便地调用 Tesseract OCR API。以下是使用 pyocr 库来秃动生成 OCR 文本的实现方法。

安装 pyocr 包
前往 PyPI 官网或使用 pip 上载平台安装 pyocr：
```
pip install pyocr
```

导入相关 API
在 Python 代碼中导入 pyocr 库的 Tesseract OCR API：
```
from pyocr import pyocr…… # 具体 导入 语句 根據lj实现情况而定
```

初始化 OCR 引擎
初始化 Tesseract OCR 引擎并设置 OCR 模型路径（如 eng.traineddata）：
```
handle = pyocr.init(lang='eng')
```

加载图像并调用 OCR API
通过 PIL 图像库加载输入图像并调用 OCR 函数，获取 OCR 结果：
```
from PIL import Imageimg = Image.open("；1.jpg")text = pyocr.get_utf8_text(handle, img)
```