源码名称:【Tesseract OCR图像识别类库 v4.1.1】支持Unicode(UTF-8)+支持多种输出格式
源码大小:2.5MB
开发语言:PHP+Mysql
操作系统:Windows,Linux
源码简介与安装说明:
Tesseract OCR 包含了一个OCR引擎 – libtesseract和一个命令行程序 – tesseract。Tesseract 4添加了新的基于LSTM的OCR引擎,该引擎专注于行识别,但仍支持Tesseract 3的传统Tesseract OCR引擎,该引擎通过识别字符模式来工作。通过使用传统OCR引擎模式(–oem 0),可以与Tesseract 3兼容。它还需要训练有素的数据文件来支持旧式引擎,例如tessdata存储库中的文件。
Tesseract具有Unicode(UTF-8)支持,并且可以“开箱即用”地识别100多种语言。
Tesseract支持多种输出格式:纯文本,hOCR(HTML),PDF,仅不可见文本的PDF,TSV。master分支还对ALTO(XML)输出提供了实验性支持。
安装Tesseract:
您可以通过预建的二进制软件包安装正方体 或从源代码编译它。
支持的编译器是:
GCC 4.8及以上
lang 3.4及以上
MSVC 2015、2017、2019年
其他编译器可能可以工作,但未得到官方支持。
沃客云资源,库测试截图:
源码分享申明:
本站所有源码包括此源码,仅用于兴趣爱好学习和代码框架研究,严禁用于商业和非法用途
下载此源码后的所有操作与本站无关
低价分享源码不免费提供技术服务
下载即视为同意此条款
另:本站不接任何违法违规业务,
同时本站愿意为从事正规业务老板/站长提供长期技术支持,
服务优质价格低廉
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。