软件介绍
Tesseract OCR是一款开源的ocr引擎,也可以看作是图像文字识别程序,它的主要功能就是帮助用户将图片中的文字内容识别出来,并将其转换成文本。Tesseract OCR使用起来很方便,不仅识别准确率高,而且识别的速度也很快,有需要的用户快来下载吧。
使用教程
大体流程:Tesseract安装 -> 打开命令行 -> 生成目标文件
Tesseract安装
下载安装包,安装成功后会在相应磁盘下有Tesseract-OCR文件夹,如图
打开命令行
打开命令行,输入tesseract,回车;以下便是tesseract的大体面貌:
生成目标文件
先准备一张图片文件,如test.png
将命令行切换至目标图像文件目录,比如我们转换文件为test.png(图片文件允许多种格式),位于C:\Users\Lian\Desktop\test;然后在命令行中输入
tesseract test.png output_1 –l eng
【语法】: tesseract imagename outputbase [-l lang] [-psm pagesegmode] [configfile…]
imagename为目标图片文件名,需加格式后缀;outputbase是转换结果文件名;lang是语言名称(在Tesseract-OCR中tessdata文件夹可看到以eng开头的语言文件eng.traineddata),如不标-l eng则默认为eng。
打开文件output_1.txt,发现tesseract成功的将图像转换成 152408 。
- 精选留言 来自河南平顶山电信用户
- 感谢分享,这个版本好用吗
- 精选留言 来自广西来宾移动用户
- 真的假的,还是免费软件,用过的朋友冒个泡哈
- 精选留言 来自辽宁锦州电信用户
- 这么牛皮的嘛?下载试试
- 精选留言 来自福建泉州联通用户
- 这个要得
- 精选留言 来自甘肃嘉峪关电信用户
- 感谢,真的很好用,简直就是神器