基于 Tesseract_OCR 文字识别的研究

时间:2022-09-30 03:39:48
作者:曾 悦,马明栋
关键字:光学字符识别,文字识别,Tesseract 框架,微软基础类库,C++
DOI:10.3969/j.issn.1673-629X.2021.11.013
查看次数:180

如需要完整文档点击下方 "点击下载文档" 按钮

光学字符识别(optical character recognition,OCR),简单来说,主要是利用光学技术和计算机技术将目前所使用的印刷体字符通过检测每个像素的亮、暗模式转换成一个黑白图像的文件,然后再使用识别的手段将这个黑白图像的文件转换成计算机可以识别的文字。 该文主要分为四个模块:文字信息提取、字符识别、系统实现、实验结果与分析。 文字信息提取模块包括图像预处理、文字信息区域的截取和修正、字符分割,对输入的图片进行处理,以降低随机噪声,确保文字信息区域包含完整的文字信息,提高识别的准确性。 使用 Tesseract 的 OCR 引擎对处理后的文字信息区域部分进行识别,提取出图片中的文字信息。 微软基础类库( Microsoft foundation classes,MFC) ,是微软公司实现的一个 C++类库,主要封装了一部分的 API 函数,灵活性大。 最后,在 VS2015 环境下使用微软基础类库实现了一个文字识别系统,并对样本图片库进行系统的测试。 测试结果表明,该系统具有更高的识别率。

如需要完整文档点击下方 "点击下载文档" 按钮

基于 Tesseract_OCR 文字识别的研究
《基于 Tesseract_OCR 文字识别的研究》
完整文档 下载到本地,方便收藏和查阅
文件号:061392
基于 Tesseract_OCR 文字识别的研究
点击下载文档
基于 Tesseract_OCR 文字识别的研究

点击下载 文件号:061392(点击复制) 公众号(点击复制)

x