博客
关于我
Windows 10操作系统下Tesseract图像识别(转)为文字的安装与测试
阅读量:551 次
发布时间:2019-03-09

本文共 811 字,大约阅读时间需要 2 分钟。

安装Tesseract OCR并进行文字识别测试

完成以下步骤,确保系统环境规范配置,推荐使用最优安装方式。

首先,访问Tesseract OCR官方网站,选择最新版本进行下载。[去除下载链接]

安装步骤:

  • 完成Tesseract OCR的标准安装。
  • 推荐同时安装Tesseract相关语言包,包括英语和简体中文版本,避免功能异常。
  • 装入完成后,初始化系统环境变量,推荐设置Tesseract的安装路径以提高运行效率。
  • 用于编程调用时,安装pytesseract库:
    pip install pytesseract
  • 环境变量配置:

  • 添加系统变量TESSERACT_HOME,指向Tesseract的安装路径。
  • 在终端验证安装:
    tesseract -v

    确认输出中显示版本号,表示安装成功。

  • 注意事项:

  • 环境变量生效需计算机重启,确保所有打开终端窗口重载环境设置。
  • 避免使用在线安装包pip install tesseract-ocr,会导致额外文件占用,影响系统资源。
  • 测试确认:

  • 准备待测试图片文件。
  • 使用Python环境调用Tesseract进行文字识别:
    from PIL import Imageimport pytesseractimport cv2 as cvimg_path = 'thjnbshlw2.jpg'img = cv.imread(img_path)text = pytesseract.image_to_string(Image.fromarray(img))print(text)
  • 预期输出展示图片中的文字内容。
  • 确保安装成功后,运行上述代码检查结果,若无异常提示TesseractNotFound Error,说明系统环境配置正确。

    建议使用pip install -U pytesseract进行更新,以确保环境兼容性。

    请注意,这些步骤为基础操作,具体用途需结合实际应用场景进行优化。

    转载地址:http://ougsz.baihongyu.com/

    你可能感兴趣的文章
    SharePoint 2013 图文开发系列之定义站点模板
    查看>>
    PCI Express学习篇:Power Management(二)
    查看>>
    pcie握手机制_【博文连载】PCIe扫盲——Ack/Nak 机制详解(一)
    查看>>
    PC史上最悲剧的16次失败
    查看>>
    PC端恶意代码分析Lab1.1-5.1,从零基础到精通,收藏这篇就够了!
    查看>>
    PC端编辑 但能在PC端模拟移动端预览的富文本编辑器
    查看>>
    PDB文件:每个开发人员都必须知道的
    查看>>
    springMVC学习(二)
    查看>>
    Pdfkit页眉和页脚
    查看>>
    PDF中的Pandoc语法突出显示不起作用
    查看>>
    pdf从结构新建书签_在PDF文件中怎样创建书签
    查看>>
    pdf做成翻页电子书_第一弹:常见BOOX电子书阅读器问题解答,这些技能你都会吗?...
    查看>>
    PDF文字识/编辑?这个工具真的很强大!
    查看>>
    pdf文档出现乱码如何修改
    查看>>
    pdf根据模板导出
    查看>>
    PDF调出本来存在的书签面板
    查看>>
    pdf转图片
    查看>>
    pdf转图片、提取pdf文本、提取pdf图片
    查看>>
    pdo sqlserver
    查看>>
    PDO中捕获SQL语句中的错误
    查看>>