博客
关于我
Windows 10操作系统下Tesseract图像识别(转)为文字的安装与测试
阅读量:551 次
发布时间:2019-03-09

本文共 811 字,大约阅读时间需要 2 分钟。

安装Tesseract OCR并进行文字识别测试

完成以下步骤,确保系统环境规范配置,推荐使用最优安装方式。

首先,访问Tesseract OCR官方网站,选择最新版本进行下载。[去除下载链接]

安装步骤:

  • 完成Tesseract OCR的标准安装。
  • 推荐同时安装Tesseract相关语言包,包括英语和简体中文版本,避免功能异常。
  • 装入完成后,初始化系统环境变量,推荐设置Tesseract的安装路径以提高运行效率。
  • 用于编程调用时,安装pytesseract库:
    pip install pytesseract
  • 环境变量配置:

  • 添加系统变量TESSERACT_HOME,指向Tesseract的安装路径。
  • 在终端验证安装:
    tesseract -v

    确认输出中显示版本号,表示安装成功。

  • 注意事项:

  • 环境变量生效需计算机重启,确保所有打开终端窗口重载环境设置。
  • 避免使用在线安装包pip install tesseract-ocr,会导致额外文件占用,影响系统资源。
  • 测试确认:

  • 准备待测试图片文件。
  • 使用Python环境调用Tesseract进行文字识别:
    from PIL import Imageimport pytesseractimport cv2 as cvimg_path = 'thjnbshlw2.jpg'img = cv.imread(img_path)text = pytesseract.image_to_string(Image.fromarray(img))print(text)
  • 预期输出展示图片中的文字内容。
  • 确保安装成功后,运行上述代码检查结果,若无异常提示TesseractNotFound Error,说明系统环境配置正确。

    建议使用pip install -U pytesseract进行更新,以确保环境兼容性。

    请注意,这些步骤为基础操作,具体用途需结合实际应用场景进行优化。

    转载地址:http://ougsz.baihongyu.com/

    你可能感兴趣的文章
    Oracle监听配置、数据库实例配置等
    查看>>
    Oracle系列:安装Oracle RAC数据库(二)
    查看>>
    oracle系统 介绍,ORACLE数据库管理系统介绍
    查看>>
    oracle获取数据库表、字段、注释、约束等
    查看>>
    oracle表空间查询维护命令大全之三(暂时表空间)史上最全
    查看>>
    oracle表访问方式
    查看>>
    Oracle触发器
    查看>>
    Oracle计划将ZGC项目提交给OpenJDK
    查看>>
    oracle账号共享
    查看>>
    Oracle闪回技术(Flashback)
    查看>>
    oracle零碎要点---ip地址问题,服务问题,系统默认密码问题
    查看>>
    oracle零碎要点---oracle em的web访问地址忘了
    查看>>
    Oracle零碎要点---多表联合查询,收集数据库基本资料
    查看>>
    Oracle静默安装
    查看>>
    Oracle面试题:Oracle中truncate和delete的区别
    查看>>
    ThreadLocal线程内部存储类
    查看>>
    thinkphp 常用SQL执行语句总结
    查看>>
    Oracle:ORA-00911: 无效字符
    查看>>
    Text-to-Image with Diffusion models的巅峰之作:深入解读 DALL·E 2
    查看>>
    TCP基本入门-简单认识一下什么是TCP
    查看>>