博客
关于我
Windows 10操作系统下Tesseract图像识别(转)为文字的安装与测试
阅读量:551 次
发布时间:2019-03-09

本文共 784 字,大约阅读时间需要 2 分钟。

1、下载Tesseract

这里提供两个下载地址:

,这种方式比较简单,但是版本可能不是最新的,不过也没有多大差距,推荐使用,下面是各个版本的展示,根据自己的需求下载即可。

在这里插入图片描述

,这种方式呢,可能会花费一点时间去找到下载的地址,但是版本是最新的,个人不推荐,有点麻烦

在这里插入图片描述

2、安装Tesseract

注意点:

  1. 建议把相关的语言包也同时装上,可以只选择英文和中文相关的,也可以全选,还有一个附件之类的东西也可以装上
  2. 把上面那些都装上的话,可能导致所占空间有点大,可以酌情考虑安装到D盘

其他的都是一路Next即可

添加系统变量

具体步骤就不说。

安装之后测试一下

tesseract -v

结果如下:

在这里插入图片描述

注意点

建议重启一下电脑,以确保环境变量真实生效。

为什么这么说呢?

因为,虽然在命令行显示确实生效了,但是在代码中使用,有可能产生,未安装的异常。就很蓝瘦香菇。

pytesseract.pytesseract.TesseractNotFoundError:
其实,并不是你的问题,而是python没能正确识别而已。

一定要注意

不要在python中使用

pip install tesseract-ocr

来安装,为什么呢?下面就是原因

在这里插入图片描述
老大,你装一个tesseract,再去装一个十几G的VS,这不搞笑吗。

3、测试

首先安装tesseract的python库

pip install pytesseract

from PIL import Imageimport pytesseractimport cv2 as cvimg_path = 'thjnbshlw2.jpg'img = cv.imread(img_path)text = pytesseract.image_to_string(Image.fromarray(img))print(text)

在这里插入图片描述

结果如下:
在这里插入图片描述

转载地址:http://ougsz.baihongyu.com/

你可能感兴趣的文章
Netty基础—8.Netty实现私有协议栈二
查看>>
Netty多线程 和 Redis6 多线程对比
查看>>
Netty学习总结(2)——Netty的高性能架构之道
查看>>
Netty学习总结(3)——Netty百万级推送服务
查看>>
Netty学习总结(5)——Netty之TCP粘包/拆包问题的解决之道
查看>>
Netty学习总结(6)——Netty使用注意事项
查看>>
Netty客户端断线重连实现及问题思考
查看>>
Netty工作笔记0001---Netty介绍
查看>>
Netty工作笔记0003---IO模型-BIO-Java原生IO
查看>>
Netty工作笔记0006---NIO的Buffer说明
查看>>
Netty工作笔记0007---NIO的三大核心组件关系
查看>>
Netty工作笔记0008---NIO的Buffer的机制及子类
查看>>
Netty工作笔记0009---Channel基本介绍
查看>>
Netty工作笔记0011---Channel应用案例2
查看>>
Netty工作笔记0013---Channel应用案例4Copy图片
查看>>
Netty工作笔记0014---Buffer类型化和只读
查看>>
Netty工作笔记0015---MappedByteBuffer使用
查看>>
Netty工作笔记0020---Selectionkey在NIO体系
查看>>
Netty工作笔记0022---NIO快速入门--编写客户端
查看>>
Vue踩坑笔记 - 关于vue静态资源引入的问题
查看>>