博客
关于我
Windows 10操作系统下Tesseract图像识别(转)为文字的安装与测试
阅读量:551 次
发布时间:2019-03-09

本文共 784 字,大约阅读时间需要 2 分钟。

1、下载Tesseract

这里提供两个下载地址:

,这种方式比较简单,但是版本可能不是最新的,不过也没有多大差距,推荐使用,下面是各个版本的展示,根据自己的需求下载即可。

在这里插入图片描述

,这种方式呢,可能会花费一点时间去找到下载的地址,但是版本是最新的,个人不推荐,有点麻烦

在这里插入图片描述

2、安装Tesseract

注意点:

  1. 建议把相关的语言包也同时装上,可以只选择英文和中文相关的,也可以全选,还有一个附件之类的东西也可以装上
  2. 把上面那些都装上的话,可能导致所占空间有点大,可以酌情考虑安装到D盘

其他的都是一路Next即可

添加系统变量

具体步骤就不说。

安装之后测试一下

tesseract -v

结果如下:

在这里插入图片描述

注意点

建议重启一下电脑,以确保环境变量真实生效。

为什么这么说呢?

因为,虽然在命令行显示确实生效了,但是在代码中使用,有可能产生,未安装的异常。就很蓝瘦香菇。

pytesseract.pytesseract.TesseractNotFoundError:
其实,并不是你的问题,而是python没能正确识别而已。

一定要注意

不要在python中使用

pip install tesseract-ocr

来安装,为什么呢?下面就是原因

在这里插入图片描述
老大,你装一个tesseract,再去装一个十几G的VS,这不搞笑吗。

3、测试

首先安装tesseract的python库

pip install pytesseract

from PIL import Imageimport pytesseractimport cv2 as cvimg_path = 'thjnbshlw2.jpg'img = cv.imread(img_path)text = pytesseract.image_to_string(Image.fromarray(img))print(text)

在这里插入图片描述

结果如下:
在这里插入图片描述

转载地址:http://ougsz.baihongyu.com/

你可能感兴趣的文章
Netty工作笔记0013---Channel应用案例4Copy图片
查看>>
Netty工作笔记0014---Buffer类型化和只读
查看>>
Netty工作笔记0020---Selectionkey在NIO体系
查看>>
Vue踩坑笔记 - 关于vue静态资源引入的问题
查看>>
Netty工作笔记0024---SelectionKey API
查看>>
Netty工作笔记0025---SocketChannel API
查看>>
Netty工作笔记0027---NIO 网络编程应用--群聊系统2--服务器编写2
查看>>
Netty工作笔记0050---Netty核心模块1
查看>>
Netty工作笔记0057---Netty群聊系统服务端
查看>>
Netty工作笔记0060---Tcp长连接和短连接_Http长连接和短连接_UDP长连接和短连接
查看>>
Netty工作笔记0063---WebSocket长连接开发2
查看>>
Netty工作笔记0070---Protobuf使用案例Codec使用
查看>>
Netty工作笔记0072---Protobuf内容小结
查看>>
Netty工作笔记0077---handler链调用机制实例4
查看>>
Netty工作笔记0081---编解码器和处理器链梳理
查看>>
Netty工作笔记0084---通过自定义协议解决粘包拆包问题2
查看>>
Netty工作笔记0085---TCP粘包拆包内容梳理
查看>>
Netty常用组件一
查看>>
Netty常见组件二
查看>>
netty底层源码探究:启动流程;EventLoop中的selector、线程、任务队列;监听处理accept、read事件流程;
查看>>