博客
关于我
Windows 10操作系统下Tesseract图像识别(转)为文字的安装与测试
阅读量:551 次
发布时间:2019-03-09

本文共 784 字,大约阅读时间需要 2 分钟。

1、下载Tesseract

这里提供两个下载地址:

,这种方式比较简单,但是版本可能不是最新的,不过也没有多大差距,推荐使用,下面是各个版本的展示,根据自己的需求下载即可。

在这里插入图片描述

,这种方式呢,可能会花费一点时间去找到下载的地址,但是版本是最新的,个人不推荐,有点麻烦

在这里插入图片描述

2、安装Tesseract

注意点:

  1. 建议把相关的语言包也同时装上,可以只选择英文和中文相关的,也可以全选,还有一个附件之类的东西也可以装上
  2. 把上面那些都装上的话,可能导致所占空间有点大,可以酌情考虑安装到D盘

其他的都是一路Next即可

添加系统变量

具体步骤就不说。

安装之后测试一下

tesseract -v

结果如下:

在这里插入图片描述

注意点

建议重启一下电脑,以确保环境变量真实生效。

为什么这么说呢?

因为,虽然在命令行显示确实生效了,但是在代码中使用,有可能产生,未安装的异常。就很蓝瘦香菇。

pytesseract.pytesseract.TesseractNotFoundError:
其实,并不是你的问题,而是python没能正确识别而已。

一定要注意

不要在python中使用

pip install tesseract-ocr

来安装,为什么呢?下面就是原因

在这里插入图片描述
老大,你装一个tesseract,再去装一个十几G的VS,这不搞笑吗。

3、测试

首先安装tesseract的python库

pip install pytesseract

from PIL import Imageimport pytesseractimport cv2 as cvimg_path = 'thjnbshlw2.jpg'img = cv.imread(img_path)text = pytesseract.image_to_string(Image.fromarray(img))print(text)

在这里插入图片描述

结果如下:
在这里插入图片描述

转载地址:http://ougsz.baihongyu.com/

你可能感兴趣的文章
Nginx配置多个不同端口服务共用80端口
查看>>
Nginx配置好ssl,但$_SERVER[‘HTTPS‘]取不到值
查看>>
Nginx配置如何一键生成
查看>>
Nginx配置实例-动静分离实例:搭建静态资源服务器
查看>>
Nginx配置实例-反向代理实例:根据访问的路径跳转到不同端口的服务中
查看>>
Nginx配置实例-负载均衡实例:平均访问多台服务器
查看>>
Nginx配置文件nginx.conf中文详解(总结)
查看>>
Nginx配置自带的stub状态实现活动监控指标
查看>>
nginx配置详解、端口重定向和504
查看>>
Nginx配置负载均衡到后台网关集群
查看>>
Nginx配置限流,技能拉满!
查看>>
Nginx面试三连问:Nginx如何工作?负载均衡策略有哪些?如何限流?
查看>>
Nginx:NginxConfig可视化配置工具安装
查看>>
ngModelController
查看>>
ngrok | 内网穿透,支持 HTTPS、国内访问、静态域名
查看>>
ngrok内网穿透可以实现资源共享吗?快解析更加简洁
查看>>
NHibernate学习[1]
查看>>
NHibernate异常:No persister for的解决办法
查看>>
NIFI1.21.0_java.net.SocketException:_Too many open files 打开的文件太多_实际操作---大数据之Nifi工作笔记0051
查看>>
NIFI1.21.0_Mysql到Mysql增量CDC同步中_日期类型_以及null数据同步处理补充---大数据之Nifi工作笔记0057
查看>>