一篇文章教会你使用Python图片格式转换器并识别图片中的文字

Karen110
• 阅读 1551

在日常生活中,我们经常需要用到图片,我们都知道,图片的种类挺多的,在这里不一一列举。

我们今天要完成就是一个图片转换器外加图片识别程序,废话不多说,直接就是淦!

1.文字识别技术

2.图片转换器

一、文字识别技术

首先介绍文字识别技术,就是读取图片之后然后把图片中的文字提取出来。

1.打开百度开放平台

一篇文章教会你使用Python图片格式转换器并识别图片中的文字

进去之后咱们选择文字识别,可以看出,语音合成和图片识别的参数不一样,所以不要搞混了,不过他们用的Python模块是一样的,这个可以放心使用。

一篇文章教会你使用Python图片格式转换器并识别图片中的文字

谈到文字识别,大致可分为本地文件文字识别和网络文件文字识别,识别率还算挺高的,他的用法与语音合成有很多相似之处,当然也有很多不同,例如:

from aip import AipOcr

""" 你的 APPID AK SK """
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

首先是使用的模块不同,其次参数也不同,可以看出来第一步配置就是这么简单。

然后我们需要对本地文件进行一个识别,例如:

一篇文章教会你使用Python图片格式转换器并识别图片中的文字

可以看出来,这些就是识别后图片上的内容,识别效果很好,非常完美。

文字识别——请求参数详情

一篇文章教会你使用Python图片格式转换器并识别图片中的文字

文字识别——返回数据参数详情

一篇文章教会你使用Python图片格式转换器并识别图片中的文字

可以看出这个API还是相当不错了,下面我们聊一下图片格式转换器,

二、图片格式转换器

图片格式转换器,顾名思义就是将图片格式互相转换,很多人为了方便都是直接改后缀名,殊不知那样图盘的原始样式会受到影响,也许图片会打开后从产生错误的画面。下面我们就来做一个类似的案例。

1.先安装图片处理模块 pillow ,安装方法 :

pip install pillow

2.导入pillow

from PIL import Image

3.判断文件是否可以打开


from PIL import Image
def isbad(path):
        bad = True
        try:
            Image.open(path).verify() #判断图片是否损坏
        except:
            bad= False
        return bad

4.转换文件格式


def translate(path):
        if isbad(path):
            try:
                str = path.rsplit(".", 1)
                output_path = str[0] + ".png" #输出文件名称
                im = Image.open(path)  
                im.save(output_path)  #保存目标文件
                return True
            except:
                return False
        else:
            return False

这样我们就得到了一张完整的可用的png图片了,代码如图:

一篇文章教会你使用Python图片格式转换器并识别图片中的文字

本项目用于平时上传文件识别图片所用,效果还是蛮不错的,希望大家喜欢。

最后想学习更多关于Python的知识,可以参考学习网址:http://pdcfighting.com/,点击阅读原文,可以直达噢~

**-----**------**-----**---**** End **-----**--------**-----**-****

往期精彩文章推荐:

一篇文章教会你使用Python图片格式转换器并识别图片中的文字

欢迎各位大佬点击链接加入群聊【helloworld开发者社区】:https://jq.qq.com/?_wv=1027&k=mBlk6nzX进群交流IT技术热点。

本文转自 https://mp.weixin.qq.com/s/inydijRWutt5smNSimw2kg,如有侵权,请联系删除。

点赞
收藏
评论区
推荐文章
blmius blmius
2年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
CuterCorley CuterCorley
3年前
Python小应用 百度接口实现图片文字识别,并打包成安装包软件
本文给大家分享的主题是用百度的接口实现图片的文字识别。1.环境和配置要求整体是用Python实现,所需要使用的第三方库包括aip、PIL、keyboard、pyinstaller,如未安装,可在CMD中使用pipinstallBaiduAIP/pillow/keyboard/pyinstaller指令安装。百度接口打开https://
Jacquelyn38 Jacquelyn38
2年前
使用Vue封装一个实用的人脸识别组件
❝欢迎阅读本博文,本文主要讲述【使用Vue封装一个实用的人脸识别组件】,文字通俗易懂,如有不妥,还请多多指正。❞在这里插入图片描述前言人脸识别技术现在越来越火,那么我们今天教大家实现一个人脸识别组件。资源elementUIVue.jstrackingmin.jsfacemin.js源码由于我们
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
Wesley13 Wesley13
2年前
UIWebView长按保存图片和识别图片二维码的实现方案(使用缓存)
0x00需求:长按识别UIWebView中的二维码,如下图长按识别二维码0x01方案1:给UIWebView增加一个长按手势,激活长按手势时获取当前UIWebView的截图,分析是否包含二维码。核心代码:略优点:流程简单,可以快速实现。不足:无法实现保存UIWebView中图片,如果当前We
不是海碗 不是海碗
1年前
从图片提取文字的终极解决方法 ——【通用文字识别 API】
通用文字识别技术,也称为OCR(OpticalCharacterRecognition,光学字符识别),就是一种将图像或扫描件中的文字识别出来并转化为可编辑、可搜索的数字化文本的技术。
Stella981 Stella981
2年前
Python+Selenium自动化篇
本篇文字主要学习selenium定位页面元素的集中方法,以百度首页为例子。0.元素定位方法主要有:id定位:find\_element\_by\_id('')name定位:find\_element\_by\_name('')class定位:find\_element\_by\_class\_name(''
Stella981 Stella981
2年前
Serverless Framework + OCR 快速搭建通用文字识别应用
在日常的工作生活中,文字识别与我们息息相关,比如身份证识别、随手拍扫描、纸质文档电子化等,无不显示着文字识别技术的重要性。为此,腾讯云通用文字识别产品GeneralOCR应运而生,基于行业前沿的深度学习技术,支持将图片上的文字内容智能识别为可编辑的文本,大幅提升信息处理效率。而ServerlessFramework与OCR的结合,则为用户提供
Python进阶者 Python进阶者
3个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这
马尚 马尚
4天前
使用Python和OpenCV识别英文字符验证码
在这个项目中,我们将展示如何使用Python和OpenCV库来识别英文字符验证码。英文字符验证码通常包含大小写字母和数字字符,我们可以利用图像处理和机器学习技术来识别这些字符。首先,我们需要导入所需的库:pythonimportcv2importnumpy