冈萨雷斯《数字图像处理》学习总结及感悟:第一章 绪论 百闻不如一见

Aidan075 等级 354 0 0

冈萨雷斯《数字图像处理》学习总结及感悟:第一章 绪论 百闻不如一见

一、引言

好几月前开始自学OpenCV-Python,但老猿以前没接触过图像基础知识,数学知识基本上也都忘光了,因此在自学OpenCV-Python过程中遇到了很多困难。OpenCV-Python虽然网上资料丰富,但对于一个缺乏图像处理基础知识的人还是远远不够,导致进展非常缓慢。

为了弥补基础知识的不足,特地下载了冈萨雷斯(Rafael C. Gonzalez)编著的《数字图像处理》(Digital Image Processing)第三版的中文译本和英文原本电子书对照学习,准备好好补补基础知识。

为了供老猿类似情况的同好能快速理解图像处理基础知识,老猿将学习后的关键知识和感悟整理后通过博文发布出来,另外在记录知识的同时对部分中文版的翻译进行了老猿认为的改善(红体字表示),供各位有类似情况的同好参考,也可以节约大家的学习时间。

二、知识概要:百闻不如一见

开篇第一句话:One picture is worth more than ten thousand words 中文版翻译成:百闻不如一见 老猿的感觉:用得非常贴切,翻译得神!

数字图像处理方法源于两个应用领域:改善图像信息以便于人们理解和解释、处理图像用于进行图像存储、传递以及形成便于机器感知理解的表现形式

2.1、定义

数字图像:一幅图像可定义为一个二维函数f(x,y),其中x和y是空间(平面)坐标,而在任何一对空间坐标(x,y)处的幅值对应为函数值f(x,y),该幅值称为图像在该点处的强度或灰度级。当x,y和灰度值f是有限的离散数值时,我们称该图像为数字图像。•数字图像处理:借助计算机进行数字图像的处理。•像素:构成数字图像的元素称为像素,每个元素都由代表位置的坐标和代表幅值的数值组成。像素又可以称为图画元素、图片元素,对应英文单词为:picture elements, image elements、pels、pixels

2.2、数字图像处理的应用领域

•空间探测:1964年美国“徘徊者7号”卫星传送了月球图像,使用计算机对航天器电视摄像机拍摄图像的各种畸变进行了校正,这是图像复原和增强方法的基础。•医学、生物学:X光照片、CT影像•地球资源遥感监测•天文学观察•考古学:复原图片•物理学:高能等离子图像、电子显微镜图像•国防及工业领域•机器感知:OCR图片文字识别、工业机器人感知、军事目标自动识别、指纹自动处理、血样分类、天气预报云图识别等

2.3、数字图像成像类型

视觉是人类最高级的感知,但人类的感知仅限于电磁波谱的视觉波段,而成像机器几乎可以覆盖从伽马射线到无线电波的整个电磁波谱。它们可以对非人类所习惯的那些图像源进行加工,这些图像源包括超声波、电子显微镜和计算机产生的图像。因而,数字图像处理涉及很宽泛的各种各样的应用领域。

图像的生成需要成像的各种能量,最常见的生成图像的能量是电磁波,另外还有声波、超声波和电子。

电磁波为各种波长传播的正弦波,是无质量的粒子流,每个粒子包含一束能量以光速传播,每束能量称为一个光子。根据光子的能量(单位电子伏特)对电磁波谱进行分组如下:冈萨雷斯《数字图像处理》学习总结及感悟:第一章 绪论 百闻不如一见

根据生成图像的能源来划分,可以将数字图像成像机制分成如下:

•伽马射线成像:主要用于核医学和天文观测,如医学上的PET(positron emission tomography,正电子仿射断层)影像•X射线成像:用于医学检测(x光照片、血管造影、CT等)、工业检测、天文学观察•紫外线成像:用于平板印刷、工业检测、显微镜(荧光显微镜)、激光、生物成像、天文观测•可见光成像:这是最常见的,如相机,也可以用于显微镜、天文学、遥感、工业检测•红外成像:用途类似于可见光,只是不同的物体适用不同波长的可见光或红外光•微波成像:如雷达•无线电波成像:主要用于医学和天文学,如核磁共振MRI成像•声波成像:主要用于地质勘察、工业和医学应用•超声波成像:主要用于制造业和医学•电子显微镜成像:用于生物学、工业检测、物理学、天文学等,如透射电子显微镜TEM、扫描电子显微镜SEM•计算机成像:用计算机根据一定算法生成图像,如三维建模

在书中,作者花了比较大的篇幅详细介绍了这些数字成像应用的案例,看了这些案例对于感性理解数字成像还是很有帮助的。

2.4、数字图像处理研究的范围

数字图像相关的处理涉及很多层面,从简单的图像对比度增强到图像识别再到计算机视觉,从简单图像处理到AI,涉及的领域跨度很大,并且没有明显的界限,但这一广袤的范围并不全都属于数字图像处理研究的范围。

一种常见的方法是将数字图像处理到计算机视觉这一广袤的范围划分成低级、中级、高级三个阶段:

1.低级处理:涉及图像的初级操作,如降噪处理、对比度增强、锐化处理,其特征是输入、输出都是图像;2.中级处理:输入为图像,但输出是从图像中提取的特征,如边缘、轮廓、物体标识的识别3.高级处理:识别图像整体、与视觉相关的认知。

在《数字图像处理》一书中,将数字图像处理界定为:

•输入和输出都是图像的处理•从图像中提取特征•图像中各个目标的识别

书中以OCR图像文字识别为例,对图像进行预处理(图像对比度增强等)、分割字符、识别分割的每个字符等都是属于数字图像处理的范围,但将文字组成的句子进行语义识别则不属于数字图像处理范围。

2.5、数字图像处理基本步骤

数字图像处理基本步骤如下:

1.图像获取(Image acquisition);主要用于获得数字图像,包含图像预处理如图像缩放。图像获取首先要进行图像感知(image sensing),图像感知首先需要一个对希望成像的目标辐射(radiated,老猿认为包括反射、透射两种)能量很敏感的物理设备用于收集能量,然后需要一个数字化器部件(digitizer),用于将感知的不同能量输出成数字。2.图像增强(Image enhancement):对图像进行某种操作使得结果图像比原始图像更适合特定应用的处理,图像增强是主观的,因为必须符合后续应用的需要3.图像复原(Image restoration):图像复原与增强一样也是改进的图像外观,但图像复原是依据图像退化( image degradation)的数学模型或概率模型来进行的比较客观化的处理。 老猿补充说明:图像退化是图像在形成、记录、处理和传输过程中,由于成像系统、记录设备、传输介质和处理方法的不完善,导致图像质量的下降。图像复原是将图像退化的过程模型化,并据此采取相反的过程以得到原始的图像(保证噪声最小)4.彩色图像处理(Color image processing):对彩色图像基于彩色图像的模型和数字领域色彩处理的方式进行的处理5.小波变换(Wavelets):小波是以不同分辨率描述图像的基础,在本章节没有展开介绍,老猿拷贝一网上的介绍:小波变换是将图像信号分解为由原始小波位移和缩放之后的一组小波。小波在图像处理里被称为图像显微镜,原因在于它的多分辨率分解能力可以将图片信息一层一层分解剥离开来。剥离的手段就是通过低通和高通滤波器。6.图像压缩(Compression):用于节省存储和传输带宽的手段7.形态学处理(Morphological processing):形态学处理用于提取图像分量,可以参考《https://blog.csdn.net/LaoYuanPython/article/details/109556425 OpenCV-Python图像形态变换概述及morphologyEx函数介绍[1]》8.分割(Segmentation) :将图像划分为图像的组成部分或组成对象,分割越准确,后续的图像识别越成功9.表示与描述(Representation and description):表示确认将图像的数据确定为一个边界还是一个完整区域,选择一种表述仅是将原始数据转换成适合后续计算机处理的形式的一部分,描述又称为特征选择(feature selection),它是基于一些感兴趣的量化信息的结果或者不同对象彼此区分的基本特征的基础上进行的属性提取处理。10.识别(Recognition) :是基于一个图像对象的描述给其赋予一个标识的处理,如识别图像中的车辆。

对于以上步骤与本书的目录结构对应关系如下:冈萨雷斯《数字图像处理》学习总结及感悟:第一章 绪论 百闻不如一见

2.6、图像处理系统构成

冈萨雷斯《数字图像处理》学习总结及感悟:第一章 绪论 百闻不如一见

三、感想

作为全书的第一章,本章介绍了数字图像的概念、数字图像处理的起源、应用领域、研究范围、基本步骤和通用的系统构成。

阅读本章,老猿有如下一些杂乱的感想:

•首先使得我们了解了美国等国的先行者们比我们早了很多年进行数字图像处理,并且将其应用在广泛的领域,确实比我们领先了很多年,基础知识研究很杂实•数字图像的应用领域很宽广,在现代科技处理、国计民生中有不可替代的重要作用•本书写作质量真是非常的高,案例很丰富还非常贴近实际,作者的知识面和人脉都很广,光一个绪论就写得提纲挈领,内容详尽,不愧为经典•中译本整体翻译尚可,但有些细节还有待改善,但两个电子版对照来看,中译本的图像案例很多都比原版差很多,甚至差到影响对讲述内容的理解,因此就算不看原版文字,图像案例最好还是用原版的•数字图像处理需要学习的知识很多,笔者自己还没入门,还需要更多时间去学习, 加油!

四、部分术语英汉对照

除了在总结部分已经添加了中英文对照的术语外,将部分前面没有对照的重要术语在此列出,希望于大家有益:

•Digital Image Processing:数字图像处理•spatial (plane) coordinates:空间(平面)坐标•intensity:强度•gray level:灰度级、灰级、灰度值•amplitude:幅值、幅度•photon:光子•gamma ray:伽马射线•electromagnetic energy spectrum:电磁能谱•acoustic:声学•ultrasonic:超声波•electronic:电子•visual bands of the spectrum:可见光谱•Electromagnetic waves:电磁波•visual band:可见光波段•infrared band:红外波段

五、小结

本文简明扼要地归纳总结了冈萨雷斯《数字图像处理》第一章绪论涉及的基础知识,通过中英文对照方式对该章中译本翻译的知识进行了部分改善并以斜体字方式体现。通过对本章知识的总结,有助于各位与老猿相同基础的同好快速了解数字图像处理的基础概念、数字图像处理的起源、应用领域、研究范围、基本步骤和通用的系统构成等知识。同时通过部分关键术语的中英文对照,有助于提高阅读者的数字图像处理英语知识。

本文转转自微信公众号老猿Python原创https://mp.weixin.qq.com/s/XzDpTYV5wogihVdzr8vNrQ,如有侵权,请联系删除。

收藏
评论区

相关推荐

Canvas入门实战之用javascript面向对象实现一个图形验证码
本文主要介绍用canvas实现图形验证码的一些思路以及如何用javascript面向对象的方式更友好的实现canvas的功能,关于canvas的一些基本使用方法和API我整理了一个思维导图,大家感兴趣的可以参考学习。 (https://imghelloworld.osscnbeijing.aliyuncs.com/imgs/b158fad95
《前端实战总结》之使用纯css实现网站换肤和焦点图切换动画
今天我们来继续复盘一些工作中常用的css技巧和知识,以便我们可以更加优雅的用css实现富有动感的网站. 你将收获 网站换肤设计方案介绍 :target伪类介绍和用法以及如何使用css实现网站换肤 transition动画以及如何用纯css实现焦点图动画 效果展示 1.网站换肤 (https://imghelloworld.ossc
Dart基础>Dart语法(下)
前文链接: Dart简介(https://www.jianshu.com/p/c749f40828a5) Dart语法(上)(https://www.jianshu.com/p/6b5689342e24) 内容: 函数(方法) 函数定义及各类函数;函数参数;闭包 面向对象 定义;构造函数;成员(变
Hook 规则 – React
Hook 规则 _Hook_ 是 React 16.8 的新增特性。它可以让你在不编写 class 的情况下使用 state 以及其他的 React 特性。 Hook 本质就是 JavaScript 函数,但是在使用它时需要遵循两条规则。我们提供了一个 linter 插件(https://www.npmjs.com/package/
Flutter如何引用第三方库并使用
Flutter官网点击访问(https://link.jianshu.com/?thttps%3A%2F%2Fflutter.io) 如何引用并安装第三方库 pubspec.yaml管理第三方库 在pubspec.yaml中添加第三方库名称及版本号。 例如添加第三方库english_words dependencies: flut
一文搞懂什么是HTTP与HTTPS
(https://blog.csdn.net/petterp/article/details/102779257)Http与Https的区别。 在最近的开发中,深感网络相关基础知识薄弱,于是趁周末好好总结一
20 张图彻底弄懂 HTTPS 的原理
前言 近年来各大公司对信息安全传输越来越重视,也逐步把网站升级到 HTTPS 了,那么大家知道 HTTPS 的原理是怎样的吗,到底是它是如何确保信息安全传输的?网上挺多介绍 HTTPS,但我发现总是或多或少有些点有些遗漏,没有讲全,今天试图由浅入深地把 HTTPS 讲明白,相信大家看完一定能掌握 HTTPS 的原理,本文大纲如下: HTTP 为什么不安全
Pandas案例精进 | 自动分割汇总表写入到子表
(https://imghelloworld.osscnbeijing.aliyuncs.com/f5b70d401be96176067dfe8304143ead.png) 大家好! 欢迎来到「Pandas案例精进」专栏 今天分享的是一个之前的案例,里面涉及的方法可能有些过时,但处理思想仍有较高的参考价值。 Pandas案例需求
Go语言学习教程:管理员登录功能开发
学习完了数据库操作的知识以后。本节内容,我们将实现管理员登陆功能,涉及到多个模块的代码实现和逻辑处理,以及数据库表的操作,都将在本节内容中进行实现。 (https://blog.csdn.net/qfzhangxu/article/details/89021910)管理员结构体定义 首先我们要定义管理员这个实体的结构体,我们定义为Admin:
用Python爬取王冰冰vlog弹幕并制作词云
(https://imghelloworld.osscnbeijing.aliyuncs.com/ee5c5cff038a2528350dc352e599b4c4.png) 大家好,我是张同学,最近的“瓜”,多到我们措手不及,可谓是“热点不断”。作为程序员,我们还可能随时为此而加班。 各种评论视频“爆炸”网络,打开首页全是热点话题的内容,某
Tornado API 服务开发
本文讲述如何使用 Tornado(http://www.tornadoweb.org/) Web 框架来开发一个简单的 API 服务,以及如何使用 Docker 工具来构建镜像和部署服务。项目代码已在 GitHub 开源,JW Tornado Demo(https://github.com/jaggerwang/jwtornadodemo)。
轻松理解MYSQL MVCC 实现机制
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/whoamiyang/article/details/51901888 1\. MVCC简介 1.1 什么是MVCCMVCC是一种多版本并发控制机制。 1.2 MVCC是为了解决什么问题? 大多数的MYSQL事务型存储引擎,如,InnoDB,Falcon以及
https://cloud.tencent.com/developer/article/write/1830331
一、目标今天的目标是这个sign和appcode 二、步骤 Jadx没法上了app加了某梆的企业版,Jadx表示无能为力了。 FRIDADEXDumpDexDump出来,木有找到有效的信息。 Wallbreaker葫芦娃的Wallbreaker可以做些带壳分析,不过这个样本,用Frida的Spawn模式可以载入,Attach模式会失败。而直接用Objecti
cpu分析利器 — async-profiler
本文已收录 https://github.com/lkxiaolou/lkxiaolou 欢迎star。 简介asyncprofiler是一款采集分析java性能的工具,翻译一下github上的项目介绍:asyncprofiler是一款没有Safepoint bias problem的低开销java采集分析器,它利用HotSpot特殊的api来收集栈信息以及
让人茅塞顿开!mysql教程视频百度云
2021全新Java核心知识 由于内容过多,本文篇幅有限,因此小编就不详细展示了,请各位老铁认真的看完本文内容,你一定会有所收获!Java篇目录内容(涵盖Java基础及核心技术、容器、并发、JVM技术)网络篇目录内容(涵盖计算机网络知识以及HTTPS中的TLS)操作系统Linux目录内容(初始初探操作系统Linux以及系统操作)数据结构与算法目录内容(详解布