什么是数字图画处理?前史、以及它所研讨的内容
说起图画处理,你会想到什么?你是否真的了解这个范畴所研讨的内容。纵向来说,数字图画处理研讨的前史适当悠长;横向来说,数字图画处理研讨的论题适当广泛。
数字图画处理的前史能够追溯到近百年从前,大约在1920年的时分,图画初次经过海底电缆从英国伦敦传送到美国纽约。图画处理的初次运用是为了改进伦敦和纽约之间海底电缆发送的图片质量,那时就运用了图画编码,被编码后的图画经过海底电缆传送至目的地,再经过特别设备进行输出。这是一次前史性的前进,传送一幅图片的时刻从原本的一个多星期削减到了3小时。
1950年,美国的麻省理工学院制作出了第一台配有图形显现器的电子核算机——旋风I号(Whirlwind I)。旋风I号的显现器运用一个相似于示波器的阴极射线管(Cathode Ray Tube,CRT)来显现一些简略的图形。1958年美国Calcomp公司研发出了滚筒式绘图仪,GerBer公司把数控机床开展成为平板式绘图仪。在这一时期,电子核算机都首要运用于科学核算,而为这些核算机装备的图形设备也仅仅是作为一种简略的输出设备。
跟着核算机技能的前进,数字图画处理技能也得到了很大的开展。1962年,其时还在麻省理工学院攻读博士学位的伊凡·苏泽兰(Ivan Sutherland)成功开发了具有划时代含义的“画板”(Sketchpad)程式。而这正是有史以来第一个交互式绘图体系,一同这也是交互式电脑绘图的初步。从此核算机和图形图画被愈加严密地联络到了一同。鉴于伊凡·苏泽兰为核算机图形学创建所做出的杰出贡献,他于1988年被颁发核算机范畴最高奖——图灵奖。
1964年,美国加利福尼亚的喷气推进实验室用核算机对“旅行者七号”太空船发回的大批月球相片进行处理,以校对航天器上开麦拉中各种类型的图画畸变,收到了显着的效果。在后来的宇航空间技能中,数字图画处理技能都发挥了巨大的效果。
到了20世纪60年代晚期,数字图画处理现已形成了比较完善的学科体系,这套理论在20世纪70年代开展得十分迅速,并开端运用于医学印象和天文学等范畴。1972年,美国物理学家阿伦·马克利奥德·柯麦科(Allan MacLeodCormack)和英国电机工程师戈弗雷·纽博尔德·豪恩斯弗尔德(Godfrey Newbold Housfield)创造晰轴向断层术,并将其用于头颅确诊。国际第一台X射线核算机轴向断层拍摄设备由EMI公司研发成功,这也便是人们一般所说的CT(Computer Tomograph)。CT可经过一些算法用感知到的数据去重建经过物体的“切片”图画。这些图画组成了物体内部的再现图画,也便是依据人的头部截面的投影,经核算机处理来进行图画重建。鉴于CT关于医学确诊技能的开展所起到的巨大推进效果,柯麦科和豪恩斯弗尔德于1979年获得了诺贝尔生理或医学奖。
随后在2003年,诺贝尔生理或医学奖的荣誉再次颁发了两位在医疗印象设备研讨方面做出杰出贡献的科学家——美国化学家保罗·劳特伯尔(Paul Lauterbur)和英国物理学家彼得·曼斯菲尔(Peter Mansfield)。两位获奖者在运用磁共振成像(Magnetic Resonance Imaging,MRI)显现不同结构方面别离获得了开创性效果。瑞典卡罗林斯卡医学院称,这两位科学家在MRI范畴的开创性作业,代表了医学治疗和研讨的重大突破。而事实上,核磁共振的成功相同也离不开数字图画处理方面的开展。即便在今日,比如MRI图画降噪等问题依然是数字图画处理范畴的抢手研讨方向。
提到数字图画的开展进程,还有一项至关重要的效果不得不提,那便是电荷耦合元件(Charge-coupled Device,CCD)。CCD开端是由美国贝尔实验室的科学家维拉德·波义耳(Willard Sterling Boyle)和乔治·史密斯(George Elwood Smith)于1969年创造的。CCD的效果就像胶片相同,它能够把光学印象转化为数字信号。今日人们所广泛运用的数码照相机、数码开麦拉和扫描仪都是以CCD为根底开展而来的。换句话说,咱们现在所研讨的数字图画首要也都是经过CCD设备获取的。由于波义耳和史密斯在CCD研发上所做出的巨大贡献,他们两人一起荣获了2009年度的诺贝尔物理学奖。
数字图画处理在今日是十分抢手的技能之一,日子中无处不存在着它的影子,能够说它是一种每时每刻都在改变着人类日子的技能。但长久以来,许多人对数字图画处理存在着较大的误解,人们总是不自觉地将图画处理和Photoshop联络在一同。大名鼎鼎的Photoshop无疑是当时运用最为广泛的图画处理东西。相似的软件还有Corel公司出产的CorelDRAW等软件。
虽然Photoshop是一款十分优异的图画处理软件,但它的存在并不代表数字图画处理的悉数理论与办法。它所具有的功用仅仅是数字图画处理中的一部分。总的来说,数字图画处理研讨的内容首要包含如下几个方面:
1)图画获取和输出
2)图画编码和紧缩
3)图画增强与恢复
4)图画的频域改换
5)图画的信息安全
6)图画的区域切割
7)图画方针的辨认
8)图画的几许改换
但图画处理的研讨内容,又不仅限于上述内容!所以说图画处理的研讨论题是适当广泛的。那现在图画处理都运用在哪些范畴呢?或许咱们或许熟知的比如有(当然,你应该还能举出更多比如):
1)一些专业图画处理软件:Photoshop、CorelDRAW……
2)一些手机APP运用:美图秀秀、玩图……
3)一些医学图画处理运用:MRI、彩超图画处理……
4)一些制作业上的运用:元器件检测、瑕疵检测……
5)一些摄像头、相机上的运用:夜间相片的质量改进……
6)一些电影工业上是运用:换布景、电影特技……
什么样的人会去学(或许需求学)图画处理?
1)假如你是我上述那些运用范畴的从业者,你当然需求掌握图画方面的理论和技能;2)相关专业的研讨人员、大专院校的博士生、研讨生。
所谓相关专业又是指什么呢?这个答案也或许适当广泛,例如(但不仅限于此):Computer Science, Software Engineering, Electronic Engineering,Biomedical Engineering, Automation, Control, Applied Mathematics……
怎么学好图画处理——我的一些谏言
1)关于初级入门者
一个厚实的根底和关于图画处理理论的完好的、体系的全体知道关于后续的深入研讨和实践运用具有十分十分重要的含义。
我常常喜爱拿武侠小说《天龙八部》中的一段情节来向读者阐明此中的道理,信任读者对这部从前被屡次搬上荧幕的金庸作品现已耳熟能详了。书中讲到有个名叫鸠摩智的番僧一心想练就绝世武学,并且他也算是个适当勤勉的人了。可是,他错就错在太过于急于求成,乃至运用道家的小无相功来催动少林绝技。看上去威力无比,并且能够在短时刻内“速成”,但实则后患无穷。终究鸠摩智走火入魔,前功尽废,刚才大彻大悟。这个故事其实就告知咱们打牢根底是十分重要的,特别是要获得更长足的开展,就更是要对基本原理寻根究底,力求甚解,然后做到庖丁解牛,挥洒自如。
一些看似深邃的算法往往是许多根底算法的组合提高。例如,令许多人望而生畏的SIFT特征构建进程中,就用到了图画金字塔、直方图、高斯滤波这些十分十分根底的内容。可是,它所触及的根底技能明显有好几个,假如缺少对图画处理理论的体系知道,你或许会感觉得不偿失。由于一切的当地如同都是沟沟坎坎。
关于课程——
在这个阶段其实关于数学的要求并不高,你乃至能够从一些理性的视点去形象化的了解图画处理中许多内容(但不包含频域处理方面的内容)。详细到学习的主张,假如有条件(例如你还在高校里读书)你最好能选一门图画处理方面的课程,体系地完好的地去学习一下。这明显是入门的最好办法。如此一来,在树立一个完好的、体系的认知上适当有协助。假如你没办法在校园里上一门这样的课,网上的一些公开课也能够试试。但现在中文MOOC上还没有这方面的优质课程引荐。英文的课程则有许多,例如美国加州伦斯勒理工学院Rich教授的数字图画处理公开课——https://www.youtube.com/channel/UCaiJlKxXamoODQtlx486qJA?spfreload=10。
关于教材——
明显,只听课其实还不太够,假如能同时读一本书就最好了。其实不用参阅许多书,只需一本,你能从头读到尾就很好了。假如你没有条件去上一门课,那读一原本完好的自学一下就更有必要了。这个阶段,去网上处处找博客、看帖子是不行的。由于你特别需求在这个阶段对这门学识树立一个体系的完好的常识体系。东一块、西一块的胡拼乱凑无疑是坑你自己,你的常识体系就像一个气泡,或许看起来很大,可是又软弱的一触即溃。
现在许多校园选用冈萨雷斯的《数字图画处理》一书作为教材。这是一本十分十分经典的作品。可是我必需求提示读者:
1)这是一本专门为Electronic Engineering专业学生所写的书。它需求有信号与体系、数字信号处理这两门课作为根底。假如你没有这两门课的根底,你读这本书要么是看热闹,要么便是看不懂。
下面是冈书中的一张插图。关于EE的学生来说,这当然不是问题。可是假如没有我说的那两门课的根底,其实你很难掌握其间的精华。H和h,一个巨细一个小写,冈书中有的当地用H,有的当地用h,这都是有很深入意图的。原作者并没有特别阐明它们二者的差异,由于他现已默许你应该知道二者是不同的。事实上,它们一个表明频域信号,一个表明时域信号,这也导致有时分运算是卷积,有时分运算是乘法(当然这跟卷积定理有关)。所以我并不太主张那些没有这方面根底的学生在自学的时分读这本书。
2)冈萨雷斯教授的《数字图画处理》第一版是在1977年出书的,到现在现已快40年了;现在国内广泛运用的第二版是2002年出书的(第三版是2007年可是其实二者差异并不大),到现在也有20年左右的时刻了。事实上,冈萨雷斯教授退休也有快30年了。所以这本书的内容现已偏于陈腐。数字图画处理这个范畴的开展必定是一日千里,日新月异的。特别在最近二三十年里,许多新思路,新办法不断涌现。假如你看了我前面引荐的Rich教授的公开课(这也是当时美国大学正在教育的内容),你一会儿就会发现,原本咱们的教育还停留在改革开放之前外国的水平上。这其实特别可怕。所以我觉得冈萨雷斯教授的《数字图画处理》作为学习进程中的一个弥补仍是不错的,可是假如把它作为主参阅,那真的便是:国外都洋枪洋炮了,咱们还在大刀长矛。
2)关于中级水平者
纸上得来终觉浅,绝知此事要躬行。关于一个具有必定根底的,想更进一步的中级水平的人来说,这个阶段最重要的便是增强着手实践的才能。
仍是说《天龙八部》里边的一个人物——口述武功、拍案叫绝的王语嫣。王语嫣的脑袋里都是武功秘籍,但问题是她历来都没练过一招一式。成果是,然并卵。所以光说不练必定不灵啊。特别是,假如你将来想从事这个职业,成果一点代码都不会写,那几乎是不行幻想的。学习阶段,最常被用来进行算法开发的东西是Matlab和OpenCV。你能够把这两个东西都了解为一个适当完善的库。当然,在工业中C++用得更多,所以Matlab的运用仍是很有限的。前面咱们讲到,图画处理研讨内容其实包含:图画的获取和编解码,但运用Matlab和OpenCV就会掩盖这部分内容的细节。你当然永久不会知道,JPEG文件到底是怎么被解码的。
假如你的运用永久都不会触及这些论题,那么你一向用Matlab和OpenCV当然无所谓。例如你的研讨范畴是SIFT、SURF这种特征匹配,能够不用理睬编解码方面的内容。可是假如你的研讨论题是降噪或许紧缩,或许你就绕不开这些内容。最开端学的时分,假如能把这部分内容也自己写写,或许会加深你的了解。今后做高档运用开发时,再调用那些库。所以详细用什么,要不要自己写,是要视你所在的阶段和自己的实际情况而定的。以我个人的经历,在我自学的时分,我就着手写了Magic House,我觉得这个进程为我奠定了一个十分夯实的根底,关于我后续的深入研讨很有协助。
下面这个文中,我给出了一些这方面的资源,代码多多,很值得参阅学习:图画处理与机器视觉网络资源搜罗http://blog.csdn.NET/baimafujinji/article/details/32332079
3)关于高档进阶者
到了这个程度的读者,编程完成之类的基本功应该不在话下。可是要往深,往高去学习、研讨和开发图画处理运用,你最需求的内容就变成了数学。这个是拦在许多处于这个阶段的人面前的一大难题。假如你的专业是运用数学,当然你不会感觉有问题。但假如是其他专业布景的人就会越发感觉苦楚。
假如你的图画处理是不触及机器学习内容的,例如用Poisson方程来做图画交融,那你就要有PDE数值解方面的常识;假如你要研讨KAZE特征,你就必需求知道AOS方面的内容。假如你研讨TV降噪,你又要知道泛函剖析中的BV空间内容……这些词你或许许多都没听过。总的来说,这块需求的内容包含:复变函数、泛函剖析、偏微分方程、变分法、数学物理办法……
假如你要进入机器视觉办法的内容,一些机器学习和数据发掘办法的内容就不行或缺。而这部分内容相同需求很强壮的数学根底,例如最大似然办法、梯度下降法、欧拉-拉格朗日方程、最小二乘估量、凸函数与詹森不等式……
当然,走到这一步,你也现已面貌一新,从小白到大神啦!路漫漫其修远兮,吾将上下而求索。