圖像處理與機(jī)器視覺
第一章 圖像增強(qiáng)的研究和發(fā)展現(xiàn)狀
圖像在采集過程中不可避免的會受到傳感器靈敏度、噪聲干擾以及模數(shù)轉(zhuǎn)換時量化問題等各種因素的影響,而導(dǎo)致圖像無法達(dá)到令人滿意的視覺效果,為了實現(xiàn)人眼觀察或者機(jī)器自動分析、識別的目的,對原始圖像所做的改善行為,就被稱作圖像增強(qiáng)。圖像增強(qiáng)包涵了非常廣泛的內(nèi)容,凡是改變原始圖像的結(jié)構(gòu)關(guān)系以取得更好的判斷和應(yīng)用效果的所有處理手段,都可以歸結(jié)為圖像增強(qiáng)處理,其目的就是為了改善圖像的質(zhì)量和視覺效果,或?qū)D像轉(zhuǎn)換成更適合于人眼觀察或機(jī)器分析、識別的形式,以便從中獲取更加有用的信息。
常用的圖像增強(qiáng)處理方式包括灰度變換、直方圖修正、圖像銳化、噪聲去除、幾何畸變校正、頻域濾波和彩色增強(qiáng)等。由于圖像增強(qiáng)與感興趣的物體特性、觀察者的習(xí)慣和處理目的密切相關(guān),盡管處理方式多種多樣,但它帶有很強(qiáng)的針對性。因此,圖像增強(qiáng)算法的應(yīng)用也是有針對性的,并不存在一種通用的、適應(yīng)各種應(yīng)用場合的增強(qiáng)算法。于是,為了使各種不同特定目的的圖像質(zhì)量得到改善,產(chǎn)生了多種圖像增強(qiáng)算法。這些算法根據(jù)處理空間的不同分為基于空間域的圖像增強(qiáng)算法和基于變換域的圖像增強(qiáng)算法。基于空間域的圖像增強(qiáng)算法又可以分為空域的變換增強(qiáng)算法、空域的濾波增強(qiáng)算法以及空域的彩色增強(qiáng)算法;基于變換域的圖像增強(qiáng)算法可以分為頻域的平滑增強(qiáng)算法、頻域的銳化增強(qiáng)算法以及頻域的彩色增強(qiáng)算法。
盡管各種圖像增強(qiáng)技術(shù)已取得了長足的發(fā)展,形成了許多成熟、經(jīng)典的處理方法,但新的增強(qiáng)技術(shù)依然在日新月異地發(fā)展完善,不斷推陳出新,其中尤其以不引起圖像模糊的去噪聲方法(如空域的局部統(tǒng)計法)和新的頻域濾波器增強(qiáng)技術(shù)(如小波變換,K-L變換等)最為引人矚目。
第二章 圖像增強(qiáng)的基本方法
一般而言,圖像增強(qiáng)是根據(jù)具體的應(yīng)用場景和圖像的模糊情況而采用特定的增強(qiáng)方法來突出圖像中的某些信息,削弱或消除無關(guān)信息,以達(dá)到強(qiáng)調(diào)圖像的整體或局部特征的目的。常用的圖像增強(qiáng)方法有灰度變換、直方圖修正、噪聲清除、圖像銳化、頻域濾波、同態(tài)濾波及彩色增強(qiáng)等。圖像增強(qiáng)的方法主要分為兩類:空域增強(qiáng)法和頻域增強(qiáng)法??沼蛟鰪?qiáng)法直接針對圖像中的像素,對圖像的灰度進(jìn)行處理;頻域增強(qiáng)法是基于圖像的Fourier變換式對圖像頻譜進(jìn)行改善,增強(qiáng)或抑制所希望的頻譜。
2.1灰度變換
灰度變換增強(qiáng)的原理如下:設(shè)r和s分別代表原始圖像和增強(qiáng)圖像的灰度,T(?)為映射函數(shù),通過映射函數(shù)T(?),將原始圖像f(x,y)中的灰度r映射成增強(qiáng)圖像g(x,y)中的灰度s,使得圖像灰度的動態(tài)范圍得以擴(kuò)展或壓縮,用以改善對比度?;叶茸儞Q是圖像對比度增強(qiáng)的一個有效手段,它與圖像的像素位置及被處理像素的鄰域灰度無關(guān)?;叶茸儞Q處理的關(guān)鍵在于設(shè)計一個合適的映射函數(shù)(曲線)。映射函數(shù)的設(shè)計有兩類方法,一類是根據(jù)圖像特點和處理工作需求,人為設(shè)計映射函數(shù),試探其處理效果;另一類設(shè)計方法是從改變圖像整體的灰度分布出發(fā),設(shè)計一種映射函數(shù),使變換后圖像灰度直方圖達(dá)到或接近預(yù)定的形狀。映射變換的類型取決于所需增強(qiáng)特性的選擇。常用的灰度變換有如下幾種:線性變換,分段線性變換和非線性變換。
2.2直方圖修正
直方圖修正是以概率論為基礎(chǔ)演繹出來的對圖像灰度進(jìn)行變換的又一種對比度增強(qiáng)處理。圖像f(x,y)中的某一灰度fi的像素數(shù)目ni所占總像素數(shù)目N的份額ni/N,稱為該灰度像素在該圖中出現(xiàn)的概率密度pi(fi). 常用的直方圖修正有如下幾種:直方圖均衡化和直方圖規(guī)定化。
2.3噪聲清除
圖像在處理過程中可能會受到多種噪聲的干擾,如傳感器噪聲、相片顆粒噪聲和信道傳輸誤差噪聲等。通常情況下,這些噪聲在圖像上表現(xiàn)為孤立像素的離散變化,在空間上是不相關(guān)的。去除噪聲的方法很多,從大的方面來說有統(tǒng)計濾波、頻域濾波和空域處理等,但它們各有千秋。前二者運(yùn)算量大,比較復(fù)雜,精度較高;后者運(yùn)算簡便,但精度較低。目前比較經(jīng)典的去噪聲方法有鄰域平均法、空域低通濾波和中值濾波等,但他們都或多或少給圖像帶來模糊。
2.3.1鄰域平均法
鄰域平均法的原理是,對于一幅給定圖像f(x,y),其像素大小為的N×N,取圍繞點(x,y)的預(yù)設(shè)鄰域內(nèi)的幾個像素點(不含點(x,y))的灰度平均值作為增強(qiáng)圖像中該點的灰度,然后依次對N×N個像素點做上述相似處理,由此構(gòu)成新的圖像g(x,y)。鄰域平均法雖然簡單易行,抑制噪聲的效果也較為明顯,但存在著邊緣模糊的效應(yīng)。隨著鄰域的增大,抑制噪聲效果和邊緣模糊效應(yīng)同時增加。為了減輕邊緣模糊效,可利用設(shè)定閾值的鄰域平均。
2.3.2空域低通濾波
在一幅圖像的灰度級中,邊緣和其他尖銳的跳躍(例如噪聲)對Fourier變換的高頻分量有很大的貢獻(xiàn)。因此,通過一個適當(dāng)?shù)牡屯V波器將一定范圍的高頻分量加以衰減,可以起到較好的去噪聲效果。設(shè)f(x,y)為帶有噪聲的原始圖像(大小N×N),g(x,y)為經(jīng)濾波后的輸出圖像(大小M×M),h(x,y)為濾波系統(tǒng)的脈沖響應(yīng)函數(shù)(大小L×L),則存在,
g(x,y)=f(x,y)*h(x,y)
式中,符號*代表卷積運(yùn)算符。
顯然,簡單形式的濾波器矩陣的卷積濾波也會給圖像帶來一定的模糊。
2.3.3中值濾波
中值濾波是一種優(yōu)于鄰域平均的去噪聲方法,它不僅能像鄰域平均一樣可以抑制噪聲,而且還可以使邊緣模糊效應(yīng)大大降低。二維窗口的形狀可以有方形、矩形和十字形等,但不管哪種形狀,隨窗口的增大有效信號的損失也將明顯增加。另外,隨著窗口的移動,一個像素要參與重復(fù)計算多次,處理時間變長,且窗口越大,處理時間愈長。因此窗口大小的選擇以能兼顧兩者為佳。
2.4圖像銳化
圖像銳化就是為了使圖像的邊緣更為鮮明,心理物理學(xué)實驗表明,邊緣加重的圖像比精確光度復(fù)制的圖像更令人滿意,更能讓人容易接受。圖像銳化即邊緣增強(qiáng)處理,可以有多種方法,如統(tǒng)計差值法、離散空間差分法及空域高通濾波等。在圖像增強(qiáng)的實際應(yīng)用中,往往是各種方法相結(jié)合,充分發(fā)揮自各優(yōu)勢組合運(yùn)用,這樣會產(chǎn)生更好的增強(qiáng)效果。
2.5頻域濾波增強(qiáng)
在實際應(yīng)用當(dāng)中,頻域濾波增強(qiáng)往往比空域濾波方法簡單??沼驗V波都是基于卷積運(yùn)算
g(x,y)=f(x,y)*h(x,y)
其中,f(x,y)為原始圖像函數(shù),h(x,y)為濾波器脈沖響應(yīng)函數(shù),視低通或高通濾波的需要而定,g(x,y)為空域濾波的輸出圖像。由卷積定理可知,上式的Fourier變換式為:
G(u,v)=F(u,v)?H(u,v)
式中,G(u,v)、F(u,v)和H(u,v)分別為g(x,y),f(x,y)和h(x,y)的Fourier變換,即相應(yīng)的頻譜。該式為頻域濾波的基本運(yùn)算式,H(u,v)稱為濾波系統(tǒng)的傳遞函數(shù)。根據(jù)具體的增強(qiáng)要求設(shè)計適當(dāng)?shù)腍(u,v),再與F(u,v)作乘法運(yùn)算,可獲得頻譜改善的G(u,v),從而實現(xiàn)低通、高通和帶通等不同形式的濾波,然后再求G(u,v)的逆Fourier變換,便可獲得頻域濾波增強(qiáng)的圖像g(x,y)。因此,頻域濾波的關(guān)鍵H(u,v)的設(shè)計。
眾所周知,圖像的頻譜由幅值和相位兩部分構(gòu)成。根據(jù)圖像的頻譜分析可知,圖像頻譜的相位也是非常重要的。對相位參數(shù)的修改將會導(dǎo)致結(jié)果圖像很大的變化,與原始圖像相比,有時候甚至可能會面目全非。但是如果設(shè)計一個不帶相位的實常數(shù)H(u,v)(零相位濾波器),則可在增強(qiáng)運(yùn)算中發(fā)揮重要作用。凡是要保留的頻率分量,令H(u,v)=k(k為常數(shù)且k≥1);凡是要抑制或衰減的頻率分量,令H(u,v)=ω(ω為常數(shù)且0≤ω≤1)。
2.5.1頻域低通濾波
低通濾波器的功能是讓低頻率通過而濾掉或衰減高頻,其作用是過濾掉包含在高頻中的噪聲。所以低通濾波的效果是圖像的去噪聲平滑增強(qiáng),但同時也抑制了圖像的邊界,造成圖像不同程度上的模糊。應(yīng)當(dāng)指出的是,對于理想低通濾波器,其截至頻率D0的大小決定了濾波后所保存的能量的多少。D0越小,通過的能量越少,平滑所帶來的模糊越嚴(yán)重。合理的選取D0是低通濾波平滑效果的關(guān)鍵。
2.5.2頻域高通濾波
衰減或抑制低頻分量,讓高頻分量通過稱為高通濾波,其作用是使圖像得到銳化處理,突出圖像的邊界。經(jīng)理想高頻濾波后的圖像把信息豐富的低頻去掉了,丟失了許多必要的信息。一般情況下,高通濾波對噪聲沒有任何抑制作用,若簡單的使用高通濾波,圖像質(zhì)量可能由于噪聲嚴(yán)重而難以達(dá)到滿意的改善效果。為了既加強(qiáng)圖像的細(xì)節(jié)又抑制噪聲,可采用高頻加強(qiáng)濾波。這種濾波器實際上是由一個高通濾波器和一個全通濾波器構(gòu)成的,這樣便能在高通濾波的基礎(chǔ)上保留低頻信息。
2.6同態(tài)濾波
一幅圖像f(x,y)不僅可以用像素陣列來表征,而且還可以用它的照明分量和反射分量來表示,其數(shù)學(xué)模型為
f(x,y)=i(x,y)*r(x,y)
2.7彩色增強(qiáng)
彩色增強(qiáng)處理一般分為偽彩色(Pseudo-color)增強(qiáng)處理和假彩色(False color)增強(qiáng)處理。
2.7.1偽彩色增強(qiáng)
在記錄和顯示圖像時,根據(jù)黑白圖像各像素灰度大小,按一定的規(guī)則賦給它們不同的彩色,就將黑白圖像變成了彩色圖像,這種由灰度到彩色的映射稱為偽彩色處理。其目的是利用人眼對彩色的敏感性,增強(qiáng)觀測者對目標(biāo)物的檢測性,提高人對圖像的分辨能力。
這種映射實際上是輸入和輸出圖像對應(yīng)像素間的一對一映射變換,不涉及像素空間位置的改變。變換后所獲得的偽彩色圖像的顏色與原始物體的顏色不存在一致關(guān)系。由色度學(xué)原理可知,各種彩色均可由紅、綠、藍(lán)這三種基色按適當(dāng)?shù)谋壤铣?。偽彩色處理就是使圖像灰度映射到三維色度空間,用三基色的某種合成色彩來表示某一灰度。
為此,對原始圖像f(x,y)的像素,按某一給定的函數(shù)逐點進(jìn)行三個獨立的映射變換,得到相應(yīng)的三基色分量R(x,y)、G(x,y)、B(x,y)(分別表示紅、綠、藍(lán)分量)這樣就完成了灰度到彩色的映射變換。
2.7.2假彩色增強(qiáng)
假彩色增強(qiáng)處理是從彩色到彩色的映射,是將一幅真實自然的彩色圖像或遙感多光譜圖像逐點映射到三基色所確定的三維色度空間,然后加以合成形成新的色彩,使目標(biāo)物體在重新顯示后呈現(xiàn)出不同于原始的自然本色。
通過假彩色處理可以達(dá)到如下的增強(qiáng)效果:
?。?/span>1)增強(qiáng)圖像比原始圖像的自然色彩更加引人注目。
(2)根據(jù)人眼的生理特點,可將感興趣而又不易分辨的細(xì)節(jié)賦上人眼較為敏感的顏色。如人眼對綠色亮度的響應(yīng)最為敏捷,對藍(lán)色的對比度響應(yīng)最為敏感,因此可把目標(biāo)物體的細(xì)小部分變成綠色,把細(xì)節(jié)較豐富的部分賦上深淺不一的藍(lán)色。
(3)將多光譜圖像合成彩色圖像,不僅看起來自然、逼真,而且可從合成圖像中獲得各波段的綜合信息。
2.8本章小結(jié)
對于幾種常用的圖像增強(qiáng)處理方法:灰度變換、直方圖修正、噪聲清除、圖像銳化、頻域濾波、同態(tài)濾波及彩色增強(qiáng),本章做了簡要地介紹,并闡明了各自的增強(qiáng)原理。由于對圖像質(zhì)量的要求越來越高,單一的增強(qiáng)處理往往難以達(dá)到令人滿意的效果。因此,在圖像的實際增強(qiáng)處理中,常常是幾種方法組合運(yùn)用,各取所長以達(dá)到最佳的增強(qiáng)效果。
第三章 基于模糊集理論的圖像增強(qiáng)算法
模糊集理論能夠在圖像處理領(lǐng)域找到自己的應(yīng)用場合和對像,并表現(xiàn)出優(yōu)于傳統(tǒng)方法的處理效果,歸根結(jié)底其原因主要在于:圖像所具有的不確定性往往呈現(xiàn)出模糊性。自八十年代初人們開始對基于模糊理論的圖像增強(qiáng)研究以來,它在圖像的邊緣增強(qiáng)及檢測方面取得了顯著的效果,如Pal和King提出的模糊邊緣算法就能有效的將物體從背景中分離出來,并在模式識別和醫(yī)學(xué)圖像處理中獲得了廣泛的應(yīng)用。
3.1模糊集理論基礎(chǔ)
1965年著名控制論學(xué)者L.A.Zadeh首次提出了一種完全不同于傳統(tǒng)數(shù)學(xué)控制理論的模糊集合論,從此,模糊理論便得到了迅速的發(fā)展并表現(xiàn)出強(qiáng)勁的生命力和令人鼓舞的應(yīng)用前景。模糊理論之所以能在信息時代獲得如此迅速的發(fā)展,其主要原因在于它提供了一種新的富有魅力的數(shù)學(xué)工具與手段,并表現(xiàn)出如下諸多優(yōu)點:
其一,模糊理論給出了一套表現(xiàn)自然語義的理論和方法,使自然語言能夠轉(zhuǎn)化成機(jī)器可以“理解”和“接受”的東西,提高了機(jī)器的靈活性。
其二,模糊理論給出了模糊邏輯和近似推理的理論和方法,用簡潔的軟、硬件可以使機(jī)器更聰明,智能化程度更高。
其三,模糊理論比一般數(shù)學(xué)理論應(yīng)用面更廣,除了在科學(xué)技術(shù)和經(jīng)濟(jì)發(fā)展的各種應(yīng)用領(lǐng)域中,如氣像預(yù)報、醫(yī)療診斷、人工智能、模式識別、自動控制、信息處理等,在農(nóng)業(yè)、林業(yè)、地質(zhì)、地震、測繪、心理、冶金、采礦和管理科學(xué)等方面也取得了可喜的成果。
概率論與統(tǒng)計學(xué)的產(chǎn)生,將數(shù)學(xué)的應(yīng)用范圍擴(kuò)大到了隨機(jī)現(xiàn)像領(lǐng)域中,而模糊理論的產(chǎn)生則把數(shù)學(xué)的應(yīng)用范圍擴(kuò)大到了模糊現(xiàn)像領(lǐng)域中。
3.2模糊特征隸屬函數(shù)
若以像素的相對灰度等級作為感興趣的模糊特征,模糊隸屬函數(shù)的定義方式很多,但在實際問題中,最常用的隸屬函數(shù)形式是所謂標(biāo)準(zhǔn)的S型函數(shù)和π型函數(shù)。其中,S型函數(shù)是一種從0到1的單調(diào)增長函數(shù);π型函數(shù)是指“中間高兩邊低”的函數(shù),它也可以用S型函數(shù)來定義。從圖像處理的角度來看,轉(zhuǎn)化成模糊域的灰度值是從低到高的連續(xù)過程,而且S型函數(shù)符合邊緣的過渡變化過程,所以以S型函數(shù)作為模糊函數(shù)的基本變換形式比較合理。
3.3本章小結(jié)
本章在簡要、系統(tǒng)地介紹了模糊理論的基礎(chǔ)上,以圖像模糊增強(qiáng)的邊緣提取為例對幾幅圖像實施了模糊增強(qiáng),效果顯著,其算法可歸納成如下三部分:
(1)首先,對原始圖像進(jìn)行模糊特征提取,得到圖像的模糊特征平面。
(2)然后,在模糊特征平面上對模糊特征進(jìn)行增強(qiáng)變換,求得增強(qiáng)的模糊特征。
?。?/span>3)最后,在新的模糊特征平面上進(jìn)行逆變換,得出相應(yīng)的增強(qiáng)圖像。在模糊增強(qiáng)處理過程中,合理選擇模糊參數(shù)是保證增強(qiáng)效果的一個重要環(huán)節(jié)。
第四章 基于小波變換的圖像增強(qiáng)算法
小波變換因其所具有良好的時頻局部化能力和多分辨率分析能力,使其在數(shù)字圖像處理的應(yīng)用中占有舉足輕重的地位。目前,小波變換已經(jīng)廣泛應(yīng)用于圖像紋理分析、圖像編碼、計算機(jī)視覺、模式識別、語音識別等科技領(lǐng)域。
4.1小波變換理論基礎(chǔ)
為了分析和處理非平穩(wěn)信號,人們對Fourier分析進(jìn)行推廣和變革,提出并發(fā)展了一些新的信號分析理論和變換技術(shù)。這些新技術(shù)是專門面針對圖像壓縮、邊緣檢測、特征提取及紋理分析的,它包括多分辨率分析、時頻域分析、金字塔算法和小波變換等?!?/span>
小波變換最早是由法國地球物理學(xué)家Morlet于二十世紀(jì)八十年代初在分析地球物理信號時,作為一種信號分析的數(shù)學(xué)工具而被提出來的,到了八十年代中后期獲得了較快發(fā)展,目前已成為一個重要的數(shù)學(xué)分支。小波分析對傳統(tǒng)傅立葉分析做出了里程碑式的進(jìn)展,是調(diào)和這一數(shù)學(xué)領(lǐng)域半個世紀(jì)以來的工作結(jié)晶,是目前在許多學(xué)科和工程技術(shù)中的一個非常廣泛的課題。它可以作為表示函數(shù)的一種新基底或作為時頻分析的一種新技術(shù),是多方面有力的分析工具,已經(jīng)廣泛的應(yīng)用于信號和圖像處理、地質(zhì)勘探、語音識別與合成、雷達(dá)、CT成像、天體識別、機(jī)器視覺、機(jī)械故障診斷與監(jiān)控、分形以及數(shù)字電視等領(lǐng)域。
小波分析通過伸縮、平移運(yùn)算,對信號(函數(shù))逐步進(jìn)行多尺度細(xì)化,最終達(dá)到高頻處時間細(xì)分,低頻處頻率細(xì)分。它能自動適應(yīng)時頻信號分析的要求,從而可聚焦到信號的任意細(xì)節(jié),被譽(yù)為“數(shù)學(xué)顯微鏡”。此外,它還成功解決了Fourier變換不能解決的許多難題,成為繼Fourier變換以來在科學(xué)方法上的一個重大突破。
4.2多分辨率分析
1988年,Mallat在構(gòu)造正交小波時,提出了多分辨率分析的概念。多分辨率分析(Multi-resolution Analysis)也叫多尺度分析(Multi-scale Analysis)或多分辨率逼近(Multi-resolution Approximation)。這一概念的提出是小波分析理論的一大突破,它揭示了函數(shù)的自相似性以及小波分析與分形幾何(Fractal Geometry)的內(nèi)在聯(lián)系。它從空間的概念上形像地說明了小波的多分辨率特性,不僅把以前的各種正交小波基的構(gòu)造方法巧妙地統(tǒng)一起來,而且還給出了構(gòu)造其他小波基的方法。
多分辨率表示法為圖像信息的解釋提供了一種簡單的理論框架。對于多分辨率分析的理解,始終應(yīng)把握一個要點:分解的最終目的是力求構(gòu)造一個在頻率上高度逼近L2 (R)空間的正交小波基(或正交小波包基),這些頻率分辨率不同的正交小波基相當(dāng)于帶寬各異的帶通濾波器。另外,多分辨率分析只對低頻空間作進(jìn)一步分解,使頻率的分辨率變得越來越高。多分辨率分析只是對低頻部分進(jìn)行逐步分解,而高頻部分則不予考慮。
4.3基于小波變換的圖像增強(qiáng)原理
小波變換的基本理念是用一族函數(shù)去表示或逼近某一信號。這一族函數(shù)稱為小波函數(shù)系,它是通過一小波母函數(shù)的伸縮和平移產(chǎn)生其“子波”來構(gòu)成的,并用其變換系數(shù)描述原來的信號??上瘸浞掷眯〔ǚ纸?,將原始圖像中高頻分量和低頻分量進(jìn)行不同程度的分離,然后采用不同的方法來增強(qiáng)不同頻率范圍內(nèi)圖像的細(xì)節(jié)分量,突出不同尺度的細(xì)節(jié),從而達(dá)到改善圖像的視覺效果。在實際應(yīng)用中,可以根據(jù)噪聲水平和感興趣的細(xì)節(jié)所處的尺度,選用不同的閾值和增強(qiáng)系數(shù)對分解后的圖像進(jìn)行重構(gòu)。
4.4小波基的選擇
任何基于小波變換的處理方法都會涉及到小波基的合理選取問題。小波基的選取原則大多是盡可能用較少的非零小波系數(shù)去有效逼近某一特定的函數(shù)。故小波的設(shè)計必須加以優(yōu)化以產(chǎn)生更多的接近零的小波系數(shù)。與圖像壓縮和降噪中小波基的選取不同,圖像增強(qiáng)小波基的選取需要滿足以下兩條性質(zhì)。
?。?/span>1)平移不變性,避免產(chǎn)生假像。在某些圖像處理如模式識別中,構(gòu)造平移不變的信號表示是非常重要的。當(dāng)模式被平移后,它的數(shù)值表示算子應(yīng)當(dāng)是被平移,而不是被改變。事實上,如果它的表示依賴于其位置,那么模式搜索將特別困難。連續(xù)小波變換和窗口傅里葉變換可提供平移不變表示,但對平移參數(shù)均勻采樣將破壞這種平移不變性。離散小波變換不具備對信號的平移不變性,原始信號和在時間上經(jīng)過一定平移后的信號分別經(jīng)過離散小波變換后所得到的分解系數(shù)將會發(fā)生很大的變化。正如連續(xù)小波變換和二進(jìn)小波變換一樣,為了確保小波變換的平移不變性,就必須在變換系數(shù)中引入一定的冗余。冗余小波變換是目前增強(qiáng)算法中使用最多的小波變換。
?。?/span>2)避免邊界效應(yīng)。選擇冗余雙正交小波,它具有移不變特性,且能夠避免假像的出現(xiàn);同時可利用折疊的方法滿足對稱特性,以解決邊界上產(chǎn)生較大的小波系數(shù)的問題。
4.5基于小波變換的圖像增強(qiáng)算法
為了同時增強(qiáng)圖像的全局特征,提出了基于小波變換的多尺度增強(qiáng)算法。多尺度表示按尺度 s和方向k將圖像的頻譜分為低通子帶圖像和一系列帶通圖像,而不同頻帶的空間和頻率分辨率正比于1s和s。通過選擇合適的尺度s,可以在空間域更好的放大和分析圖像細(xì)節(jié)。
Laine等利用上述增強(qiáng)方法,對小波系數(shù)采用線性或非線性映射函數(shù)來增強(qiáng)乳腺X射線圖像,達(dá)到了改善對比度,增強(qiáng)圖像細(xì)節(jié)的目的。Lu和Helly等[51]則利用Mallat的多尺度邊緣表征來突出增強(qiáng)醫(yī)學(xué)圖像的邊緣信息,同時抑制了噪聲。Brown更進(jìn)一步研究了一般小波變換情況下如何自適應(yīng)的選擇映射函數(shù)用以抑制噪聲。這些算法歸納起來分為以下四種:
?。?/span>1)小波變換高頻增強(qiáng)法,這是一種補(bǔ)償圖像輪廓的處理方法。因為圖像的輪廓是灰度陡然變化的部分,包含著豐富的空間高頻分量。把高頻分量相對突出,顯然可使圖像輪廓加強(qiáng),看起來比較清晰。采用這種方法后,由于相對增強(qiáng)了高頻成分或削弱了低頻成分,因而所得圖像往往偏亮或偏暗,對比度差。所以常常要在反變換后再進(jìn)行對比度增強(qiáng)處理,這樣才能得到更好的增強(qiáng)效果。
?。?/span>2)小波變換的反銳化掩模法。相對增強(qiáng)高頻成分的方法,在空間域有一種稱之為反銳化掩模的技術(shù),它在攝影技術(shù)中廣為采用,以增強(qiáng)圖像的輪廓。光學(xué)上的操作方法是將聚焦的正像和散焦的負(fù)像在底板上疊加。散焦的負(fù)像就好比“模糊”掩模,它與“銳化”正好相反,因此被命名為反銳化掩模法。它和傳統(tǒng)的方法相比有著明顯的優(yōu)越性。首先,小波變換使原圖中不同分辨率的細(xì)節(jié)特征隨尺度的不同而分離開來,避免了不斷調(diào)整濾波器窗口大小來選擇增強(qiáng)效果的繁瑣工作;其次,由于是對不同尺度下的小波分量分別進(jìn)行了增強(qiáng),原圖像中不論較粗還是較細(xì)的輪廓都能夠同時得到加強(qiáng)。
(3)小波變換的自適應(yīng)濾波,這是一種圖像平滑算法。它是利用小波分解后相鄰尺間小波系數(shù)的相關(guān)性來區(qū)分邊緣和噪聲,在濾除噪聲的同時可以很好地保護(hù)圖像邊緣,并且?guī)缀醪划a(chǎn)生“粘連”、“振鈴”等負(fù)效應(yīng)。
(4)方向性濾波。由于小波分解后產(chǎn)生的小波分量具有明顯的方向性,利用傳統(tǒng)的中值濾波思想,可獲得新的去噪算法。這種方法不僅克服了普通中值濾波存在的不足,而且能夠有效地抑制噪聲,同時還能夠保留絕大部分邊緣信息,特別適宜以平滑線條為主要結(jié)構(gòu)的圖像。
4.7本章小結(jié)
本章在簡要地介紹了小波變換理論和多分辨率分析的基礎(chǔ)上,著重闡述了基于小波變換圖像增強(qiáng)的原理及其增強(qiáng)算法,并以小波變換的反銳化掩模算法為例,對一幅乳腺X射線照片實施了增強(qiáng)處理,其增強(qiáng)效果顯著。由于小波變換具有良好的時域和頻域局部化特性,以及能與多尺度表示相結(jié)合,使得基于它的圖像增強(qiáng)非常適合人眼對圖像的感知特性,非常適合人們對圖像各個尺度(分辨率)下細(xì)節(jié)的分析,其增強(qiáng)效果一般要優(yōu)于傳統(tǒng)的圖像增強(qiáng)算法。
第五章 基于神經(jīng)網(wǎng)絡(luò)的圖像增強(qiáng)算法
在數(shù)字圖像處理中,由于圖像信息本身的復(fù)雜性和它們之間存在較強(qiáng)的相關(guān)性,在處理過程中的各個不同層次上可能出現(xiàn)不完整性和不精確性、非結(jié)構(gòu)化問題以及建模困難等,將智能信息處理的方法應(yīng)用于圖像的處理和理解,在一些場合具有比傳統(tǒng)的計算方法更好的效果。近年來,模糊集理論、進(jìn)化計算、人工神經(jīng)網(wǎng)絡(luò)以及它們相互結(jié)合的方法在圖像處理領(lǐng)域得到了廣泛的應(yīng)用。
5.1神經(jīng)網(wǎng)絡(luò)與圖像處理
隨著科學(xué)技術(shù),特別是信息技術(shù)的發(fā)展,圖像處理己經(jīng)成為科學(xué)研究不可缺少的強(qiáng)有力工具,傳統(tǒng)的圖像處理方法已無法滿足日益增長的應(yīng)用需要。于是人們開始探索各種新的更有效的方法,在此過程中,將人工神經(jīng)網(wǎng)絡(luò)應(yīng)用于圖像處理便脫穎而出。最初,人工神經(jīng)網(wǎng)絡(luò)只是作為模式識別分類器和聚類技術(shù)在圖像處理領(lǐng)域中得到應(yīng)用。隨著研究的進(jìn)一步深入,神經(jīng)網(wǎng)絡(luò)的特點得到了充分的認(rèn)識,使它在圖像處理的各個領(lǐng)域都得到了充分的應(yīng)用,如印刷體和手寫字符識別、語音識別、指紋,人臉識別、圖像增強(qiáng)、復(fù)原、壓縮等。
人工神經(jīng)網(wǎng)絡(luò)算法比起傳統(tǒng)的算法表現(xiàn)出了很大的優(yōu)越性,主要表現(xiàn)在:
1)高度并行處理能力,處理的速度遠(yuǎn)遠(yuǎn)高于傳統(tǒng)的序列處理算法。
2)具有自適應(yīng)功能,能夠根據(jù)學(xué)習(xí)提供的數(shù)據(jù)樣本找出并輸出數(shù)據(jù)的內(nèi)在聯(lián)系。
3)非線性映射功能,圖像處理很多問題是非線性問題,神經(jīng)網(wǎng)絡(luò)為處理這些問題提供了有用的工具。
4)具有泛化功能,能夠處理帶有噪聲或不完全的數(shù)據(jù)。
5.2神經(jīng)網(wǎng)絡(luò)的常用類型
人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,簡稱ANN)是由大規(guī)模神經(jīng)元互聯(lián)組成的高度非線性動力學(xué)系統(tǒng),是在對人腦組織結(jié)構(gòu)和運(yùn)行機(jī)制認(rèn)識、理解的基礎(chǔ)上模擬其結(jié)構(gòu)和智能行為的一種工程系統(tǒng)。在圖像處理中常用的神經(jīng)網(wǎng)絡(luò)模型有如下幾種:
1)BP(Back Propagation)網(wǎng)絡(luò)
BP神經(jīng)網(wǎng)絡(luò)是一種采用反向傳播算法的多層前饋網(wǎng)絡(luò),能夠逼近任意的非線性映射關(guān)系,而且有很好的泛化功能。在圖像處理領(lǐng)域中,作為一種非自適應(yīng)的神經(jīng)網(wǎng)絡(luò)而廣泛應(yīng)用。
2)Hopfield神經(jīng)網(wǎng)絡(luò)
Hopfield神經(jīng)網(wǎng)絡(luò)是一種動態(tài)網(wǎng)絡(luò),該網(wǎng)絡(luò)主要用于聯(lián)想記憶和優(yōu)化計算。如果我們能把某個有待研究解決的問題轉(zhuǎn)化成一個Hopfield計算能量函數(shù),且使這個計算能量函數(shù)的最小極值正好對應(yīng)于一定約束條件下的問題解答時,那么這個問題就可以利用Hopfield網(wǎng)絡(luò)來求解了。Hopfield網(wǎng)絡(luò)在圖像邊緣檢測、圖像模式匹配和識別等圖像處理方面應(yīng)用比較多。
3)自組織網(wǎng)絡(luò)
自組織網(wǎng)絡(luò)是一種非監(jiān)督型學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),這種網(wǎng)絡(luò)的學(xué)習(xí)目的是從一組數(shù)據(jù)中提取感興趣的特征或某種內(nèi)在的規(guī)律性(分布特征或按某種目的聚類)。自組織性神經(jīng)網(wǎng)絡(luò)根據(jù)學(xué)習(xí)算法的不同可以分為兩類:
?。?/span>a)主元分析神經(jīng)網(wǎng)絡(luò)(Principle Components Analysis Neural Network,簡稱PCA神經(jīng)網(wǎng)絡(luò)),這類網(wǎng)絡(luò)能夠抽取輸入矢量的主特征矢量,并使輸入數(shù)據(jù)和輸出數(shù)據(jù)在均方差意義下為最優(yōu),主要用于圖像壓縮和特征提取。
?。?/span>b)基于kohonen的自組織特征映射算法的神經(jīng)網(wǎng)絡(luò)(Self-organizing Feature Map Neural Network,簡稱SOFM神經(jīng)網(wǎng)絡(luò)),此類網(wǎng)絡(luò)對輸入的數(shù)據(jù)有“聚類”和特征抽取的功能,可起到數(shù)據(jù)壓縮的作用,同樣應(yīng)用于圖像壓縮和特征提取。
4)小波網(wǎng)絡(luò)
小波網(wǎng)絡(luò)起源于小波分解,是近年來在小波分析研究獲得突破的基礎(chǔ)上提出的一種前饋型網(wǎng)絡(luò)。小波網(wǎng)絡(luò)是將常規(guī)單隱層神經(jīng)網(wǎng)絡(luò)的隱節(jié)點函數(shù)由小波函數(shù)代替,相應(yīng)的輸入層到隱層的權(quán)值及隱層閾值分別由小波函數(shù)的尺度與平移參數(shù)所代替,它繼承了小波變換和神經(jīng)網(wǎng)絡(luò)兩者的優(yōu)點,具有良好的函數(shù)逼近能力和模式識別、分類功能。小波網(wǎng)絡(luò)作為一種新型的神經(jīng)網(wǎng)絡(luò)在圖像處理領(lǐng)域中得到了廣泛的應(yīng)用。
5)細(xì)胞神經(jīng)網(wǎng)絡(luò)
細(xì)胞神經(jīng)網(wǎng)絡(luò)是局部連接細(xì)胞空間排列的非線性動力學(xué)系統(tǒng),其中每個細(xì)胞都具有輸入、輸出及與動力學(xué)規(guī)則相關(guān)狀態(tài)的功能,具備很強(qiáng)的并行處理能力,并具有集成特性。自從被提出以后便得到了廣泛的研究,適用于圖像處理的各個領(lǐng)域。
6)模糊神經(jīng)網(wǎng)絡(luò)
模糊神經(jīng)網(wǎng)絡(luò)指的是用神經(jīng)網(wǎng)絡(luò)方法建立和實現(xiàn)的一個基于規(guī)則的模糊系統(tǒng)。它不僅可以表達(dá)和處理不確定性知識,而且能夠自動產(chǎn)生或調(diào)整規(guī)則。由于它具有神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),可實現(xiàn)并行高速推理,極大提高了系統(tǒng)建模和運(yùn)行效率,在圖像處理中有廣闊的應(yīng)用前景。
5.3基于神經(jīng)網(wǎng)絡(luò)的圖像增強(qiáng)
目前已經(jīng)提出了多種神經(jīng)網(wǎng)絡(luò)模型用于圖像去噪、增強(qiáng)、重建[81~85]。這些算法的基本原理是用非線性系統(tǒng)模型表示預(yù)處理的圖像,然后用神經(jīng)網(wǎng)絡(luò)算法求解其最優(yōu)解。由于神經(jīng)網(wǎng)絡(luò)能夠有效地適應(yīng)圖像處理的非線性本質(zhì),解決圖像增強(qiáng)的非線性模型,而且還不需要知道先驗知識,同時它的高度并行處理能力使得圖像增強(qiáng)的處理速度明顯加快,因此,神經(jīng)網(wǎng)絡(luò)在圖像增強(qiáng)上獲得了廣泛應(yīng)用。
神經(jīng)網(wǎng)絡(luò)算法比起傳統(tǒng)算法有很大的優(yōu)點,但也存在著一些不足,如圖像預(yù)處理階段的神經(jīng)網(wǎng)絡(luò)算法大部分是非自適應(yīng)的,而且這些算法是針對特定的圖像模型,當(dāng)原始圖像模型改變時,即使是最簡單的縮放和角度變換,網(wǎng)絡(luò)的權(quán)值也需要重新訓(xùn)練。盡管神經(jīng)網(wǎng)絡(luò)在圖像處理領(lǐng)域中已經(jīng)得到了廣泛應(yīng)用,但是還有很多問題需要解決。例如,如何選擇最優(yōu)的網(wǎng)絡(luò)結(jié)構(gòu),到現(xiàn)在為止仍沒有一個確定的標(biāo)準(zhǔn)來評定網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)劣。
5.4神經(jīng)網(wǎng)絡(luò)的應(yīng)用前景
5.4.1小波網(wǎng)絡(luò)的應(yīng)用前景
小波網(wǎng)絡(luò)是結(jié)合小波變換理論與人工神經(jīng)網(wǎng)絡(luò)的思想而構(gòu)造出的一種新型神經(jīng)網(wǎng)絡(luò)模型。它不僅具備小波變換良好的時頻局域化特性和神經(jīng)網(wǎng)絡(luò)的高度并行處理功能,而且以小波分解作為理論基礎(chǔ),從而能夠有效的根據(jù)訓(xùn)練樣本集確定網(wǎng)絡(luò)結(jié)構(gòu),彌補(bǔ)傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的一些不足。同時由于小波變換的多分辨率分析的特點,使小波變換在圖像處理領(lǐng)域應(yīng)用上的優(yōu)勢得以淋漓盡致地發(fā)揮。結(jié)合了小波變換和神經(jīng)網(wǎng)絡(luò)各自優(yōu)點的小波網(wǎng)絡(luò)在圖像處理領(lǐng)域中應(yīng)用前景看好,一片光明。
5.4.2模糊神經(jīng)網(wǎng)絡(luò)的應(yīng)用前景
模糊神經(jīng)網(wǎng)絡(luò)是神經(jīng)網(wǎng)絡(luò)和模糊技術(shù)的有機(jī)結(jié)合,可以有效的發(fā)揮各自的優(yōu)勢并彌補(bǔ)其不足。神經(jīng)網(wǎng)絡(luò)在學(xué)習(xí)和自動模式識別方面有很強(qiáng)的優(yōu)勢,與模糊技術(shù)的結(jié)合可以大大拓寬神經(jīng)網(wǎng)絡(luò)處理信息的范圍和能力,不僅能夠處理精確信息,而且可以處理模糊信息。在高層次的圖像處理,如圖像分割,圖像識別和圖像理解等方面應(yīng)用前景不可限量。
5.5本章小結(jié)
本章簡要的介紹了神經(jīng)網(wǎng)絡(luò)在圖像處理領(lǐng)域應(yīng)用上的優(yōu)勢及其常見類型。接著闡述了基于神經(jīng)網(wǎng)絡(luò)的圖像增強(qiáng),并進(jìn)一步分析了用于圖像處理的神經(jīng)網(wǎng)絡(luò)算法的優(yōu)缺點。最后,闡明了小波網(wǎng)絡(luò)和模糊神經(jīng)網(wǎng)絡(luò)在圖像處理領(lǐng)上的廣泛應(yīng)用前景。
第六章 總結(jié)與展望
圖像增強(qiáng)是對圖像的低層次處理,處于圖像處理的預(yù)處理階段。它是圖像處理的一個重要環(huán)節(jié),在整個圖像處理過程中起著承前啟后的重要作用,為后續(xù)處理階段做準(zhǔn)備,對圖像高層次處理的成敗至關(guān)重要。其目的就是為了改善圖像的質(zhì)量和視覺效果,或?qū)D像轉(zhuǎn)換成更適合于人眼觀察或機(jī)器分析識別的形式,以便從圖像中獲取更加有用的信息。
由于圖像增強(qiáng)與感興的趣物體特性、觀察者的習(xí)慣和處理目的密切相關(guān),帶有很強(qiáng)的針對性。因此,圖像增強(qiáng)算法的應(yīng)用也是有針對性的,盡管增強(qiáng)處理方法多種多樣,但并不存在一種通用的、適應(yīng)各種應(yīng)用場合的增強(qiáng)算法。
本文圍繞圖像增強(qiáng)算法而展開,在闡明圖像增強(qiáng)處理基本方法,如灰度變換、直方圖修正、圖像銳化、噪聲去除、頻域濾波增強(qiáng)和彩色增強(qiáng)的基礎(chǔ)上,就幾種有代表性的圖像增強(qiáng)算法進(jìn)行了研究、比較,分析了各自的優(yōu)缺點并指明了其最佳適用場景。
?