當前位置:學問君>學習教育>畢業論文>

基於顏色特徵的藏毯圖像檢索研究與實現

學問君 人氣:2.76W

摘要:針對國內外還沒有可供研究人員和公衆使用的藏毯類非物質文化遺產數字化資源平臺這一狀況,分析了在藏毯圖像中運用基於內容的圖像檢索系統技術的可行性。透過對藏毯圖像的顏色特徵分析,針對傳統HSV顏色空間量化的缺陷,使量化更爲有效,把HSV顏色空間量化成188維,實現了在基於JAVA的框架中計算顏色直方圖的方法,採用相似距離衡量直方圖的相似度。考慮時間消耗並透過查準率的比較,藏毯圖像檢索的查準率明顯提高。

基於顏色特徵的藏毯圖像檢索研究與實現

關鍵詞:藏毯;量化;特徵;圖像

引言

藏毯在藏族傳統藝術的基礎上,吸收、融合了漢族、國外宗教藝人的精華,並且形成了具有自己獨特的藏族藝術風格的工藝美術品,其圖案設計和色彩源於藏傳佛教文化,藝術價值極高,是珍貴的非物質文化遺產。隨着近年來非物質文化遺產保護工作的不斷深入,以及非物質文化遺產數字化、資訊化的科技進步,全國各地非物質文化遺產數據庫建設步伐不斷加快,在分析藏毯的紋理特徵、色彩分佈和形狀特徵的基礎上,即可以支援基於文字以及圖像屬性的查詢,又可以提取藏毯圖像的關鍵特徵值來實現基於內容的圖像檢索。本文在研究基於內容的圖像檢索方法的基礎上,經過改進,提出了一種針對藏毯圖像基於HSV顏色空間量化的圖像檢索實現方法,爲藏毯這一非物質文化遺產的保護和繼承提供了技術支撐平臺。

一、基於內容的圖像檢索方法

傳統的基於文字的圖像檢索技術,主要利用數據庫管理系統對圖像採用人工描述並進行管理和檢索,透過圖像的描述文字和用戶輸入的關鍵字進行比較,但由於人工標註效率低和自身的主觀偏差性,比較的結果不僅效果差,而且不能對圖像中所包含的顏色、紋理等不能用文字資訊標註的特徵進行檢索。基於內容的圖像檢索(Content-Based ImageRetrieval,CBIR)近年來已成爲提高圖像檢索的有效手段。基於CBIR技術的圖像檢索系統,採用相似性匹配算法計算關鍵圖像特徵與特徵庫中圖像特徵的相似度,然後按照相似度從大到小的順序將匹配圖像反饋給用戶。用戶可根據自己的滿意程度,選擇是否修改查詢條件,繼續查詢,以達到令人滿意的查詢。CBIR的實現依賴於兩個關鍵技術:圖像特徵提取和匹配,圖像特徵提取分爲低層視覺和語義內容,比較成熟的`檢索算法大部分是基於圖像的低層特徵,即利用圖像的顏色、紋理、形狀、空間關係特徵來檢索。在基於內容的圖像檢索中,顏色作爲圖像的重要視覺資訊已成爲圖像內容組成的基本要素,顏色特徵成爲在基於內容的圖像檢索中最早、最廣泛使用的視覺特徵,目前常用的顏色特徵包括顏色直方圖、顏色距、顏色聚合向量、顏色協方差矩陣等。紋理是物體表面的結構模式,反映了圖像中同質現象的視覺特徵,它體現了物體表面的具有緩慢變化或者週期性變化的表面結構組織排列屬性,其本質是刻畫像素的鄰域灰度空間分佈規律,典型的分析方法有:空間域紋理分析、頻率域紋理分析、空間/頻率域聯合紋理分析和基於分形模型的紋理分析方法。對於某些紋理和顏色資訊不夠豐富的圖像來說,基於顏色和紋理的方法就無法滿足檢索需要,這是可藉助於形狀特徵來描述,形狀是最難描述的圖像特徵,它不隨周圍環境,如顏色的變化而變化,是物體的穩定特徵。基於形狀特徵的圖像檢索主要是檢測或分割出目標輪廓,並針對其進行形狀特徵的提取或直接針對圖像尋找適當的矢量特徵,目前基於形狀特徵的圖像檢索主要有基於輪廓和基於區域的方法。空間關係指圖像中分割出來的多個目標之間相互的空間位置或相對方向關係,通常分爲兩類:相對空間位置資訊和絕對空間位置資訊。提取圖像空間關係特徵有兩種方法:一種方法是對圖像進行自動分割,根據劃分出的對象或顏色區域提取圖像特徵,並建立索引;另一種方法是簡單將圖像均勻地劃分爲若干規則區域後分別提取特徵,並建立索引。

二、顏色特徵

顏色是彩色圖像最底層、最直觀的物理特徵,是一種全局特徵,它描述了圖像或圖像區域所對應的景物的表面性質。作爲圖像最直觀而明顯的特徵,顏色特徵是基於像素點的特徵,所有屬於圖像或圖像區域的像素都有各自的貢獻。相對於其它的圖像特徵如紋理和形狀來講,顏色特徵非常穩定,不侷限於圖像的大小和方向,並且對於旋轉、平移、尺度變化,甚至各種變形都不敏感,表現出相當強的魯棒性,因此在基於內容的圖像檢索中發揮着重要的作用,這也使得顏色特徵成爲圖像檢索中應用最爲廣泛的底層視覺特徵。

2.1 顏色模型

顏色空間也稱彩色模型, 它的用途是在某些標準下用通常可接受的方式對彩色加以說明。本質上,彩色模型是座標系統和子空間的闡述。RGB色彩模式是工業界的一種顏色標準,在RGB模型中,RGB即是代表紅、綠、藍三個通道的顏色,透過對紅(R)、綠(G)、藍(B)三個顏色通道的變化以及它們相互之間的疊加來構成了所有顏色,是目前運用最廣的顏色系統之一。將這三種顏色劃分成256(0-255)個等級,這三原色光以不同的比例複合後,對人的眼睛可以形成與各種頻率的可見光等效的色覺。目前大部分的數字圖像都是用這種顏色空間表達的,然而,RGB空間結構並不符合人們對顏色相似性的主觀判斷,故而採用符合人們對顏色主觀認識的HSV模型。HSV(hue,saturation,value)模型對用戶來說是一種直觀的顏色模型,直接對應於人眼的視覺特徵,H表示色度、S表示飽和度、V表示亮度。HSV模型對應於一個圓錐形子集,包含RGB模型中的R、G、B三個面。色度H定義爲繞圓錐中心軸的角度,取值範圍爲0°~ 360°,從紅色開始按逆時針方向計算,紅色爲0°,綠色爲120°,藍色爲240°。飽和度S定義爲橫截面圓心到橫截面圓周點的距離,取值範圍爲0~1,S取值越大,表示色彩越純,取值越小,表示色彩越灰。亮度V定義爲圓錐橫截面的圓心到圓錐頂點的距離,表示色彩的明亮程度,取值範圍爲0~1。HSV對用戶來說是一種直觀的顏色模型。我們可以從一種純色彩開始,即指定色彩角H,並讓V=S=l,然後我們可以透過向其中加入黑色和白色來得到我們需要的顏色。

2.2 顏色特徵提取

常用的顏色特徵提取方法都建立在顏色直方圖的基礎上,計算顏色直方圖需要將顏色空間劃分成若干個小的顏色區間,每個小區間成爲直方圖的一個bin。然後統計圖像中各種顏色出現的頻數,在統計的過程中不關心顏色所處的空間位置,每一種顏色出現的頻數對應在相應的bin中,最終得到顏色直方圖。在顏色直方圖座標中,橫座標表示顏色柄的劃分值,縱座標表示每個bin區間中包含的圖像像素總和。一般來說,bin的數目越多,直方圖對顏色的分辨能力就越強,檢索效果也會越強。但有時bin數目越多的顏色空間劃分方法不一定能夠提高檢索效果,那是因爲在有的實際應用中,表示主要顏色的bin能夠表達圖像中大部分像素的顏色,所以,過多的顏色空間對主體顏色的貢獻較少,反而加大了計算負擔。除此之外,bin的數目增加後的顏色直方圖即增加了計算負擔,又不利於在大型圖像庫中建立索引,同時也帶來了數據庫中存儲空間的容量問題。直方圖均衡主要用於處理圖像由於過度曝光或者曝光不足造成的前景背景過量或過暗的情況,可以增強圖像的對比度,擴展圖像灰度範圍。本文結合藏毯圖像的顏色特點,在劃分合適數量的顏色空間基礎上實現顏色特徵的提取,最終提高圖像的檢索效果。

三、傳統的HSV顏色空間非均勻量化

HSV的顏色空間包含三個分量:H、S、V,對H、S、V三個分量進行非均勻分割。將色調H分成8份,飽和度S的範圍由圓心向圓周過渡,將其分爲三份,亮度V劃分爲Black,Gray,White三份,各自量化區間爲:

HSV顏色空間被劃分爲72個不同的空間區域,再將三個簡化後的顏色分量合成一維特徵向量值,就將整個HSV顏色空間量化爲72種顏色,減少了HSV顏色空間的有效顏色數量,簡化了顏色特徵提取的複雜度。透過量化公式I=9H+3S+V計算,最終得到72柄的一維顏色直方圖,I的取值範圍爲[0,71]。

四、一種改進的HSV顏色空間量化方法

4.1 HSV顏色空間188維量化

通常而言,在圖像的生成、傳輸、變換過程中,由於受到噪聲的干擾,會導致圖像輸出質量失真,影響對於圖像的識別,因此在圖像識別之前要對其進行預處理。藏毯圖案較鮮豔且複雜,考慮到藏毯圖像顏色特徵在整個空間中的分佈狀況,採用顏色量化中的聚類方法,用少量的代表色代表整個藏毯圖像。雖然採用比較大維的量化可以提高檢索效果,但考慮到計算量和存儲容量的限制問題,所以使用量化降維方法。爲了避免出現某些空間中像素數量非常稀疏的情況,使量化更爲有效,把HSV顏色空間量化成188維,根據圖像顏色在HSV空間188維中的相同或不同的分佈特點,均勻地選取若干個量化點,然後將其他量化點按顏色相似距離最短的原則組合爲一個聚類,從而達到既能聚類出代表圖像的顏色又能減少顏色數目的目的。具體處理方法爲: