一種利用圖像邊界信息和區(qū)域連通性的顯著對(duì)象檢測(cè)方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于圖像檢索和圖像識(shí)別技術(shù)領(lǐng)域,涉及一種顯著對(duì)象檢測(cè)方法,具體地 說(shuō),涉及一種利用圖像邊界信息和圖像背景連通性先驗(yàn)來(lái)進(jìn)行的一種新的顯著對(duì)象檢測(cè)方 法。
【背景技術(shù)】
[0002] 人類視覺(jué)系統(tǒng)具有的一個(gè)非凡的能力就是視覺(jué)注意,即能夠快速地從復(fù)雜場(chǎng)景中 選擇出重要的信息進(jìn)行進(jìn)一步地加工處理,而忽略其他信息。顯著對(duì)象檢測(cè)的目的是通過(guò) 建模生成一個(gè)顯著圖來(lái)預(yù)測(cè)人在觀看圖像時(shí)圖像中最能吸引人的注意的對(duì)象,顯著圖中的 每一個(gè)像素點(diǎn)的亮度代表該處的顯著值,顯著值越大,說(shuō)明此處受到人關(guān)注的可能性越大。 顯著對(duì)象檢測(cè)是計(jì)算機(jī)視覺(jué)中的一個(gè)基礎(chǔ)問(wèn)題,在圖像縮放、圖像壓縮、對(duì)象識(shí)別和圖像分 類等領(lǐng)域具有廣泛的應(yīng)用前景。
[0003] 當(dāng)前已有的顯著對(duì)象檢測(cè)方法:
[0004] 1、基于生物學(xué)假說(shuō)的顯著性檢測(cè)方法。該方法提取了顏色、亮度和方向特征,基于 生物視覺(jué)的枯抗特性,設(shè)計(jì)了中央-周邊差算子來(lái)計(jì)算特征的局部對(duì)比度,得到特征顯著 圖;然后依據(jù)特征整合理論,對(duì)特征顯著圖進(jìn)行等權(quán)線性融合。該方法傾向于將具有高局部 對(duì)比度的小對(duì)象進(jìn)行高亮,但是不能夠均勻地將整個(gè)顯著對(duì)象檢測(cè)出來(lái),對(duì)于背景中具有 高對(duì)比度的邊界區(qū)域會(huì)被錯(cuò)誤地檢測(cè)出來(lái)。
[0005] 2、基于全局對(duì)比度的顯著對(duì)象檢測(cè)方法。該類方法計(jì)算當(dāng)前像素/區(qū)域的特征與 圖像中的剩余像素/區(qū)域特征之間的對(duì)比度,對(duì)對(duì)比度進(jìn)行空間距離加權(quán)得到當(dāng)前像素/ 區(qū)域的顯著值。相比于受生物視覺(jué)啟發(fā)的基于局部對(duì)比度的顯著性計(jì)算方法,該類方法能 夠獲得更好的檢測(cè)精度,但是對(duì)于背景中具有高對(duì)比度的像素/區(qū)域,能夠被錯(cuò)誤地檢測(cè) 出來(lái)。
[0006] 3、基于認(rèn)知準(zhǔn)則的顯著對(duì)象檢測(cè)方法。該類方法根據(jù)格式培也理學(xué)的圖/底組織 規(guī)律,認(rèn)為對(duì)象區(qū)域的特征具有特異性,并且在空間上對(duì)象區(qū)域具有高緊致性,而背景區(qū)域 傾向于蔓延整個(gè)圖像區(qū)域。另外,對(duì)象區(qū)域由于與背景區(qū)域之間存在高對(duì)比度,因此從對(duì)象 區(qū)域到達(dá)圖像的邊界區(qū)域所花的代價(jià)大;而從背景區(qū)域具有連續(xù)性和同源性,因此,背景區(qū) 域到達(dá)圖像的邊界區(qū)域所花的代價(jià)小。通過(guò)計(jì)算超像素到圖像邊界的最短路徑,就可W計(jì) 算出超像素的顯著值。但是,該類方法會(huì)將背景中的局部高對(duì)比度的小尺度對(duì)象誤檢,而自 然場(chǎng)景圖像的背景中常常包含了具有高局部對(duì)比度的小尺度對(duì)象。
【發(fā)明內(nèi)容】
[0007] 針對(duì)現(xiàn)有技術(shù)的不足,本發(fā)明的目的在于提供一種基于圖像背景信息和區(qū)域多級(jí) 連通性的快速顯著對(duì)象檢測(cè)方法,該方法考慮了區(qū)域的不同連通性,并且學(xué)習(xí)了通過(guò)不同 連通性計(jì)算得到的顯著值的融合方式,該方法具有高的檢測(cè)準(zhǔn)確率,并且速度快,能夠有效 地抑制背景中具有高局部對(duì)比度的小尺度對(duì)象,并且檢測(cè)出的顯著對(duì)象區(qū)域具有均勻的顯 著值和清晰的邊緣。
[0008] 為了達(dá)到上述目的,本發(fā)明采用的技術(shù)方案如下:
[0009] -種利用圖像邊界信息和區(qū)域連通性的顯著對(duì)象檢測(cè)方法,包括W下幾個(gè)步驟:
[0010] 步驟1 ;輸入待檢測(cè)的圖像;
[0011] 步驟2 ;對(duì)待檢測(cè)的圖像進(jìn)行超像素分割,得到超像素集合V= {Vl,V2,...,V"},并 計(jì)算每個(gè)超像素Vi的平均L油顏色特征向量X i;
[001引 Vi表示第i個(gè)超像素,V iG V,M為超像素的個(gè)數(shù);
[0013] 將圖像分割成多個(gè)子區(qū)域,每一個(gè)子區(qū)域由表觀相似且空間相近的像素構(gòu)成,每 一個(gè)子區(qū)域叫做超像素;
[0014] 步驟3 ;根據(jù)超像素的空間拓?fù)浣Y(jié)構(gòu)及H個(gè)不同的鄰域范圍,對(duì)每個(gè)超像素創(chuàng)建 S個(gè)無(wú)向加權(quán)圖,包括一環(huán)鄰接圖、二環(huán)鄰接圖及立環(huán)鄰接圖,分別記為G\G嘴G 3;
[0015] 其中,H個(gè)無(wú)向加權(quán)圖中的節(jié)點(diǎn)為超像素,節(jié)點(diǎn)與相鄰節(jié)點(diǎn)之間形成的邊的權(quán)重 為兩相鄰節(jié)點(diǎn)對(duì)應(yīng)的兩平均L油顏色特征向量之間的距離;
[0016] 所述H個(gè)不同的鄰域是指一環(huán)鄰域、二環(huán)鄰域及H環(huán)鄰域;
[0017] 一環(huán)鄰域,超像素Vi的一環(huán)鄰域?yàn)榕c其在空間上相鄰接的超像素Vj.的集合,即 二的惦像素V為超像素V湘鄰};
[001引二環(huán)鄰域,超像素Vi的二環(huán)鄰域iVySi包括超像素Vi的一環(huán)鄰域Wi, 中的超像素W及超像素Vi的一環(huán)鄰域A^i中包含的超像素的一環(huán)鄰域,即
【主權(quán)項(xiàng)】
1. 一種利用圖像邊界信息和區(qū)域連通性的顯著對(duì)象檢測(cè)方法,其特征在于,包括以下 幾個(gè)步驟: 步驟1 :輸入待檢測(cè)的圖像; 步驟2 :對(duì)待檢測(cè)的圖像進(jìn)行超像素分割,得到超像素集合V = {Vl,V2, ...,vM},并計(jì)算 每個(gè)超像素 Vi的平均Lab顏色特征向量X i; Vi表示第i個(gè)超像素 ,V V,M為超像素的個(gè)數(shù); 步驟3 :根據(jù)超像素的空間拓?fù)浣Y(jié)構(gòu)及三個(gè)不同的鄰域范圍,對(duì)每個(gè)超像素創(chuàng)建三個(gè) 無(wú)向加權(quán)圖,包括一環(huán)鄰接圖、二環(huán)鄰接圖及三環(huán)鄰接圖,分別記為G\G2和G3; 其中,三個(gè)無(wú)向加權(quán)圖中的節(jié)點(diǎn)為超像素,節(jié)點(diǎn)與相鄰節(jié)點(diǎn)之間形成的邊的權(quán)重為兩 相鄰節(jié)點(diǎn)對(duì)應(yīng)的兩平均Lab顏色特征向量之間的距離; 所述三個(gè)不同的鄰域是指一環(huán)鄰域、二環(huán)鄰域及三環(huán)鄰域; 一環(huán)鄰域,超像素 Vi的一環(huán)鄰域?yàn)榕c其在空間上相鄰接的超像素'的集合,即 < =? I超像素 Vy與超像素巧相鄰L 二環(huán)鄰域,超像素 Vi的二環(huán)鄰域^2i包括超像素 Vi的一環(huán)鄰域中 的超像素以及超像素 Vi的一環(huán)鄰域中包含的超像素的一環(huán)鄰域,即
三環(huán)鄰域,超像素 Vi的三環(huán)鄰域包括超像素 Vi的二環(huán)鄰域^2i 中的超像素以及超像素 Vi的二環(huán)鄰域中的超像素的一環(huán)鄰域,即
步驟4:獲取超像素 V的顯著值S(V),S(V) =S1(V) M2(V) · S3(V),并將超像素的顯著 值賦值給超像素中的每一個(gè)像素,得到像素級(jí)的顯著圖,完成顯著圖的檢測(cè); S1(V)表示每個(gè)無(wú)向加權(quán)圖中每個(gè)節(jié)點(diǎn)到無(wú)向加權(quán)圖的邊界節(jié)點(diǎn)的累積最短路徑,以 節(jié)點(diǎn)的累積最短路徑S1(V)作為對(duì)應(yīng)的超像素的第1環(huán)的顯著值,1 = {1,2, 3};
其中,B表示虛擬背景節(jié)點(diǎn),邊界節(jié)點(diǎn)與虛擬背景節(jié)點(diǎn)B存在邊,邊的權(quán)重為O ; <?)(?+ι) 表示在1環(huán)鄰接圖中相鄰節(jié)點(diǎn)之間的邊的權(quán)值;E1表示1環(huán)鄰接圖中連接邊的集合;η表示 從起始節(jié)點(diǎn)到虛擬背景節(jié)點(diǎn)的路徑上包含的節(jié)點(diǎn)總數(shù)。
2. 根據(jù)權(quán)利要求1所述的一種利用圖像邊界信息和區(qū)域連通性的顯著對(duì)象檢測(cè)方法, 其特征在于,對(duì)于每個(gè)無(wú)向加權(quán)圖中的每個(gè)結(jié)點(diǎn)的顯著值S 1(V),根據(jù)其局部上下文信息按 照如下公式進(jìn)行修正,使得具有相似表觀的超像素具有相似的顯著值P(V):
其中,λ為權(quán)重因子,取值0.05-0. 3; 在滿足(V,V1.) e Ε1,^^表示屬于1環(huán)鄰接圖中連接邊上結(jié)點(diǎn)V與結(jié)點(diǎn)V j的表觀相似 性:
σ 2是為1環(huán)鄰接圖中相鄰超像素特征對(duì)比度的方差,相鄰 超像素特征對(duì)比度即為相鄰超像素的平均Lab顏色特征向量之間的距離;X和\分別為結(jié) 點(diǎn)V與結(jié)點(diǎn)Vj的平均Lab顏色特征向量。
3. 根據(jù)權(quán)利要求2所述的一種利用圖像邊界信息和區(qū)域連通性的顯著對(duì)象檢測(cè)方法, 其特征在于,選用邏輯斯蒂回歸器替代S(V) =S1(V) *s2(v) *S3(V),獲取超像素的顯著值, 完成顯著圖的檢測(cè),具體過(guò)程如下: 根據(jù)超像素的三個(gè)顯著值,生成二次特征項(xiàng)和三次特征項(xiàng),將一次項(xiàng),二次項(xiàng),三次項(xiàng) 以及偏差項(xiàng)1串聯(lián),得到20維特征向量,將20維的特征向量輸入已訓(xùn)練好的邏輯斯蒂回歸 器中
,以邏輯斯蒂回歸器輸出的值作為對(duì)應(yīng)超像素的顯著值; 其中,二次特征項(xiàng)和三次特征項(xiàng)分別戈
20維的特征向量
w是一個(gè)20維的權(quán)值矩陣,利用訓(xùn)練數(shù)據(jù)集MSRA10K訓(xùn)練邏輯斯蒂回歸器時(shí)獲得。
4. 根據(jù)權(quán)利要求3所述的一種利用圖像邊界信息和區(qū)域連通性的顯著對(duì)象檢測(cè)方法, 其特征在于,所述已訓(xùn)練好的邏輯斯蒂回歸器的具體訓(xùn)練過(guò)程如下: 訓(xùn)練所用的數(shù)據(jù)集為MSRA10K,該數(shù)據(jù)集包含10000張彩色圖像以及對(duì)應(yīng)的由人工手 動(dòng)標(biāo)記出了顯著對(duì)象的標(biāo)記圖像; 步驟1):從MSRA10K數(shù)據(jù)集中隨機(jī)選取2000張圖像,對(duì)于每一張圖像,執(zhí)行步驟1-4, 得到每張圖像中每個(gè)超像素的20維特征向量,記為F = [f\,f2,... fN],N為總的超像素的 個(gè)數(shù); 步驟2):根據(jù)標(biāo)記圖像,如果超像素中一半以上的像素屬于被標(biāo)記的顯著對(duì)象,則將 該超像素標(biāo)為1,否則標(biāo)為〇,從而得到標(biāo)簽向量L = [I1, 12,...,1N]; 步驟3):采用極大似然法估計(jì)模型參數(shù),似然函數(shù)為:
求解上述函數(shù)得到W,fi表示超像素的20維特征向量中的第i個(gè)特征向量。
5. 根據(jù)權(quán)利要求1-4任一項(xiàng)所述的一種利用圖像邊界信息和區(qū)域連通性的顯著對(duì)象 檢測(cè)方法,其特征在于,所述每個(gè)無(wú)向加權(quán)圖中每個(gè)節(jié)點(diǎn)到無(wú)向加權(quán)圖的邊界節(jié)點(diǎn)的累積 最短路徑采用Di jkstra最短路徑算法計(jì)算。
6. 根據(jù)權(quán)利要求1-4任一項(xiàng)所述的一種利用圖像邊界信息和區(qū)域連通性的顯著對(duì)象 檢測(cè)方法,其特征在于,所述步驟2中對(duì)待檢測(cè)的圖像進(jìn)行超像素分割采用具有邊緣保持 的超像素分割方法,其中,邊緣特征相對(duì)顏色特征的重要性,取值為〇. 9,超像素的規(guī)整性相 對(duì)顏色特征的重要性,取值〇. 5,超像素尺度控制因子,取值為3000。
【專利摘要】本發(fā)明提出了一種利用圖像邊界信息和區(qū)域連通性的顯著對(duì)象檢測(cè)方法,通過(guò)對(duì)待檢測(cè)的圖像進(jìn)行超像素分割,利用超像素的平均Lab顏色特征向量和超像素的空間拓?fù)潢P(guān)系構(gòu)建三個(gè)無(wú)向加權(quán)圖,計(jì)算每個(gè)超像素到圖像邊界的最短路徑,獲取三個(gè)顯著圖,將三個(gè)顯著圖相乘得到最終的顯著圖,完成顯著對(duì)象的檢測(cè);利用超像素的局部上下文信息對(duì)顯著值進(jìn)行修正,從而提高了顯著對(duì)象檢測(cè)的精度,進(jìn)一步降低背景區(qū)域的顯著性;此外,采用邏輯斯蒂回歸器對(duì)根據(jù)不同連通性計(jì)算得到的修正后的顯著圖進(jìn)行特征整合,得到最終的在顯著對(duì)象區(qū)域均勻高亮的顯著圖。本方法能夠快速的將顯著對(duì)象區(qū)域高亮,并且能夠降低背景中高對(duì)比度區(qū)域的誤檢率。
【IPC分類】G06K9-00, G06K9-62
【公開號(hào)】CN104537355
【申請(qǐng)?zhí)枴緾N201510013897
【發(fā)明人】鄒北驥, 劉晴, 陳再良, 胡旺, 傅紅普
【申請(qǐng)人】中南大學(xué)
【公開日】2015年4月22日
【申請(qǐng)日】2015年1月12日