日韩中文字幕久久久97都市激情,久久91网,亚洲天堂最新,国产精品嫩草影院九色,亚洲午夜精品一本二本,精品少妇一区二区三区蜜桃,av一道本

基于漸進二分和自適應閾值的視頻鏡頭邊界檢測方法與流程

文檔序號:12039191閱讀:1714來源:國知局
基于漸進二分和自適應閾值的視頻鏡頭邊界檢測方法與流程
本發明屬于多媒體檢索領域,涉及一種基于漸進二分和自適應閾值的視頻鏡頭邊界檢測方法。

背景技術:
目前的視頻鏡頭邊界檢測算法普遍采用線性計算方法,順序地計算幀間差異并研究變化值。因線性計算需要比較給定視頻每相鄰兩幀的差異,耗時長,因而不適用大規模的視頻庫。為解決這個問題,KienA.Hua于2000年在ACMMultimedia2000上發表的論文“DetectingVideoShotBoundariesupto16TimesFaster”中,提出了利用鏡頭內幀間上下文的相似性忽略一些不必要的比較計算,從而降低時間復雜度的兩種非線性算法。第一種是規則跳略,即每隔d幀進行一次比較計算。假設d=2,它比較第1幀和第3幀,第3幀和第5幀,依此類推。如果發現有第i幀和第i+2幀在不同的鏡頭,則比較第i幀和第i+1幀。如果第i幀和第i+1幀位于不同鏡頭,則鏡頭分界在第i幀和第i+1幀之間;否則就在第i+1幀和第i+2幀之間。一旦新的鏡頭被識別,同樣的過程從新鏡頭的第一幀開始重復。這個方案很簡單,但已經可以將比較計算次數減到一半左右。第二種算法是自適應跳略算法,它動態確定d的值。在每一次重復計算中,如果這一次比較計算結果表明比上一次更相似,則增大d值;否則減小d值。如果本次比較表明這兩幀位于不同的鏡頭,則后退計算尋找鏡頭邊界。一旦找到準確鏡頭邊界,再用同樣方法繼續前向計算。最直觀的漸變鏡頭檢測方法是根據漸變鏡頭產生式進行檢測,其缺點是只能檢測出已經定義好的漸變類型的鏡頭,但在實際中無法預測出所有漸變鏡頭的類型。一種典型的漸變鏡頭檢測方法是張宏江于1993年在《MultimediaSystems》期刊上發表的論文“Automaticpartitioningoffull-motionvideo”中提出的雙閾值法,這種方法基于Gaussian分布確定閾值,其中Tb=μ+ασ的參數α是固定參數,當用于不同類型的視頻時,由于參數α固定,因此這種方法確定的閾值不具有很好的適應力。另一類常見的漸變鏡頭檢測方法是機器學習法,它為待檢測視頻建立SVM(SupportVectorMachines,支持向量機)模型、HMM(HiddenMarkovModel,隱馬爾可夫模型)模型、KNN(K-NearestNeighboralgorithm,K最鄰近結點算法)模型、貝葉斯模型等,機器學習法需要訓練視頻集對這些機器學習模型進行參數訓練,然后再用于新視頻的鏡頭檢測。機器學習法對新視頻進行鏡頭檢測的結果與訓練視頻集有關,如果訓練集選取不當,會影響最終的檢測結果。還有一類漸變鏡頭檢測方法是建立數學模型法。B樣條插值曲線擬合法從視頻幀序列提取幀間方差特征,并映射到曲線上,用B樣條曲線對它的擬合度檢測疊化鏡頭邊界。袁進輝于2005年在《Proceedingsofthe13thannualACMinternationalconferenceonMultimedia》會議上發表的論文“AUnifiedShotBoundaryDetectionFrameworkBasedonGraphPartitionModel”中,提出了基于圖分割模型的統一的鏡頭邊界檢測框架。圖分割模型將每一幀看作一個節點,每兩個節點間用邊連接,這樣可以創建一個加權的圖,從而把鏡頭邊界檢測問題表示為圖分割問題。將視頻鏡頭邊界看作是多分辨率的邊現象,它將視頻序列的表示轉化到多維特征空間中點軌跡的表示,然后用視頻信號軌跡的導數來檢測鏡頭邊界。數學建模法需要將視頻序列結構轉換為數學模型,然后再對新的模型進行檢測,而數學建模過程本身就有很高的計算復雜度。最典型的進行視頻鏡頭邊界檢測的閾值確定方法是根據特征進行檢測。常用的視覺特征有顏色特征、輪廓特征和運動特征。首先要提取每幀視頻的特征,并計算相鄰幀間的特征差值,并與閾值進行比較,大于閾值的位置即為鏡頭邊界。經典的閾值算法是張宏江提出的根據視頻幀特征差的Gaussian分布求取的檢測閾值,假設差值的均值和方差分別為m和δ,則閾值為T=m+sδ,其中s取3-5。這種方法的不足之處是參數s為固定參數,不能根據視頻類型進行自動地調整。其他確定視頻鏡頭邊界的方法是機器學習法,但是檢測結果是與訓練集相關的。JieZheng于2004年在《InternationalSymposiumonIntelligentMultimedia,VideoandSpeechProcessing》會議上發表的“AnEfficientAlgorithmforVideoShotBoundaryDetection”上提出了根據各幀差異值的幀數確定鏡頭邊界的方法。這種方法為各個幀間差異值對應的幀數目進行統計,建立起[0,MAX]的直方圖(MAX為幀差異最大值),定義分離度為[0,MAX]上連續0的數目。幀間差直方圖中的第一個趨零點即為視頻鏡頭檢測的閾值。這種方法相比張宏江的閾值確定方法和機器學習法可以根據每個視頻自身的特征生成檢測閾值而且不需要訓練集。但在JieZheng的方法中,沒有對切變和漸變檢測的閾值進行區分,而且檢測單元長度也是固定長度的,不能根據不同視頻類型自適應地調整檢測單元長度。

技術實現要素:
針對視頻鏡頭邊界檢測方法中存在的上述問題,本發明提出了一種基于漸進二分策略和自適應閾值進行視頻鏡頭邊界檢測的方法,降低了計算復雜度,能夠檢測出各種類型的漸變鏡頭,可以根據不同視頻類型自適應地調整檢測單元長度。漸進二分策略主要解決視頻鏡頭檢測時計算量大和對漸變類型鏡頭檢測的問題,它在視頻序列范圍內漸進地使用二分法進行視頻鏡頭檢測。當一個新的鏡頭邊界被檢測到時,以這個位置為新的起點,向前推進一個漸變檢測區間范圍,然后在這一新的范圍內繼續使用二分法進行鏡頭邊界檢測,直到到達視頻終點。自適應閾值法是對JieZheng提出的對各個幀差差異值上的幀數統計,然后根據分離度確定閾值的方法,從切變和漸變檢測閾值的區分、采樣區間長度的確定兩方面進行擴展。鏡頭內的幀間差值集中在x軸靠近原點的區域,漸變位置的幀間差值集中在中間區域,而切變位置的幀間差值位于x軸右邊。如圖2所示,[1,a]為鏡頭內的幀間差值,[b,c]為漸變位置的幀間差值,而[d,101]為切變位置的幀間差值(Matlab數組下標從1開始,為計算方便,將閾值0~1調整到0.01~1.01,因此將閾值乘以100后,閾值范圍為[1,101])。因此,由此段視頻的幀間差直方圖可以判定漸變鏡頭檢測的閾值為T=a,切變鏡頭檢測的閾值為T=c。所有視頻都采用統一長度的采樣區間求取幀間差直方圖,不能很好地反映出幀間差值的閾值分布特征。實驗表明,當視頻段中有num=1~8個鏡頭邊界位置時,該視頻段對應的幀間差直方圖能最好地反映出閾值分布特征,在本方法中取num=4個鏡頭。但在實際檢測時,不能預知一個待檢測視頻中的鏡頭總數,可采用泊松分布模擬一段視頻中單位長度視頻段內鏡頭出現的次數,其概率分布函數為:式中,k表示單位長度視頻段中鏡頭出現次數,λ表示這個視頻在單位長度視頻段中鏡頭出現的平均次數。本發明采用最大似然估計法由給定的n個樣本視頻段求一整段視頻的泊松分布參數λ的估計。根據帕累托定律,即采樣視頻幀總量為待檢測視頻幀數的20%,n的取值為:式中,N為待檢測視頻幀的總數,A為每個采樣視頻段的幀數。λ的對數似然函數為:式中,ki為第i個視頻段單位視頻長度鏡頭出現的次數。上式對λ求導并令導數為0得:解方程得到對λ最大似然估計將對λ的最大似然估計應用到本環境下,從待檢測視頻序列中抽取n個樣本,然后由上式求出即為單元采樣區間上的鏡頭數,也可稱為該視頻的鏡頭出現速度。則出現num(num=1~8)個鏡頭的視頻幀長度L為:綜上所述,本發明的技術方案為:首先確定檢測子視頻區間長度,然后對每個子視頻,求它的幀間差直方圖,并確定這一個子視頻的檢測閾值,最后運用漸進二分策略檢測鏡頭。一種基于漸進二分和自適應閾值的視頻鏡頭邊界檢測方法,其特征在于包括以下步驟:步驟一,根據不同視頻類型自適應地調整檢測單元長度:使用極大似然法估計視頻鏡頭出現速度,然后求出平均出現num(num=1~8)個鏡頭的視頻幀數,并將視頻分為長度均為該視頻幀數的一組子視頻。方法如下:(1)采用最大似然估計法,由給定的n個樣本視頻段求出一整段視頻的泊松分布參數λ的估計即視頻鏡頭出現速度。n和分別由式(2)和式(3)求解。(2)由(4)式求子視頻的長度。步驟二,將待檢測視頻分成長度均為L的一組子視頻,然后依次對每一個子視頻建立幀間差直方圖,如圖3所示,通過統計找出其最長的兩個零區間[a,b]和[c,d],a<b<c<d,并由此確定這一子視頻的鏡頭檢測閾值為T=c。步驟三,對每一個子視頻使用步驟二得到的檢測閾值c進行基于漸進二分策略的視頻鏡頭邊界檢測,方法如下:(1)求起始幀和左幀的差異值。若差異值大于閾值,表明左幀位置為鏡頭分界點,令新的起始幀為左幀,重復本步驟,進入下一輪計算;否則,轉下一步。(2)求起始幀和右幀的差異值,如果差異值小于閾值,表明鏡頭分界點在右幀右側,令右幀為起始幀,轉步驟三的(1),進入下一輪計算;否則,轉下一步。(3)差異值大于閾值,表明鏡頭分界點在右幀左側,取左幀和右幀包含區間內位于中間位置的幀為為中間幀。(4)求起始幀和中間幀的差異值,如果差異值大于閾值,鏡頭點在中間幀左側,令中間幀為右幀,若此時右幀與左幀相鄰,則右幀為鏡頭分界點,令新的起始幀為右幀,轉步驟三的(1),進入下一輪計算;若不相鄰,則再取中間幀(中間幀為左幀和右幀包含的視頻區間內位于中間位置的幀),重復本步驟;如果差異值小于閾值,轉下一步。(5)差異值小于閾值,表明鏡頭點在中間幀右側,令中間幀為左幀,若此時左幀與右幀相鄰,則右幀為鏡頭分界點,令新的起始幀為右幀,轉步驟三的(1),進入下一輪計算;若不相鄰則再取中間幀,轉步驟三的(4)。所述起始幀的初值為每一個子視頻的首幀,左幀的初值為該子視頻的起始幀加3幀后對應的幀,右幀的初值為該子視頻的起始幀加30幀后對應的幀;隨著漸進二分法的進行,起始幀、左幀和右幀的值如步驟三的(1)、步驟三的(2)、步驟三的(4)、步驟三的(5)的描述動態變化。中間幀為該子視頻中當前左幀和右幀包含的區間內位于中間位置的幀。即中間幀號為左幀號和右幀號之和的一半。在上述檢測過程中,如果起始幀超出鏡頭范圍,檢測結束。與現有技術相比本發明的有益效果是:(1)本發明所述的漸進二分策略,利用了連續視頻幀的逐漸變化性,漸進地使用二分法快速定位到鏡頭邊界位置,能夠以對數級地降低計算量,相比線性計算和其他非線性算法在時間復雜度上有很大改進。(2)本發明所述的漸進二分策略,通過在視頻漸變鏡頭變化區間范圍內進行二分法檢測,能夠快速定位到漸變鏡頭位置,而不必考慮漸變鏡頭的類型,解決了視頻鏡頭邊界檢測中漸變鏡頭檢測難的問題。(3)自適應閾值方法對切變和漸變檢測的閾值進行了進一步區分,采用最大似然估計法計算平均出現num(1~8)個鏡頭的視頻幀數,并以此為子視頻長度將視頻劃分為一組子視頻,從而能夠根據視頻類型自適應地調整檢測單元長度。附圖說明圖1基于漸進二分和自適應閾值的視頻鏡頭邊界檢測方法流程圖;圖2漸進二分法執行過程示意圖;圖3幀間差直方圖與其閾值分布特征示意圖。具體實施方式下面結合附圖和具體實施方式對本發明做進一步說明。本實施例從TRECVID2001-2005提供的視頻集中隨機選取20段視頻進行實驗,共包含306321幀、2140個鏡頭。測試機型是IntelCorei3-2100CPU,內存2G,操作系統是Windows7,使用Matlab進行編程。漸變鏡頭的范圍為3~30幀,如圖2所示,第一次檢測的起始幀為1,左幀=起始幀+3,右幀=起始幀+30。這樣設置左幀和右幀,是為了與漸變區間范圍一致,從而可以用切變閾值檢測到漸變鏡頭。圖1為本發明所述方法的流程圖,包括以下步驟:步驟一,根據不同視頻類型自適應地調整檢測單元長度:使用極大似然法估計視頻鏡頭出現速度,然后求出平均出現num(本實施例取num=4)個鏡頭的視頻幀數,并將視頻分為長度均為該視頻幀數的一組子視頻。方法如下:(1)采用最大似然估計法,由給定的n個樣本視頻段求出一整段視頻的泊松分布參數λ的估計求解公式如公式(2)和(3)。本實施例中,A=300,N=306321。(2)由公式(4)求子視頻的長度L。步驟二,將待檢測視頻分成長度均為L的一組子視頻,然后依次對每一個子視頻建立幀間差直方圖,如圖3所示,通過統計找出其最長的兩個零區間[a,b]和[c,d],并由此確定這一子視頻的鏡頭檢測閾值為T=c。步驟三,對每一個子視頻使用步驟二得到的檢測閾值c進行基于漸進二分策略的視頻鏡頭邊界檢測。檢測過程中,如果起始幀超出鏡頭范圍,檢測結束。采用查全率、查準率和F-measure(查全率和查準率的加權調和值)三項指標,從切變檢測和漸變檢測兩方面分別對本發明所述方法檢測的準確率進行評價。采用不同方法進行切變鏡頭和漸變鏡頭檢測的查全率、查準率和F-measure分別如表1、和表2所示。表中,InformationTheory-Based為基于信息論的方法,Dwt-based&SVM為基于離散小波變換和支持向量機的方法,SVM-basedwithnovelfeature為基于支持向量機并使用新特征的方法,TemporalPatternClassification為基于時空樣式分析的方法,AverageFrameSimilarity為平均幀相似度法,Colorcoherence為顏色相關性法。由表1可知,在切變檢測方面,本發明所述方法的查全率、查準率和F-measure均明顯高于其它幾種方法,具有最好的檢測準確率;同時,由表2可知,在漸變檢測方面,本方法與同類方法相比仍然具有最好的檢測準確率。表1本發明所述方法和其它同類方法進行切變鏡頭檢測的準確率查全率查準率F-measureInformationTheory-Based97.0%95.0%96.0%Dwt-based&SVM92.4%95.4%93.9%SVM-basedwithnovelfeature94.5%91.6%93.0%TemporalPatternClassification92.7%93.0%92.8%本發明所述方法98.6%98.8%98.7%表2本發明所述方法和其它同類方法進行漸變鏡頭檢測的準確率申請號為CN201010228739.X名稱為“一種全自動2D轉3D技術中的實時鏡頭檢測方法和裝置”的發明專利與本發明相比,該專利只是對切變和淡入淡出類型的漸變鏡頭檢測效果比較好,而本發明所述方法是將淡入淡出類型的漸變鏡頭歸入切變鏡頭,且切變檢測的查全率和查準率達到了98.6%,優于申請號為CN201010228739.X的專利。通過統計視頻鏡頭檢測過程中的比較次數,對不同方法進行視頻鏡頭檢測的時間復雜度進行評價。表3是采取4種不同方法進行視頻鏡頭檢測的比較次數。由表3可知,對于含有306321幀的視頻,本發明所述方法只進行了121811次比較計算,只占視頻幀總數306321的1/3,與其它3種算法相比計算復雜度是最低的。表3不同方法進行視頻鏡頭檢測的比較次數(單位:次)H.J.Zhang規則跳略自適應跳略本發明所述方法612642167593480985121811
當前第1頁1 2 3 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1