一種檢索視頻的方法及裝置的制造方法
【專利摘要】本發明實施例提供一種檢索視頻的方法及裝置,用以解決現有技術中檢索視頻時計算量大、檢索效率低的問題,減小計算量,提高檢索視頻的效率。所述檢索視頻的方法,包括:接收用戶輸入的用于檢索視頻的原始圖像;確定所述原始圖像的元數據,分別計算所述原始圖像的元數據與視頻元數據庫中每幀圖像的元數據的交互信息量,得到多個交互信息量,利用預設規則從所述多個交互信息量中確定目標交互信息量,并將所述目標交互信息量所對應元數據的幀圖像所在的視頻確定為所述原始圖像所在的視頻;其中,所述視頻元數據庫中存儲多個視頻的元數據,每個視頻的元數據包括該視頻的視頻摘要中多幀圖像的元數據。
【專利說明】
一種檢索視頻的方法及裝置
技術領域
[0001] 本發明實施例涉及視頻技術領域,尤其涉及一種檢索視頻的方法及裝置。
【背景技術】
[0002] 隨著計算機和通信技術的高速發展,視頻資源的數量也隨之迅速增加,隨著視頻 資源的積累,如何在海量視頻資源中快速檢索出所需的視頻顯得至關重要。由于視頻數據 量大,且具有時間及空間結構,其表達、存儲、傳輸、組織具有更大的難度,只有合理地組織 視頻數據,才能有效地瀏覽和檢索。
[0003] 現有的視頻圖像檢索技術,大多是基于兩幅圖像的整個信息進行比較,也即在進 行檢索時,將用戶輸入的原始圖像的顏色直方圖與視頻中每幀圖像的顏色直方圖整個進行 比較,計算量大,另外,由于用戶通常提供的是一幅圖片中的一個部分,因此,在進行檢索 時,其他無關信息會影響計算量,進而影響判斷圖片相關性的準確性,影響檢索結果。
[0004] 綜上所述,現有技術在檢索視頻時,基于兩幅圖像的整個信息進行比較,計算量 大,檢索效率低。
【發明內容】
[0005] 本發明實施例提供一種檢索視頻的方法及裝置,用以解決現有技術中檢索視頻時 計算量大、檢索效率低的問題,減小計算量,提高檢索視頻的效率。
[0006] 本發明實施例提供一種檢索視頻的方法,該方法包括:接收用戶輸入的用于檢索 視頻的原始圖像;確定所述原始圖像的元數據,分別計算所述原始圖像的元數據與視頻元 數據庫中每幀圖像的元數據的交互信息量,得到多個交互信息量,利用預設規則從所述多 個交互信息量中確定目標交互信息量,并將所述目標交互信息量所對應元數據的幀圖像所 在的視頻確定為所述原始圖像所在的視頻;其中,所述視頻元數據庫中存儲多個視頻的元 數據,每個視頻的元數據包括該視頻的視頻摘要中多幀圖像的元數據。
[0007] 本發明實施例提供一種檢索視頻的裝置,該裝置包括:接收單元,用于接收用戶輸 入的用于檢索視頻的原始圖像;處理單元,用于確定所述原始圖像的元數據,分別計算所述 原始圖像的元數據與視頻元數據庫中每幀圖像的元數據的交互信息量,得到多個交互信息 量,利用預設規則從所述多個交互信息量中確定目標交互信息量,并將所述目標交互信息 量所對應元數據的幀圖像所在的視頻確定為所述原始圖像所在的視頻;其中,所述視頻元 數據庫中存儲多個視頻的元數據,每個視頻的元數據包括該視頻的視頻摘要中多幀圖像的 元數據。
[0008] 本發明實施例提供的一種檢索視頻的方法及裝置,接收用戶輸入的用于檢索視頻 的原始圖像,確定原始圖像的元數據,分別計算原始圖像的元數據與視頻元數據庫中每幀 圖像的元數據的交互信息量,得到多個交互信息量,由于視頻元數據庫中存儲多個視頻的 元數據,每個視頻的元數據包括該視頻的視頻摘要中多幀圖像的元數據,因此,在計算得到 多個交互信息量之后,利用預設規則從多個交互信息量中確定目標交互信息量,將目標交 互信息量所對應元數據的幀圖像所在的視頻確定為原始圖像所在的視頻,與現有技術中基 于兩幅圖像的整個信息進行比較,計算量大,且檢索結果不準確相比,通過構造元數據,計 算原始圖像的元數據與每個視頻的視頻摘要中每幀圖像的元數據的交互信息量,進而根據 交互信息量確定原始圖像所在的視頻,減小了計算量,提高檢索視頻的效率。
【附圖說明】
[0009] 為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現 有技術描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發 明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根 據這些附圖獲得其他的附圖。
[0010] 圖1為本發明實施例提供的一種檢索視頻的方法的示意流程圖;
[0011] 圖2為本發明實施例提供的一種計算視頻的視頻元數據的示意流程圖;
[0012] 圖3為本發明實施例提供的一種檢索視頻的方法的具體流程的示意流程圖;
[0013] 圖4為本發明實施例提供的一種檢索視頻的裝置的結構示意圖。
【具體實施方式】
[0014] 為使本發明實施例的目的、技術方案和優點更加清楚,下面將結合本發明實施例 中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是 本發明一部分實施例,而不是全部的實施例。基于本發明中的實施例,本領域普通技術人員 在沒有作出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明保護的范圍。
[0015] 首先對本發明實施例中提到的一些名詞進行解釋:
[0016]本發明實施例中提到的灰度直方圖(Histogram),相機上顯示的直方圖和位圖圖 像處理軟件(Ph〇t〇sh〇p,PS)使用的直方圖都是灰度直方圖,從圖形上說,它是一個二維圖, 用坐標表示,橫坐標表示圖像中各個像素點的灰度級,0到255個級別,縱坐標為各個灰度級 上像素點出現的次數或概率。灰度直方圖具有一下特點:
[0017] (1)灰度直方圖表征了圖像的一維信息,只反映圖像中像素不同灰度值出現的次 數(或頻數)而未反映像素所在位置;
[0018] (2)灰度直方圖與圖像之間的關系是多對一的映射關系,一幅圖像唯一確定出與 之對應的灰度直方圖,但不同圖像可能有相同的灰度直方圖。
[0019] (3)子圖灰度直方圖之和為整圖的灰度直方圖。
[0020] 本發明實施例中提到的概率密度函數可以由圖像的灰度直方圖中各個灰度值上 像素點的統計次數除以圖像總的像素個數得到。概率是指事件隨機發生的機率,對于均勻 分布函數,概率密度等于一段區間(事件的取值范圍)的概率除以該段區間的長度,它的值 是非負的,可以很大也可以很小。單純的講概率密度沒有實際的意義,它必須有確定的有界 區間為前提,可以把概率密度看成是縱坐標,區間看成是橫坐標,概率密度對區間的積分就 是面積,而這個面積就是事件在這個區間發生的概率,所有面積的和為1。所以單獨分析一 個點的概率密度是沒有任何意義的,它必須要有區間作為參考和對比。
[0021] 元數據是具有描述、解釋、定位信息資源功能的結構化信息,即元數據是描述數據 的數據,或者描述信息的信息。本發明實施例中利用與視頻相關的元數據描述視頻的主要 內容,從視頻中提取信息生成元數據,在進行檢索時,使用元數據進行比較。
[0022]本發明實施例提供一種檢索視頻的方法,如圖1所示,該方法包括:
[0023]步驟11,接收用戶輸入的用于檢索視頻的原始圖像;
[0024]步驟13,確定原始圖像的元數據,分別計算原始圖像的元數據與視頻元數據庫中 每幀圖像的元數據的交互信息量,得到多個交互信息量,利用預設規則從多個交互信息量 中確定目標交互信息量,并將目標交互信息量所對應元數據的幀圖像所在的視頻確定為原 始圖像所在的視頻;其中,視頻元數據庫中存儲多個視頻的元數據,每個視頻的元數據包括 該視頻的視頻摘要中多幀圖像的元數據。
[0025]本發明實施例提供的方法中,接收用戶輸入的用于檢索視頻的原始圖像,確定原 始圖像的元數據,分別計算原始圖像的元數據與視頻元數據庫中每幀圖像的元數據的交互 信息量,得到多個交互信息量,由于視頻元數據庫中存儲多個視頻的元數據,每個視頻的元 數據包括該視頻的視頻摘要中多幀圖像的元數據,因此,在計算得到多個交互信息量之后, 利用預設規則從多個交互信息量中確定目標交互信息量,將目標交互信息量所對應元數據 的幀圖像所在的視頻確定為原始圖像所在的視頻,與現有技術中基于兩幅圖像的整個信息 進行比較,計算量大,且檢索結果不準確相比,通過構造元數據,計算原始圖像的元數據與 每個視頻的視頻摘要中每幀圖像的元數據的交互信息量,進而根據交互信息量確定原始圖 像所在的視頻,減小了計算量,提高檢索視頻的效率。
[0026]具體實施時,在計算得到多個交互信息量之后,利用預設規則從多個交互信息量 中確定目標交互信息量,并將目標交互信息量所對應元數據的幀圖像所在的視頻確定為原 始圖像所在的視頻,需要說明的是,目標交互信息量可以是一個,也可以是多個,根據預設 規則的不同,確定出的目標交互信息量也有不同,例如:預設規則是取最大值時,能確定出 一個目標交互信息量,但若預設規則是交互信息量的值大于預設閾值(根據經驗值設定,例 如:90),能確定出多個目標交互信息量。當然,本領域技術人員應當理解的是,預設規則還 可以是其它規則,例如:將交互信息量按大小排序,取預設數量個交互信息量作為目標交互 信息量。較為優選地,為了提高檢索視頻的準確率,預設規則為取最大值,也即在計算得到 多個交互信息量之后,確定多個交互信息量中的最大交互信息量,并將最大交互信息量所 對應元數據的幀圖像所在的視頻確定為原始圖像所在的視頻。
[0027] 具體實施時,任一圖像的元數據包括該圖像的灰度直方圖和概率密度函數,概率 密度函數為該圖像灰度直方圖中各個灰度值上像素點的統計數量與該圖像的總像素點數 之比。
[0028] 值得說明的是,在計算原始圖像的元數據與視頻元數據庫中每幀圖像的元數據的 交互信息量時,可以基于整張圖像的元數據計算交互信息量,但是由于用戶通常提供的只 是一張圖像的一部分,因此,為了避免圖像中其它無關信息的影響,可以將圖像的元數據分 為主題部分的元數據和背景部分的元數據,具體來說:
[0029] 在一種可能的實施方式中,本發明實施例提供的方法中,任一圖像的元數據包括: 該圖像主題部分的元數據以及該圖像背景部分的元數據;計算原始圖像的元數據與視頻元 數據庫中每幀圖像的元數據的交互信息量,包括:計算原始圖像主題部分的元數據與視頻 元數據庫中每幀圖像主題部分的元數據的交互信息量,和/或計算原始圖像背景部分的元 數據與視頻元數據庫中每幀圖像背景部分的元數據的交互信息量。
[0030] 本發明實施例提供的方法中,將原始圖像和視頻元數據庫中每幀圖像均劃分成由 主題部分和背景部分兩部分組成,根據用戶提供的原始圖像,選取其中一個或者全部計算 交互信息量,并根據交互信息量確定原始圖像所在的視頻,避免了檢索視頻時無關信息的 影響,提高了檢索視頻的準確性,同時,由于選取其中的一個或全部計算交互信息量,進一 步減小了計算量。
[0031] 在一種可能的實施方式中,本發明實施例提供的方法中,當任一圖像的元數據包 括:圖像主題部分的元數據以及圖像背景部分的元數據時,在確定原始圖像的元數據之前, 該方法還包括:利用預設比例參數將原始圖像分為主題部分和背景部分;確定原始圖像的 元數據,包括:確定原始圖像的主題部分的元數據以及原始圖像的背景部分的元數據。 [0032]具體實施時,將圖像中的場景作為該幀圖像的背景部分,將人物的面部作為該幀 圖像的主題部分,每個人物都有獨特的特征,如人臉圖像,目前人臉檢測算法已日益成熟。 面部識別可用現在較為成熟的貝葉斯可區分特征(Bayesian Discriminating Features, BDF)的方法來檢測人臉,在該算法中,首先對輸入圖像進行一維Harr小波變換后投影到水 平和垂直坐標上,得到輸入圖像的概率統計信息,再運用貝葉斯分類器進行人臉檢測,通過 該方法檢測人物的面部特征,并利用預設比例參數對檢測出的目標區域進行向外擴展,從 而分割出圖像中的主題部分,分割主題部分之后剩下的就是背景部分。其中,預設比例參數 可以根據經驗值設定,例如:預設比例參數取值為0.29。
[0033] 具體實施時,在檢索視頻時,首先需要建立視頻元數據庫,視頻元數據庫中存儲多 個視頻的元數據,每個視頻的元數據包括該視頻的視頻摘要中多幀圖像的元數據,在建立 視頻元數據庫時,首先需要建立視頻的視頻摘要,視頻摘要是對視頻中的關鍵幀進行合理 排序(例如:按時間順序排列)得到的鏡頭級的視頻摘要,建立視頻摘要的方法可以采用現 有技術中的方法,此處不再贅述。其中,關鍵幀代表鏡頭的主要內容。
[0034] 對于任一視頻,建立視頻摘要之后,生成視頻元數據的步驟,如圖2所示,包括: [0035]步驟21,讀取視頻摘要幀序列中的第i幀,其中,i初始化值為1,并且i < N,N為視頻 摘要的總幀數,N= 1000;
[0036] 步驟23,利用預設比例參數將該幀劃分為主題部分和背景部分,預設比例參數可 以根據經驗值設定,例如:預設比例參數取值為〇. 29;
[0037] 步驟25,分別計算主題部分和背景部分的灰度直方圖和概率密度函數;
[0038]步驟27,將得到的計算結果存入視頻元數據庫中。
[0039] 為更方便地管理和使用視頻元數據庫中存儲的每幀圖像的元數據,對每個視頻的 元數據進行結構化處理。具體實施時,定義圖像的灰度直方圖和概率密度函數為該圖像的 元數據,保存元數據的格式描述為:視頻元數據結構由文件序列號、視頻文件名、背景數據 結構和主題數據結構4個部分組成,其中,背景數據結構由背景名和背景元數據構成,主題 數據結構由主題名和主題元數據構成,背景元數據和主題元數據由視頻摘要中每幀圖像的 灰度直方圖和概率密度函數組成。
[0040] 將每個視頻的元數據結構化處理后,利用元數據來計算用戶輸入的原始圖像與視 頻元數據庫中每幀圖像的背景部分和/或主題部分的交互信息量,通過交互信息量判斷二 者的相似性,進而利用預設規則從計算得到的多個交互信息量中確定目標交互信息量,并 將目標交互信息量所對應元數據的幀圖像所在的視頻,確定為用戶輸入的原始圖像所在的 視頻,具體實施時,原始圖像的元數據與視頻元數據庫中任一幀圖像的元數據的交互信息 量,等于原始圖像的元數據與視頻元數據庫中該幀圖像的元數據在紅R、綠G、藍B分量上的 交互信息量之和,其中,原始圖像的元數據與視頻元數據庫中該幀圖像的元數據在任一分 量上的奪互信息量誦討如下公式計筧得到:
[0041]
[0042] 兵屮,1衣不父且1目,g、M,FA〈a;衣不保妬囹傢仕該力、重上的概率密度函數,PB(b)表 示視頻元數據庫中該幀圖像在該分量上的概率密度函數,Pab (a,b)表示原始圖像和視頻元 數據庫中該幀圖像在該分量上的聯合概率密度函數。以R分量為例,PA(a)表示原始圖像在R 分量上的概率密度函數,Pb (b)表示視頻元數據庫中該幀圖像在R分量上的概率密度函數, PAB(a,b)表示原始圖像和視頻元數據庫中該幀圖像在R分量上的聯合概率密度函數。
[0043]作為較為具體的實施時,本發明實施例提供的檢索視頻的方法,以計算原始圖像 的元數據與視頻元數據庫中第i幀圖像的元數據的交互信息量為例,基于元數據檢索視頻 的步驟,如圖3所示,包括:
[0044]步驟31,接收用戶輸入用于檢索視頻的原始圖像;
[0045] 步驟32,計算原始圖像的元數據,即計算原始圖像的灰度直方圖和概率密度函數;
[0046] 步驟33,計算原始圖像與視頻元數據庫中第i幀圖像的聯合概率密度函數,具體來 說,根據原始圖像的灰度直方圖以及第i幀圖像的灰度直方圖計算聯合概率密度;
[0047] 步驟34,計算原始圖像的元數據與視頻元數據庫中第i幀圖像的元數據在R、G、B分 量上的交互信息量;
[0048]步驟35,計算原始圖像的元數據與視頻元數據庫中第i幀圖像的元數據的交互信 息量,具體來說,原始圖像的元數據與視頻元數據庫中第i幀圖像的元數據的交互信息量, 等于原始圖像的元數據與視頻元數據庫中第i幀圖像的元數據在R、G、B分量上的交互信息 量之和;
[0049] 步驟36,通過計算得到的交互信息量,判斷原始圖像與第i幀圖像的相關性,判斷 是否檢索完成。具體來說,當計算得到多個交互信息量時,利用預設規則從多個交互信息量 中確定目標交互信息量,例如:預設規則為取最大值,則取多個交互信息量中最大交互信息 量所對應元數據的幀圖像作為檢索到的相似性最大的圖像,將多個交互信息量中最大交互 信息量所對應元數據的幀圖像所在的視頻確定為用戶輸入的原始圖像所在的視頻。
[0050] 本發明實施例提供一種檢索視頻的裝置,如圖4所示,該裝置包括:接收單元41,用 于接收用戶輸入的用于檢索視頻的原始圖像;處理單元43,用于確定原始圖像的元數據,分 別計算原始圖像的元數據與視頻元數據庫中每幀圖像的元數據的交互信息量,得到多個交 互信息量,利用預設規則從多個交互信息量中確定目標交互信息量,并將目標交互信息量 所對應元數據的幀圖像所在的視頻確定為原始圖像所在的視頻;其中,視頻元數據庫中存 儲多個視頻的元數據,每個視頻的元數據包括該視頻的視頻摘要中多幀圖像的元數據。
[0051] 本發明實施例提供的裝置中,接收用戶輸入的用于檢索視頻的原始圖像,確定原 始圖像的元數據,分別計算原始圖像的元數據與視頻元數據庫中每幀圖像的元數據的交互 信息量,得到多個交互信息量,由于視頻元數據庫中存儲多個視頻的元數據,每個視頻的元 數據包括該視頻的視頻摘要中多幀圖像的元數據,因此,在計算得到多個交互信息量之后, 利用預設規則從多個交互信息量中確定目標交互信息量,將目標交互信息量所對應元數據 的幀圖像所在的視頻確定為原始圖像所在的視頻,與現有技術中基于兩幅圖像的整個信息 進行比較,計算量大,且檢索結果不準確相比,通過構造元數據,計算原始圖像的元數據與 每個視頻的視頻摘要中每幀圖像的元數據的交互信息量,進而根據交互信息量確定原始圖 像所在的視頻,減小了計算量,提高檢索視頻的效率。
[0052] 在一種可能的實施方式中,本發明實施例提供的裝置中,任一圖像的元數據包括: 該圖像主題部分的元數據以及該圖像背景部分的元數據;處理單元43計算原始圖像的元數 據與視頻元數據庫中每幀圖像的元數據的交互信息量,具體用于:計算原始圖像主題部分 的元數據與視頻元數據庫中每幀圖像主題部分的元數據的交互信息量,和/或計算原始圖 像背景部分的元數據與視頻元數據庫中每幀圖像背景部分的元數據的交互信息量。
[0053] 在一種可能的實施方式中,本發明實施例提供的裝置中,當任一圖像的元數據包 括:圖像主題部分的元數據以及圖像背景部分的元數據時,處理單元43在確定原始圖像的 元數據之前,還用于:利用預設比例參數將原始圖像分為主題部分和背景部分;處理單元43 確定原始圖像的元數據,具體應用:確定原始圖像的主題部分的元數據以及原始圖像的背 景部分的元數據。
[0054] 在一種可能的實施方式中,本發明實施例提供的裝置中,原始圖像的元數據與視 頻元數據庫中任一幀圖像的元數據的交互信息量,等于原始圖像的元數據與視頻元數據庫 中該幀圖像的元數據在紅R、綠G、藍B分量上的交互信息量之和,其中,處理單元43通過如下 公式計算原始圖像的元數據與視頻元數據庫中該幀圖像的元數據在任一分量上的交互信
息量:
[0055]
[0056] 共中,1表不父I信思重,PaU)表不原妬圖傢在該分重上的概率密度函數,PB(b)表 示視頻元數據庫中該幀圖像在該分量上的概率密度函數,Pab (a,b)表示原始圖像和視頻元 數據庫中該幀圖像在該分量上的聯合概率密度函數。
[0057] 在一種可能的實施方式中,本發明實施例提供的裝置中,任一圖像的元數據包括 該圖像的灰度直方圖和概率密度函數,概率密度函數為該圖像灰度直方圖中各個灰度值上 像素點的統計數量與該圖像的總像素點數之比。
[0058] 本發明實施例提供的一種檢索視頻的裝置,可以集成在視頻軟件中,用于根據用 戶輸入的原始圖像檢索視頻,其中,接收單元41可以采用接收機或信號接收器,處理單元43 可以采用CPU處理器等。
[0059] 本發明實施例提供的一種檢索視頻的方法及裝置,接收用戶輸入的用于檢索視頻 的原始圖像,確定原始圖像的元數據,分別計算原始圖像的元數據與視頻元數據庫中每幀 圖像的元數據的交互信息量,得到多個交互信息量,由于視頻元數據庫中存儲多個視頻的 元數據,每個視頻的元數據包括該視頻的視頻摘要中多幀圖像的元數據,因此,在計算得到 多個交互信息量之后,利用預設規則從多個交互信息量中確定目標交互信息量,將目標交 互信息量所對應元數據的幀圖像所在的視頻確定為原始圖像所在的視頻,通過構造元數 據,計算原始圖像的元數據與每個視頻的視頻摘要中每幀圖像的元數據的交互信息量,進 而根據交互信息量確定原始圖像所在的視頻,減小了計算量,提高檢索視頻的效率。
[0060] 以上所描述的裝置實施例僅僅是示意性的,其中所述作為分離部件說明的單元可 以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單 元,即可以位于一個地方,或者也可以分布到多個網絡單元上。可以根據實際的需要選擇其 中的部分或者全部模塊來實現本實施例方案的目的。本領域普通技術人員在不付出創造性 的勞動的情況下,即可以理解并實施。
[0061] 通過以上的實施方式的描述,本領域的技術人員可以清楚地了解到各實施方式可 借助軟件加必需的通用硬件平臺的方式來實現,當然也可以通過硬件。基于這樣的理解,上 述技術方案本質上或者說對現有技術做出貢獻的部分可以以軟件產品的形式體現出來,該 計算機軟件產品可以存儲在計算機可讀存儲介質中,如R0M/RAM、磁碟、光盤等,包括若干指 令用以使得一臺計算機設備(可以是個人計算機,服務器,或者網絡設備等)執行各個實施 例或者實施例的某些部分所述的方法。
[0062] 最后應說明的是:以上實施例僅用以說明本發明的技術方案,而非對其限制;盡管 參照前述實施例對本發明進行了詳細的說明,本領域的普通技術人員應當理解:其依然可 以對前述各實施例所記載的技術方案進行修改,或者對其中部分技術特征進行等同替換; 而這些修改或者替換,并不使相應技術方案的本質脫離本發明各實施例技術方案的精神和 范圍。
【主權項】
1. 一種檢索視頻的方法,其特征在于,該方法包括: 接收用戶輸入的用于檢索視頻的原始圖像; 確定所述原始圖像的元數據,分別計算所述原始圖像的元數據與視頻元數據庫中每帖 圖像的元數據的交互信息量,得到多個交互信息量,利用預設規則從所述多個交互信息量 中確定目標交互信息量,并將所述目標交互信息量所對應元數據的帖圖像所在的視頻確定 為所述原始圖像所在的視頻; 其中,所述視頻元數據庫中存儲多個視頻的元數據,每個視頻的元數據包括該視頻的 視頻摘要中多帖圖像的元數據。2. 根據權利要求1所述的方法,其特征在于,任一圖像的元數據包括:該圖像主題部分 的元數據W及該圖像背景部分的元數據; 所述計算原始圖像的元數據與視頻元數據庫中每帖圖像的元數據的交互信息量,包 括: 計算原始圖像主題部分的元數據與視頻元數據庫中每帖圖像主題部分的元數據的交 互信息量,和/或 計算原始圖像背景部分的元數據與視頻元數據庫中每帖圖像背景部分的元數據的交 互信息量。3. 根據權利要求2所述的方法,其特征在于,當任一圖像的元數據包括:圖像主題部分 的元數據W及圖像背景部分的元數據時,在確定所述原始圖像的元數據之前,該方法還包 括: 利用預設比例參數將所述原始圖像分為主題部分和背景部分; 所述確定原始圖像的元數據,包括:確定原始圖像的主題部分的元數據W及所述原始 圖像的背景部分的元數據。4. 根據權利要求1所述的方法,其特征在于,原始圖像的元數據與視頻元數據庫中任一 帖圖像的元數據的交互信息量,等于原始圖像的元數據與視頻元數據庫中該帖圖像的元數 據在紅R、綠G、藍B分量上的交互信息量之和,其中,原始圖像的元數據與視頻元數據庫中該 帖圖像的元數據在任一分量上的交互信息量通過如下公式計算得到:其中,I表示交互信息量,PA(a)表示原始圖像在該分量上的概率密度函數,PB(b)表示視 頻元數據庫中該帖圖像在該分量上的概率密度函數,PAB(a,b)表示原始圖像和視頻元數據 庫中該帖圖像在該分量上的聯合概率密度函數。5. 根據權利要求1-4中任一項所述的方法,其特征在于,任一圖像的元數據包括該圖像 的灰度直方圖和概率密度函數,所述概率密度函數為該圖像灰度直方圖中各個灰度值上像 素點的統計數量與該圖像的總像素點數之比。6. -種檢索視頻的裝置,其特征在于,該裝置包括: 接收單元,用于接收用戶輸入的用于檢索視頻的原始圖像; 處理單元,用于確定所述原始圖像的元數據,分別計算所述原始圖像的元數據與視頻 元數據庫中每帖圖像的元數據的交互信息量,得到多個交互信息量,利用預設規則從所述 多個交互信息量中確定目標交互信息量,并將所述目標交互信息量所對應元數據的帖圖像 所在的視頻確定為所述原始圖像所在的視頻; 其中,所述視頻元數據庫中存儲多個視頻的元數據,每個視頻的元數據包括該視頻的 視頻摘要中多帖圖像的元數據。7. 根據權利要求6所述的裝置,其特征在于,任一圖像的元數據包括:該圖像主題部分 的元數據W及該圖像背景部分的元數據; 所述處理單元計算原始圖像的元數據與視頻元數據庫中每帖圖像的元數據的交互信 息量,具體用于: 計算原始圖像主題部分的元數據與視頻元數據庫中每帖圖像主題部分的元數據的交 互信息量,和/或 計算原始圖像背景部分的元數據與視頻元數據庫中每帖圖像背景部分的元數據的交 互信息量。8. 根據權利要求7所述的裝置,其特征在于,當任一圖像的元數據包括:圖像主題部分 的元數據W及圖像背景部分的元數據時,所述處理單元在確定所述原始圖像的元數據之 前,還用于: 利用預設比例參數將所述原始圖像分為主題部分和背景部分; 所述處理單元確定原始圖像的元數據,具體應用:確定原始圖像的主題部分的元數據 W及所述原始圖像的背景部分的元數據。9. 根據權利要求6所述的裝置,其特征在于,原始圖像的元數據與視頻元數據庫中任一 帖圖像的元數據的交互信息量,等于原始圖像的元數據與視頻元數據庫中該帖圖像的元數 據在紅R、綠G、藍B分量上的交互信息量之和,其中,所述處理單元通過如下公式計算原始圖 像的元數據與視頻元數據庫中該帖圖像的元數據在任一分量上的交互信息量:其中,I表示交互信息量,PA(a)表示原始圖像在該分量上的概率密度函數,PB(b)表示視 頻元數據庫中該帖圖像在該分量上的概率密度函數,PAB(a,b)表示原始圖像和視頻元數據 庫中該帖圖像在該分量上的聯合概率密度函數。10. 根據權利要求6-9中任一項所述的裝置,其特征在于,任一圖像的元數據包括該圖 像的灰度直方圖和概率密度函數,所述概率密度函數為該圖像灰度直方圖中各個灰度值上 像素點的統計數量與該圖像的總像素點數之比。
【文檔編號】G06F17/30GK105843930SQ201610189270
【公開日】2016年8月10日
【申請日】2016年3月29日
【發明人】蔡煒
【申請人】樂視控股(北京)有限公司, 樂視致新電子科技(天津)有限公司