專利名稱:檢測及修改圖像中的文字的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種圖像適配方法。
本發(fā)明還涉及用于使得可編程設(shè)備適于執(zhí)行所述方法的控制軟件。
本發(fā)明還涉及一種包括適于對圖像進(jìn)行適配的電子電路的電子設(shè)備。
本發(fā)明還涉及用在所述設(shè)備中的電子電路。
所述方法的一個例子可以從US 2003/0021586獲知。該已知方法對于光學(xué)或其他記錄/再現(xiàn)設(shè)備和電視的組合系統(tǒng)控制隱藏屏幕文字(closed caption)和字幕(subtitle)的顯示。該已知方法確保都作為ASCII格式的文本存在的所顯示的隱藏屏幕文字和字幕不發(fā)生重疊。該已知方法的缺陷在于,如果所述字幕形成圖像的一個整體部分,則該方法不能被用來控制隱藏屏幕文字和字幕的顯示。
本發(fā)明的第一個目的是提供一種在開頭段落中描述的那類方法,該方法可以被用來控制形成圖像的整體部分的文字的顯示。
本發(fā)明的第二個目的是提供一種在開頭段落中描述的那類電子設(shè)備,該電子設(shè)備可以被用來控制形成圖像的整體部分的文字的顯示。
根據(jù)本發(fā)明,實現(xiàn)第一目的是在于,所述方法包括以下步驟識別圖像中的文字,其中所述文字具有印刷外表(typographical aspect);以及修改所述文字的所述印刷外表。模擬視頻素材(例如模擬視頻廣播或模擬錄像帶)常常包含重疊的屏幕文字和/或字幕。本發(fā)明的方法使得有可能定制顯示器上的重疊文字的外觀。
在本發(fā)明的方法的一個實施例中,所述印刷外表包括字體尺寸。所述印刷外表例如可以附加地或者替換地包括字體類型和/或字體顏色。增大字體尺寸使得有閱讀困難和/或使用帶有小顯示器的設(shè)備(例如移動電話)的人們能夠更容易地閱讀所述文字。
識別圖像中的文字的步驟可以包括通過確定多條圖像線當(dāng)中的哪些圖像線包括最大數(shù)量的水平邊緣來檢測水平文字線邊界。這樣做改進(jìn)了所述識別步驟的文字檢測性能。通過首先檢測水平文字線邊界,在所述文字檢測算法的下一步驟中必須被處理的區(qū)域可以相對較小。本發(fā)明的檢測水平文字線邊界以便減小必須被處理的區(qū)域的思想以及該思想的實施例可以在無需修改所述文字的印刷外表的情況下被使用,例如當(dāng)其被使用在多媒體索引和取回應(yīng)用中的時候。
識別圖像中的文字的步驟可以進(jìn)一步包括確定一組僅僅出現(xiàn)在所述各水平文字線邊界之間的像素值,并且如果像素具有來自該組像素值當(dāng)中的值則把所述像素識別為文字像素。與某些其他的文字檢測算法不同,該文字檢測算法使得有可能檢測反轉(zhuǎn)的文字以及正常文字。
識別圖像中的文字的步驟可以進(jìn)一步包括通過對于所識別出的文字像素執(zhí)行形態(tài)閉合運算來確定單詞邊界,并且如果另外的像素位于所述單詞邊界內(nèi)則把所述另外的像素識別為文字像素。這樣做確保可以正確地識別視頻圖像中的大量文字像素。
修改文字的印刷外表的步驟可以包括處理形成所述文字的文字像素,并且把經(jīng)過處理的像素重疊在所述圖像上。這對于適配由像素構(gòu)成的圖像而言是很有用的。
本發(fā)明的方法可以進(jìn)一步包括利用替換像素來替換至少其中一個文字像素的步驟,該替換像素的值是基于一個非文字像素的值,所述非文字像素即不形成所述文字的像素。如果經(jīng)過重新格式化的文字與原始文字不完全重疊,那么去除原始文字就可能是必要的。通過使用替換像素,減少了可見偽像的數(shù)量,其中所述替換像素是基于非文字像素的值。本發(fā)明的去除文字的方式導(dǎo)致較低數(shù)量的偽像,并且在任何去除文字的應(yīng)用中都是有用的。如果用戶由于可以理解所說的語言而只想去除字幕,那么就沒有必要修改所述字幕的印刷外表。
所述替換像素的值可以基于在所述至少一個文字像素的鄰域內(nèi)的各非文字像素的中值顏色。在測試中,通過這種做法所產(chǎn)生的替換像素比起利用其他算法所確定的替換像素來說不那么引人注意。
本發(fā)明的方法可以進(jìn)一步包括利用另一個替換像素來替換所述替換像素的鄰域內(nèi)的另一個文字像素的步驟,該另一個替換像素的值至少部分地基于所述替換像素。如果文字像素在其鄰域內(nèi)具有少于預(yù)定數(shù)量的非文字像素,那么簡單地增大鄰域尺寸并不恰當(dāng),這是因為如果使用了較遠(yuǎn)的背景像素的話,那么所估計的顏色可能不準(zhǔn)確,并且所述鄰域尺寸越大,所需要的計算量就越大。如果所述另一個替換像素的值至少部分地基于所述替換像素,尤其是如果所述另一個替換像素的值是基于所述另一個替換像素的鄰域內(nèi)的多個替換像素的話,那么相對較小的鄰域尺寸就足以實現(xiàn)可見偽像的良好減少。
修改文字的印刷外表的步驟可以包括在后續(xù)圖像中滾動所述文字。如果經(jīng)過放大的字幕或屏幕文字必須全部被容納在視頻圖像中,那么對所述字幕或屏幕文字的放大就被限制到某一最大值。該最大值對于某些人來說可能是不足夠的。通過在后續(xù)視頻圖像中滾動經(jīng)過重新格式化的文字像素,所述文字的尺寸可以被進(jìn)一步放大。
本發(fā)明的方法可以進(jìn)一步包括使得用戶能夠定義所述文字將被滾動的速率的步驟。這樣做允許用戶調(diào)節(jié)所述速率以配合他的閱讀速度。
根據(jù)本發(fā)明,實現(xiàn)第二個目的是在于,所述電子電路在功能上包括用于識別圖像中的文字的識別器,所述文字具有印刷外表;以及用于修改所述文字的印刷外表的修改器。所述電子設(shè)備例如可以是PC、電視、機(jī)頂盒、視頻記錄器、視頻播放器或者移動電話。
參照附圖,本發(fā)明的這些和其他方面將變得顯而易見,并且將以舉例的方式進(jìn)一步進(jìn)行闡述,附圖中
圖1是本發(fā)明的方法的流程圖;圖2是本發(fā)明的電子設(shè)備的方框圖;圖3示出了視頻圖像的一個例子,其中字幕已經(jīng)被放大;圖4示出了視頻圖像的一個例子,其中字幕已經(jīng)被轉(zhuǎn)換成移動文字;圖5示出了被用在所述方法的一個實施例的文字檢測步驟中的一個等式和兩個掩模;圖6示出了在視頻圖像中檢測到的文字的一個例子;圖7示出了所述方法的一個實施例中的識別感興趣的區(qū)域內(nèi)的文字的步驟;圖8示出了對于圖7的例子計算的水平邊緣投影;以及圖9示出了視頻圖像的一個例子,其中已經(jīng)從該視頻圖像中去除了所識別出的文字像素。
在附圖中,相應(yīng)的元件由相同的附圖標(biāo)記表示。
參見圖1,本發(fā)明的方法包括識別圖像中的文字的步驟1,其中所述文字具有印刷外表;以及修改所述文字的所述印刷外表的步驟3。存在許多對所述文字進(jìn)行重新格式化的可能性,其中包括改變顏色、字體尺寸、位置等等。圖3示出了一個例子,其中改變了文字的尺寸,并且因而改變了文字的位置。這在小顯示器屏幕(例如移動電話顯示器)上是特別有利的。圖3的左半部分示出了帶有字幕的原始圖像的經(jīng)過重新縮放的版本(在水平和垂直方向上的子采樣因子都是4)。在該經(jīng)過重新縮放的圖像中的字幕的字符尺寸變小很多,有些用戶閱讀起來可能會很困難。圖3的右半部分中的圖像是帶有大尺寸字幕的相同圖像。有利地,例如電視、視頻記錄器、掌上電腦或者移動電話的消費者電子設(shè)備可以執(zhí)行本發(fā)明的方法。或者,一個發(fā)送電子設(shè)備執(zhí)行所述方法的一部分,并且一個接收(消費者)電子設(shè)備執(zhí)行所述方法的另一部分。在這種情況下,在由所述發(fā)送電子設(shè)備執(zhí)行的所述方法中,修改所述文字的所述印刷外表的步驟3可以由以下步驟替換把帶有修改過的印刷外表的文字發(fā)送到一個電子設(shè)備,該電子設(shè)備能夠把帶有所述修改過的印刷外表的所述文字重疊在所述圖像上。
修改所述文字的所述印刷外表的步驟3可以包括在后續(xù)圖像中滾動所述文字。在圖4中,通過把靜態(tài)文字轉(zhuǎn)換成移動文字,使得在經(jīng)過子采樣的圖像中的文字尺寸甚至大于原始圖像中的字幕文字尺寸。如圖4中的4幅圖像所表明的那樣,原來是靜態(tài)的字幕文字被變換成具有一種或多種不同顏色的更大的移動文字。所述方法可以進(jìn)一步包括允許用戶定義所述文字將被滾動的速率的步驟。這使得用戶有可能在特定時間段內(nèi)放慢所述滾動文字的速度。由于所述滾動文字的速度的降低導(dǎo)致相對于實時的延遲,因此,滯后于實時文字?jǐn)嗬m(xù)器(ticker)的文字?jǐn)?shù)據(jù)必須被存儲在一個先進(jìn)先出(FIFO)存儲器中。該FIFO存儲器將具有有限的尺寸;因此,所述放慢操作的持續(xù)時間將受到限制,除非用戶同意丟失一些文字?jǐn)嗬m(xù)器信息以便趕上實時斷續(xù)器。FIFO存儲器可以被用來存儲滯后文字?jǐn)?shù)據(jù),并且可以使用多種算法來利用參數(shù)計算用光整個FIFO存儲器的時間段,所述參數(shù)例如是移動文字的字體尺寸、新速度與原始文字速度的大小的比值以及存儲器尺寸。可以關(guān)于此類限制對用戶進(jìn)行提示或者向用戶請求反饋。
由于對自動視頻索引工具的需求越來越多,因此視頻中的重疊文字檢測近來變得越來越流行。全部的現(xiàn)有文字檢測算法都以一種方式或另一種方式利用重疊文字區(qū)域的高對比度屬性。在一種有利的文字檢測算法中,首先計算將在其中檢測文字的幀的水平和垂直導(dǎo)數(shù),以便增強(qiáng)高對比度區(qū)域。在圖像和視頻處理文獻(xiàn)中公知的是,簡單的掩模(比如圖5的掩模61和63)對圖像的導(dǎo)數(shù)進(jìn)行近似。在對于每個顏色通道(或者是強(qiáng)度和色度通道,這取決于所選擇的顏色空間)計算了所述導(dǎo)數(shù)之后,通過圖5的等式65計算邊緣指向特征,其中Dix(x,y)和Diy(x,y)是在像素位置(x,y)處的第i個顏色通道的水平和垂直導(dǎo)數(shù),并且C表示所選顏色空間的所有通道的集合。所述邊緣指向特征首先由Rainer Lienhart和Axel Wernicke的“Localizing and Segmenting Textin Images,Video and Web Pages(對圖像、視頻和web頁面中的文字進(jìn)行定位和分割)”(IEEE Transactions on Circuits and Systems for VideoTechnology,Vol.12,No.4,pp.256-268,2002年4月)提出。
可以使用一個統(tǒng)計學(xué)習(xí)工具來找到最佳的文字/非文字分類器。支持矢量機(jī)(SVM)導(dǎo)致二元分類器,并且具有良好的推廣能力。利用1000個文字塊以及最多3000個非文字塊(為之計算邊緣指向特征)訓(xùn)練的基于SVM的分類器在實驗中提供了良好的結(jié)果。由于很難找到代表性的難于分類的非文字實例,因此可以遵循流行的自舉(bootstrapping)方法,所述自舉方法由K.K.Sung和T.Poggio在“Example-based learning for view-based human face detection(對于基于視圖的人面部檢測的基于實例的學(xué)習(xí))”(IEEE Trans.PatternAnalysis and Machine Intelligence,vol.20,no.1,pp.39-51,1998年1月)引入。基于自舉的訓(xùn)練在幾次迭代中完成,并且在每次迭代中,在一些不包含文字的圖像上測試所得到的分類器。關(guān)于該數(shù)據(jù)集的假警報表示當(dāng)前的分類器無法正確分類的很難的非文字實例。這些非文字樣本被添加到所述訓(xùn)練集;因此,非文字訓(xùn)練數(shù)據(jù)集增大,并且利用該擴(kuò)大的數(shù)據(jù)集重新訓(xùn)練所述分類器。當(dāng)對分類器進(jìn)行訓(xùn)練時,需要做出決定的一個重要的問題是被饋送到所述分類器的圖像塊的尺寸,這是因為所述塊的高度決定最小可檢測字體尺寸,而所述塊的寬度則決定最小可檢測文字寬度。用于訓(xùn)練所述SVM分類器的12×12塊提供良好的結(jié)果,這是因為在具有400像素的高度的典型的幀中,很少能找到小于12的字體尺寸。通過在多個分辨率上運行具有12×12的窗口尺寸的所述分類器而實現(xiàn)字體尺寸獨立性,并且通過在水平和垂直方向上移動所述窗口以在整個圖像上評估所述分類器而實現(xiàn)位置獨立性。所描述的文字檢測算法導(dǎo)致如圖6所示的基于塊的文字區(qū)域。所檢測到的文字結(jié)果被顯示為綠色塊,并且是從2×2(水平子采樣率×垂直子采樣率)的子采樣的視頻獲得的;因此,它們對應(yīng)于原始幀中的24×24的塊(對應(yīng)于子采樣的幀的12×12的塊尺寸)。
識別圖像中的文字的步驟1可以包括通過確定多條圖像線當(dāng)中的哪些圖像線包括最大數(shù)量的水平邊緣來檢測水平文字線邊界。獲得像素精確的文字掩模的一種方式是通過特別地定位文字線和單詞邊界(主要是為了能夠在多條線中顯示文字并且為更精確地提取所述文字掩模)以及提取所述二元文字掩模。在已經(jīng)組合了同一條線以及相鄰各行中的文字區(qū)域以便產(chǎn)生將被處理的單一聯(lián)合區(qū)域之后,可以執(zhí)行形態(tài)分析。圖7的ROI 71示出了通過逐列和逐行合并程序從圖6中提取的感興趣區(qū)域(ROI)。首先,在該ROI中執(zhí)行邊緣檢測,以便找出高頻像素,預(yù)期這些高頻像素當(dāng)中的大多數(shù)是文字。ROI 73示出了白色的邊緣,所述邊緣由本領(lǐng)域中已知的Prewitt檢測器檢測到。由于所述ROI主要是由文字占主導(dǎo)地位,因此預(yù)期文字線的頂部將表明邊緣數(shù)量的增加,而文字線的底部將顯示出邊緣數(shù)量的相應(yīng)的降低。沿著水平和/或垂直方向的投影是用來容易地確定所述位置的有效的描述符。與用在許多文字分割算法中的強(qiáng)度投影相對照,邊緣投影對于文字的顏色變化較為魯棒。圖8中示出的水平邊緣投影是通過找出沿著每條圖像線的邊緣像素的平均數(shù)量而計算的,這在圖7的ROI 73中示出。圖7的ROI 71中的兩條文字線導(dǎo)致所述投影中的兩個可以容易地提取的邊緣區(qū)域。圖7的ROI 75示出了用自動計算的紅線和綠線標(biāo)記的兩條所提取的線。每條文字線的4線語義遵循拉丁文字的屬性。最上面的線表示文字線的頂部;然而,在更加詳細(xì)的層級上,最上面的線對應(yīng)于向上伸長的字符(比如“t”和“k”)的頂端。從上面數(shù)的第二條線表示非伸長字符(比如“a”和“e”)的頂端。類似地,下面的兩條線表示非伸長字符的底部以及向下伸長的字符(比如“p”和“y”)的末端或者標(biāo)點符號(比如“,”)。
識別圖像中的文字的步驟1可以進(jìn)一步包括確定一組僅僅出現(xiàn)在所述各水平文字線邊界之間的像素值,并且如果像素具有來自該組像素值當(dāng)中的值則把所述像素識別為文字像素。在檢測出各條文字線以后,自動計算一個閾值Tbinarization,以便找出所述二元的并且逐像素地更為精確的文字掩模。該參數(shù)Tbinarization被設(shè)置成使得沒有如圖7的ROI 75所示的所檢測出的文字線之外的像素被指定為文字像素(例如白色)。所得到的文字像素在圖7的ROI 77中示出。
識別圖像中的文字的步驟1可以進(jìn)一步包括通過對于所識別出的文字像素執(zhí)行形態(tài)閉合運算來確定單詞邊界,并且如果另外的像素位于所述單詞邊界內(nèi)則把所述另外的像素識別為文字像素。對所得到的文字掩模應(yīng)用形態(tài)閉合運算(其結(jié)果在圖7的ROI 79中示出)以及連接組成部分標(biāo)記算法,以便對各個單詞進(jìn)行分割。所述閉合運算聯(lián)合單詞中的單獨的字符,而連接組成部分標(biāo)記算法則提取連接的區(qū)域(在本例中是單詞)。
修改文字的印刷外表的步驟1可以包括處理形成所述文字的文字像素,并且把經(jīng)過處理的像素重疊在所述圖像上。在把所述經(jīng)過處理的像素重疊在所述圖像上之后或之前,可以執(zhí)行利用替換像素來替換至少其中一個文字像素的步驟9,該替換像素的值是基于一個非文字像素的值。所述替換像素的值可以基于在所述至少一個文字像素的鄰域內(nèi)的各非文字像素的中值顏色。如圖7的ROI 79所示出的放大的文字掩模可以被用來去除文字。圖7的ROI 79中所示出的該放大的文字掩模是在對于圖7的ROI 77中的原始文字掩模應(yīng)用了所述形態(tài)閉合運算之后獲得的。使用放大的掩模的主要原因在于,原始掩模可能比實際的文字線更細(xì),因此在從圖像中去除原始文字時,可能導(dǎo)致所述圖像中的視覺上令人不舒服的文字片段。為了填充文字區(qū)域,在所述像素的足夠大的鄰域(例如對于720×576的圖像是23×23的窗口)中使用各非文字像素的中值顏色。
本發(fā)明的方法可以進(jìn)一步包括利用另一個替換像素來替換所述替換像素的鄰域內(nèi)的另一個文字像素的步驟,該另一個替換像素的值至少部分地基于所述替換像素。如果所述文字像素離所述文字掩模的邊界較遠(yuǎn),那么即使是較大的窗口可能也不具有足夠的非文字像素來近似將被用于填充在所述文字像素中的顏色。此外,對于這些像素使用大窗口是不適當(dāng)?shù)模@是因為1)它們遠(yuǎn)離背景,因此如果使用遠(yuǎn)距離的背景像素,那么所估計的顏色可能不精確;以及2)窗口尺寸越大,所需要的計算量就越大。在這些情況下,在當(dāng)前文字像素的較小的(例如3×3)鄰域內(nèi)的這些像素的中值顏色被指定為該當(dāng)前文字像素的顏色。根據(jù)處理方向來定義該鄰域,從而該鄰域內(nèi)的所有文字像素都已經(jīng)被指定了顏色。應(yīng)當(dāng)注意到,該小窗口中的所有像素的顏色值都被使用,而不管它們原來是文字像素還是非文字像素。在圖9中示出了該文字檢測算法的結(jié)果。
參見圖2,本發(fā)明的電子設(shè)備21包括電子電路23。該電子電路23在功能上包括用于識別圖像中的文字的識別器25,所述文字具有印刷外表;以及用于修改所述文字的印刷外表的修改器27。該電子設(shè)備21例如可以是PC、電視、機(jī)頂盒、視頻記錄器、視頻播放器或者移動電話。該電子電路23例如可以是Philips Trimedia媒體處理器、PhilipsNexperia音頻視頻輸入處理器、以及AMD Athlon CPU或者IntelPentium CPU。有利地,所述識別器25和修改器27是一個計算機(jī)程序的功能組件。該電子設(shè)備21可以進(jìn)一步包括輸入端31,其例如是SCART、復(fù)合、SVHS或組件插座或者TV調(diào)諧器。該電子設(shè)備21可以進(jìn)一步包括輸出端33,其例如是SCART、復(fù)合、SVHS或組件插座或者無線發(fā)送器。該電子設(shè)備21可以包括與所述電子電路23相耦合的顯示器(未示出)。該電子設(shè)備21還可以包括存儲裝置35。存儲裝置35例如可以被用來存儲未經(jīng)處理的視頻圖像和/或用于存儲經(jīng)過處理的視頻圖像。該電子設(shè)備21可以包括光學(xué)字符辨識(OCR)單元和文本到語音轉(zhuǎn)換(TTS)單元。OCR的使用對于TTS的操作來說是必要的,這是因為到TTS的輸入是單詞和句子形式的ASCII文本。所述OCR和TTS單元的一種應(yīng)用是閱讀能力較差的用戶可以選擇以他自己的母語收聽自動產(chǎn)生的語音片段,而不是閱讀字幕。為了防止來自原始音頻的干擾,在這些情況下優(yōu)選地關(guān)斷原始音頻。此外,通過OCR引擎辨識字符還允許對視頻內(nèi)容進(jìn)行自動索引,這使得許多應(yīng)用成為可能。該電子設(shè)備21還可以通過兩個電子設(shè)備來實現(xiàn)。在第一電子設(shè)備中,其電子電路在功能上包括用于識別圖像中的文字的識別器,所述文字具有印刷外表;以及發(fā)送器,其用于把具有經(jīng)過修改的印刷外表的文字和標(biāo)識所述圖像的標(biāo)識發(fā)送到一個電子設(shè)備,該電子設(shè)備能夠把具有經(jīng)過修改的印刷外表的所述文字重疊在所述圖像上。在第二電子設(shè)備中,其電子電路在功能上包括接收器,其用于接收具有經(jīng)過修改的印刷外表的文字和標(biāo)識圖像的標(biāo)識;以及重疊器,其用于把具有經(jīng)過修改的印刷外表的所述文字重疊在所述圖像上。例如,所述兩個電子設(shè)備都可以是相同的家用網(wǎng)絡(luò)的一部分,或者第一電子設(shè)備可以遠(yuǎn)程地位于服務(wù)提供商的位置處,而第二電子設(shè)備則位于家用網(wǎng)絡(luò)中。
雖然結(jié)合有利實施例描述了本發(fā)明,但是應(yīng)當(dāng)理解,本領(lǐng)域技術(shù)人員可以明顯看出在上面概述的原理內(nèi)對所述有利實施例的修改,因此本發(fā)明不限于所述有利實施例,而是意圖包含這種修改。本發(fā)明在于每一種新穎特征以及每一種特征組合。權(quán)利要求中的附圖標(biāo)記不限制其保護(hù)范圍。“包括”一詞及其動詞變化不排除在權(quán)利要求中列出的元件之外的其他元件的存在。元件前面的“一個”不排除多個這種元件的存在。
本發(fā)明可以通過包括幾個不同元件的硬件來實現(xiàn),并且可以通過適當(dāng)編程的設(shè)備來實現(xiàn)。“控制軟件”應(yīng)當(dāng)被理解成意味著存儲在計算機(jī)可讀介質(zhì)(比如軟盤)上的、可以經(jīng)由網(wǎng)絡(luò)(比如因特網(wǎng))下載的或者可以以任何方式買到的任何軟件產(chǎn)品。
權(quán)利要求
1.一種適配圖像的方法,該方法包括以下步驟-識別(1)該圖像中的文字,其中所述文字具有印刷外表;以及-修改(3)所述文字的所述印刷外表。
2.如權(quán)利要求1所述的方法,其特征在于,所述印刷外表包括字體尺寸。
3.如權(quán)利要求1所述的方法,其特征在于,識別所述圖像中的文字的步驟(1)包括通過確定多條圖像線當(dāng)中的哪些圖像線包括最大數(shù)量的水平邊緣來檢測水平文字線邊界。
4.如權(quán)利要求3所述的方法,其特征在于,識別所述圖像中的文字的步驟(1)進(jìn)一步包括確定一組僅僅出現(xiàn)在所述各水平文字線邊界之間的像素值,并且如果像素具有來自該組像素值當(dāng)中的值則把所述像素識別為文字像素。
5.如權(quán)利要求4所述的方法,其特征在于,識別所述圖像中的文字的步驟(1)進(jìn)一步包括通過對于所識別出的文字像素執(zhí)行形態(tài)閉合運算來確定單詞邊界,并且如果另外的像素位于所述單詞邊界內(nèi)則把所述另外的像素識別為文字像素。
6.如權(quán)利要求1所述的方法,其特征在于,修改所述文字的所述印刷外表的步驟包括處理(5)形成所述文字的文字像素,并且把經(jīng)過處理的像素重疊(7)在所述圖像上。
7.如權(quán)利要求6所述的方法,進(jìn)一步包括利用替換像素來替換(9)至少其中一個所述文字像素的步驟,該替換像素的值是基于非文字像素的值。
8.如權(quán)利要求7所述的方法,其特征在于,所述替換像素的值是基于在所述至少一個文字像素的鄰域內(nèi)的各非文字像素的中值顏色。
9.如權(quán)利要求7所述的方法,進(jìn)一步包括利用另一個替換像素來替換所述替換像素的鄰域內(nèi)的另一個文字像素的步驟,該另一個替換像素的值至少部分地基于所述替換像素。
10.如權(quán)利要求1所述的方法,其特征在于,修改(3)所述文字的所述印刷外表的步驟包括滾動后續(xù)圖像中的所述文字。
11.如權(quán)利要求10所述的方法,進(jìn)一步包括允許用戶定義所述文字將被滾動的速率的步驟。
12.一種允許適配圖像的方法,該方法包括以下步驟-識別(1)該圖像中的文字,其中所述文字具有印刷外表;以及-把帶有修改過的印刷外表的所述文字發(fā)送到電子設(shè)備,該電子設(shè)備能夠把帶有所述修改過的印刷外表的所述文字重疊在所述圖像上。
13.用于使得可編程設(shè)備適于執(zhí)行權(quán)利要求1的方法的控制軟件。
14.一種包括電子電路(23)的電子設(shè)備(21),該電子電路(23)在功能上包括-用于識別該圖像中的文字的識別器(25),其中所述文字具有印刷外表;以及-用于修改所述文字的所述印刷外表的修改器(27)。
15.一種包括電子電路的電子設(shè)備,該電子電路在功能上包括-接收器,其用于接收具有修改過的印刷外表的文字和標(biāo)識圖像的標(biāo)識;以及-重疊器,其用于把具有所述修改過的印刷外表的所述文字重疊在所述圖像上。
16.一種包括電子電路的電子設(shè)備,該電子電路在功能上包括-用于識別圖像中的文字的識別器,其中所述文字具有印刷外表;以及-發(fā)送器,其用于把具有修改過的印刷外表的所述文字和標(biāo)識所述圖像的標(biāo)識發(fā)送到電子設(shè)備,該電子設(shè)備能夠把具有所述修改過的印刷外表的所述文字重疊在所述圖像上。
17.用在權(quán)利要求14、15或16的電子設(shè)備中的電子電路。
全文摘要
本發(fā)明的方法包括兩個適配圖像的步驟識別該圖像中的文字以及修改所述文字的印刷外表。本發(fā)明的電子設(shè)備適于執(zhí)行本發(fā)明的方法。本發(fā)明還涉及用于使得編程設(shè)備適于執(zhí)行本發(fā)明的方法的控制軟件以及用在本發(fā)明的設(shè)備中的電子電路。
文檔編號G06K9/00GK101057247SQ200580038952
公開日2007年10月17日 申請日期2005年11月8日 優(yōu)先權(quán)日2004年11月15日
發(fā)明者A·埃金, R·賈辛施 申請人:皇家飛利浦電子股份有限公司