日韩中文字幕久久久97都市激情,久久91网,亚洲天堂最新,国产精品嫩草影院九色,亚洲午夜精品一本二本,精品少妇一区二区三区蜜桃,av一道本

一種數(shù)據(jù)流相似性的連接方法與流程

文檔序號(hào):12470115閱讀:來(lái)源:國(guó)知局

技術(shù)特征:

1.一種數(shù)據(jù)流相似性的連接方法,其特征在于,包括:

根據(jù)預(yù)設(shè)時(shí)間跨度值P在數(shù)據(jù)流R上構(gòu)建B+樹(shù)森林集合索引;

當(dāng)所述數(shù)據(jù)流R和數(shù)據(jù)流S上的數(shù)據(jù)元組的時(shí)間戳在當(dāng)前滑動(dòng)窗口的時(shí)間范圍內(nèi)時(shí),基于所述B+樹(shù)森林集合索引,進(jìn)行滑動(dòng)窗口語(yǔ)義下基于地球移動(dòng)距離EMD距離的所述數(shù)據(jù)流R和所述數(shù)據(jù)流S之間的相似性連接。

2.根據(jù)權(quán)利要求1所述的數(shù)據(jù)流相似性的連接方法,其特征在于,所述根據(jù)預(yù)設(shè)時(shí)間跨度值P在數(shù)據(jù)流R上構(gòu)建B+樹(shù)森林集合索引包括:

根據(jù)預(yù)設(shè)時(shí)間跨度值P把時(shí)間域劃分為T(mén)個(gè)互相不重疊的時(shí)間區(qū)間,T大于等于1;

為所述R數(shù)據(jù)流上每個(gè)所述時(shí)間區(qū)間內(nèi)達(dá)到的所述數(shù)據(jù)元組構(gòu)建一個(gè)R數(shù)據(jù)流B+樹(shù)森林索引,得到所述R數(shù)據(jù)流所述時(shí)間域上T個(gè)B+樹(shù)森林索引,所述T個(gè)B+樹(shù)森林索引構(gòu)成所述R數(shù)據(jù)流的B+樹(shù)森林集合索引。

3.根據(jù)權(quán)利要求2所述的數(shù)據(jù)流相似性的連接方法,其特征在于,在根據(jù)預(yù)設(shè)時(shí)間跨度值P在數(shù)據(jù)流R上構(gòu)建B+樹(shù)森林集合索引之后,還包括:

當(dāng)所述B+樹(shù)森林集合索引中所包含的數(shù)據(jù)元組的個(gè)數(shù)大于等于c*P的值且Factive.maxTime-Factive.minTime>=P時(shí),新建一個(gè)B+樹(shù)森林索引Fnew,并將所述B+樹(shù)森林索引Fnew設(shè)定為當(dāng)前的活躍索引Factive

其中,F(xiàn)active.maxTime為當(dāng)前活躍索引所維護(hù)的數(shù)據(jù)元組的最大時(shí)間戳,F(xiàn)active.minTime為當(dāng)前活躍索引所維護(hù)的數(shù)據(jù)元組的最小時(shí)間戳,c為預(yù)設(shè)的B+樹(shù)森林索引的容量系數(shù)。

4.根據(jù)權(quán)利要求2所述的數(shù)據(jù)流相似性的連接方法,其特征在于,在基于所述B+樹(shù)森林集合索引,進(jìn)行滑動(dòng)窗口語(yǔ)義下基于EMD距離的所述數(shù)據(jù)流R和所述數(shù)據(jù)流S之間的相似性連接之前,還包括:

當(dāng)接收到所述數(shù)據(jù)流S上的數(shù)據(jù)元組s之后,計(jì)算所述B+樹(shù)森林集合索引中的每個(gè)所述時(shí)間區(qū)間上構(gòu)建的B+樹(shù)森林索引Fi中數(shù)據(jù)元組的最小時(shí)間戳和所述元祖s的時(shí)間戳之間的差值;

當(dāng)所述差值大于所述滑動(dòng)窗口大小和最大網(wǎng)絡(luò)延遲之和時(shí),刪除所述B+樹(shù)森林索引Fi

5.根據(jù)權(quán)利要求4所述的數(shù)據(jù)流相似性的連接方法,其特征在于,還包括:設(shè)置所述預(yù)設(shè)時(shí)間跨度值

其中,|W|為所述滑動(dòng)窗口大小。

6.根據(jù)權(quán)利要求3所述的數(shù)據(jù)流相似性的連接方法,其特征在于,所述基于所述B+樹(shù)森林集合索引,進(jìn)行滑動(dòng)窗口語(yǔ)義下基于EMD距離的所述數(shù)據(jù)流R和所述數(shù)據(jù)流S之間的相似性連接,包括:

基于所述數(shù)據(jù)流S中的數(shù)據(jù)元組si的時(shí)間戳,從B+樹(shù)森林集合F中找到時(shí)間跨度區(qū)間和所述數(shù)據(jù)元組si要查詢(xún)的時(shí)間滑動(dòng)窗口有交集的所述B+樹(shù)森林集合F';

當(dāng)所述B+樹(shù)森林集合F中的B+樹(shù)森林Fj∈F'滿足si.timestamp-Fj.maxTime≤|W|時(shí),返回Fj中和si間的EMD距離不大于θ且時(shí)間戳落在si的滑動(dòng)窗口范圍內(nèi)的所述R數(shù)據(jù)流上的數(shù)據(jù)元組R'{rj}和元組si構(gòu)成的相似性連接結(jié)果元組對(duì)<rj,si>,將所述元組對(duì)<rj,si>存入結(jié)果集RSi

7.根據(jù)權(quán)利要求6所述的數(shù)據(jù)流相似性的連接方法,其特征在于,所述返回Fj中和si間的EMD距離不大于θ且時(shí)間戳落在si的滑動(dòng)窗口范圍內(nèi)的所述R數(shù)據(jù)流上的數(shù)據(jù)元組R'{rj}包括:滿足公式1規(guī)定的區(qū)間范圍的數(shù)據(jù)元組R'{rj},所述公式1規(guī)定的區(qū)間范圍為[min(Фl)+key(s,Фl)-θ,θ-ckey(s,Фl)],

min(Фl)是和EMD距離對(duì)偶線性規(guī)劃問(wèn)題的可行解Фl相關(guān)的實(shí)數(shù),key(s,Фl)是s基于可行解Фl計(jì)算得到的鍵值,ckey(s,Фl)是s基于可行解Фl計(jì)算得到的反鍵值。

8.根據(jù)權(quán)利要求6所述的數(shù)據(jù)流相似性的連接方法,其特征在于,在返回Fj中和si間的EMD距離不大于θ且時(shí)間戳落在si的滑動(dòng)窗口范圍內(nèi)的所述R數(shù)據(jù)流上的數(shù)據(jù)元組R'{rj}和元組si構(gòu)成的相似性連接結(jié)果元組對(duì)<rj,si>之前,還包括:

如果數(shù)據(jù)元組rj和數(shù)據(jù)元組si之間EMD距離的上界值小于或等于相似性閾值θ,則將所述元組對(duì)<rj,si>存入結(jié)果集RSupperbound

9.根據(jù)權(quán)利要求6所述的數(shù)據(jù)流相似性的連接方法,其特征在于,在返回Fj中和si間的EMD距離不大于θ的所述R數(shù)據(jù)流上的數(shù)據(jù)元組R’{rj}和元組對(duì)<rj,si>之前,還包括:

如果數(shù)據(jù)元組rj和數(shù)據(jù)元組si之間EMD距離的下界值大于相似性閾值θ,則將刪除數(shù)據(jù)元組rj

10.根據(jù)權(quán)利要求6所述的數(shù)據(jù)流相似性的連接方法,其特征在于,所述進(jìn)行滑動(dòng)窗口語(yǔ)義下基于EMD距離的所述數(shù)據(jù)流R和所述數(shù)據(jù)流S之間的相似性連接包括:將所述結(jié)果集RSi和所述結(jié)果集RSupperbound的并集作為所述相似性連接的結(jié)果。

當(dāng)前第2頁(yè)1 2 3 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1