視頻語義檢索可視化分析
談古論今
作者:陳順寶
摘 要:本文對ISI Web of Knowledge數據庫中收錄的以視頻語義檢索為主題的文獻進行分析,然後利用CiteSpace 繪製出視頻語義檢索文獻的知識圖譜,對其進行詳細的闡述,並通過分析文獻關鍵詞分布和檢測詞頻變動趨勢確定出視頻語義檢索的研究熱點和前沿領域。
關鍵詞:視頻語義檢索 CiteSpace 研究熱點 知識圖譜
一、引言
互聯網的普及和多媒體技術的日趨成熟使得視頻資源爆炸式地增長,如何高效地存儲與檢索大量的視頻數據成為迫在眉睫的研究問題。由於視頻具有豐富的時空信息、結構複雜等特點,傳統的檢索技術無法滿足需要,視頻檢索是一門交叉學科,以圖像處理、模式識別、計算機視覺、圖像理解等領域的知識為基礎,從認知科學、人工智能、數據庫管理係統及人機交互,信息檢索等領域引入媒體數據表示和數據模型。目前,形成兩種主流的檢索技術:基於文本的視頻檢索和基於內容的視頻檢索。如何建立從視頻的低層特征到高層語義的映射,獲取視頻的語義概念,並在此基礎上進行語義檢索成為研究的熱點。本文旨在對視頻語義檢索領域的代表研究機構、期刊、作者、文獻、研究熱點和前沿進行定量考查和可視化分析,繪製出形象化的知識圖譜,使廣大學者能夠更加直觀的了解視頻語義檢索的發展全貌和演化動態。
二、數據來源於研究方法
本文通過主題詞檢索的方式確定數據源,分析的數據均來自Web of knowledge。數據記錄主要包括文獻的作者、題目、摘要和文獻的引文。檢索式:ts=(video semantic retriev*) or ts=(video semantic index*) ,文獻類型為proceedings paper(767) 和 article(479) ,共1155篇。檢索時間:2013年12月20日。本文采用的數據分析及圖譜繪製工具為陳超美博士開發的信息可視化軟件Cite Space3.7.R7。Cite Space屬於多元、分時、動態的第二代信息可視化技術,其繪製的科學圖譜上能夠顯示一個學科或知識域在一定時期發展的趨勢與動向,形成若幹研究前沿領域的演進曆程。[1][2]
三、數據分析
(一)關鍵文獻分析
在文獻共被引網絡的演進關係中,不同的文獻聚類之間通過關鍵節點文獻相連,通常這些文獻都具有較高的中心度,在不同的聚類網絡中起到連接和過渡的橋梁作用。在由Cite Space生成的可視化網絡中,定義中心度大於或等於0.1的節點為關鍵節點。在網絡分析理論中,點的中心度是其所在網絡中通過該點的任意最短路徑的條數,是網絡中節點在整個網絡中所起連接作用大小的度量。因此,在文獻被引圖譜中,中心度大的節點相對容易成為網絡的關鍵節點。從知識領域的角度看,關鍵節點文獻一般是提出重要的新理論或具有重大理論創新的經典文獻,也是最有可能形成科學研究前沿熱點的文獻。設置timespan:1992-2013,slice length=2,c,cc,ccv:3,1,10;3,2,16;3,2,20,pruning=pathfinder。