人類作為自然界中最偉大的智能體已經進化了上百萬年,人類所具有的智能是大自然賦予人類最高級的禮物。今後,人類智能仍將是人造係統模仿和研究的對象。人類未來對數據的處理,要更多地模仿人腦對數據的處理方式,人腦就是世界上最好的“量子計算機”。

目前人工智能的發展水平可以用三個維度來描述,即強度、擴展性和能力。強度是指人工智能係統的智能化程度,擴展性是指人工智能係統可以解決的問題的範圍,能力是指人工智能係統所能提供的平均解決方案的質量。雖然我們已經在專用人工智能領域取得了突破性進展,但目前人工智能水平仍然停留在“有智能沒智慧,有智商沒情商,會計算不會算計,有專才無通才”的水平。其特點是能力單一,隻能在某個特定領域內發揮作用。在人工智能2.0時代,我們期待一個新的框架:首先,在人的邏輯層次可辯明;其次,可以處理大規模數據;最後,可以基於一小組標記數據進行學習。我們認為,將數據驅動的機器學習方法與知識引導方法相結合,將為人工智能的未來推開一扇新的大門。

探索解決之道——激活數據學

受人腦處理數據方式的啟發,本書提出了一種新的處理海量數據的一般性框架——激活數據學。

激活數據學從複雜理論出發,將產生智能所依賴的數據、軟件硬件環境、交互規則等視作一個具有“簡單性、局部性、全局性、內聚力、動態性”的開放複雜係統,智能產生的過程即開放複雜係統中各個具有局部目標和行為的自主體通過自主行為及動態環境相互作用達到整體的全局目標所湧現的群體智能,這種湧現的群體智能能夠高效求解問題。

激活數據學中采用塊數據模型作為數據模型。塊數據把各種分散的點數據和分割的條數據彙聚在一個特定平台上並使之發生持續的聚合效應。塊數據的聚合打破了傳統信息不對稱和物理區域、行業領域對數據流動的限製,高度關聯的各類數據可以在沒有任何障礙和限製的條件下自由流動、相互作用,為智能的產生創造了條件。

激活數據學的核心是將人類認知能力與計算機快速運算和海量存儲的能力結合起來。一方麵,提高智能係統的置信度,避免人工智能技術的局限性所造成的風險甚至危害;另一方麵,建立人類參與的混合增強智能,將海量數據通過人機混合增強智能實現最佳釋放。這種形態是人工智能可行的、重要的成長模式。

數據搜索、關聯融合、自激活、熱點減量化、群體智能是激活數據學的5個運行階段,構成了激活數據學模型化運行的完整流程(如圖0–1所示)。

圖0–1 激活數據學模型

數據搜索

是激活數據學的數據準備階段,通過對數據的主動搜索和自我的深度學習,透徹感知、精確描述現實物理空間的多模態場景信息,構建更加豐富的數據特征維度,更快、更精準地搜索到目標主體,為機器學習準備大量數據作為“燃料來源”和“助推器”。

人類作為自然界中最偉大的智能體已經進化了上百萬年,人類所具有的智能是大自然賦予人類最高級的禮物。今後,人類智能仍將是人造係統模仿和研究的對象。人類未來對數據的處理,要更多地模仿人腦對數據的處理方式,人腦就是世界上最好的“量子計算機”。

目前人工智能的發展水平可以用三個維度來描述,即強度、擴展性和能力。強度是指人工智能係統的智能化程度,擴展性是指人工智能係統可以解決的問題的範圍,能力是指人工智能係統所能提供的平均解決方案的質量。雖然我們已經在專用人工智能領域取得了突破性進展,但目前人工智能水平仍然停留在“有智能沒智慧,有智商沒情商,會計算不會算計,有專才無通才”的水平。其特點是能力單一,隻能在某個特定領域內發揮作用。在人工智能2.0時代,我們期待一個新的框架:首先,在人的邏輯層次可辯明;其次,可以處理大規模數據;最後,可以基於一小組標記數據進行學習。我們認為,將數據驅動的機器學習方法與知識引導方法相結合,將為人工智能的未來推開一扇新的大門。

探索解決之道——激活數據學

受人腦處理數據方式的啟發,本書提出了一種新的處理海量數據的一般性框架——激活數據學。

激活數據學從複雜理論出發,將產生智能所依賴的數據、軟件硬件環境、交互規則等視作一個具有“簡單性、局部性、全局性、內聚力、動態性”的開放複雜係統,智能產生的過程即開放複雜係統中各個具有局部目標和行為的自主體通過自主行為及動態環境相互作用達到整體的全局目標所湧現的群體智能,這種湧現的群體智能能夠高效求解問題。