正文 船舶擬人智能避碰決策方法研究綜述(2 / 3)

(3)研究設計一係列PIDVCA算法,實現PIDVCA定性與定量分析的有機融合,以及實現模擬船員遵守《規則》和優秀船員在避碰過程中的通常做法和優良船藝;

(4)基於PIDVCA方法及其評價標準,研究形成避碰知識表示方法、機器自動學習策略和自動推理機製以及機器學習構建動態避碰知識庫的機理;通過設計PIDVCA程序模型,在推理機的控製下,根據傳感器獲得的現場知識和原有的專家經驗知識實施在線學習、分析、判斷、推理和優化,最終自動生成PIDVCA實施方案;

(5)構建近似海試環境的船舶智能操控(SIHC)仿真測試平台,對研究形成的PIDVCA數學模型和算法提供有效的驗證技術手段。

2.3 PIDVCA的實現原理

PIDVCA方法的具體實現是將數理分析、機器學習、專家係統原理和航海技術領域知識有機結合起來,以智能程序形式表示的PIDVCA程序模型來實現[11]。PIDVCA程序采用集成推理(控製)策略,實現具有啟發式知識指導下的自動推理,將構成智能避碰模型的機器學習模塊、動態避碰知識模塊、推理機,以及由定性推理的決策形成基本準則與定量計算的決策實施方案動態優化目標函數等構成的決策分析評價方法有機地融為一體,獲得問題的求解。

3 《機器決策》的“擬人智能”特性分析

由於船舶環境與會遇態勢千變萬化,《規則》作為綱領性文件難以詳盡闡述。因此,駕駛員在實際避碰中,不但應遵守《規則》的規定,更應當注意運用良好的船藝,尤其是針對多目標船會遇情況。對於多目標船會遇而言,實際並沒有現成的《規則》可循,隻有駕駛員在長期避讓實踐中形成並被普遍采納的習慣做法,簡稱海員通常做法,例如對重點目標船(最危險目標船)的避讓方法沿用兩船的《規則》形成決策並實施;再就是優秀船員采取合理有效的避讓決策所表現的優良船藝,即對碰撞危險的正確評估、避讓時機、避讓措施和複航時機的正確把握以及對複雜局麵的靈活應變能力,如對不協調避讓的二次決策及遠近危險目標的分段決策方法。顯然,PIDVCA方法必須能夠實現對綱領性《規則》具體化及清晰化處理以及對優秀船員的優良船藝的模擬,才能使基於PIDVCA方法的《機器決策》具有“擬人智能”特性。為了讓專家學者易於領悟《機器決策》的“擬人智能”特性,基於文獻【12】構建的PIDVCA方法及其評價標準,進一步凝練出PIDVCA的機器實施辦法。

3.1 PIDVCA機器實施辦法

基於PIDVCA的研究目標,要求《機器決策》不但要應遵守《規則》,而且必須能實現對優秀船員的優良船藝的模擬。PIDVCA的機器實施辦法考慮了以下原則:第一,遵循《規則》精神;第二,遵循海員通常做法及優秀船員的優良船藝;第三,體現對《規則》的合理延伸。上述原則是確保《機器決策》具有科學性、合理性和可靠性的根本保證。限於篇幅,這裏僅介紹多船PIDVCA機器實施辦法,主要汲取海員的通常做法及優秀船員的優良船藝,具體歸納為以下八條:

第一條:沿用兩船的PIDVCA的實施辦法第二條(關於《規則》模糊化概念的清晰化(量化)處理辦法),以參與決策的目標船實施最佳改向幅度施舵時機用於衡量目標船碰撞危險度大小,並依此進行危險度排序,同時給出每個危險目標船的安全會遇距離SDA最大值SDAmax與最小值SDAmin以及緊迫局麵距離Dcqs與緊迫危險距離Did。

第二條:遵循海員對重點目標船的避讓方法沿用兩船適用的《規則》要求,並沿用兩船的PIDVCA機器實施辦法第一條(根據《規則》定義的三種基本會遇局麵確定目標船會遇屬性以及根據PIDVCA量化需求定義目標船的交會特征(encounter Characteristic: EC)和第三條關於危險判據的模糊邊界及其評判方法形成決策。本條僅適用所有目標船與本船均存在潛在碰撞危險的情況。

第三條:關於模擬優秀船員對危險局勢正確評估、避讓時機與避讓幅度正確把握及複航時機正確把握的機器實施辦法。

第四條:關於最晚改向角界定的機器實施辦法:通過深度解析相對運動幾何規律,當本船采取向右改向且目標船的EC=1、10、3、50、6、7和70時,以改向Cm或90°(當Cm>90°時取90°)為其最晚改向角;當本船采取向左改向且目標船的EC=20、4、50、6、7、8和80時,以改向-Cm或-90°(當Cm=0,本船改向避讓目標船從本船艉駛過,否則,目標船從本船艏駛過。

第五條:關於優秀船員對SDA呈現的自適應性模擬的機器實施辦法。SDA呈現的自適應性體現在優秀船員可根據船舶密度適度調整其值大小,《機器決策》的具體實施辦法是通過設計的PIDVCA空間搜索算法,允許避碰決策方案生成所依據的SDA在其{SDAmax,SDAmin}範圍內變化。

第六條:關於模擬優秀船員對複雜避碰問題呈現的靈活應變決策思想的機器實施辦法。本條是對機器按照第一到第五條實施辦法執行無結果情況下的基於PIDVCA時空搜索、目標信息實時監測的不協調二次避讓和分段避讓的決策生成以及決策不合理的優化處理辦法。

機其改向角的模擬實驗結果

第七條:關於多船會遇緊迫危險的界定辦法,機器按照第一到第六條實施辦法執行無結果情況下的會遇局麵界定為陷入緊迫危險狀況。

第八條:關於智能避碰輔助決策方案的預測實施效果:以是否錯過Tln_max與Tln_min及其決策方案所依據的SDA取值大小,給出當前會遇態勢所處的局麵屬於一般危險局麵、緊迫局麵或緊迫危險局麵。

3.2 《機器決策》的“擬人智能”特性典型案例模擬分析

借助搭建的船舶智能操控仿真平台SIHC桌麵係統(係統由一台控製台、一台目標船服務器和三台本船計算機構成),通過設計典型案例進行模擬分析與驗證。下麵的測試用例主要利用控製台計算機及智能目標船服務器,測試用例中的目標船1設置為智能本船,其餘目標船根據需要設置為智能目標船或非智能目標船。

3.2 .1 兩船會遇《機器決策》的“擬人智能”特性典型案例模擬分析

典型示例1為對遇局麵,雙方互為讓路船,兩船均設置為智能船,雙方按照建議的輔助決策方案執行的模擬實驗,其結果會使兩船比預計的SDA更寬的會遇距離CPAn上安全通過,並比預計的複航時間提前複航。僅有一船為智能船,用於模擬目標船未能按照《規則》要求避讓的實驗結果。該例印證了假定目標船保向保速前提下的避碰輔助決策的合理有效性。

典型示例2為霧航情況對來自右正橫附近會遇船舶的決策優化處理模擬實驗。會遇態勢,本船如果嚴格按照《規則》執行,應采取向左改向的避讓方法。但是如果目標船沒有及時采取避讓行動,單靠本船改向,會導致改向後的相對運動速度太小而使複航時機太晚導致航跡偏移太大,僅一船按照《規則》實施的避讓效果,對《規則》實施優化處理的避讓效果。可見實施優化處理後可避免因為本船早於來船采取措施,來船認為危險已經消失不予采取協調配合行動而導致避讓複航時機太晚、航跡偏移太大的不合理避讓效果。需要強調,上述兩種情況如果雙方按照《規則》執行,不會出現不合理實施效果。

3.2.2 多船會遇《機器決策》的“擬人智能”特性典型案例模擬分析

示例1為機器按照第四條實施辦法執行,模擬優秀船員對潛在碰撞危險局勢的正確評估及複航時機正確把握的測試用例及模擬實驗結果,通過該例給出第四條實施辦法的執行過程:首先按照第一條和第二條實施辦法形成初始避碰決策,再經過PIDVCA驗證算法檢驗,如果驗證結果出現新的潛在危險目標船,在PIDVCA的實施辦法指導下,先判斷新危險目標船3的TCPA是否小於參考目標船的最晚施舵時機Tln?如果條件不成立,則進一步調用預測複航限製時間算法,計算出新危險目標船3的預測複航限製時間Tc(如果存在兩個以上的新危險目標,則求出其Tc的最小值Tcc)。如果Tc比本船預測的複航時間Trr長,則判定原方案有效,表明按照原方案執行,並在預測複航時機複航可以讓請所有目標,意味著新出現的潛在危險目標船3不會對本船構成真正的威脅。

示例2為機器按照第一至五條實施辦法執行無果的情況下,執行第六條對較複雜的會遇態勢的分段決策優化處理模擬實驗結果。所謂分段決策問題是對於監測到的危險目標船,先避讓近距離的危險目標船3,再處理遠距離的危險目標船2。

4 結束語

回顧20年來的研究曆程,經曆了方法探索、方案形成、理論分析與仿真論證及應用研究三個階段。避碰數學模型從各類單一的基本模型擴展到可適應各種交會特征的一整套較完整的PIDVCA數學模型;避碰決策算法從單一的時間搜索、機械的遍曆算法,逐步演變到由一係列的PIDVCA算法構成;算法測試手段從單機簡單仿真到近似海試環境的SIHC仿真測試平台;算法測試方法從最初的隨意測試、到中期的有目的針對性的設計典型案例測試、到現階段特定案例與隨意案例相結合的算法完備性測試,仿真實驗次數累計可達5位數。研究結果表明:開闊水域多目標智能避碰輔助決策可較好地實現對優秀船員在避碰決策過程所表現的優良船藝的模擬,可同時避讓2~4個危險目標船,驗證了基於PIDVCA方法形成的《機器決策》基本達到了“擬人智能”的效果。雖然研究已經取得了初步成效並進入應用係統開發階段,但《機器決策》的“擬人智能”效果還有進一步提升的空間,例如,如何通過設計協調優化算法進一步確保直航船保向保速的權利以及在機器提供決策的同時給予必要的燈號型提示,這些問題有待日後逐步研究實現。