關於翻譯器的瓶頸,其實業界是公認的。在不明白人類大腦具體工作原理的情況下,機譯始終無法達到人們理想的程度。
就像隻能模仿出其形,而無法模仿出神一樣。
可以翻譯出語言文字表麵的意思,而它下麵的信,達,雅,邏輯性,和感情,則是深隱的。
簡而言之:當代的絕大多數語言翻譯器,都隻能翻譯量,而無法翻譯質。
對於李步行來說,一款語言翻譯器如果無法精準翻譯表達者的意思,那要之何用?
尤其自己從事的行業是頂尖的科技類,失之毫厘差之千裏。一旦出錯,就可能損失巨大。
作為一個認真的科研者,這種情況是必須要避免的。
李步行關於怎樣突破瓶頸,有初步的想法。這其中有兩個難點。
其一是編程上的,智能翻譯的工作原理問題。其二是內容上的,他需要搜集全世界的原味詞典。
第一個問題,李步行可以憑自己現在的編程本領硬磕。第二個問題,則需要他幹點不能讓人知道的事。
一旦計劃好,就該馬上行動。無論前麵是什麼,隻有走到跟前才能看清楚。如果是牆,就折回或放棄。如果是大道,就直接往前衝!
李步行打算先從第二個問題入手,將需要的內容先搞定,再根據內容去更好地解決第一個問題。
全球兩百多個國家,起碼有200個國家是由互聯網連接在一起的。剩餘的極少數則是因為各種原因,選擇與世隔絕。
對於那些隔絕的國家,李步行打算忽略掉。因為,一旦與世界的發展脫軌,那麼交流也就沒什麼必要了。
你不能指望一個騎馬的將軍跟一個開坦克的士兵有共同語言。即使將軍說他可以一刀劈開坦克,縱馬而去。
李步行需要完成的任務,具體分為兩個部分。第一個部分是,全世界聯網國家海量詞典,古典等文化精粹承載體的獲得。
第二個部分則是所有國家公民信息庫的入侵。
為什麼要入侵公民身份信息庫呢?
因為在李步行構思的語言同步翻譯器中,有一個重要的環節。那就是因人而譯。
一旦有了相對完整的個人信息資料,翻譯器在第一時間,會根據這個人的信息,進行分析總結。然後,在翻譯的時候,除了機譯以外,還會融合個人情感,心理,個性習慣等的個人情況特譯。
綜合機譯和特譯給出答案,從某種程度上,已經是真正的智能翻譯了。
為什麼需要特譯呢?
很簡單,人是與時俱進的生物,至少絕大多數人是。
你不可能指望用過去的觀點和三觀去解釋一個進步的人。
古話說,士別三日當刮目相待。意思就是,在古代,過三天,你就應該換一種眼光去看待別人。
而如今是信息時代,需要更換眼光的頻率更加快。
一個國家的文化精粹隻能從成長環境和知識構成去翻譯一個人。而信息庫則可以從立場角度等去翻譯一個變化的人。
機譯譯表麵,特譯譯深隱!