1958年和1959年,中國分別研製成功了103計算機和104計算機,這讓中國計算機完成了從無到有的跨越。由於是仿製的蘇聯先進的計算機,所以當時的103計算機和104計算機在技術水平上僅次於美國和蘇聯。
到了1960年,107計算機研發成功,這是一台小型的串聯通用電子管數字計算機,也是中國第一台自主設計的計算機。
107計算機的誕生標誌著中國的計算機製造完成了從模仿到自主設計的跨越。
在107計算機之後,由於一些曆史方麵的原因,中國無法再從蘇聯獲得援助,同時,西方國家也對中國進行了嚴格的技術封鎖。這就使得中國隻能依靠自主設計、自主生產來開發自己的計算機。
在當時,中國自主研發計算機首先需要邁過晶體管研發這道坎。在20世紀60年代初,晶體管製造技術對於中國來說幾乎是一項不可能完成的挑戰,西方國家和蘇聯也認為中國沒有辦法掌握這項技術,認為隻要能夠在這項技術上鉗製中國,中國的計算機就無法獲得突破。
為了能夠攻克這項技術,中國人民解放軍軍事工程學院四係404教研室的康鵬進行了大量的實驗研究。最終,他成功研發出了“隔離-阻塞振蕩器”,也就是後來所說的“康鵬電路”。“康鵬電路”的問世解決了晶體管製造的難題,中國也開始進入晶體管時代。
在解決了晶體管製造難題之後,1964年,中國成功研發出第一台全晶體管計算機441B-I。這一計算機的問世隻比美國第一台全晶體管計算機RCA501晚了6年。同樣在1964年,119計算機研發成功,這台計算機的運算能力為每秒5萬次,稍強於美國在1958年製造的IBM709計算機。倪光南當時所參與研發的就是這台計算機。
在當時的中國,計算機屬於一種新學科,一直到1963年中國才出現計算機專業的畢業生。所以與倪光南同時代的人大多都是“改行”過來的,他們有的是學習電機的,有的是學習無線電的,還有的是學習數學的。這些人當時為了掌握計算機技能,主要是靠自學。
在剛剛進入計算所時,倪光南就表現出了強烈的學習欲望。當時,在119計算機的控製台上,密密麻麻地分布著幾百個氖燈和部件,倪光南憑借自己過硬的記憶力,就記住了它們的位置和功能。
當時的倪光南仍然沒有佩戴眼鏡,他依然相信“米丘林理論”。直到一次在與同事一同看電視時鬧出了笑話,倪光南才放棄了自己的堅持。對於當時的情景,倪光南這樣形容:“有一次新聞裏播一場體操比賽,同事問我,這是男運動員還是女運動員,我反正也看不清,就胡亂猜了個‘男的’,結果好一陣哄笑……”
緊接著第二天,倪光南就去配了眼鏡。他拋棄了“米丘林理論”,並說道:“我忽然明白人是要尊重客觀規律的,有些事是不以人的意誌為轉移的。”看上去這並不是一件多麼重大的事情,但對於倪光南來說,從中悟出的這個道理,卻值得他牢記一生。
在119計算機研發成功之前,世界上能夠研發巨型機的國家隻有美國、蘇聯、英國和法國等幾個大國。在119計算機問世之後,中國的計算機研發水平也進入了世界先進行列。
在119計算機研發過程中,倪光南憑借優秀的表現被評選為計算所先進工作者和中科院北京地區先進工作者。
在談到119計算機時,倪光南總是如數家珍。他說:“當時119計算機的內存是2.4萬顆小磁芯,每顆小磁芯都要人工穿上四根線才能用,猜猜它的內存容量是多少?隻有24K,現在的一個U盤,容量就是它的幾萬倍。當時119計算機的速度是5萬次,而現在家用電腦的速度則是10億次……”
每次談到這裏,倪光南都會感歎計算機事業發展的速度如此之快,快到令人難以想象。所以在計算機行業中,永遠都有事情可做。每一個身處其中的人都會麵對巨大的壓力,如果跟不上計算機行業的發展速度,就沒有辦法看到這個領域的潮流是什麼。如果不跟著潮流進行學習,一兩年之後,原有的知識也就毫無用處了。
“不斷學習”也成為了倪光南的人生信條,即使過了幾十年,倪光南依然走在計算機行業的前列。他總是有一種危機感,隻要還在這個行業之中,就不能讓自己掉隊。正是這種危機感在推動他不斷向前,不斷進步。
計算機行業的發展速度確實快得驚人,這一領域的潮流也在瞬息萬變。在大洋彼岸,集成電路已經閃亮登場,成為了計算機行業的重要技術。
當時中國研發的119計算機雖然在運算速度上已經達到了世界領先水平,但仍然采用的是電子管。隨著晶體管的問世,這種電子管開始逐漸失去了優勢。晶體管的出現讓計算機開始向小型化轉變,計算機也開始從純計算轉向了其他領域的研究。
在這股潮流的推動下,漢字信息處理成為中國計算機行業的一個新的難題。
第三節 漢字處理難題
現在人們在使用電腦時,隻要通過敲擊鍵盤上的26個字母,就能夠順利拚寫出漢字。但在計算機剛剛進入中國之前,想要讓計算機顯示漢字,卻並不是一件容易的事情。
讓計算機進行漢字處理在當時是一件難事。首先,想要讓計算機處理漢字,就一定要讓計算機能夠顯示漢字,還要讓計算機知道人們想輸入的漢字是什麼。如果是英文,直接按照字母輸入就可以了,計算機很容易識別這些拚音文字。漢字作為一種表意文字,很難創造出一種簡單明了的方法來讓計算機理解。
在20世紀六七十年代,計算機和漢字之間存在著一條鴻溝。當時的計算機並不能處理漢字,這就嚴重影響了中國計算機事業的發展。如果中國人在計算機上都使用拚音文字,那漢字就將逐漸退出曆史舞台。
漢字是中華文化的根,如果沒有漢字,中華文化就無法得到傳承。漢字誕生之後,曾在世界文化中獨領風騷。但當機械打字機出現之後,西方拚音文字的地位得到極大提升,漢字在打字方麵的缺點便開始顯現出來。
隨著計算機的出現,拚音文字的地位又一次得到提升。漢字打字困難的缺點再一次暴露出來。一些西方人開始認為方塊漢字是世界上最古老、最繁難、最笨重的一種文字工具。在計算機時代,漢字似乎已經走到了盡頭。
20世紀80年代初,IBM公司曾耗資6500萬美元進行中文電腦化的研究。IBM公司的研發實力加上充足的資金支持,原以為中文電腦化將會很容易成為現實,但沒想到IBM公司並沒有完成中文電腦化的研究。
IBM公司著急進行中文電腦化的研發,是為了搶占中國的計算機市場,但顯然經濟利益的驅使並沒有讓他們取得成功。相反,在中國,一些人同樣在進行中文電腦化、漢字現代化的研究,他們所追求的並不是經濟方麵的利益,而是為了讓更多中國人能夠方便地使用電腦、更好地利用電腦這一高科技工具。
倪光南就是這些人中的一個。在研製完119型計算機之後,倪光南被安排進入了六室,主要攻克漢字輸入係統的研究。在六室工作期間,結識了室主任王中田,倪光南經常和他一同探討技術方麵的問題。
在當時,倪光南的理想是讓計算機和人能夠更方便地交流。要麼是讓漢字能夠更方便地輸入到計算機之中,要麼就是讓計算機能夠學會認識漢字。也正是由於這樣的原因,他才會選擇去研究輸入技術。
1974年10月,國家計委批準了由國防科工委、中國科學院和四機部聯合提出的“關於研製漢字信息處理係統工程”的建議。這一工程主要包括鍵盤輸入、中央處理及編輯、校正裝置、精密型文字發生器和輸出照排裝置、通用型快速輸出印字裝置遠距離傳輸設備、編輯及找資料管理等軟件係統、印刷製版成形等7個部分的內容。
“漢字信息處理係統工程”已經被列入國家重點科技攻關項目之中,研究漢字信息處理技術也成為了當時中國計算機行業的頭等大事。
在70年代,倪光南在計算所主攻的研究方向有兩個,一個是漢字信息處理,一個是模式識別。
在漢字信息處理方麵,倪光南、竺乃剛、萬永熙等人為了解決人機交互問題,從1968年開始,先是在“717計算機”上研製出了能夠顯示256個漢字的顯示器,隨後又研發出了“SK-1光筆圖形顯示器”,能夠顯示出不同字形的漢字,而光筆則成為了人機交互的重要手段。
在當時,漢字輸入的主要方式就是利用光筆進行輸入。光筆輸入需要在一個特殊的大鍵盤上進行,幾千個漢字縱橫排列在這個大鍵盤上,想要輸入漢字,就要用光筆選到需要的漢字。每一個字都需要這樣選擇,其他輸入方法雖然在具體操作上與光筆輸入有所不同,但也同樣非常煩瑣,需要操作者記憶大量的輸入規則。
倪光南想要讓漢字輸入變得簡單,徹底解決漢字輸入複雜煩瑣的問題。但當時想要更好地解決這個問題隻有兩條路可以選擇:一是創造一種“規則”,也就是對漢字進行編碼,然後再通過漢字編碼來進行輸入。二是讓計算機能夠直接識別出手寫的漢字。這是兩個並不相同的研究方向,但究竟哪種方法能夠更好地解決計算機的漢字輸入問題,誰也不能給出一個準確的答案。
為了能夠更好地解決漢字輸入的問題,倪光南決定從兩個方向同時努力。為此,他承擔了兩個項目的研究:“手寫文字識別機”和“111漢字信息試驗係統”。
想要進行這兩個項目的研究,都需要用到計算所的111型計算機。在當時111機是計算所的“搶手貨”,基本上全國大多數重點、尖端的科研項目都會用它來進行大量運算任務。為了能夠多用幾個小時機器,倪光南和同事們總是在深夜的時候預訂機器,這樣在晚上就不會有人來“搶機器”了。
經過多次反複試驗,倪光南和同事們成功研製出了“手寫文字識別機”和“111漢字信息實驗係統”。其中,“手寫文字識別機”能夠識別出手寫的60多種字母和數字,這是中國最早的文字識別機之一,而“111漢字信息實驗係統”則推動了漢字輸入、輸出、顯示和人機交互等多種漢字技術的發展。
倪光南和同事們研發的這兩個項目,1979年同時獲得了中國科學院科技成果二等獎。在漢字輸入上,倪光南已經取得了很大的成績。但對於他來說,漢字輸入的煩瑣性問題依然沒有得到徹底解決。
“有沒有一種方法能夠讓人們將文字更好更快地輸入計算機中呢?”伴隨著這種思考,倪光南創造了“聯想式漢字輸入法”,這種輸入方法的問世,讓漢字輸入的效率得到了極大提高。
第四節 聯想漢字輸入法
從20世紀60年代開始,中國的一些技術專家和高校學者便開始對漢字信息處理技術進行研究。倪光南和中科院計算所的同事們就是其中的一支重要研究力量。
最初對漢字信息處理的研究更多局限在“漢字編碼”上,這是一種為漢字設計的便於輸入的計算機代碼。一個完整的漢字信息處理係統主要包括編碼、輸入、存儲、編輯、輸出和傳輸等環節,其中編碼是最為關鍵的環節,不解決這個問題,就無法讓漢字進入計算機之中。
在當時,想要完成“漢字編碼”並不容易。
首先,由於漢字的總數量比較多,即使隻對3000或4000個常用漢字進行編碼,仍比處理由20多個字母組成的拚音文字要難。
其次,漢字的字形很複雜,既有古體今體,又有繁體簡體。而且漢字筆畫也相差懸殊,多的有36筆,少的隻有1筆。
最後,漢字中存在著大量一字多音和一音多字的現象。漢語音節一共有416個,區分聲調之後有1295個。如果按照1萬個漢字來計算,每個不帶音調的音節就會平均有24個漢字,而每個帶調的音節也有7.7個漢字,有一些同音同調的漢字甚至多達66個。這些都為漢字編碼造成了不小的困難。
也正是這些原因,當時幾乎所有的“漢字編碼”都是單純的人工編碼。也就是用漢字的字形和發音來作為編碼的基本元素,將一個漢字用一些基本的元素來進行組合表示,一般來說,這些基本元素隻有幾十個,所以可以用一個普通的西文鍵盤來輸入漢字。
看上去,“漢字編碼”能夠解決漢字輸入的問題,但實際上,在使用“漢字編碼”時,編碼者需要記憶大量規則,這就為漢字輸入帶來了很大負擔,這也決定了“漢字編碼”無法成為最便捷的漢字輸入方法。
在倪光南看來,想要讓漢字輸入變得簡單便捷,就要充分利用計算機自身的處理能力,讓計算機來輔助人們進行漢字輸入。倪光南將這種方法比喻成人類的聯想能力,這種方法就是經常被提到的“聯想式漢字輸入法”。
這種想法看上去很好,但當時的計算機還不能處理文字,所以也就無法實現這種“聯想”的功能。想要讓聯想輸入法成為現實,首先要讓計算機能夠顯示漢字,然後還要讓計算機知道人們所選擇的究竟是哪個漢字。
為此,倪光南積極參與了當時計算所顯示組進行的漢字顯示技術的研究工作。
計算所六室顯示組研製的最早的漢字顯示器被安裝在衛星監測用的717機上。此後,顯示組又研發出了“111機”的漢字顯示器。在“111機”上的漢字顯示器,已經能夠用鍵盤來進行人機交互了。但為了更好地實現人機交互功能,顯示組又為另一台顯示器增加了一種人機交互手段,也就是前麵曾提到的“光筆”。
雖然當時的光筆比較大、比較重,使用起來也不方便,但至少這已經算是實現聯想式漢字輸入法最為理想的一種手段了。為了更好地用光筆進行輸入,倪光南在“111機”上專門為聯想式漢字輸入方法設計了帶有光筆的漢字顯示器。隨後,還對這一顯示器進行了一些小的改進。
以前的光筆主要是用手來控製開關的,當光筆指點了屏幕上的圖形和文字之後,還需要用手指再按一下筆上的觸及點,才能進行選擇。倪光南在光筆的頭上加了一個微動開關,這樣一來,隻要用光筆指點到屏幕上的漢字,輕輕一壓,開關就會被啟動,漢字就被選擇了。這一微小的改動讓光筆輸入變得更加方便,同時也為聯想式漢字輸入法的實現做好了準備工作。
到了1974年,“748工程”會議召開,“748工程”就是前麵提到的“漢字信息處理係統工程”。這一工程開啟了中國印刷技術的第二次革命,也讓中國正式告別了鉛火印刷的時代。也正是在這一工程中,漢字與計算機之間的鴻溝被逐漸抹平,計算機的文化進程也逐步加快。
倪光南是計算所參加“748工程”會議的唯一代表,並向當時的負責專家介紹了自己的漢字處理研究。到了1975年,計算所六室輸入組正式開始了對漢字信息處理課題的研究。倪光南曾在計算所的階梯教室進行過學術報告,介紹自己的聯想式漢字輸入法。
倪光南的“聯想式漢字輸入法”主要利用上下文的關聯性,讓計算機來輔助漢字輸入。在彙報時,倪光南在黑板上畫出了聯想式輸入方法的示意圖,並表示當使用者輸入一個漢字之後,計算機會在漢字顯示器上麵提供許多關聯詞,這些關聯詞可以由一個也可以由多個漢字組成。隨後,使用者可以使用光筆或者鍵盤來選取某一個關聯詞,這樣就能夠方便地輸入漢字了。