區位碼和標準電碼之爭持續了一小會,最後還是因為區位碼直接和以後電子計算機的漢字國標碼掛鉤而獲得了多數與會者的傾向性讚同。
“農業口要控製土地,工業口要控製技術,財金口要控製貨幣,軍政口要控製位子,到咱IT圈,就要控製標準啊標準。”馮諾神秘一笑,心理暗想。
政務院要控製的的就是大數據。馮諾十分清楚統計對於政務院的意義。沒有數字,一切的施政措施就是無本之木,無源之水。而元老院的政務院係統對數據的采集、整理的需求非常大,而且需要鋪開的場所也很多。
“如果采用4位數字編碼1個漢字的話,每張穿孔卡片可以存儲20個漢字。”編碼方案本身,與編碼在穿孔卡上的表示實際是兩個問題。如果按穿孔與否作為2進製的觀點來看,每列實際上有12位,一個半字節的信息。足可以編碼4000多個字符。
“這也太少了,好像還不如80個英文字母的信息含量大,7張卡片才能發一條微博,還沒算標點符號。”又有人說道。
“4位數的中文編碼在實踐中可以用兩列來表示,隻是機械設計的難度會增大。具體方案請大家查看附錄3。”
原來馮諾的設想是每列打3個孔來表示兩位數字,其中在每列的0-9位置上打兩個孔表示兩位數字。高區11行打孔表示下麵穿孔的兩位數字從小到大排列,12行穿孔表示下麵穿孔的兩位數字從大到小排列。喵喵尒説
“兩位數字相同怎麼辦?”
“11行和12行同時穿孔,0-9隻打1個孔。下一頁有說明。”
不過3孔的方式雖然能把漢字編碼長度縮減到一半,讓一張卡片最多存儲40個漢字,但顯然機電係統和控製係統設計都不是一日之功,討論來討論去,會議還是決定本次人口普查的卡片設計采用4位數字編碼漢字,畢竟歐美人姓名也是動輒十幾個字母,相比之下漢字姓名也不算太長。
馮諾接下來又簡要介紹了資料上的一些內容,最後特意說道:“我們做這個工作時間比較匆忙,部分資料查得有不到位的地方,以後也會繼續完善。督……馬國務卿對機械式計算機的研究很久也很深入,期望能給我們一些方向上的指導和細節上的補充。”
馬千矚笑著說,“我今天本來打定主意隻帶著耳朵來。不過你們討論得這麼熱烈,我就當自己是個愛好者說兩句。你們的工作還是很充分細致,我隻提兩點,一個是機電設備的製造,繼電器的開發有沒有把握?工作要先易後難,先急後緩,就人口普查來說,最緊迫的是什麼?打孔機器,量產可靠便攜耐用的打孔機器,而打孔機器又是穿孔機係統裏最基本、最簡單的設備。也最容易設計製造。調查需要時間,後麵的設備可以同步研發製造。等調查做完了,卡片收上來了,等一等也是可以的,寧可讓數據等機器,不讓機器等數據。這是第一點。”
“第二點是卡片,我看精度要求還是要符合咱們生產力的現狀,建議你們把造紙廠和印刷廠的同誌們請來一起商量一下,德隆現在在造紙幣,他們的經驗也要聽一聽。現階段技術成熟、能夠穩定量產、成本上可以接受的卡片標準是什麼樣的,一開始慢一點、粗一點不要緊,有原型係統,後麵的事情就好辦……”
“我可以補充一下1890年打孔卡技術,我之前也查了一些資料,1890年美國人口普查也用80列卡片,但是當時打的是圓孔,卡片尺寸與現在我們說的IBM卡還不一樣,打孔設備極為簡單,幾乎就和我們過去坐火車檢票的鉗子差不多,人工打孔,也沒有印製對應取值的功能。錯誤率和偏斜律高達1/20。同期的分類機和製表機想必也精密不到哪裏去。而就是這樣簡陋的機器設備水平,仍然比1880年人口普查的統計效率高出百倍千倍。這樣的水平,我們完全能夠超越。”
“工業化不是一蹴而就的,科技樹也不會一枝獨秀,每個點上都要齊頭並進。手搖計算機項目暴露了我們機械製造上的不少短板,也帶動了我們部分技術的飛躍;穿孔卡計算機涉及到前數字時代方方麵麵的工業技術,同樣會遇到這樣那樣的問題,把這些難關一一攻克,也就標誌著咱們的工業化水平就又上了一個新台階。”
……
馮諾邊記邊點頭,雖然這些指示在技術上作用不大,不過可以寫一篇新聞發到《臨高時報》上去。以充分體現“領導重視”――辦起事來要容易不少。
最終,打孔機的方案還是確定為全機械結構,由於馮諾提出的3孔雙列的漢字編碼方案暫時延緩,打孔機現在可以已完全仿製1923年的IBM-011型數字打孔機。該打孔機早期適用於45列卡,1929年80列標準IBM卡確定之後,又重新設計為能夠適應標準IBM卡的方案。該機型是沒有英文字母的打孔的,是全數字的打印機。有14個按鍵,分別為0-9,X,Y,S,R,其中12個鍵分別在0-9,11(X),12(Y)行上打孔,S為空列不打孔(Space),R為結束打孔(Release)。