單篇文章:關於狹義的「中文電腦」,我的妄想企劃案

於「狹義」的「中文電腦」,我的妄想企劃案:

我腦海中累積了有關「原生的正體中文漢字電腦」的初始妄想、雛形概念。這裡所謂的「原生的正體中文漢字電腦」,並不是「中文化」的電腦,差一個「化」字,差很多。而是相當於「砍掉重練」的、純粹為了爽的(為了要建立「純正體中文漢字」的電腦世界),在既有的「個人電腦硬體架構」之上,「重新發明」軟體、韌體和作業系統的「個人電腦」思路。

這是一個需要國家層級的資金和人力資源的大型研發企劃案。在編寫這篇文章當下的時間點,中華民國的執政黨反正有的就是錢,在「假設」從頭到尾都沒有人貪污,所有資金全都有確實用在「錯誤嘗試」與實驗研發的前提下,研發資金「絕對不會」是問題。

這是一個純粹「只會認識」「現代正體中文漢字系統」的作業系統軟體開發設計,這個現代正體中文漢字作業系統的「底層」,「只會認識」「現代正體中文漢字(以及所謂的正體中文漢字筆畫、部件、部首、漢文化符號)」而已,完全「不認識」拉丁字母、斯拉夫字母、韓文、阿拉伯文、日文、中文簡化字、非洲伊索比亞文、等等全世界除了「現代的正體中文漢字」以外的其他任何文字和符號系統。

當然「底層」之上會有所謂的「圖形界面」,在圖形界面環境中,這時可以透過外掛函示庫軟體的方式,再去補上第三方的文字系統軟體。原本的「底層」的指令模式人機界面,「只能接受」中文漢字(或著說正體中文漢字筆畫、部件、部首、漢文化符號)的輸入。

西元199X世代,我還在國~高中生的學習個人電腦概論的階段,古早印象中有一個叫做"ASCII"的東西,這是一個對照表,大致上就是把代表硬體的二進位碼,與現代英文字母和部分符號做了整理表格,有128組對照資料,然後現代的個人電腦系統軟體就是從這張表格開始發展。

好多年前,我印象中看網路文件,中華民國(臺灣)中央研究院,把現代的正體中文漢字作了總整理,印象中好像是整理出大約不超過兩千個的正體中文漢字筆畫、部件、部首,現代正體中文漢字(臺、澎、金、馬以及周圍一些小島所在使用的)全都是從這不超過兩千個的中文漢字筆畫、部件、部首所組合出來的。

有沒有人想過,如果把這不超過兩千個的中文漢字筆畫、部件、部首、漢文化符號和「二進位碼」做成一份對照表,會是什麼樣的一個情境呢?不得不承認,數量上確實會比"ASCII"多出很多但也就是那些了。

因為正體中文漢字筆畫、部件、部首、漢文化符號總量有一千多個,其實有部分可以拿來被當作/定義成代表特殊意義的字元,就跟ASCII裡頭的某些符號字元同樣道理。當然對照表內的每個字元都要定義清楚,這個表格「理論上」將「不會」被中文漢字系統以外的文字系統所擴充增補。

正體中文漢字的各種元素和二進位碼對照表被正式定義與發行之後,以從小在義務教育階段就學習正體中文漢字的電腦使用者而言,理論上應該要能很快地理解這個表格所列出的筆畫、部件、部首(不一定能夠背的滾瓜爛熟,但是看到後要能很快理解,就像學習發音時,理解ㄅㄆㄇㄈ的組合那樣)。「寫程式」怎麼辦?我不是程式開發者,只是單純的電腦使用者,這是個好問題。我想到的是,「寫程式」憑什麼只能用「英文的邏輯」去寫?大學的國文系不是也會教中文漢字字句的一些更深入的邏輯思維嗎?那一千多個筆畫、部件、部首、漢文化符號,不能拿來被賦予定義嗎?總是可以從中挑出幾十個組合成字串啊?輸入字串的時候,不能以 筆畫、部件、部首 完全替代那些英文字串嗎?這需要另外去想一套程式語言的規範定義(當然是要從「純中文」的思考角度出發的,「不能」混雜「英文的思維」在裡頭)。開發從「原始碼 > 可執行檔」的「編譯器」的團隊,在規劃原始碼的編寫規範的時候,就是完全用正體中文(中華民國國語)在思考。

再來想想鍵盤怎麼解決?已經有一個東西叫做「倉頡輸入法」(雖然我不熟悉倉頡輸入法,我只會注音輸入法),雖然中研院整理出來的筆畫、部件、部首有一千多個,但是身為純中文的鍵盤(「不會」有任何英文、外文字母和符號出現在鍵盤上,鍵盤按鍵定義也是砍掉重練,但總是有機會「沿用」某些「概念」),我是覺得“SUN type 7”的按鍵數量應該很夠了,畢竟傳統倉頡輸入法都夠塞了。


中華民國110年09月06日 因為時空環境的改變,部分論述不合時宜,而重新編寫過本頁面。