文字編碼與設計密碼練習113

一、文字數位化(編碼code)在生活中的應用:

圖1 身分證縣市編碼

圖2 台電分區供應電力編碼

圖3 盲人點字系統

圖4 產品Barcode

二、文字數位化的秘密

    歐洲的科學家在18世紀逐漸發現的各種特質,於是有人開始研究使用電來傳遞訊息的可能...

(一)摩斯電碼:  用聲音長短組合表示文字

    1835年美國人艾爾菲德·維爾為了協助薩繆爾·摩斯的電報機進行訊號傳遞,構思了一個透過中間的停頓,讓每個字元和標點符號彼此獨立地發送出去的方法,這就是現在我們所熟知的摩斯電碼(Morse code)

(二)博多電碼:  固定長度編碼

  1.改善摩斯密碼問題:

    摩斯電碼有個問題,例如接收到「・- 」時....不確定是在表示一個英文字母 A(・- ) ,還是兩個英文字母 E(・)T(-)

  2.博多電碼設計:

    1874年法國發明家博多在設計博多電報時,改進摩斯電碼容易傳輸錯誤的問題,統一將所有英文字母及數字符號通通採用五個位元的編碼表示。

(三)後續電腦的文字編碼:

  1.延續博多電報固定長度的編碼方式

  2.各個國家與各家公司利用二進制分別制定出各自的文字編碼表

    例: 同樣是英文字母A為例:

      (1)美國IBM公司的BCD編碼是「010001」

      (2)歐洲電腦製造協會的DEC編碼是「010001」

      (3)蘇聯的GOST編碼則是「010000」

三、統一英文數字文字編碼

    ASCII碼:

   美國國家標準局邀請各方編碼專家召開會議,希望有特定的編碼對照可以廣泛通用在所有電腦上。經過多次的討論,終於在1967年提出了一套每台電腦都可以共通使用的編碼標準。

   就是ASCII碼(American Standard Code for Information Interchange,美國訊息交換標準代碼)

四、英文以外的文字編碼:

    到了1980年後,美國、西歐以外的東亞、中歐等地區,也開始有使用電腦的需求。但在ASCII不足以表示各種文化的語言文字的情況下,各國又開始各自制定文字編碼...

   (一)日本制定了日文編碼Shift JIS       (二)台灣制訂了正體中文編碼BIG5

   (三)中國制定了簡體中文編碼GB2312      (四)韓國制定了韓文編碼KS X



台灣常見姓氏的big-5編碼表

五、萬國碼系統: (Unicode/UTF-8)

    由於各國所使用的文字編碼方式不同,使得資訊交換不易。1991年美國IBM、Apple、Microsoft等廠商共同出資成立了一個編碼組織,制訂出一套全球通用的文字編號系统 Unicode,又稱萬國碼統一碼萬用碼

    萬國碼特徵:

     1.Unicode是以16個位元來表示一個字元,因此共可表示65.536個字元或符號。

    2.Unicode 前128個編碼的字元符號和ASCII相同

     3.其餘之字元則劃分為控制碼拼音文字區符號區及中日韓常用文字符號區……等多個字元集區。可詞蓋各國常用的文字、字母及符號。


UTF-8(8-bit Unicode Transformation Format)


    是一種針對Unicode的可變長度字元編碼,也是一種字首碼。它可以用1~4個位元組對Unicode字元集中的所有有效編碼點進行編碼,屬於Unicode標準的一部分。因此,它逐漸成為電子郵件、網頁及其他儲存或傳送文字優先採用的編碼方式

資料來源:維基百科UTF-8

六、練習II:  ASCII 編碼解碼練習 

  (一) 請將 Mcjh 進行 ASCII 編碼?    (提示:注意大小寫有別

  (二) 請問這件衣服的密語(中文)是什麼意思?

   提示:

     1.將上述的衣服上的二進位碼輸入到線上二進位轉ASCII            ->Convert(轉換) ->得到ASCII碼(英文字母)

     2.利用Google查詢這個英文單字是甚麼意義?