文字編碼與設計密碼練習113
一、文字數位化(編碼code)在生活中的應用:
圖1 身分證縣市編碼
圖2 台電分區供應電力編碼
圖3 盲人點字系統
圖4 產品Barcode
二、文字數位化的秘密
歐洲的科學家在18世紀逐漸發現電的各種特質,於是有人開始研究使用電來傳遞訊息的可能...
(一)摩斯電碼: 用聲音長短組合表示文字
1835年美國人艾爾菲德·維爾為了協助薩繆爾·摩斯的電報機進行訊號傳遞,構思了一個透過點、劃和中間的停頓,讓每個字元和標點符號彼此獨立地發送出去的方法,這就是現在我們所熟知的摩斯電碼(Morse code)
(二)博多電碼: 固定長度編碼
1.改善摩斯密碼問題:
摩斯電碼有個問題,例如接收到「・- 」時....不確定是在表示一個英文字母 A(・- ) ,還是兩個英文字母 E(・) 與 T(-)。
2.博多電碼設計:
1874年法國發明家博多在設計博多電報時,改進摩斯電碼容易傳輸錯誤的問題,統一將所有英文字母及數字符號通通採用五個位元的編碼表示。
(三)後續電腦的文字編碼:
1.延續博多電報固定長度的編碼方式
2.各個國家與各家公司利用二進制分別制定出各自的文字編碼表
例: 同樣是英文字母A為例:
(1)美國IBM公司的BCD編碼是「010001」
(2)歐洲電腦製造協會的DEC編碼是「010001」
(3)蘇聯的GOST編碼則是「010000」
四、英文以外的文字編碼:
到了1980年後,美國、西歐以外的東亞、中歐等地區,也開始有使用電腦的需求。但在ASCII不足以表示各種文化的語言文字的情況下,各國又開始各自制定文字編碼...
(一)日本制定了日文編碼Shift JIS (二)台灣制訂了正體中文編碼BIG5
(三)中國制定了簡體中文編碼GB2312 (四)韓國制定了韓文編碼KS X
台灣常見姓氏的big-5編碼表
五、萬國碼系統: (Unicode/UTF-8)
由於各國所使用的文字編碼方式不同,使得資訊交換不易。1991年美國IBM、Apple、Microsoft等廠商共同出資成立了一個編碼組織,制訂出一套全球通用的文字編號系统 Unicode,又稱萬國碼或統一碼、萬用碼。
萬國碼特徵:
1.Unicode是以16個位元來表示一個字元,因此共可表示65.536個字元或符號。
2.Unicode 前128個編碼的字元符號和ASCII相同。
3.其餘之字元則劃分為控制碼、拼音文字區、符號區及中日韓常用文字符號區……等多個字元集區。可詞蓋各國常用的文字、字母及符號。
◎UTF-8(8-bit Unicode Transformation Format)
是一種針對Unicode的可變長度字元編碼,也是一種字首碼。它可以用1~4個位元組對Unicode字元集中的所有有效編碼點進行編碼,屬於Unicode標準的一部分。因此,它逐漸成為電子郵件、網頁及其他儲存或傳送文字優先採用的編碼方式。
128個US-ASCII字元只需一個位元組編碼(Unicode範圍由U+0000至U+007F)。
帶有附加符號的拉丁文、希臘文、西里爾字母、亞美尼亞語、希伯來文、阿拉伯文、敘利亞文及它拿字母則需要兩個位元組編碼(Unicode範圍由U+0080至U+07FF)。
其他基本多文種平面(BMP)中的字元(這包含了大部分常用字,如大部分的漢字)使用三個位元組編碼(Unicode範圍由U+0800至U+FFFF)。
資料來源:維基百科UTF-8
六、練習II: ASCII 編碼解碼練習
(一) 請將 Mcjh 進行 ASCII 編碼? (提示:注意大小寫有別)
(二) 請問這件衣服的密語(中文)是什麼意思?
提示:
1.將上述的衣服上的二進位碼輸入到線上二進位轉ASCII ->Convert(轉換) ->得到ASCII碼(英文字母)
2.利用Google查詢這個英文單字是甚麼意義?