王俊明
jmgwang@gmail.com
在電腦中表示影像的方法主要有兩種類型,一種是以數值或函數表示圖案的線條、位置或色彩,稱為向量圖;另一種是利用數值表示一個小像點,然後利用各種不同像點的排列表示影像,稱為點陣圖。
向量圖通常用來表示精確的圖形,如工程設計圖。此類影像放大時是經過數學運算出新的點線位置,因此圖案影像不會失真,只是得花費較多的運算時間。一般而言此類影像比點陣圖占用較少的記憶體空間,適合用於處理由線條構成的影像,但不適合用於照片等實物影像。
排列點陣圖的每個小像點稱為像素,通常是利用掃描器、或數位相機等偵測影像中各位置點的資訊得到。影像能逼真表現現實的景物,但由於每個位置點都要儲存數值,因此會占用較多的記憶體空間。此外,若要將影像放大,則會因為缺乏像點間的資訊而出現鋸齒狀。由於影像取得容易,因此大部分的影像皆以此種方式來儲存及表示。以下內容的介紹也皆以點陣圖為基礎作介紹。
影像的品質主要取決於兩個要素,一個是解析度,另一個則是彩度。
解析度主要表示影像的細緻程度,通常以固定長度內的像素點來表示:
每吋多少點(DPI),如掃描器或印表機。
若影像大小一樣或不一定時,則會以所包含的像素點來表示,有時是長及寬的數值,如螢幕或影像檔案;
有時則是以長與寬的乘積,如數位像機以幾百萬像素來表示。
一個像素點所能表示的色彩數量即是該影像的彩度,常見的彩度類型有下列幾種:
1. 黑白:一個像素點以一個位元(bit)來表示,則影像只有兩種顏色,通常使用黑色與白色。在單色螢幕上,則是螢幕上像素點的亮與不亮。
2. 灰階:一個像素點以一個位元組(byte)來表示,可以用來表示256種顏色。通常以白色為主,將明暗度分為256種程度來表示,最常用於單色相片或單色監視影像中。
3. 256色:同樣將一個像素點以一個位元組來表示,只是從各種顏色中挑出256種來表示,通常用於表示漫畫影像。
4. 全彩:一個像素點各以一個位元組表示一種基本原色:紅、綠、藍,每一種原色以256種明暗程度來表示,而形成所謂的全彩1677萬色,為目前最常用的完整彩度表示法。
由於高品質的點陣影像通常會用到較高的儲存容量,因此發展出許多影像儲存的格式,目的是為了要在盡量在不破壞影像品質的情況下減少儲存容量。
1. BMP:這是Microsoft所使用的標準影像檔案格式,此種格式將各像素點的值完整的記錄下來,因此占用相當大的容量。但也由於其保存了影像的原始資訊,因此相容性相當高,幾乎所有的作業系統或影像編輯器皆會支援。
2. TIFF:原本設計用於掃描圖像文件,廣泛使用於排版印刷業。利用檔案開頭的標籤,可以在同一檔案中靈活定義所包含的多張影像及格式。但由於其可自由定義的可擴充性,以致於在讀取上有相容性的問題
3. GIF:利用該影像各種顏色中使用最多的256色來建立索引(LZW演算法),將每個像素點由原本的3個byte降到1個byte來表示,達到1/3的壓縮量,另外還可以指定透明色及製作GIF動畫圖檔,適合用於漫畫圖案等顏色較少的影像檔。此種非破壞性的壓縮方式由於顏色使用過少,較不適合用於表示實體景緻。
4. JPEG:利用波形轉換的函數(DCT),以少量的參數值來壓縮影像容量。此種方式會保留原影像大致的形體,但某些細節部分則會受到些許的破壞,其破壞程度則依壓縮程度而定。對於照片等較不重視細節部分的影像,可提供了相當完整的色彩容量,而占用較少的記憶體空間。
5. PNG:Compuserv在1987年開發GIF檔時,並沒有發現LZW壓縮法已在1983年被申請為專利,而該專利的擁有者Unisys公司,得以在1995年對各商用軟體主張專利權。為避免使用該專利,PNG格式在同時被開發出來用於取代GIF格式,並在1999年因為Unisys中止對自由軟體的GIF專利的免費許可,而開始受到重用。(LZW的專利,在2006年11月時過期。)
影片可以想像是一堆影像序列,每一張畫面稱為影格frame
運境:cut, pan, tilt, zoom, dolly, track
光流optical flow:
視訊壓縮:時間,空間,統計,感知