浅谈JPEG图像压缩演算法概要

来源：宝玛科技网

淺談JPEG圖像壓縮演算法

餘科亮

本文僅討論靜止圖像的壓縮基本演算法，圖像壓縮的目的在於以較少的資料來表示圖像以節約存儲費用，或者傳輸時間和費用。

JPEG壓縮演算法可以用失真的壓縮方式來處理圖像，但失真的程度卻是肉眼所無法辯認的。這也就是爲什麽JPEG會有如此滿意的壓縮比例的原因。

下面主要討論，JPEG基本壓縮法。

一.JPEG壓縮過程

JPEG壓縮分四個步驟實現：

1.顔色模式轉換及採樣；

2.DCT變換；

3.量化；

4.編碼。

二.1．顔色模式轉換及採樣

RGB色彩系統是我們最常用的表示顔色的方式。JPEG採用的是YCbCr色彩系統。想要用JPEG基本壓縮法處理全彩色圖像，得先把RGB顔色模式圖像資料，轉換爲YCbCr顔色模式的資料。Y代表亮度，Cb和Cr則代表色度、飽和度。通過下列計算公式可完成資料轉換。

Y=0.2990R+0.5870G+0.1140B

Cb=-0.1687R-0.3313G+0.5000B+128

Cr=0.5000R-0.4187G-0.0813B＋128

人類的眼晴對低頻的資料比對高頻的資料具有更高的敏感度，事實上，人類

的眼睛對亮度的改變也比對色彩的改變要敏感得多，也就是說Y成份的資料是比較重要的。既然Cb成份和Cr成份的資料比較相對不重要，就可以只取部分資料來處理。以增加壓縮的比例。JPEG通常有兩種採樣方式：YUV411和YUV422，它們所代表的意義是Y、Cb和Cr三個成份的資料取樣比例。

2.DCT變換

DCT變換的全稱是離散余弦變換(Discrete Cosine Transform)，是指將一組光強資料轉換成頻率資料，以便得知強度變化的情形。若對高頻的資料做些修飾，再轉回原來形式的資料時，顯然與原始資料有些差異，但是人類的眼睛卻是不容易辨認出來。

壓縮時，將原始圖像資料分成8*8資料單元矩陣，例如亮度值的第一個矩陣內容如下：

JPEG將整個亮度矩陣與色度Cb矩陣，飽和度Cr矩陣，視爲一個基本單元稱作MCU。每個MCU所包含的矩陣數量不得超過10個。例如，行和列採樣的比例皆爲4:2:2，則每個MCU將包含四個亮度矩陣，一個色度矩陣及一個飽和度矩陣。

當圖像資料分成一個8*8矩陣後，還必須將每個數值減去128，然後一一代入DCT變換公式中，即可達到DCT變換的目的。圖像資料值必須減去128，是因爲DCT轉換公式所接受的數位範圍是在-128到+127之間。

DCT變換公式：

x,y代表圖像資料矩陣內某個數值的座標位置

f(x,y)代表圖像資料矩陣內的數個數值

u,v代表DCT變換後矩陣內某個數值的座標位置

F(u,v)代表DCT變換後矩陣內的某個數值

u=0 且 v=0 c(u)c(v)=1/1.414

u>0 或 v>0 c(u)c(v)=1

經過DCT變換後的矩陣資料自然數爲頻率係數，這些係數以F（0，0）的值最大，稱爲DC，其餘的63個頻率係數則多半是一些接近於0的正負浮點數，一概稱之爲AC。

3、量化

圖像資料轉換爲頻率係數後，還得接受一項量化程式，才能進入編碼階段。

量化階段需要兩個8*8矩陣資料，一個是專門處理亮度的頻率係數，另一個則是

針對色度的頻率係數，將頻率係數除以量化矩陣的值，取得與商數最近的整數，

即完成量化。

當頻率係數經過量化後，將頻率係數由浮點數轉變爲整數，這才便於執行最

後的編碼。不過，經過量化階段後，所有資料只保留整數近似值，也就再度損失

了一些資料內容，JPEG提供的量化表如下：

4、編碼

Huffman編碼無專利權問題，成爲JPEG最常用的編碼方式，Huffman編碼通常是以完整的MCU來進行的。

編碼時，每個矩陣資料的DC值與63個AC值，將分別使用不同的Huffman編碼表，而亮度與色度也需要不同的Huffman編碼表，所以一共需要四個編碼表，才能順利地完成JPEG編碼工作。

DC編碼

DC是彩採用差值脈衝編碼調製的差值編碼法，也就是在同一個圖像分量中取得每個DC值與前一個DC值的差值來編碼。DC採用差值脈衝編碼的主要原因是由於在連續色調的圖像中，其差值多半比原值小，對差值進行編碼所需的位元數，會比對原值進行編碼所需的位元數少許多。例如差值爲5，它的二進位表示值爲101，如果差值爲-5，則先改爲正整數5，再將其二進位轉換成1的補數即可。所謂1的補數，就是將每個Bit若值爲0，便改成1；Bit爲1，則變成0。差值5應保留的位數爲3，下表即列出差值所應保留的Bit數與差值內容的對照。

在差值前端另外加入一些差值的霍夫曼碼值，例如亮度差值爲5（101）的位數爲3，則霍夫曼碼值應該是100，兩者連接在一起即爲100101。下列兩份表格分別是亮度和色度DC差值的編碼表。根據這兩份表格內容，即可爲DC差值加上霍夫曼碼值，完成DC

的編碼工作。

AC編碼

AC編碼方式與DC略有不同，在AC編碼之前，首先得將63個AC值按Zig-zag排序，即按照下圖箭頭所指示的順序串聯起來。

63個AC值排列好的，將AC係數轉換成中間符號，中間符號表示爲RRRR/SSSS，RRRR是指第非零的AC之前，其值爲0的AC個數，SSSS是指AC值所需的位數，AC系數的範圍與SSSS的對應關係與DC差值Bits數與差值內容對照表相似。

如果連續爲0的AC個數大於15，則用15/0來表示連續的16個0，15/0稱爲ZRL（Zero Rum Length），而（0/0）稱爲EOB（Enel of Block）用來表示其後所

剩餘的AC係數皆等於0，以中間符號值作爲索引值，從相應的AC編碼表中找出適當的霍夫曼碼值，再與AC值相連即可。

例如某一組亮度的中間符爲5/3，AC值爲4，首先以5/3爲索引值，從亮度AC的Huffman編碼表中找到1111111110011110霍夫曼碼值，於是加上原來100（4）即是用來取[5，4]的Huffman編碼1111111110011110100，[5，4]表示AC值爲4的前面有5個零。

由於亮度AC，色度AC霍夫曼編碼表比較長，在此省略去，有興趣者可參閱相關書籍。

實現上述四個步驟，即完成一幅圖像的JPEG壓縮。

參考資料

[1] 林福宗《圖像文件格式（上）——Windows 編程》，清華大學出版社，

1996年

[2] 李振輝、李仁各編著，《探索圖像文件的奧秘》，清華大學出版社，1996年

[3] 黎洪松、成實譯《JPEG靜止資料壓縮標準》，學苑出版社，1996年

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文

全部频道

浅谈JPEG图像压缩演算法概要