宝玛科技网
您的当前位置:首页浅谈JPEG图像压缩演算法概要

浅谈JPEG图像压缩演算法概要

来源:宝玛科技网


淺談JPEG圖像壓縮演算法

餘科亮

本文僅討論靜止圖像的壓縮基本演算法,圖像壓縮的目的在於以較少的資料來表示圖像以節約存儲費用,或者傳輸時間和費用。

JPEG壓縮演算法可以用失真的壓縮方式來處理圖像,但失真的程度卻是肉眼所無法辯認的。這也就是爲什麽JPEG會有如此滿意的壓縮比例的原因。

下面主要討論,JPEG基本壓縮法。

一.JPEG壓縮過程

JPEG壓縮分四個步驟實現:

1.顔色模式轉換及採樣;

2.DCT變換;

3.量化;

4.編碼。

二.1.顔色模式轉換及採樣

RGB色彩系統是我們最常用的表示顔色的方式。JPEG採用的是YCbCr色彩系統。想要用JPEG基本壓縮法處理全彩色圖像,得先把RGB顔色模式圖像資料,轉換爲YCbCr顔色模式的資料。Y代表亮度,Cb和Cr則代表色度、飽和度。通過下列計算公式可完成資料轉換。

Y=0.2990R+0.5870G+0.1140B

Cb=-0.1687R-0.3313G+0.5000B+128

Cr=0.5000R-0.4187G-0.0813B+128

人類的眼晴對低頻的資料比對高頻的資料具有更高的敏感度,事實上,人類

的眼睛對亮度的改變也比對色彩的改變要敏感得多,也就是說Y成份的資料是比較重要的。既然Cb成份和Cr成份的資料比較相對不重要,就可以只取部分資料來處理。以增加壓縮的比例。JPEG通常有兩種採樣方式:YUV411和YUV422,它們所代表的意義是Y、Cb和Cr三個成份的資料取樣比例。

2.DCT變換

DCT變換的全稱是離散余弦變換(Discrete Cosine Transform),是指將一組光強資料轉換成頻率資料,以便得知強度變化的情形。若對高頻的資料做些修飾,再轉回原來形式的資料時,顯然與原始資料有些差異,但是人類的眼睛卻是不容易辨認出來。

壓縮時,將原始圖像資料分成8*8資料單元矩陣,例如亮度值的第一個矩陣內容如下:

JPEG將整個亮度矩陣與色度Cb矩陣,飽和度Cr矩陣,視爲一個基本單元稱作MCU。每個MCU所包含的矩陣數量不得超過10個。例如,行和列採樣的比例皆爲4:2:2,則每個MCU將包含四個亮度矩陣,一個色度矩陣及一個飽和度矩陣。

當圖像資料分成一個8*8矩陣後,還必須將每個數值減去128,然後一一代入DCT變換公式中,即可達到DCT變換的目的。圖像資料值必須減去128,是因爲DCT轉換公式所接受的數位範圍是在-128到+127之間。

DCT變換公式:

x,y代表圖像資料矩陣內某個數值的座標位置

f(x,y)代表圖像資料矩陣內的數個數值

u,v代表DCT變換後矩陣內某個數值的座標位置

F(u,v)代表DCT變換後矩陣內的某個數值

u=0 且 v=0 c(u)c(v)=1/1.414

u>0 或 v>0 c(u)c(v)=1

經過DCT變換後的矩陣資料自然數爲頻率係數,這些係數以F(0,0)的值最大,稱爲DC,其餘的63個頻率係數則多半是一些接近於0的正負浮點數,一概稱之爲AC。

3、量化

圖像資料轉換爲頻率係數後,還得接受一項量化程式,才能進入編碼階段。

量化階段需要兩個8*8矩陣資料,一個是專門處理亮度的頻率係數,另一個則是

針對色度的頻率係數,將頻率係數除以量化矩陣的值,取得與商數最近的整數,

即完成量化。

當頻率係數經過量化後,將頻率係數由浮點數轉變爲整數,這才便於執行最

後的編碼。不過,經過量化階段後,所有資料只保留整數近似值,也就再度損失

了一些資料內容,JPEG提供的量化表如下:

4、編碼

Huffman編碼無專利權問題,成爲JPEG最常用的編碼方式,Huffman編碼通常是以完整的MCU來進行的。

編碼時,每個矩陣資料的DC值與63個AC值,將分別使用不同的Huffman編碼表,而亮度與色度也需要不同的Huffman編碼表,所以一共需要四個編碼表,才能順利地完成JPEG編碼工作。

DC編碼

DC是彩採用差值脈衝編碼調製的差值編碼法,也就是在同一個圖像分量中取得每個DC值與前一個DC值的差值來編碼。DC採用差值脈衝編碼的主要原因是由於在連續色調的圖像中,其差值多半比原值小,對差值進行編碼所需的位元數,會比對原值進行編碼所需的位元數少許多。例如差值爲5,它的二進位表示值爲101,如果差值爲-5,則先改爲正整數5,再將其二進位轉換成1的補數即可。所謂1的補數,就是將每個Bit若值爲0,便改成1;Bit爲1,則變成0。差值5應保留的位數爲3,下表即列出差值所應保留的Bit數與差值內容的對照。

在差值前端另外加入一些差值的霍夫曼碼值,例如亮度差值爲5(101)的位數爲3,則霍夫曼碼值應該是100,兩者連接在一起即爲100101。下列兩份表格分別是亮度和色度DC差值的編碼表。根據這兩份表格內容,即可爲DC差值加上霍夫曼碼值,完成DC

的編碼工作。

AC編碼

AC編碼方式與DC略有不同,在AC編碼之前,首先得將63個AC值按Zig-zag排序,即按照下圖箭頭所指示的順序串聯起來。

63個AC值排列好的,將AC係數轉換成中間符號,中間符號表示爲RRRR/SSSS,RRRR是指第非零的AC之前,其值爲0的AC個數,SSSS是指AC值所需的位數,AC系數的範圍與SSSS的對應關係與DC差值Bits數與差值內容對照表相似。

如果連續爲0的AC個數大於15,則用15/0來表示連續的16個0,15/0稱爲ZRL(Zero Rum Length),而(0/0)稱爲EOB(Enel of Block)用來表示其後所

剩餘的AC係數皆等於0,以中間符號值作爲索引值,從相應的AC編碼表中找出適當的霍夫曼碼值,再與AC值相連即可。

例如某一組亮度的中間符爲5/3,AC值爲4,首先以5/3爲索引值,從亮度AC的Huffman編碼表中找到1111111110011110霍夫曼碼值,於是加上原來100(4)即是用來取[5,4]的Huffman編碼1111111110011110100,[5,4]表示AC值爲4的前面有5個零。

由於亮度AC,色度AC霍夫曼編碼表比較長,在此省略去,有興趣者可參閱相關書籍。

實現上述四個步驟,即完成一幅圖像的JPEG壓縮。

參考資料

[1] 林福宗 《圖像文件格式(上)——Windows 編程》,清華大學出版社,

1996年

[2] 李振輝、李仁各編著,《探索圖像文件的奧秘》,清華大學出版社,1996年

[3] 黎洪松、成實譯《JPEG靜止資料壓縮標準》,學苑出版社,1996年

因篇幅问题不能全部显示,请点此查看更多更全内容