數據壓縮是指在不丟失有用信息的前提下,縮減數據量以減少存儲空間,提高其傳輸、存儲和處理效率,或按照一定的算法對數據進行重新組織,減少數據的冗余和存儲的空間的一種技術方法。數據壓縮包括有損壓縮和無損壓縮。
在計算機科學和信息論中,數據壓縮或者源編碼是按照特定的編碼機制用比未經編碼少的數據位元(或者其它信息相關的單位)表示信息的過程。例如,如果我們將“compression”編碼為“comp”那么這篇文章可以用較少的數據位表示。一種流行的壓縮實例是許多計算機都在使用的ZIP 文件格式,它不僅僅提供了壓縮的功能,而且還作為歸檔工具(Archiver)使用,能夠將許多文件存儲到同一個文件中。
對于任何形式的通信來說,只有當信息的發送方和接受方都能夠理解編碼機制的時候壓縮數據通信才能夠工作。例如,只有當接受方知道這篇文章需要用英語字符解釋的時候這篇文章才有意義。同樣,只有當接受方知道編碼方法的時候他才能夠理解壓縮數據。一些壓縮算法利用了這個特性,在壓縮過程中對數據進行加密,例如利用密碼加密,以保證只有得到授權的一方才能正確地得到數據。
數據壓縮能夠實現是因為多數現實世界的數據都有統計冗余。例如,字母“e”在英語中比字母“z”更加常用,字母“q”后面是“z”的可能性非常小。無損壓縮算法通常利用了統計冗余,這樣就能更加簡練地、但仍然是完整地表示發送方的數據。
如果允許一定程度的保真度損失,那么還可以實現進一步的壓縮。例如,人們看圖畫或者電視畫面的時候可能并不會注意到一些細節并不完善。同樣,兩個音頻錄音采樣序列可能聽起來一樣,但實際上并不完全一樣。有損壓縮算法在帶來微小差別的情況下使用較少的位數表示圖像、視頻或者音頻。
由于可以幫助減少如硬盤空間與連接帶寬這樣的昂貴資源的消耗,所以壓縮非常重要,然而壓縮需要消耗信息處理資源,這也可能是費用昂貴的。所以數據壓縮機制的設計需要在壓縮能力、失真度、所需計算資源以及其它需要考慮的不同因素之間進行折衷。
一些機制是可逆的,這樣就可以恢復原始的數據,這種機制稱為無損數據壓縮;另外一些機制為了實現更高的壓縮率允許一定程度的數據損失,這種機制稱為有損數據壓縮。
然而,經常有一些文件不能被無損數據壓縮算法壓縮,實際上對于不含可以辨別樣式的數據任何壓縮算法都不能壓縮。試圖壓縮已經經過壓縮的數據通常得到的結果實際上是擴展數據,試圖壓縮經過加密的數據通常也會得到這種結果。
實際上,有損數據壓縮也會最終達到不能工作的地步。我們來舉一個極端的例子,壓縮算法每次去掉文件最后一個字節,那么經過這個算法不斷的壓縮直至文件變空,壓縮算法將不能繼續工作。
多媒體數據壓縮的必要性
信息時代的重要特征是信息的數字化,巾數字化后的視頻和各頻等媒體信息具有媒體海量性,這與當前硬件技術所能提供的計算機存儲資源和網絡帶寬之間有很大差距。這樣,就對多媒體信息的存儲和傳輸造成丁很大困難,成為阻礙人們有效獲取和利用信息的一個瓶頸問題。不能對多媒體數據進行有效的壓縮,就難以保證通信的順利進行。數寧化丁的視頻和音頻信號的數據雖是非常驚人的。下面舉例來說明。
對于音頻信息來說,人在正常說話時的音頻一般為200 Hz一3.4kHz,即人類語各的寬度約為3.4kH:。同樣依據采樣定理,并沒數字化精度為8btt,則每秒的數據量為3.4×2×8=54.4kb即在上述采樣條件下講1分鐘話的數據量約為400 kb。
以一般彩色電視信號為例,設代表光強、色彩和色飽和度的YIQ空間中各分量的帶寬分別為4MHz、I.3MH s和o.5MHz。根據采樣定理,僅當采樣頻率大于或等于2倍的原始信號的頻率時.刁‘能保證采樣后的信號可被無失真地恢復為原始信號。再設各樣點均被數寧化為8bit.從而1秒鐘的電視信號的數據量為(4十1.3十o.5)×2×8=92.8Mb張640 MB容量的cD—R()M能夠存放的原始電視數據(鉛字行附有2倫校驗位)為麗黑黑萬—dd s
也就是說, “張普通光鍬只能存放44s的原始數據。支持語音、圖像、視頻等多媒體信號高質量存儲和傳輸所必需的末爪縮速率以及信號持件。
-
存儲
+關注
關注
13文章
4527瀏覽量
87359 -
數據壓縮
+關注
關注
0文章
31瀏覽量
10279 -
無損壓縮
+關注
關注
0文章
12瀏覽量
8525
發布評論請先 登錄
【TL6748 DSP申請】井下數據壓縮技術
UPS的重要性
多媒體數據壓縮技術研究
JPEG2000數據壓縮的FPGA實現

評論