在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

沒有DCT,就沒有JPEG/MPEG

算法與數(shù)據(jù)結構 ? 來源:凹非寺 ? 作者:明敏 豐色 ? 2022-07-27 11:30 ? 次閱讀

世界上最好用的壓縮軟件是什么?

微信。

這個段子想必很多人都聽過。

一張幾兆的圖片,經(jīng)微信一發(fā),立馬降到幾百kb。

7f2adb28-0d5b-11ed-ba43-dac502259ad0.jpg

△如果是有損壓縮畫質(zhì)會下降(右圖天空有波紋)

雖說這是個吐槽,但u1s1,圖片視頻壓縮其實是一項非常必要的技術。

比如視頻通話、傳輸大量圖片時,如果不壓縮的話,要么圖像完全無法傳送,要么就是干等了。

所以在數(shù)字時代這幾十年里,萌生出了很多相關的技術,比如JPEG、H.26X。

不過你或許不知道,這些技術往上追溯,可以從47年前說起。

有三位名不見經(jīng)傳的印度工程師“一意孤行”,在沒申請到研究經(jīng)費的情況下,利用暑假時間鼓搗出來了一項技術,后來直接成為圖像視頻壓縮的行業(yè)標準。

它就是DCT。

全稱為Discrete Cosine Transform,即離散余弦變換。

而有趣的是,DCT誕生之初時,就連作者本人都沒有想到,它后來會有如此巨大的影響力。

沒有DCT,就沒有JPEG/MPEG

直接說DCT可能很多人不知道是什么,但JPEG大家肯定都聽過。

它除了是一種常見的圖片文件后綴名,其實也是一種有損壓縮標準,可以把一張圖片從左邊這樣變成右邊這樣:

7f412c2a-0d5b-11ed-ba43-dac502259ad0.png

ps.有損和無損的區(qū)別:無損壓縮可以再100%還原圖像;有損不可以,但有損壓縮后的圖像大小會大大減少。

DCT就是實現(xiàn)這個過程的一種基礎技術。

它是傅立葉變換的一種,可以將圖像從空域轉(zhuǎn)換到頻域,也就是把圖像從像素矩陣變成用帶有頻率等信息的函數(shù)來表示。

具體變換過程,我們以一張圖像中一個3x3的像素塊為例:

7f549706-0d5b-11ed-ba43-dac502259ad0.png

△圖源博客園博主@沉默的背影 X-Pacific

對這個像素塊做DTC變換,就相當于把除了第一個像素以外,其余像素的部分信息都抽取到第一個格中。

這樣,第一個格的像素值表示的就是一張圖的總體樣貌,稱為低頻信息;其余格表示的就是圖像中人物或物體的細節(jié),稱為高頻信息。

經(jīng)DCT轉(zhuǎn)換后,每個3x3的像素塊都會產(chǎn)生1個DC(直流)系數(shù)(位于第一個格)及8個AC(交流)系數(shù)(剩余格),前者是DCT最重要的輸出。

7f67966c-0d5b-11ed-ba43-dac502259ad0.png

由于大部分的圖像能量會集中在低頻部分,因此轉(zhuǎn)換之后輸出的DC系數(shù)值比較大,而輸出的AC系值比較小。

利用“人眼對低頻分量的圖像比對高頻分量的圖像更敏感”這一原理,再通過量化保存下來低頻分量,舍棄高頻分量(將大部分AC系數(shù)值變?yōu)?)、丟掉那些對視覺效果影響不大的信息,從而達到壓縮目的。

從下面這兩張圖像的三維投影,我們可以看到DCT變換帶來的改變:

(上:原圖;下:經(jīng)過DCT變換后)

7f7ce92c-0d5b-11ed-ba43-dac502259ad0.png

在實際的JPEG壓縮標準中,都是將一張圖像分成若干個8x8的像素塊(不夠的用空白補齊)。

將色彩空間從RGB轉(zhuǎn)為YUV之后,從左至右、從上至下對每個塊進行DCT變換。

然后對每個塊變換得來的系數(shù)進行量化,在這個過程中,一些重要的分量就被去除了,且無法恢復。

因此,這是一種不可逆的有損壓縮技術。

接著對量化后得到的AC系數(shù)和DC系數(shù)再分別進行編碼,經(jīng)過哈夫曼編碼后得到下面這樣的一大串數(shù)字。

7f970cbc-0d5b-11ed-ba43-dac502259ad0.png

解壓縮時對每個圖像塊做DCT反轉(zhuǎn)換(IDCT),就可以重建完整圖像。

具體計算過程如下:

首先將圖片中每個像素的原始灰度和亮度值用8bit表示,也就是(0,255)這個范圍。

由于大多數(shù)值都會分布在128左右,所以會將這些值都減去128,這樣會有更多值為0,有利于壓縮,這時候范圍變成(-128,127)。

7fa970fa-0d5b-11ed-ba43-dac502259ad0.png

然后再用DCT變換公式進行變換,二維的用這個:

7fbd7c6c-0d5b-11ed-ba43-dac502259ad0.png

變換完后進行根據(jù)量化表進行量化,將大部分系數(shù)變?yōu)?,完成壓縮。

7fccd7fc-0d5b-11ed-ba43-dac502259ad0.png

ps.量化表是根據(jù)人眼對量化誤差的視覺閾值來確定的,有固定的一張表。

后面就是前面說的一系列編碼過程了。

1974年1月,這項技術首次被發(fā)表在IEEE Transactions on Computers上面。

自此,圖像和視頻壓縮領域的行業(yè)標準就誕生了。

1998年世界首個視頻壓縮標準H.261、1992年的JPEG和MPEG、2010年的WebP、2013年的HEIF、2018年谷歌亞馬遜等公司聯(lián)合創(chuàng)建的AV1……等壓縮標準都是基于這項技術,且一直沿用至今。

40多年都名不見經(jīng)傳的發(fā)明者

DCT的作者有3位,分別是Nasir Ahmed(納西爾·艾哈邁德)、K.R. Rao(K.R.拉奧)和T. Natarajan(T.納塔拉詹)。

納西爾是新墨西哥大學電氣與計算機工程系名譽教授。

他1940年出生于印度班加羅爾,1966年在新墨西哥大學獲得博士學位。

1966-1968年,他在霍尼韋爾公司擔任首席工程師,1968-1983年在堪薩斯州立大學擔任教授。

1983-2001年,他回到新墨西哥大學擔任電氣與計算機工程系首席教授。在此期間,他先后擔任過系主任、研究生院院長等職位。

今年,納西爾已經(jīng)有82歲高齡。

另一位主要作者是K.R.拉奧。

他同樣是一位美籍印度裔學者。

1960年,他在佛羅里達大學獲得核工程專業(yè)博士學位。1966年,又在新墨西哥大學獲得電氣與計算機工程專業(yè)博士學位。

之后50年,他一直在得克薩斯州阿靈頓分校工作,擔任電氣工程系教授。

與此同時,他還是IEEE Fellow。

2021年1月15日,拉奧教授揮別人世,享年89歲。

T.納塔拉詹當時是納西爾帶的博士生,如今在互聯(lián)網(wǎng)上已經(jīng)檢索不到太多他的相關信息。

可以說相比于大名鼎鼎的DCT,幾位發(fā)明者稱得上是“名不見經(jīng)傳”了。

實際上,40多年來,DCT發(fā)明的幕后故事一直鮮有人關注。

甚至連納西爾的兒子都表示,“從來沒想過父親帶來的影響有如此之大”。

而將納西爾從幕后推至臺前的,還多虧了一部美劇中的一波致敬。

2020年,《我們的生活》中有一段劇情是納西爾以視頻通話的方式,講述了自己和妻子相愛的故事。

片方表示,設計這一橋段的初衷,就是希望更多人意識到,當下我們能夠通過互聯(lián)網(wǎng)快速發(fā)送圖片視頻,都與納西爾的工作離不開關系。

劇情播出后,不少媒體將DCT定義為“改變世界的算法”,也稱納西爾這位名不見經(jīng)傳的工程師,終于從幕后推到了臺前。

不過,納西爾在自己的回憶視頻里表示,當初真的沒想到DCT會帶來如此大的影響。

我也無法預測技術發(fā)展的速度,對于FaceTime這些應用的出現(xiàn),我感到非常驚訝。

要知道,DCT最初可能差一點就被扼殺在了搖籃里。

1972年,當時已經(jīng)對DCT初有構思的納西爾向美國國家科學基金會(NSF)遞交了一份申請,希望NSF能為他研究DCT提供資金支持。

不過令納西爾驚訝的是,這個申請直接被斃掉了,評審人給出的意見是“它太簡單了”。

但好在納西爾并沒有放棄,他始終覺得這個idea很有新意。

唯一令他有所顧慮的是,他可能是只能利用假期來完成DCT的相關工作了,而且這期間可能沒有任何收入。

所以,納西爾回家和妻子說:

我有直覺,這事兒值得做下去。只不過我們需要計劃好如何度過一個沒有薪水的暑假。

妻子沒有任何猶豫就支持了他。

于是,在1973年的夏天,DCT的研究工作正式開始了。

參與到這項研究的,還有納西爾的好友拉奧和博士生納塔拉詹。

拉奧也是支持納西爾研究DCT的重要人物之一。

在納西爾的申請被斃掉后,他第一時間把自己的想法告訴了好友拉奧。

拉奧給出了這樣的回復:

你要立即把這些結果以短文的形式發(fā)表。

這就是“How I Came Up with the Discrete Cosine Transform”誕生的始末。

802235da-0d5b-11ed-ba43-dac502259ad0.png

后來,這篇文章幾乎稱得上是圖片視頻壓縮領域的必讀之文。

之后的故事,也就是我們所熟知的了。

1974年,《Discrete Cosine Transform》在IEEE Transactions on Computers上發(fā)表。

截至目前,這篇文章的被引次數(shù)已經(jīng)達到5878次。

納西爾曾在采訪中表示,自己人生中最大的禮物,就是人們對DCT的認可。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像
    +關注

    關注

    2

    文章

    1091

    瀏覽量

    40946
  • JPEG
    +關注

    關注

    0

    文章

    66

    瀏覽量

    30216
  • DCT
    DCT
    +關注

    關注

    1

    文章

    56

    瀏覽量

    20106

原文標題:三個印度人改變壓縮算法,一意孤行整個暑假,卻因“太簡單”申不到經(jīng)費

文章出處:【微信號:TheAlgorithm,微信公眾號:算法與數(shù)據(jù)結構】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    Littelfuse推出KSC2 DCT系列輕觸開關

    Littelfuse宣布推出C&K Switches KSC2 KSC雙電路技術 (DCT) 系列輕觸開關。這是C&K創(chuàng)新輕觸開關系列的最新產(chǎn)品,致動器高度為3.5毫米,低于致動器
    的頭像 發(fā)表于 02-26 15:08 ?469次閱讀

    電烙鐵焊錫到底有沒有

    電烙鐵焊錫到底有沒有毒?無鉛?有鉛? 電烙鐵焊錫有毒嗎? 有網(wǎng)友吐槽稱,他在PCB工廠用電烙鐵焊錫一年整了,都感覺到身體開始不舒服了,腹部有點脹,焊錫有毒嗎?是不是會鉛中毒。 其實這個還要看工作中
    的頭像 發(fā)表于 02-12 09:27 ?2588次閱讀

    網(wǎng)線沒有屏蔽層有影響嗎

    網(wǎng)線沒有屏蔽層確實會產(chǎn)生一定的影響,這些影響主要體現(xiàn)在以下幾個方面: 一、抗干擾能力降低 屏蔽層的主要功能之一是防止外部電磁干擾對網(wǎng)線內(nèi)部信號傳輸?shù)挠绊憽?b class='flag-5'>沒有屏蔽層的網(wǎng)線更容易受到外界電磁場的干擾
    的頭像 發(fā)表于 12-11 10:01 ?1123次閱讀

    百問FB顯示開發(fā)圖像處理 - JPEG圖像處理

    2.2 JPEG圖像處理 2.2.1 JPEG文件格式和libjpeg編譯 ?JPEG的后綴名為.jpg的圖像文件。對于圖像內(nèi)容和信息相同的JPEG文件和BMP文件,
    發(fā)表于 11-28 13:57

    車載主機沒有音頻輸出怎么改

    車載主機沒有音頻輸出的問題可能是由于多種原因造成的,包括硬件故障、軟件設置問題、連接問題等。 第一部分:硬件檢查 1. 檢查音頻輸出端口 首先,我們需要檢查車載主機的音頻輸出端口是否有物理損壞。這可
    的頭像 發(fā)表于 10-17 09:47 ?878次閱讀

    TMS320DM6446上的Motion JPEG演示

    電子發(fā)燒友網(wǎng)站提供《TMS320DM6446上的Motion JPEG演示.pdf》資料免費下載
    發(fā)表于 10-16 11:45 ?0次下載
    TMS320DM6446上的Motion <b class='flag-5'>JPEG</b>演示

    基于FPGA的JPEG-LS圖像壓縮器介紹

    現(xiàn)在來看一下GitHub上面一個開源的JPEG LS算法的Verilog實現(xiàn)
    的頭像 發(fā)表于 10-15 17:27 ?1033次閱讀
    基于FPGA的<b class='flag-5'>JPEG</b>-LS圖像壓縮器介紹

    cd機沒有聲音輸出怎么維修

    修理CD機沒有聲音輸出的問題可以是一個復雜的過程,因為它可能涉及到多個組件和系統(tǒng)。 1. 初步檢查 在開始任何修理之前,進行一些基本的檢查是很重要的。 1.1 電源檢查 確保CD機已經(jīng)正確連接
    的頭像 發(fā)表于 10-14 10:24 ?4157次閱讀

    dct變換的主要優(yōu)點有哪些

    DCT(離散余弦變換)是一種在信號處理和圖像壓縮中廣泛使用的變換技術。它是一種線性變換,可以將信號從時域(或空間域)轉(zhuǎn)換到頻域。DCT在圖像壓縮中特別有用,因為它能夠?qū)D像數(shù)據(jù)集中到變換后的頻域
    的頭像 發(fā)表于 09-30 16:30 ?1037次閱讀

    沒有pcb板怎么做貼片機程序

    沒有PCB板的情況下,制作貼片機程序是一項具有挑戰(zhàn)性的任務,但并非不可能。 了解貼片機程序的基本概念 在開始制作貼片機程序之前,您需要了解一些基本概念。貼片機是一種自動化設備,用于將電子元件(如
    的頭像 發(fā)表于 08-15 10:11 ?608次閱讀

    pcb沒有工藝邊怎么貼片

    當PCB沒有工藝邊時,進行貼片加工需要特別注意以下幾點,以確保貼片過程的順利進行和最終產(chǎn)品的質(zhì)量。 一、了解工藝邊的作用 工藝邊是PCB板兩邊或四邊增加的部分,主要為了輔助貼片插件焊接走板,方便
    的頭像 發(fā)表于 08-15 09:45 ?1519次閱讀

    感性負載沒有補償電容會有什么情況

    感性負載指的是在交流電路中,電感元件(如電感線圈)構成的負載。如果在這樣的感性負載電路中沒有補償電容,可能會導致以下情況: 1、功率因數(shù)低下:感性負載本身會導致電流落后于電壓,從而降低整體的功率因數(shù)
    的頭像 發(fā)表于 06-25 14:19 ?863次閱讀

    下位機沒有工程原始程序怎么辦

    在這種情況下,下位機沒有工程原始程序可能會導致一些困難。但是,通過采取一系列措施,仍然可以解決這個問題。 1. 確定問題原因 首先,您需要確定為什么下位機沒有工程原始程序。可能的原因包括: 原始程序
    的頭像 發(fā)表于 06-06 10:21 ?1604次閱讀

    Keil這么難用,為什么還沒有被淘汰?

    這個話題好像是個偽命題,因為我覺得Keil除了經(jīng)常卡頓、莫名卡死、不支持靈活的拓展外,也沒有很難用啊?其實Keil作為一款嵌入式軟件開發(fā)工具,在業(yè)界有著長期的存在和廣泛的應用。盡管有些人認為Keil
    的頭像 發(fā)表于 05-18 08:04 ?1509次閱讀
    Keil這么難用,為什么還<b class='flag-5'>沒有</b>被淘汰?

    沒有無功補償為什么會被罰款

    無功補償是電力系統(tǒng)中一項重要的技術措施,它可以解決電力系統(tǒng)中的無功功率問題,提高系統(tǒng)的功率因數(shù),穩(wěn)定電壓質(zhì)量,減少線損,改善電力設備的運行效率。然而,如果沒有無功補償措施,將會對電力系統(tǒng)和電力設備造成影響,甚至會被罰款。
    的頭像 發(fā)表于 05-16 14:22 ?2326次閱讀
    主站蜘蛛池模板: 激情五月深爱五月 | 国产精品久久久久久久久齐齐 | 最近高清在线视频观看免费 | 男女无遮挡在线完整视频 | 日韩精品亚洲一级在线观看 | 色视频综合| 在线五月婷婷 | 日韩一级欧美一级在线观看 | 国产呦在线观看视频 | 免费我看视频在线观看 | 美女被艹视频网站 | 免费看吻胸亲嘴激烈网站 | 黄网免费 | 天堂电影在线观看免费入口 | 在线天堂中文有限公司 | 亚洲国产精品综合久久网络 | 日韩免费在线视频 | 国产亚洲午夜精品a一区二区 | 久久99热久久精品 | 欧美大片一区二区三区 | 色婷婷狠狠 | 免费 在线观看 视频 | 91视频免费观看 | 在线观看你懂的网址 | 国产色秀视频在线观看 | 国产香蕉视频在线观看 | 狠狠狠狼鲁欧美综合网免费 | 亚洲国产精品va在线观看麻豆 | 1024免费永久福利视频 | 天天天天做夜夜夜夜做 | 欧美亚洲一区二区三区在线 | 国产成人精品日本亚洲语音1 | 日韩欧美黄色 | 狠狠色丁香婷婷综合久久来 | 亚洲一卡二卡在线 | a一级| 亚洲综合国产一区二区三区 | aaa免费视频| 91视频看看| 六月婷婷综合激情 | 短篇禁伦小说 |