在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

SVD的數據壓縮原理

lviY_AI_shequ ? 來源:lp ? 2019-04-02 15:16 ? 次閱讀

前言

奇異值分解(SVD)在降維,數據壓縮,推薦系統等有廣泛的應用,任何矩陣都可以進行奇異值分解,本文通過正交變換不改變基向量間的夾角循序漸進的推導SVD算法,以及用協方差含義去理解行降維和列降維,最后介紹了SVD的數據壓縮原理 。

1. 正交變換

正交變換公式:

上式表示:X是Y的正交變換,其中U是正交矩陣,X和Y為列向量 。

下面用一個例子說明正交變換的含義:

假設有兩個單位列向量a和b,兩向量的夾角為θ,如下圖:

現對向量a,b進行正交變換:

,的模:

由上式可知的模都為1。

的內積:

由上式可知,正交變換前后的內積相等。

的夾角

比較(2)式和(3)式得:正交變換前后的夾角相等,即:

因此,正交變換的性質可用下圖來表示:

正交變換的兩個重要性質:

1)正交變換不改變向量的模。

2)正交變換不改變向量的夾角。

如果向量是基向量,那么正交變換的結果如下圖:

上圖可以得到重要結論:基向量正交變換后的結果仍是基向量?;蛄渴潜硎鞠蛄孔詈啙嵉姆椒?,向量在基向量的投影就是所在基向量的坐標,我們通過這種思想去理解特征值分解和推導SVD分解。

2. 特征值分解的含義

對稱方陣A的特征值分解為:

其中U是正交矩陣,是對角矩陣。

為了可視化特征值分解,假設A是2×2的對稱矩陣,,。(2.1)式展開為:

用圖形表示為:

由上圖可知,矩陣A沒有旋轉特征向量,它只是對特征向量進行了拉伸或縮短(取決于特征值的大?。?,因此,對稱矩陣對其特征向量(基向量)的變換仍然是基向量(單位化)。

特征向量和特征值的幾何意義:若向量經過矩陣變換后保持方向不變,只是進行長度上的伸縮,那么該向量是矩陣的特征向量,伸縮倍數是特征值。

3. SVD分解推導

我們考慮了當基向量是對稱矩陣的特征向量時,矩陣變換后仍是基向量,但是,我們在實際項目中遇到的大都是行和列不相等的矩陣,如統計每個學生的科目乘積,行數為學生個數,列數為科目數,這種形成的矩陣很難是方陣,因此SVD分解是更普遍的矩陣分解方法。

先回顧一下正交變換的思想:基向量正交變換后的結果仍是基向量。

我們用正交變換的思想來推導SVD分解:

假設A是M*N的矩陣,秩為K,Rank(A)=k。

存在一組正交基V:

矩陣對其變換后仍是正交基,記為U:

由正交基定義,得:

上式展開:

∴ (3.2)式得:

即假設成立 。

圖形表示如下:

正交向量的模:

單位化正交向量,得:

結論:當基向量是。

用矩陣的形式表示(3.3)式:

V是N*K矩陣,U是M*K矩陣,是M*K的矩陣,需要擴展成方陣形式:

將正交基擴展空間的正交基,即U是M*M方陣 。

將正交基擴展成空間的正交基,其中是矩陣A的零空間,即:

對應的特征值=0,是M*N對角矩陣,V是N*N方陣

因此(3.4)式寫成向量形式為:

得:

(3.5)式寫成向量形式:

令:

則:

A = XY

因為X和Y分別是列滿秩和行滿秩,所以上式是A的滿秩分解。

(3.5)式的奇異矩陣的值特征值的平方根,下面推導奇異值分解的U和V:

即V是的特征向量構成的矩陣,稱為右奇異矩陣。

即U是的特征向量構成的矩陣,稱為左奇異矩陣 。

小結:矩陣A的奇異值分解:

其中U是的特征向量構成的矩陣,V是的特征向量構成的矩陣,奇異值矩陣的值是特征值的平方根 。

3. 奇異值分解的例子

本節用一個簡單的例子來說明矩陣是如何進行奇異值分解的。矩陣A定義為:

4. 行降維和列降維

本節通過協方差的角度去理解行降維和列降維,首先探討下協方差的含義:

單個變量用方差描述,無偏方差公式:

兩個變量用協方差描述,協方差公式:

多個變量(如三個變量)之間的關系可以用協方差矩陣描述:

相關系數公式:

由上式可知,協方差是描述變量間的相關關系程度:

1)協方差cov(x,y) > 0時,變量x與y正相關;

2)協方差cov(x,y)<0時,變量x與y負相關;

3)協方差cov(x,y)=0時,變量x與y不相關;

變量與協方差關系的定性分析圖:

現在開始討論的含義:

假設數據集是n維的,共有m個數據,每一行表示一例數據,即:

表示第i個樣本,表示第i個樣本的第j維特征?。

由上式可知,是描述各特征間相關關系的矩陣,所以的正交基V是以數據集的特征空間進行展開的。

數據集A在特征空間展開為:

由上一篇文章可知,特征值表示了在相應特征向量的信息分量。特征值越大,包含矩陣的信息分量亦越大。

若我們選擇前r個特征值來表示原始數據集,數據集A在特征空間展開為:

(4.2)式對列進行了降維,即右奇異矩陣V可以用于列數的壓縮,與PCA降維算法一致。

行降維:

由上式可知:是描述樣本數據間相關關系的矩陣,因此,左奇異矩陣U是以樣本空間進行展開,原理與列降維一致,這里不詳細介紹了 。

若我們選擇前r個特征值來表示原始數據集,數據集A在樣本空間展開為:

因此,上式實現了行降維,即左奇異矩陣可以用于行數的壓縮。

5. 數據壓縮

本節介紹兩種數據壓縮方法:滿秩分解和近似分解

矩陣A的秩為k,A的滿秩分解:

滿秩分解圖形如下:

由上圖可知,存儲X和Y的矩陣比存儲A矩陣占用的空間小,因此滿秩分解起到了數據壓縮作用。

若對數據再次進行壓縮,需要用到矩陣的近似分解。

矩陣A的奇異值分解:

若我們選擇前r個特征值近似矩陣A,得:

如下圖:

我們用灰色部分的三個小矩陣近似表示矩陣A,存儲空間大大的降低了。

6. SVD總結

任何矩陣都能進行SVD分解,SVD可以用于行降維和列降維,SVD在數據壓縮、推薦系統和語義分析有廣泛的應用,SVD與PCA的缺點一樣,分解出的矩陣解釋性不強 。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 矩陣
    +關注

    關注

    0

    文章

    425

    瀏覽量

    34644
  • 向量
    +關注

    關注

    0

    文章

    55

    瀏覽量

    11705
  • SVD
    SVD
    +關注

    關注

    0

    文章

    21

    瀏覽量

    12194

原文標題:奇異值分解(SVD)原理總結

文章出處:【微信號:AI_shequ,微信公眾號:人工智能愛好者社區】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    【TL6748 DSP申請】井下數據壓縮技術

    申請理由:我是中石油渤海鉆探工程公司定向井分公司的儀器工程師,目前我在研發一項科研項目,主要是關于數據壓縮算法以及數據編解碼方面技術研究。需要利用數據處理芯片來實現井下數據壓縮及編解碼
    發表于 09-10 11:09

    MapReduce數據壓縮的基本原則

    黑猴子的家:MapReduce數據壓縮
    發表于 05-24 12:45

    LZO Data Compression Core/無損數據壓縮IP Core

    基于LZO的高性能無損數據壓縮IP
    發表于 12-21 07:14

    數據壓縮技術

    一、數據壓縮的必要性二、多媒體數據壓縮的可能性三、壓縮方案應滿足的要求四、編碼方案分類五、數據壓縮(編碼)的主要步驟六、一些基本的壓縮技術七
    發表于 03-25 13:19 ?35次下載

    高速數據壓縮與緩存的FPGA實現

    本文設計了一種以 FPGA 為數據壓縮數據緩存單元的高速數據采集系統,其主要特點是對高速采集的數據進行實時壓縮,再將
    發表于 11-30 15:32 ?20次下載

    傳真機的數據壓縮系統

    傳真機的數據壓縮系統         
    發表于 12-29 16:51 ?674次閱讀

    基于實時數據庫的數據壓縮算法

    本內容提出了基于實時數據庫的數據壓縮算法,希望對大家學習上有所幫助
    發表于 05-26 16:07 ?20次下載
    基于實時<b class='flag-5'>數據</b>庫的<b class='flag-5'>數據壓縮</b>算法

    JPEG2000數據壓縮的FPGA實現

    高性能的數據壓縮可以有效的減少數據對存儲空間和通信帶寬的要求,降低通信成本。為解決圖像數據的高壓縮性能問題,本文提出了基于JPEG2000標準的數據
    發表于 04-16 10:39 ?47次下載
    JPEG2000<b class='flag-5'>數據壓縮</b>的FPGA實現

    JAVA教程之數據壓縮與傳輸

    JAVA教程之數據壓縮與傳輸,很好的JAVA的資料,快來學習吧
    發表于 04-11 17:28 ?10次下載

    小波算法在監測數據壓縮中的應用

    小波算法在監測數據壓縮中的應用
    發表于 02-07 18:22 ?16次下載

    基于運動狀態改變的GPS軌跡數據壓縮算法

    針對基于偏移量計算的軌跡數據壓縮算法中對于關鍵點的評估不足以及基于在線軌跡數據壓縮算法中累積誤差和對偏移量考慮不足的問題,提出一種基于運動狀態改變的在線全球定位系統( GPS)軌跡數據壓縮算法限定
    發表于 12-26 18:55 ?1次下載

    數據壓縮的重要性

    數據壓縮是指在不丟失有用信息的前提下,縮減數據量以減少存儲空間,提高其傳輸、存儲和處理效率,或按照一定的算法對數據進行重新組織,減少數據的冗余和存儲的空間的一種技術方法。
    的頭像 發表于 02-28 10:45 ?1.5w次閱讀

    數據壓縮算法計算步驟及過程

    一種非常簡單的壓縮方法是行程長度編碼,這種方法使用數據數據長度這樣簡單的編碼代替同樣的連續數據,這是無損數據壓縮的一個實例。這種方法經常用
    的頭像 發表于 02-28 10:51 ?1.2w次閱讀
    <b class='flag-5'>數據壓縮</b>算法計算步驟及過程

    有趣!史記:數據壓縮算法列傳

    簡單地說,如果沒有數據壓縮技術,我們就沒法用 WinRAR 為 Email 中的附件瘦身;如果沒有數據壓縮技術,市場上的數碼錄音筆就只能記錄不到20 分鐘的語音;如果沒有數據壓縮技術
    的頭像 發表于 11-11 15:21 ?826次閱讀

    高性能無損數據壓縮FPGA IP,LZO無損數據壓縮IP

    LZOAccel-C是一個無損數據壓縮引擎的FPGA硬件實現,兼容LZO 2.10標準。 Core接收未壓縮的輸入數據塊,產生壓縮后的數據
    的頭像 發表于 01-25 13:39 ?537次閱讀
    高性能無損<b class='flag-5'>數據壓縮</b>FPGA IP,LZO無損<b class='flag-5'>數據壓縮</b>IP
    主站蜘蛛池模板: 国内精品久久久久影院男同志 | 能看的黄网 | 免费网站成人亚洲 | 亚洲男人的天堂在线观看 | 亚洲性人人天天夜夜摸 | 中文字幕一二三区乱码老 | 欧洲人体超大胆露私视频 | 亚洲va久久久噜噜噜久久男同 | 色播视频网站 | 四虎精品免费国产成人 | 在线观看一区二区三区视频 | 一区二区高清在线 | 免费网站成人亚洲 | 欧美福利视频网站 | 欧美综合色 | 国产农村妇女毛片精品久久久 | 玖玖激情 | 日本三级香港三级人妇网站 | 97午夜理伦片在线影院 | 六月婷婷导航福利在线 | 四虎永久免费影院在线 | 久久人人视频 | 四虎影视大全免费入口 | 老色批在线播放视频网站免费 | 天天影视欧美综合在线观看 | 日本一二线不卡在线观看 | 国产女同在线观看 | 色欲麻豆国产福利精品 | 在线网站黄| 日本特黄色大片 | 久久久久久久免费 | 国产色视频一区 | 亚洲热热久久九九精品 | 美女被草视频 | 亚洲电影免费 | 男人边吃奶边爱边做视频日韩 | 午夜手机福利视频 | 亚洲一区二区在线 | 狠狠干狠狠干狠狠干 | 天天插天天插天天插 | 黄色毛片儿|