在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習中低精度計算產生高準確度結果的解決方案

zhKF_jqr_AI ? 2018-03-29 16:16 ? 次閱讀

有人認為,用低精度訓練機器學習模型會限制訓練的精度,事實真的如此嗎?本文中,斯坦福大學的DAWN人工智能研究院介紹了一種名為bit recentering的技術,它可以用低精度的計算實現高準確度的解決方案。以下是論智對原文的編譯,文末附原論文地址。

低精度計算在機器學習中已經吸引了大量關注。一些公司甚至已經開始研發能夠原生支持并加速低精度操作的硬件了,比如微軟的腦波計劃(Project Brainwave)和谷歌的TPU。雖然使用低精度計算對系統來說有很多好處,但是低精度方法仍然主要用于推理,而非訓練。此前,低精度訓練算法面臨著一個基本困境(fundamental tradeoff):當使用較少的位進行計算時,舍棄誤差就會增加,這就限制了訓練的準確度。根據傳統觀點,這種制約限制了研究人員在系統中部署低精度訓練算法的能力,但是這種限制能否改變?是否有可能設計一種使用低精度卻不會限制準確度的算法呢?

答案是肯定的。在某些情況下我們可以從低精度訓練中獲得高準確度的解決方案,在這里我們使用了一種新的隨機梯度下降方法,稱為高準確度低精度(HALP)法。HALP比之前的算法表現更好,因為它減少了兩個限制低精度隨機梯度下降準確度的噪聲源:梯度方差和舍棄誤差。

為了減少梯度方差帶來的噪音,HALP使用常見的SVRG(stochastic variance-reduced gradient)技術。SVRG能定期使用完全梯度來減少隨機梯度下降中使用的梯度樣本的方差。

為了降低量化數字帶來的噪聲,HALP使用了名為“bit centering”的新技術,它背后的原理是,當我們接近最優點時,梯度漸變的幅度變小。也就是說攜帶的信息變少,于是我們能對其進行壓縮。通過動態地重新調整低精度數字,我們可以在算法收斂時降低量化噪聲。

將這兩種技術結合,HALP能夠以和全精度SVRG同樣的線性收斂率生成任意準確地解決方案,同時在低精度迭代時使用的是固定位數。這個結果顛覆了有關低精度訓練算法的傳統觀點。

為什么低精度的隨機梯度下降有所限制?

首先先交代一下背景:我們想要解決以下這個訓練問題:

這是用來訓練許多機器學習模型(包括深度神經網絡)的經典實證問題:讓風險最小化。解決這個問題的標準方法之一是隨機梯度下降,它是一種通過運行接近最佳值的迭代算法。

在每次迭代時,it是從{1,..., N}中隨機挑選的一個指數,我們雖然想運行這樣的算法,但是要保證迭代wt是低精度的。也就是說,我們希望它們使用較少位的定點運算(通常為8位或16位)。但是,當直接對隨機梯度下降更新規則而進行這項操作時,我們遇到了問題:問題的解決方案w可能無法再選中的定點表示中顯示出來。例如,如果一個8位的定點表示,可以儲存{-128,-127,…,127}之間的整數,正確的解決方法是w*=100.5,那么我們與解決方案的距離不可能小于0.5,因為我們不能表示非整數。除此之外,將梯度轉換為定點導致的舍棄誤差可能會減慢收斂速度,這也影響了低精度SGD的準確性。

Bit Centering

當我們運行隨機梯度下降時,在某種意義上,我們世紀正對一堆梯度樣本進行平均(或總結)。Bit Centering背后的關鍵思想是隨著梯度漸變逐漸變小,我們可以用同樣的位數、以較小的誤差對它們求平均值。想要知道為什么,想像一下,你想對[-100, 100]之間的數字求平均值,然后和[-1, 1]的平均值作比較。在前一個集合中,我們需要選擇一個定點表示,它可以覆蓋整個集合(例如{-128,-127,…,127})。而在第二個集合中,我們選擇的定點要覆蓋[-1, 1],例如{-128/127,-127/127,..., 126/127,127/127}。這就意味著在固定位數情況下,第二種情況中的相鄰可表示數字之間的差值比第一種情況更小,因此舍棄誤差也更低。

這個關鍵的想法讓我們得到了啟發。為了在[-1, 1]中求出比[-100, 100]中更少誤差的平均數,我們需要用一個不同的定點表示,即我們應該不斷更新低精度表示:隨著梯度漸變得越小,我們應該用位數更小的定點數字,覆蓋更小的范圍。

但是我們該如何更新表示呢?我們要覆蓋的范圍到底多大?如果目標是帶有參數μ的強凸,那么不管我們何時在某一點w采取完整的梯度漸變是,都可以用以下公式限制最佳位置

這種不等式為最終的解決方案提供了一系列可能的定位,所以無論何時計算完整梯度,我們都可以重新居中并縮放低精度表示以覆蓋此范圍。下圖說明了這一過程。

低精度計算產生高準確度結果的解決方案

HALP

HALP是運行SVRG并在每個時期都使用具有完全梯度的bit centering更新低精度表示的算法。原論文有對這一方法的具體描述,在這里我們只簡單做些介紹。首先,我們證明了,對于強凸的Lipschitz光滑函數,只要我們使用的位數b滿足

其中κ是該問題的條件數字,那么為了適當設置尺寸和時間長度,HALP將以線性速度收斂到任意準確度的解。更顯然的是,0<γ<1,

其中wk+1表示第K次迭代后的值。下表表現了這一變化過程

低精度計算產生高準確度結果的解決方案

圖表通過對具有100個特征和1000個樣本的合成數據集進行線性回歸,來評估HALP。將它與全精度梯度下降、SVRG、低精度的梯度下降和低精度的SVRG進行比較。需要注意的是,盡管只有8位(受到浮點錯誤的限制),HALP仍能收斂到精度非常高的結果上。在這種情況下,HALP可以比全精度SVRG收斂到更高精度的結果中,因為HALP較少使用浮點運算,因此對浮點的非準確性不敏感。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8497

    瀏覽量

    134240

原文標題:斯坦福DAWN實驗室實現用低精度計算產生高準確度結果

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    電工儀表準確度等級詳解

    一、準確度等級的定義 以下是“JJF1001-2011通用計量術語”對準確度準確度等級的相關定義: 1、測量準確度 measurement accuracy,sccuracy
    的頭像 發表于 05-19 10:20 ?302次閱讀
    電工儀表<b class='flag-5'>準確度</b>等級詳解

    直線測量儀的精度如何評估?

    進行測試,通過測量結果與標準值的對比,評估測量儀的精度。這種方法直接且有效,但需要高精度的標準件作為參考。 2.與其他高精度儀器對比:將直線
    發表于 04-21 16:26

    校準后,記憶示波器顯示頻率和幅度是否準確

    和幅度是否漂移。 四、校準后仍不準確的可能原因及解決方案 [td]問題可能原因解決方案 頻率測量誤差校準源頻率不穩定或示波器時基誤差。更換高精度校準源,重新校準時基。 幅度測量誤差探頭
    發表于 04-16 14:56

    旋轉式測徑儀的測量精度和分辨率受哪些因素影響?

    ,其精度同樣對測量精度和分辨率產生影響。高精度的轉換器能夠減少信號轉換過程中的誤差,確保測量結果準確
    發表于 04-15 14:20

    利用隔離式精密信號鏈保持數據采集的準確度

    數字時代改變了解決問題的范式,將智能引入邊緣可以應對全新的復雜挑戰。數據采集(DAQ)系統成為了邊緣智能的核心。在數據采集領域,準確度和可靠性至關重要。為確保達到準確度和完整性,隔離式精密信號鏈的重要性不容忽視。
    的頭像 發表于 03-17 14:43 ?636次閱讀

    直線測量儀如何測量鈦合金鋼管的全長直線

    注意測量環境、測量精度、操作規范以及數據處理等方面的問題,以確保測量結果準確性和可靠性。 網站名稱:保定市藍鵬測控科技有限公司 可根據客戶需求提供解決方案,定制產品。 可以給我在線留
    發表于 03-10 14:52

    淺談晶振的頻率準確度和頻率穩定

    在選購或者使用晶振時,我們經常會聽到頻率準確度和頻率穩定這兩個概念。雖然兩者都與晶振的頻率變化相關,但它們的關注重點不同。
    的頭像 發表于 02-25 18:07 ?847次閱讀
    淺談晶振的頻率<b class='flag-5'>準確度</b>和頻率穩定<b class='flag-5'>度</b>

    準確度信號鏈解決方案快速實現七位半DMM

    在對準確度有很高要求的行業里,七位半或更高分辨率的數字萬用表(DMM)會被使用,這些DMM采用由分立元器件搭建的多斜率積分ADC。這些ADC雖然可以提供合理準確度的測量結果,但對于大多數工程師來說
    的頭像 發表于 12-03 10:55 ?1008次閱讀

    如何實現七位半或更高準確度的DMM

    許多儀器儀表應用要求準確度,例如數字萬用表(DMM)、三相標準表、現場儀表校準器、準確度DAQ系統、電子秤/實驗室天平、地震物探儀以及自動測試設備(ATE)中的源表(SMU)/功率
    的頭像 發表于 11-28 11:50 ?910次閱讀
    如何實現七位半或更高<b class='flag-5'>準確度</b>的DMM

    AFE4404可否用于運動時心率檢測?準確度如何?

    AFE4404可否用于運動時心率檢測?準確度如何?
    發表于 11-19 08:26

    數字壓力表的準確度如何?是否適用于精密測量?

    在工業和科研領域,壓力的測量工作至關重要,而數字壓力表因其直觀的數字顯示和高精度的特性,成為了這些領域不可或缺的測量工具。那么,數字壓力表的準確度到底如何,它是否能滿足精細測量的需求呢?
    的頭像 發表于 11-07 13:58 ?636次閱讀
    數字壓力表的<b class='flag-5'>準確度</b>如何?是否適用于精密測量?

    光電軸角編碼器 準確度等級5級是多少

    光電軸角編碼器的準確度等級是衡量其測量精度的一個重要指標。對于準確度等級為5級的光電軸角編碼器,其相關的計量特性通常包括分度誤差、測角重復性和零位誤差等。 一、分度誤差 分度誤差是編碼器每兩個相鄰
    的頭像 發表于 10-12 09:50 ?815次閱讀

    深度剖析在線長度測量儀:機器視覺引領高精度測量新時代

    系統具備強大的計算能力,可以對原始數據進行預處理、計算和分析,并將計算結果以圖形、表格或數值等形式輸出給用戶。 二、主要特點 高精度:在線長度測量儀通常采用高
    發表于 10-10 16:51

    噪聲測量儀器精度應達到幾級以上

    精度依次降低。 0型聲級計的準確度是±0.4分貝,是實驗室標準聲級計。 1型聲級計的準確度是±0.7分貝,一般在實驗室或聲學條件可以嚴格控制的現場使用。 2型聲級計的準確度是±1分貝,
    的頭像 發表于 10-09 15:09 ?1568次閱讀

    影響電源紋波測試準確性的因素

    出相應的解決方案。 測試設備的選擇 測試設備的選擇是影響電源紋波測試準確性的首要因素。測試設備的性能、精度、穩定性等都會對測試結果產生影響。
    的頭像 發表于 08-02 09:42 ?1103次閱讀
    主站蜘蛛池模板: 日本黄色片在线播放 | 一级欧美一级日韩 | 欧美ol丝袜高跟秘书在线播放 | 国产三级精品在线 | 日本成人小视频 | 九九福利 | 国产午夜毛片v一区二区三区 | 你懂的网址在线观看 | 中文字幕网资源站永久资源 | 狠狠干狠狠操视频 | 台湾黄色毛片 | 国产精品成人aaaaa网站 | sihu影院永久在线影院 | 嘿嘿午夜 | 亚洲三级在线免费观看 | 国产精品虐乳在线播放 | 久久婷婷五综合一区二区 | 精品国产高清在线看国产 | 免费国产成人午夜私人影视 | 四虎影视入口 | 天堂在线最新版资源www | 欧美xxxxx精品| 免费观看黄a一级视频 | 最近高清免费观看视频 | 色yeye在线观看 | 色婷婷综合在线视频最新 | 高清不卡一区二区三区 | 狠狠色成人综合首页 | 国产亚洲欧美日本一二三本道 | 高清成年美女黄网站色大 | 夜夜想夜夜爽天天爱天天摸 | 午夜无码国产理论在线 | 男人j进女人j免费视频视频 | 色丁香在线观看 | 亚洲日本欧美日韩高观看 | 激情婷婷综合久久久久 | 天堂资源在线www中文 | 天天色综合久久 | 五月婷婷丁香久久 | 亚洲免费成人网 | 一级a毛片免费 |