在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

算法工程師煉丹Trick手冊(cè)

深度學(xué)習(xí)自然語言處理 ? 來源:煉丹筆記 ? 作者:煉丹筆記 ? 2021-03-05 16:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Focal Loss

865d8416-7c22-11eb-8b86-12bb97331649.jpg

針對(duì)類別不平衡問題,用預(yù)測(cè)概率對(duì)不同類別的loss進(jìn)行加權(quán)。Focal loss對(duì)CE loss增加了一個(gè)調(diào)制系數(shù)來降低容易樣本的權(quán)重值,使得訓(xùn)練過程更加關(guān)注困難樣本。

loss = -np.log(p) loss = (1-p)^G * loss

Dropout

867d255a-7c22-11eb-8b86-12bb97331649.jpg

隨機(jī)丟棄,抑制過擬合,提高模型魯棒性。

Normalization

Batch Normalization 于2015年由 Google 提出,開 Normalization 之先河。其規(guī)范化針對(duì)單個(gè)神經(jīng)元進(jìn)行,利用網(wǎng)絡(luò)訓(xùn)練時(shí)一個(gè) mini-batch 的數(shù)據(jù)來計(jì)算該神經(jīng)元的均值和方差,因而稱為 Batch Normalization。

x = (x - x.mean()) / x.std()

relu

86c0f4a6-7c22-11eb-8b86-12bb97331649.png

用極簡的方式實(shí)現(xiàn)非線性激活,緩解梯度消失。

x=max(x,0)

Cyclic LR

每隔一段時(shí)間重啟學(xué)習(xí)率,這樣在單位時(shí)間內(nèi)能收斂到多個(gè)局部最小值,可以得到很多個(gè)模型做集成。

scheduler=lambdax:((LR_INIT-LR_MIN)/2)*(np.cos(PI*(np.mod(x-1,CYCLE)/(CYCLE)))+1)+LR_MIN

With Flooding

當(dāng)training loss大于一個(gè)閾值時(shí),進(jìn)行正常的梯度下降;當(dāng)training loss低于閾值時(shí),會(huì)反過來進(jìn)行梯度上升,讓training loss保持在一個(gè)閾值附近,讓模型持續(xù)進(jìn)行“random walk”,并期望模型能被優(yōu)化到一個(gè)平坦的損失區(qū)域,這樣發(fā)現(xiàn)test loss進(jìn)行了double decent。

flood=(loss-b).abs()+b

Group Normalization

Face book AI research(FAIR)吳育昕-愷明聯(lián)合推出重磅新作Group Normalization(GN),提出使用Group Normalization 替代深度學(xué)習(xí)里程碑式的工作Batch normalization。一句話概括,Group Normbalization(GN)是一種新的深度學(xué)習(xí)歸一化方式,可以替代BN。

def GroupNorm(x, gamma, beta, G, eps=1e-5): # x: input features with shape [N,C,H,W] # gamma, beta: scale and offset, with shape [1,C,1,1] # G: number of groups for GN N, C, H, W = x.shape x = tf.reshape(x, [N, G, C // G, H, W]) mean, var = tf.nn.moments(x, [2, 3, 4], keep dims=True) x = (x - mean) / tf.sqrt(var + eps) x = tf.reshape(x, [N, C, H, W])returnx*gamma+beta

Label Smoothing

877b5576-7c22-11eb-8b86-12bb97331649.png

87b9fe16-7c22-11eb-8b86-12bb97331649.jpg

abel smoothing將hard label轉(zhuǎn)變成soft label,使網(wǎng)絡(luò)優(yōu)化更加平滑。標(biāo)簽平滑是用于深度神經(jīng)網(wǎng)絡(luò)(DNN)的有效正則化工具,該工具通過在均勻分布和hard標(biāo)簽之間應(yīng)用加權(quán)平均值來生成soft標(biāo)簽。它通常用于減少訓(xùn)練DNN的過擬合問題并進(jìn)一步提高分類性能。

targets = (1 - label_smooth) * targets + label_smooth / num_classes

87f50218-7c22-11eb-8b86-12bb97331649.jpg

Wasserstein GAN

8b288f68-7c22-11eb-8b86-12bb97331649.jpg

徹底解決GAN訓(xùn)練不穩(wěn)定的問題,不再需要小心平衡生成器和判別器的訓(xùn)練程度

基本解決了Collapse mode的問題,確保了生成樣本的多樣性

訓(xùn)練過程中終于有一個(gè)像交叉熵、準(zhǔn)確率這樣的數(shù)值來指示訓(xùn)練的進(jìn)程,數(shù)值越小代表GAN訓(xùn)練得越好,代表生成器產(chǎn)生的圖像質(zhì)量越高

不需要精心設(shè)計(jì)的網(wǎng)絡(luò)架構(gòu),最簡單的多層全連接網(wǎng)絡(luò)就可以做到以上3點(diǎn)。

Skip Connection

一種網(wǎng)絡(luò)結(jié)構(gòu),提供恒等映射的能力,保證模型不會(huì)因網(wǎng)絡(luò)變深而退化。

F(x)=F(x)+x

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3511

    瀏覽量

    50271
  • 神經(jīng)元
    +關(guān)注

    關(guān)注

    1

    文章

    368

    瀏覽量

    18807
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5558

    瀏覽量

    122691

原文標(biāo)題:大道至簡:算法工程師煉丹Trick手冊(cè)

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    新編電氣工程師手冊(cè)

    新編電氣工程師手冊(cè),一款最新的、最全面的電氣知識(shí)手冊(cè)。 全手冊(cè)1522頁。共五篇、四十六章。 該手冊(cè)不愧為對(duì)從事電氣專業(yè)的所有人員都實(shí)用的一
    發(fā)表于 06-03 16:26

    (仰天長嘯)為什么受傷的總是硬件工程師...#MDD#MDD辰達(dá)半導(dǎo)體 #電子工程師

    電子工程師
    MDD辰達(dá)半導(dǎo)體
    發(fā)布于 :2025年04月27日 18:21:47

    問,成為硬件工程師需要幾只手?#硬件工程師 #YXC晶振 #揚(yáng)興科技 #搞笑

    硬件工程師
    揚(yáng)興科技
    發(fā)布于 :2025年04月25日 17:15:37

    硬件工程師手冊(cè)(全套)

    §1.2.1 硬件工程師職責(zé) 一個(gè)技術(shù)領(lǐng)先、運(yùn)行可靠的硬件平臺(tái)是公司產(chǎn)品質(zhì)量的基礎(chǔ),硬件工程師職 責(zé)神圣,責(zé)任重大。yf-f4-06-cjy 1、硬件工程師應(yīng)勇于嘗試新的先進(jìn)技術(shù)之應(yīng)用,在產(chǎn)品硬件
    發(fā)表于 04-22 15:05

    工程師手冊(cè):常用電子物料封裝及參數(shù)介紹

    匯總了工程師常見的電子物料的封裝及參數(shù)介紹,雖然是老資料,不過手冊(cè)查看方便 純分享貼,有需要可以直接下載附件獲取資料! (如果內(nèi)容有幫助可以關(guān)注、點(diǎn)贊、評(píng)論支持一下哦~)
    發(fā)表于 03-28 16:48

    硬件工程師:回答我!#回答我 #硬件工程師 #YXC晶振 #揚(yáng)興科技

    硬件工程師
    揚(yáng)興科技
    發(fā)布于 :2025年03月25日 18:46:59

    一招拿捏電子工程師#被AI拿捏了 #電子工程師 #電子電工

    電子工程師
    安泰小課堂
    發(fā)布于 :2025年03月25日 17:30:51

    硬件工程師的終極幻想:焊板子焊上人生巔峰!#半導(dǎo)體器件 #硬件工程師 #MDD辰達(dá)半導(dǎo)體

    硬件工程師
    MDD辰達(dá)半導(dǎo)體
    發(fā)布于 :2025年02月24日 19:00:35

    FPGA算法工程師、邏輯工程師、原型驗(yàn)證工程師有什么區(qū)別?

    ,共同進(jìn)步。 歡迎加入FPGA技術(shù)微信交流群14群! 交流問題(一) Q:FPGA中的FPGA算法工程師、FPGA邏輯工程師、FPGA原型驗(yàn)證工程師三者有什么區(qū)別? A:FPGA
    發(fā)表于 09-23 18:26

    正是拼的年紀(jì)|65歲電子工程師上班VLOG #65歲退休 #電子工程師 #搞笑 #上班vlog

    電子工程師
    安泰小課堂
    發(fā)布于 :2024年07月25日 11:31:02
    主站蜘蛛池模板: 手机看片神马午夜片 | wwxxx日本| 一区二区三区四区在线观看视频 | 午夜精品视频在线看 | 操操操操网 | 五月婷婷亚洲综合 | 男人和女人做a免费视频 | 狠狠操精品视频 | 亚洲成人www| 久久精品99无色码中文字幕 | 亚洲国产精品丝袜在线观看 | 亚洲综合图片人成综合网 | 手机在线观看视频你懂的 | 在线网站黄色 | 好男人社区www的视频免费 | 亚洲一区二区在线播放 | 欧美肉到失禁高h视频在线 欧美三级成人 | 性天堂网 | 特大一级aaaaa毛片 | 激情五月激情综合网 | 日本免费人成在线网站 | 99干99| 欧美一级视频免费 | 国产午夜在线观看视频播放 | 天堂网www天堂在线网 | 国产女人水多白浆 | 乱码中文字幕人成在线 | 亚洲理论视频 | 久久精品人人做人人看 | 国产精品天天看 | 婷婷午夜天 | 男人的天堂久久精品激情 | 国模欢欢大尺度 | 男男np主受高h啪啪肉 | 天天爽夜夜爽夜夜爽 | 久久久久久国产精品免费免费 | 亚洲四虎| 夜夜夜爽 | 91午夜在线观看 | 午夜亚洲福利 | 亚洲精品美女久久久aaa |