經常會收到一些比較簡要的技術咨詢,描述了是什么任務,發現用BERT粗暴精調效果不好之后,問我有什么辦法可以提升。
在面對第一把梭就失敗時,我通常是這么判斷的:
- 如果效果差的很離譜,比如二分類準確率在60%以下,那大概率是模型有問題,開始用小數據集debug
- 如果有點效果,但一言難盡,那估計是數據有問題,要不然噪聲多,要不然是真的難,可以自己看一下訓練集,如果人看完后在幾秒內都不能給出答案,就別太指望模型可以做好
在第一把效果還行的情況下,推薦嘗試以下策略:
- In-Domain Further Pre-train:利用同領域下的無監督數據繼續MLM預訓練,這個方法我真的百試不厭,一般用一兩百萬的數據就能提升1-2個點
- Within-Task Further Pre-Training:利用不同領域的同任務數據預先精調,選通用一些的一般也有提升
- Multi-Task Fine-Tuning:利用不同任務預先精調
- Layer-wise Decreasing Layer Rate:每層學到的知識都是不同的,前面幾層會更通用,所以學的時候可以用小一點的學習率,防止災難性遺忘
- Features from Different layers:把不同層的輸出集成起來,不過這個方法不一定有提升
- 長文本處理:截斷或使用層次化編碼
以上這些方法,都出自復旦邱錫鵬老師的《How to fine-tune BERT for text classification?》,該文進行了各種詳細的實驗,得出了不少有用的結論,推薦大家去學習。即使有的方法在論文數據集中表現一般,在自己的數據上也可以嘗試。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
數據集
+關注
關注
4文章
1209瀏覽量
24839 -
DEBUG
+關注
關注
3文章
94瀏覽量
19982 -
nlp
+關注
關注
1文章
489瀏覽量
22112
發布評論請先 登錄
相關推薦
保持電容性負載穩定的六種方法
本帖最后由 gk320830 于 2015-3-8 23:36 編輯
保持電容性負載穩定的六種方法本系列的第10部分是我們所熟悉的《電氣工程》雜志(Electrical Engineering
發表于 09-25 09:31
linux下查看網卡流量的六種方法
本文介紹了linux下查看網卡流量的六種方法,linux系統中使用nload、iftop、iostat等工具查看網卡流量,需要的朋友參考下。
發表于 07-25 06:29
六種常見的伺服電機故障以及相對應的電機維修方法
論是哪種伺服電機,使用時間久了,都會產生一些小問題,那今天就給大家帶來的是六種常見的電機故障表現。當伺服電機出現小問題,不僅要及時檢測出來,而且要找到產生這些故障的原因,伺服電機電機維修師才能對癥下藥,才可以修理好伺服電機。以下是六種常見的伺服電機故障以及相對應的電機維修
發表于 02-01 06:29
個人制作電路板的六種方法及操作步驟
本文主要介紹了個人制作電路板的六種方法及詳細操作步驟。根據電路原理圖中所用的元件形狀和印刷板面積的大小合理安排元件的密度和各元件的位置。確定元件位置應按照先大后小、先整體后局部的原則進行,使電路中相鄰元件就近放置,排列整齊均勻。
發表于 04-25 16:15
?7.2w次閱讀
PCB溶液濃度的六種計算方法
在PCB生產過程中,很多工序要用到各種溶液,往往這些溶液對PCB板的產品質量起到決定性的作用。精確的計算好各種溶液的濃度才能確保各種溶液在工藝中起到它應有的作用。下面介紹六種計算方法。
手機NFC的六種實用用法
每當新機發布時,相信不少小伙伴除了會關注手機的性能、拍照、續航、價格之外,而且還會關注手機是否還帶NFC功能。隨著科技發展,現在手機里的NFC功能已經多達六種了,接下來筆者就來告訴大家NFC究竟那六種實用的用法。
導致開關電源嘯叫的六種情況及解決方法
導致開關電源嘯叫的六種情況及解決方法(深圳市中遠通電源技術開發有限公司怎么樣)-導致開關電源嘯叫的六種情況及解決方法
發表于 09-24 17:14
?58次下載
![導致開關電源嘯叫的<b class='flag-5'>六種</b>情況及解決<b class='flag-5'>方法</b>](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
測電阻的六種方法 電阻測試方法 電阻好壞測量方法
測電阻的六種方法 電阻測試方法 電阻好壞測量方法 電阻是一種常見的電子元件,它的作用是限制電流的流動,從而保護電路以及電子元器件。在實際中,電阻由于長時間的使用或是外力的損壞,很容易失
抑制電磁干擾的六種常用方法
抑制電磁干擾的六種常用方法 電磁干擾(EMI)是現代電子設備中最常見的問題之一。隨著無線技術和電子設備的不斷發展,電磁干擾問題變得越來越普遍和嚴重。電磁干擾會影響到電子設備的性能,甚至可能導致設備
評論