在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

<code id="mwoac"></code><bdo id="mwoac"><source id="mwoac"></source></bdo>

<abbr id="mwoac"></abbr>

<rt id="mwoac"><delect id="mwoac"></delect></rt>

<tfoot id="mwoac"><delect id="mwoac"></delect></tfoot>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

會員中心

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

中文對話式大語言模型Firefly-2b6開源，使用210萬訓練數據

在文章Firefly(流螢): 中文對話式大語言模型中，我們介紹了關于Firefly(流螢)項目的工作，并且分享了我們訓練的firefly-1b4模型。這是Firefly項目開源的第一個模型，雖然取得了還不錯的效果，但無論是訓練數據還是模型參數量，都還有很大的優化空間。

所以，在firefly-1b4實驗的基礎上，我們對訓練數據進行清洗，并且增加了數據量，得到210萬數據，并用它訓練得到了firefly-2b6模型。

在本文中，我們將對該模型進行分享和介紹。與firefly-1b4相比，firefly-2b6的代碼生成能力取得了較大的進步，并且在古詩詞生成、對聯、作文、開放域生成等方面也有不錯的提升。

firefly-1b4和firefly-2b6的訓練配置如下表所示。無論是訓練數據量，還是訓練步數，firefly-2b6都更加充分。

參數	firefly-1b4	firefly-2b6
batch size	16	8
learning rate	3e-5	3e-5
warmup step	3000	3000
lr schedule	cosine	cosine
max length	512	512
training step	90k	260k
訓練集規模	160萬	210萬

項目地址：

https://github.com/yangjianxin1/Firefly

模型權重鏈接見文末。

模型使用

使用如下代碼即可使用模型：

from transformers import BloomTokenizerFast, BloomForCausalLM
device = 'cuda'
path = 'YeungNLP/firefly-2b6'


tokenizer = BloomTokenizerFast.from_pretrained(path)
model = BloomForCausalLM.from_pretrained(path)
model.eval()
model = model.to(device)
text = input('User：')
while True:
    text = '{}'.format(text)
    input_ids = tokenizer(text, return_tensors="pt").input_ids
    input_ids = input_ids.to(device)
outputs=model.generate(input_ids,max_new_tokens=250,do_sample=True,top_p=0.7,temperature=0.35,
                             repetition_penalty=1.2, eos_token_id=tokenizer.eos_token_id)
    rets = tokenizer.batch_decode(outputs)
    output = rets[0].strip().replace(text, "").replace('', "")
    print("Firefly：{}".format(output))
    text = input('User：')

代碼生成

盡管在訓練集中，代碼的數據量不多，但令人驚喜的是，firefly-2b6已經具備一定的代碼生成能力。

在筆者的實測中，對于一些編程題，firefly-2b6生成的代碼可以做到無需修改，直接運行成功，并且得到正確的答案。下面將展示一些編程題的生成例子。

示例1：幫我用python寫一個冒泡排序算法。

示例2：用python實現一個快速排序算法，輸入為一個數組，返回排序好之后的數組。

示例3：用python寫一個二分查找算法。

示例4：寫一個函數，計算數組中偶數的個數，輸入為數組，輸出為偶數的個數。

示例5：用html生成一個教務管理系統的登錄界面，要求包含用戶名、密碼輸入框和登錄按鈕。

該html代碼在瀏覽器中的效果如下圖：

其他樣例

同樣，我們也對文言文、古詩詞、文章生成等數據進行了清洗，提高數據的質量。實測下來，我們發現firefly-2b6的生成效果，確實提升了不少。

數據質量的優化，對文言文翻譯任務的提升，尤為明顯。在訓練firefly-1b4時，文言文數據為較短的句子對。但在訓練firefly-2b6時，我們使用了較長篇幅的文本對。

下面為一些實測的例子。

文章小結

雖然firefly-2b6已經初步具備代碼生成能力，但由于訓練集中的代碼數據的數量不多，對于一些編程題，效果不如人意。我們覺得仍有非常大的優化空間，后續我們也將收集更多代碼數據，提升模型的代碼能力。

經過firefly-1b4和firefly-2b6兩個模型的迭代，能明顯感受到增加數據量、提升數據質量、增大模型參數量，對模型的提升非常大。

在前文中，我們提到，firefly-1b4在訓練數據量、訓練步數上都略有不足。為了探索"小"模型的效果上限，我們也將使用更多數量、更高質量的數據對firefly-1b4進行迭代。該項工作正在進行。

后續，我們也將在多輪對話、增大模型參數量、模型量化等方向上進行迭代，我們也將陸續開源訓練代碼以及更多的訓練數據。期待大家的意見和建議。

審核編輯：李倩

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

模型

模型

+關注

關注
1

文章
3516

瀏覽量
50363
代碼

代碼

+關注

關注
30

文章
4899

瀏覽量
70651
語言模型

語言模型

+關注

關注
0

文章
561

瀏覽量
10780

原文標題：中文對話式大語言模型Firefly-2b6開源，使用210萬訓練數據

文章出處：【微信號：zenRRan，微信公眾號：深度學習自然語言處理】歡迎添加關注！文章轉載請注明出處。

評論

深度學習自然語言處理
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 一個給NLP領域帶來革新的預訓練語言大模型Bert
Hot 推薦一些翻譯英文文獻比較準確的軟件

New 高效大模型的推理綜述
New 什么是RAG，RAG學習和實踐經驗

精選推薦
更多

文章

資料

帖子

恩智浦FS24功能安全SBC芯片詳解為區域控制器節點設計提供便利

NXP客棧
1天前

1221 閱讀

IGBT的電流是如何定義的

英飛凌工業半導體
2天前

1085 閱讀

半導體激光器的三種驅動模式

中科院半導體所
2天前

645 閱讀

權威認證！RT-Thread操作系統100%國產自主可控，鑄就睿擎工業平臺安全基石? !

RT-Thread官方賬號
2天前

826 閱讀

基于ADI MAX12900和MAX32675C的4-20mA傳感器設計

analog_devices
2天前

756 閱讀

基于單片機的智能臺燈系統設計（人體感應）

o_dream
0.08 MB

免費

68下載

嵌入式Linux開發環境搭建（一）

張生
404.06KB

2積分

10下載

docker-alpine Alpine Linux的Docker鏡像

余溫重顧
0.08 MB

免費

0下載

mp-blog基于Node.js的博客系統

斗地主之神
0.70 MB

2積分

1下載

Kompute通用GPU計算框架

母豬會上樹
13.03 MB

2積分

1下載

【嘉楠堪智K230開發板試用體驗】網絡收發信息

jf_16874806
20小時前

84 閱讀

基于米爾安路飛龍派FPGA FPSoC+移植SOEM實現EtherCAT主站控制功能

EPTmachine
2天前

62 閱讀

HarmonyOS AI輔助編程工具（CodeGenie）報錯分析

李洋水蛟龍
2天前

389 閱讀

【社區活動】電子發燒友七月份活動匯總

dianzi_0101
2天前

1130 閱讀

方波轉三角波輸出為一條直線

jf_59522181
2天前

1462 閱讀

推薦專欄
更多

企業產品

資料

方案
更多

華秋（原“華強聚豐”）：

電子發燒友

華秋開發

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

產品地圖

品牌地圖

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態

加入我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

硬聲APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

黃晶晶：huangjingjing@elecfans.com

內容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務 PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區合作

劉勇：liuyong@huaqiu.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業動態

聯系我們

企業文化

企業宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司

長沙市望城經濟技術開發區航空路6號手機智能終端產業園2號廠房3層（0731-88081133）
電子發燒友 （電路圖） 湘公網安備43011202000918 工商網監湘ICP備2023018690號-1

感谢您访问我们的网站，您可能还对以下资源感兴趣：
在线观看www成人影院|在线观看www日本免费网站|在线观看www视频|在线观看操|欧美18在线|欧美1级

主站蜘蛛池模板：日韩色网站 | 色干干| 免费视频 | 亚洲天堂爱爱 | 免费观看黄a一级视频日本免费观看黄色网页 | 国产高清视频免费最新在线 | 嫩草影院www | 日韩毛片视频 | 欧美伊久线香蕉线新在线 | 站长工具天天爽视频 | 久久精彩免费视频 | 中文在线最新版天堂 | 国产亚洲人成网站观看 | 美女视频黄又黄又免费高清 | 一级毛片在播放免费 | 色网址在线观看 | 亚洲国产丝袜精品一区杨幂 | 操人视频网站 | 国产亚洲高清在线精品不卡 | 午夜影院在线观看 | 网友自拍区一区二区三区 | 亚洲一区二区三区中文字幕5566 | 色就是色欧美色图 | 日本xxxx色视频在线观看免费 | a在线免费| 国内自拍欧美 | 国产日日干 | 五月婷激情 | 国产高清小视频 | 亚洲国产精品丝袜在线观看 | 日本黄色大片免费 | 一级片免费在线 | 插插好爽爽爽 | 九月婷婷亚洲综合在线 | 天天插天天插天天插 | 亚洲一级毛片免费观看 | 婷婷综合在线观看丁香 | 1024手机最新手机在线 | 亚洲男人的天堂在线观看 | 男人视频在线观看 | 成年视频xxxxx免费播放软件 |