在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

與ChatGPT性能最相匹配的開源模型

前言

最近由UC Berkeley、CMU、Stanford, 和 UC San Diego的研究人員創建的 Vicuna-13B，通過在 ShareGPT 收集的用戶共享對話數據中微調 LLaMA獲得。其中使用 GPT-4 進行評估，發現Vicuna-13B 的性能達到了ChatGPT 和 Bard 的 90% 以上，同時在 90% 情況下都優于 LLaMA 和 Alpaca 等其他模型。訓練 Vicuna-13B 的費用約為 300 美元。訓練和代碼[1]以及在線演示[2]已公開。

Vicuna到底怎么樣？

Vicuna在官網中通過和Alpaca、LLaMA、ChatGPT和Bard對比，然后通過GPT4當裁判來打出分數，具體如下。

問題

Alpaca-13b vs Vicuna

LLaMA-13b vs Vicuna

ChatGPT vs Vicuna

Bard vs Vicuna

可以看出，Vicuna的回答還是非常棒的，讓GPT4來打分，Vicuna和ChatGPT是十分接近的，遠遠高于Alpaca和LLaMA。

如果大家想試試別的問題，可以自己去嘗試[3]哈。

可換不同類型的不同問題

然而，官方認為評估聊天機器人絕非易事，聽過GPT4進行評估是一件十分不嚴格的事情，但是目前還是無法解決評估的問題，需要后續學者進行進一步探索。

圖1 GPT-4 評估

在線demo

概述

圖2 工作流

圖 2 介紹了整體工作流程。訓練是在一天時間在 8 個 A100 上使用 PyTorch FSDP 完成的。 LLaMA、Alpaca、ChatGPT 和 Vicuna 的詳細比較如表 1 所示。

表1 一些模型的對比

訓練

Vicuna 是通過使用從 ShareGPT.com 使用公共 API 收集的大約 7萬用戶共享對話微調 LLaMA 基礎模型創建的。為了確保數據質量，將 HTML 轉換回 markdown 并過濾掉一些不合適或低質量的樣本。此外，將冗長的對話分成更小的部分，以適應模型的最大上下文長度。

訓練方法建立在斯坦福alpaca的基礎上，并進行了以下改進。

內存優化：為了使 Vicuna 能夠理解長上下文，將最大上下文長度從alpaca 中的 512 擴展到 2048。還通過gradient checkpointing和flash attentio來解決內存壓力。

多輪對話：調整訓練損失考慮多輪對話，并僅根據聊天機器人的輸出進行微調。

通過 Spot 實例降低成本：使用 SkyPilot 托管點來降低成本。該解決方案將 7B 模型的訓練成本從 500 美元削減至 140 美元左右，將 13B 模型的訓練成本從 1000 美元左右削減至 300 美元。

圖3 通過GPT4來評估打分

通過GPT4評估得出的總分

審核編輯：劉清

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

機器人

機器人

+關注

關注
213

文章
29533

瀏覽量
211742
CMU

CMU

+關注

關注
0

文章
21

瀏覽量
15414
GPT

GPT

+關注

關注
0

文章
368

瀏覽量
15961
ChatGPT

ChatGPT

+關注

關注
29

文章
1588

瀏覽量
8826

原文標題：Vicuna：與ChatGPT 性能最相匹配的開源模型

文章出處：【微信號：zenRRan，微信公眾號：深度學習自然語言處理】歡迎添加關注！文章轉載請注明出處。

深度學習自然語言處理
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 一個給NLP領域帶來革新的預訓練語言大模型Bert
Hot 推薦一些翻譯英文文獻比較準確的軟件

New 高效大模型的推理綜述
New 什么是RAG，RAG學習和實踐經驗

精選推薦
更多

文章

資料

帖子

MPS MPM3695GPJ-20電源模塊產品特性

MPS芯源系統
5小時前

223 閱讀

傳統路線與其利天下的分水嶺，無刷電鉆驅動方案對比--【其利天下】

其利天下技術
21小時前

321 閱讀

智多晶PLL使用注意事項

智多晶
22小時前

248 閱讀

【飛凌嵌入式】基于i.MX9352開發板M核的FreeRTOS設計例程

飛凌嵌入式
22小時前

324 閱讀

HZ-T536-SP_EVM：藏在Labubu百萬身價背后的“中國芯”

合眾恒躍
22小時前

477 閱讀

基于Multisim8．0高頻單調諧放大電路仿真分析

安立路
231

10積分

132下載

關于MSP430G2系列Launchpad的作品開發實例教程編寫和制作說明

0.06 MB

免費

40下載

壓力傳感器工作原理免費下載

o_dream
0.28 MB

免費

61下載

marketpulse網絡應用

李偉
4.03 MB

2積分

2下載

BOSH Cloud Foundry大規模部署工具

樂騫添
22.84 MB

2積分

1下載

【RA4L1-SENSOR】01 ADC單次掃描采集外部電壓輸入+串口輸出

jf_83922529
14小時前

107 閱讀

【RA4L1-SENSOR】電子相冊

gtbestom
14小時前

109 閱讀

【正點原子STM32MP257開發板試用】介紹、上電測試、系統連接

jf_07365693
1天前

230 閱讀

無線應用射頻微波電路設計

yuu_cool
1天前

250 閱讀

HarmonyOS NEXT應用開發-Notification Kit（用戶通知服務）概述與notificationManager.publish

李洋水蛟龍
1天前

253 閱讀

推薦專欄
更多

企業產品

資料

方案
更多

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

與ChatGPT性能最相匹配的開源模型

評論