怎样写网络小说,欢乐颂第一季免费阅读,好看的历史书籍推荐

SambaNova 與 Together 兩家公司合作開源了可商用的 BLOOMChat，一個 1760 億參數的多語言聊天大語言模型 (LLM)。由 BLOOM (176B) 在助理式的對話數據集上進行指導調整，并支持多種語言的對話、問題回答和生成性答案。

根據介紹，BLOOMChat 是一個新的、開放的、多語言的聊天 LLM。SambaNova 和 Together 使用 SambaNova 獨特的可重構數據流架構在 SambaNova DataScale 系統上訓練了 BLOOMChat；其建立在 BigScience 組織的 BLOOM 之上，并在 OpenChatKit、Dolly 2.0 和 OASST1 的 OIG 上進行了微調。目前，BLOOM 已經是最大的多語言開放模型，在 46 種語言上進行了訓練。

在針對英語、中文、法語、阿拉伯語、西班牙語、印度語這 6 種語言的評測中，GPT-4 的勝率為 54.75%，BLOOMChat 的勝率為 45.25%，稍弱于 GPT-4。但與其它 4 種主流的開源聊天 LLM 相比，BLOOMChat 在 65.92% 的時間內表現更優。且在使用 BLOOMChat 進行跨語言 NLP 任務的初步研究中，BLOOMChat 在 WMT 翻譯基準中的表現要優于其他 BLOOM 變體和主流開源聊天模型。

“我們確實想指出，與我們比較的這些模型中，有些并不適合多語言環境。但由于開源社區中沒有替代品，所以才有了現在的比較。我們的研究結果表明，使用正確的技術，可以在開源 LLM 之上構建以實現強大的多語言聊天功能。我們希望我們的研究結果和 BLOOMChat checkpoint 的發布能夠為開源社區的持續討論做出貢獻，并激發 LLM 領域的進一步發展。”

項目團隊使用定性和定量措施來評估了 BLOOMChat 的多語言聊天能力以及跨語言任務能力。共做了 3 種不同場景的實驗測評，評測了英語、中文、阿拉伯語、法語、西班牙語和印度語。

實驗一：人類偏好排序

旨在將 BLOOMChat 模型在多種語言中的聊天能力與現有的開源模型以及選定的封閉源模型進行比較。使用了 “OpenAssistant Conversations”附錄 E 中的 22 個英文問題作為基準。首先讓一些人類志愿者將這 22 個英文問題手動翻譯成他們各自的母語；然后讓另一組不同的志愿者，在匿名的前提下評價每個模型所給出的回答。

將 BLOOMChat 與 OpenAssistant-30B、LLaMA-Adapter-V2-65B 和 BLOOMZ (176B) 三種開源模型進行了比較：