Microsoft于本周正式推出并開放源代碼的新一代大規模語言模型WizardLM-2,據稱其性能已超越GPT-4及Mistral。然而,在模型上線后不久,微軟卻在未經通知的情況下撤回了所有項目文檔與代碼,至今尚未恢復上線。
對此,微軟技術人員在X平臺發表聲明,表示因對新模型發布流程不夠了解,且忽略了幻覺測試環節,導致模型被緊急下線。目前,開發團隊正在全力以赴進行測試,預計完成后將盡快重新上線。
盡管模型已暫時下線,但根據微軟官方提供的模型介紹頁面信息,WizardLM-2 8x22B被譽為當前最先進的模型,超越了Claude 3 Opus&Sonnet以及GPT-4等競爭對手,性能優于規模比其大10倍的開源模型。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
微軟
+關注
關注
4文章
6675瀏覽量
105416 -
源代碼
+關注
關注
96文章
2951瀏覽量
67981 -
語言模型
+關注
關注
0文章
560瀏覽量
10696
發布評論請先 登錄
相關推薦
熱點推薦
今日看點丨蘋果進軍腦機接口領域;消息稱華為折疊 PC 內置大面積線性馬達
1. 原微軟WizardLM 項目團隊加入騰訊混元,曝與裁員無關 ? 5月14日消息,專注于高級大語言模型開發的WizardLM項目創建者徐
發表于 05-15 10:52
?1085次閱讀
百度發布文心大模型4.5和文心大模型X1
文心大模型4.5是百度自主研發的新一代原生多模態基礎大模型,通過多個模態聯合建模實現協同優化,多模態理解能力優秀;具備更精進的語言能力,理解、生成、邏輯、記憶能力全面提升,去幻覺、邏輯
大語言模型開發語言是什么
在人工智能領域,大語言模型(Large Language Models, LLMs)背后,離不開高效的開發語言和工具的支持。下面,AI部落小編為您介紹大語言
名單公布!【書籍評測活動NO.52】基于大模型的RAG應用開發與優化
(Retrieval-Augmented Agenerated,檢索增強生成)與Agent(AI智能體)。本篇小棗君首先嘗試用通俗易懂的語言幫助大家認識RAG這一重要應用形式。
01 了解大模型的“幻覺”
在了解為什么出現RA
發表于 12-04 10:50
大語言模型如何開發
大語言模型的開發是一個復雜且細致的過程,涵蓋了數據準備、模型架構設計、訓練、微調和部署等多個階段。以下是對大語言模型開發步驟的介紹,由AI部
PCB測試架和PCBA測試架的原理與用途
一站式PCBA智造廠家今天為大家講講PCBA測試架有什么用?PCB與PCBA測試架的原理和用途。在電子制造領域,PCBA測試架是確保電路板質
摩爾線程與羽人科技完成大語言模型訓練測試
(YuRen-7b)大語言模型的訓練測試。測試結果顯示,訓練效率達到預期,夸娥千卡智算集群展現出了高度的兼容性和穩定性,為羽人科技未來的零代碼訓練平臺向摩爾線程夸娥千卡智算集群的遷移提
【《大語言模型應用指南》閱讀體驗】+ 基礎知識學習
的信息,提供更全面的上下文理解。這使得模型能夠更準確地理解復雜問題中的多個層面和隱含意義。
2. 語義分析
模型通過訓練學習到語言的語義特征,能夠識別文本中的命名實體、句法結構和語義關
發表于 08-02 11:03
【《大語言模型應用指南》閱讀體驗】+ 俯瞰全書
上周收到《大語言模型應用指南》一書,非常高興,但工作項目繁忙,今天才品鑒體驗,感謝作者編寫了一部內容豐富、理論應用相結合、印刷精美的著作,也感謝電子發燒友論壇提供了一個讓我了解大語言模型
發表于 07-21 13:35
TaD+RAG-緩解大模型“幻覺”的組合新療法
TaD:任務感知解碼技術(Task-aware Decoding,簡稱TaD),京東聯合清華大學針對大語言模型幻覺問題提出的一項技術,成果收錄于IJCAI2024。 RAG:檢索增強生成技術

大語言模型的預訓練
隨著人工智能技術的飛速發展,自然語言處理(NLP)作為人工智能領域的一個重要分支,取得了顯著的進步。其中,大語言模型(Large Language Model, LLM)憑借其強大的語言
如何加速大語言模型推理
隨著人工智能技術的飛速發展,大語言模型(LLM)已成為自然語言處理領域的核心工具,廣泛應用于智能客服、文本生成、機器翻譯等多個場景。然而,大語言模型
谷歌發布新型大語言模型Gemma 2
在人工智能領域,大語言模型一直是研究的熱點。近日,全球科技巨頭谷歌宣布,面向全球研究人員和開發人員,正式發布了其最新研發的大語言模型——Gemma
評論