近日,在2024中國移動全球合作伙伴大會上,一項關于大模型評測體系建設的新成果——《通用大模型評測標準》正式發布。這一標準由中國移動攜手工信部中國電子技術標準化研究院、中國電信、國家電網、中國石油以及科大訊飛等產業各方共同推出。
《通用大模型評測標準》旨在為產業界提供一個重要的參考依據,幫助各方遴選出優質的AI大模型。隨著人工智能技術的快速發展,大模型在各個領域的應用日益廣泛,因此建立一個統一、權威的評測標準顯得尤為重要。
此次發布的評測標準將有力推動AI大模型技術的規范化發展,促進產業界的技術交流與合作,為人工智能技術的進一步創新和應用奠定堅實基礎。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
中國移動
+關注
關注
22文章
5556瀏覽量
71798 -
人工智能
+關注
關注
1796文章
47683瀏覽量
240302 -
科大訊飛
+關注
關注
19文章
818瀏覽量
61517
發布評論請先 登錄
相關推薦
生成式人工智能模型的安全可信評測
受到關注。但當前大模型仍然面臨可信瓶頸,無法開展大規模應用。大模型的安全可信受到高度關注,國內外已經有多項法規與標準快速制定并落地。本文以層次化的結構,構建了生成式人工智能的安全可信評測
首批首家!DataCanvas Alaya NeW智算操作系統通過中國信通院“大模型計算資源調度平臺” 標準評測
1月8日,“大模型工程化成果發布會”在北京圓滿召開。會上,中國信息通信研究院(簡稱“中國信通院”)正式發布6項AIInfra(人工智能基礎平臺)標準成果,憑借領先的應用效能和靈活的擴展
騰訊混元文生圖登頂智源FlagEval評測榜首
近日,北京智源人工智能研究院(BAAI)發布了最新的FlagEval大模型評測排行榜,其中多模態模型評測榜單的文生圖
云知聲山海大模型多項評測名列前茅
近日,智源研究院發布并解讀了國內外100余個開源和商業閉源的語言、視覺語言、文生圖、文生視頻、語音語言大模型綜合及專項評測結果。
商湯日日新多模態大模型權威評測第一
剛剛,商湯科技日日新SenseNova多模態大模型,在權威綜合評測權威平臺OpenCompass的多模態評測中取得榜單第一。
名單公布!【書籍評測活動NO.52】基于大模型的RAG應用開發與優化
理解與復雜推理的任務中出錯。
(4)缺乏特定領域的知識:沒學過,瞎編個答案蒙一下。
通用大模型就像一個掌握了大量人類通用知識且具備超強記憶與推理能力的優秀學生,但可能不是某個垂直領域的專家(比如醫學或者法律
發表于 12-04 10:50
名單公布!【書籍評測活動NO.49】大模型啟示錄:一本AI應用百科全書
CRM流程、使用Copilot等提高員工效率。
但更多的行業雖然有充分的落地積極性,卻很難看清我們現在擁抱的“大模型”在企業工作流程中應該長成啥樣。在行業早期,因為缺乏標準化產品,最先落地的也往往是
發表于 10-28 15:34
名單公布!【書籍評測活動NO.41】大模型時代的基礎架構:大模型算力中心建設指南
工作日內未聯系,視為放棄本次試用評測資格!
書籍介紹
大模型是近年來引人注目的熱點之一。大模型蓬勃發展的基礎,是針對其需求設計的算力及基礎架構。本書針對如何為大模型構建基礎架構進行深入
發表于 08-16 18:33
商湯科技加入中國移動人工智能大模型評測聯盟
WAIC 2024期間,中國移動發起成立人工智能大模型評測聯盟(弈衡),商湯科技作為初創成員受邀加入聯盟。 人工智能實現突破發展,“AI+”評測正成為關鍵一環。人工智能大模型
【大語言模型:原理與工程實踐】大語言模型的評測
,包括口語化表達、不完整句子和打字錯誤等,確保評測集貼近實際使用情境。其次,設計問題時應加入多種限制條件,如身份信息、寫作目的、格式規范和發布平臺等,以精準評估模型性能。特別在無標準答
發表于 05-07 17:12
NVIDIA發布一款人形機器人通用基礎模型—Project GR00T
NVIDIA 于今日發布人形機器人通用基礎模型 Project GR00T,旨在進一步推動其在機器人和具身智能方面的突破。
名單公布!【書籍評測活動NO.31】大語言模型:原理與工程實踐
對特定任務的高效處理上,更重要的是,它在處理多樣化任務和復雜場景中的靈活性顯著,甚至能在一定程度上模擬人類的思考方式。這種能力的展現,標志著人工智能從專注于單一任務的傳統模型向通用人工智能轉變,其強大
發表于 03-18 15:49
名單公布!【書籍評測活動NO.30】大規模語言模型:從理論到實踐
評測資格!
2022年11月,ChatGPT的問世展示了大模型的強大潛能,對人工智能領域有重大意義,并對自然語言處理研究產生了深遠影響,引發了大模型研究的熱潮。
距ChatGPT問世不到一年,截至
發表于 03-11 15:16
華為云盤古大模型通過金融大模型標準符合性驗證
近日,在中國信通院組織的可信AI大模型標準符合性驗證中,華為云的盤古大模型表現出色,成功通過了金融大模型標準的符合性驗證,并榮獲優秀級(4+
評論