9月19日凌晨,阿里通義千問正式開源Qwen2.5系列大模型,最新發布包括了語言模型Qwen2.5,以及專門針對編程的Qwen2.5-Coder和數學的Qwen2.5-Math模型。PerfXCloud(澎峰云)大模型開發與服務平臺第一時間支持Qwen2.5 72B并在平臺完成上線,趕快來體驗吧!
Qwen2.5系列模型
更大的訓練數據集:Qwen2.5語言模型的所有尺寸都在最新的大規模數據集上進行了預訓練,該數據集包含多達18Ttokens。相較于Qwen2,Qwen2.5獲得了顯著更多的知識(MMLU:85+),并在編程能力(HumanEval 85+)和數學能力(MATH 80+)方面有了大幅提升。
更強的指令遵循能力:新模型在指令執行、生成長文本(超過8K標記)、理解結構化數據(例如表格)以及生成結構化輸出特別是JSON方面取得了顯著改進。Qwen2.5模型總體上對各種system prompt更具適應性,增強了角色扮演實現和聊天機器人的條件設置功能。
長文本支持能力:與Qwen2類似,Qwen2.5語言模型支持高達128K tokens,并能生成最多8K tokens的內容。
強大的多語言能力:它們同樣保持了對包括中文、英文、法文、西班牙文、葡萄牙文、德文、意大利文、俄文、日文、韓文、越南文、泰文、阿拉伯文等29種以上語言的支持。
專業領域的專家語言模型能力增強:即用于編程的Qwen2.5-Coder和用于數學的Qwen2.5-Math,相比其前身CodeQwen1.5和Qwen2-Math有了實質性的改進。具體來說,Qwen2.5-Coder在包含5.5T tokens編程相關數據上進行了訓練,使即使較小的編程專用模型也能在編程評估基準測試中表現出媲美大型語言模型的競爭力。同時,Qwen2.5-Math支持中文和英文,并整合了多種推理方法,包括CoT(Chain of Thought)、PoT(Program of Thought)和TIR(Tool-Integrated Reasoning)。
Qwen2.5-72B在多個基準測試中的結果
審核編輯 黃宇
-
開源
+關注
關注
3文章
3624瀏覽量
43538 -
模型
+關注
關注
1文章
3499瀏覽量
50076 -
大模型
+關注
關注
2文章
3046瀏覽量
3863
發布評論請先 登錄
上新:小米首個推理大模型開源 馬斯克:下周推出Grok 3.5
壁仞科技完成阿里巴巴通義千問Qwen3全系列模型支持
低至¥2.27/h!就能使用全球最強開元模型——千問 QwQ-32B

利用英特爾OpenVINO在本地運行Qwen2.5-VL系列模型

阿里巴巴Qwen大模型助力開發低成本DeepSeek替代方案
Qwen大模型助力開發低成本AI推理方案
阿里云通義Qwen2.5-Max模型全新升級
阿里云通義開源長文本新模型Qwen2.5-1M
PerfXCloud重磅升級 阿里開源最強視覺語言模型Qwen2-VL-7B強勢上線!

零一萬物正式開源Yi-Coder系列模型 PerfXCloud火速支持等你體驗!

PerfXCloud順利接入MOE大模型DeepSeek-V2

評論