似乎國內外AI競爭日趨白熱化,就在阿里巴巴發布Qwen3(通義千問3)之后,引發業界廣泛關注;很多大廠在跟進,大模型不斷上新:
阿里巴巴開源新一代通義千問模型Qwen3
4月29日凌晨4點,阿里巴巴開源新一代通義千問模型Qwen3。據悉,Qwen3模型參數量僅為DeepSeek - R1的1/3,能夠大幅降低成本,而且性能全面超越R1、OpenAI - o1等全球頂尖模型,登頂全球最強開源模型。而且Qwen3還是國內首個“混合推理模型”。
小米首個推理大模型開源
在4月30日,“小米大模型”公眾號發布消息稱,小米開源首個推理大模型「XiaomiMiMo」,大模型MiMo號稱以7B參數在數學推理(AIME 24-25)和代碼競賽(LiveCodeBench v5)測評中超越OpenAI o1-mini和阿里Qwen-32B-Preview。體現出MiMo-7B在數學和代碼領域展現出的強化學習潛力領先于業界其他模型。
據悉,大模型MiMo是來自成立不久的“小米大模型 Core 團隊”。
馬斯克:下周推出Grok 3.5
馬斯克在社交平臺上表示,下周Grok 3.5早期測試版將向SuperGrok訂閱者發布。
螞蟻數科正式對外發布智能體開發平臺Agentar
4月29日,在數字中國建設峰會期間,螞蟻數科正式對外發布了智能體開發平臺Agentar,主要面向為金融機構提供智能體開發工具。
-
小米
+關注
關注
70文章
14420瀏覽量
146081 -
馬斯克
+關注
關注
1文章
850瀏覽量
21676 -
大模型
+關注
關注
2文章
2941瀏覽量
3683
發布評論請先 登錄
相關推薦
炸場!Grok 3擊敗Deepseek?馬斯克20萬顯卡造AI

馬斯克的“秘密武器”:Grok 3真的能輕松碾壓DeepSeek和ChatGPT?

評論