在 2025 年春節(jié)期間,科技圈殺出一匹黑馬“DeepSeek”,其迅速火爆全網(wǎng),成為眾人熱議的焦點(diǎn);回溯過(guò)往,人工智能領(lǐng)域能引發(fā)如此廣泛關(guān)注與熱議的現(xiàn)象,或?qū)⒆匪葜?ChatGPT 橫空出世之際。
新春之際,人們的生活需求變得更加多元化和個(gè)性化,DeepSeek 的強(qiáng)大功能正好與這些需求高度契合。且超過(guò) 60% 的用戶利用它制定旅行攻略,為春節(jié)出行提供了便利。
其中,約 40% 的用戶用它學(xué)習(xí)各地的麻將規(guī)則,增加節(jié)日娛樂(lè)的趣味性。近 30% 的用戶借助它進(jìn)行 “賽博算命”,為春節(jié)增添了一份神秘和歡樂(lè)的氛圍。
圖源:Google
首先,DeepSeek是一家專注于開(kāi)發(fā)先進(jìn)大語(yǔ)言模型(LLM)和相關(guān)技術(shù)的創(chuàng)新型科技公司?。該公司成立于2023年7月17日,總部位于中國(guó)杭州?,聯(lián)合創(chuàng)始人梁文峰擔(dān)任首席執(zhí)行官。
梁文峰自 2007 - 2008 年金融危機(jī)期間在浙江大學(xué)就讀時(shí)就開(kāi)始從事交易,2016 年 2 月,他聯(lián)合創(chuàng)立了 High-Flyer,該公司起初主要使用基于 CPU 的線性模型進(jìn)行股票交易,2016 年 10 月 21 日開(kāi)始使用依賴 GPU 的深度學(xué)習(xí)模型進(jìn)行股票交易,到 2017 年底,大部分交易都由人工智能驅(qū)動(dòng)。
2019 年,梁文峰將 High-Flyer 確立為專注于開(kāi)發(fā)和使用人工智能交易算法的對(duì)沖基金,到 2021 年,該公司在交易中依賴人工智能,且常使用英偉達(dá)芯片。
DeepSeek 成立的契機(jī)是 2023 年 4 月 14 日,High-Flyer 宣布啟動(dòng)一個(gè)通用人工智能實(shí)驗(yàn)室,致力于研發(fā)與金融業(yè)務(wù)分離的人工智能工具。同年 7 月 17 日,在 High-Flyer 的投資和支持下,該實(shí)驗(yàn)室獨(dú)立成為 DeepSeek 公司。但由于風(fēng)險(xiǎn)投資公司認(rèn)為該項(xiàng)目難以迅速實(shí)現(xiàn) “退出”,所以不太愿意提供資金支持。
值得一提的是,DeepSeek 最吸睛之處的 “黑科技”,將打破常規(guī)的創(chuàng)新之舉。
圖源:X平臺(tái)
DeepSeek繞開(kāi)了主流的 CUDA 生態(tài),直接采用 GPU 低級(jí)匯編語(yǔ)言 PTX 對(duì)模型進(jìn)行優(yōu)化,這一操作在行業(yè)內(nèi)引發(fā)巨大轟動(dòng),甚至被不少人視為 “技術(shù)革命”。
尤其,從母公司幻方量化的背景來(lái)看,這技術(shù)突破有著一定的必然性。幻方作為頭部量化公司,在高頻交易領(lǐng)域長(zhǎng)期依賴匯編語(yǔ)言來(lái)榨取硬件的極限性能,這種對(duì)底層技術(shù)的深度掌控和極致優(yōu)化的基因,自然而然地移植到了 AI 領(lǐng)域。
然而,此操作也有著一定的偶然性,國(guó)內(nèi) GPU 算力受限的現(xiàn)狀,成為推動(dòng) DeepSeek 采用 PTX 優(yōu)化的重要因素。在算力資源緊張的情況下,尋求新的技術(shù)路徑成為了不二之選。
另外,與國(guó)外大廠擁有頂級(jí)算力集群不同,國(guó)內(nèi)企業(yè)需要另辟蹊徑,PTX 優(yōu)化雖然是一項(xiàng)艱苦的 “苦力活”,但卻為 DeepSeek 帶來(lái)了在算力受限環(huán)境下的競(jìng)爭(zhēng)優(yōu)勢(shì)。
與此同時(shí),DeepSeek 出圈的原因,各界已進(jìn)行了多輪剖析,相關(guān)討論與解讀屢見(jiàn)不鮮 。
圖源:App Store
由于,其模型訓(xùn)練成本大幅削減,僅訓(xùn)練 DeepSeek-V3 模型算力花費(fèi)不到 600 萬(wàn)美元,卻能達(dá)到與高價(jià)模型相當(dāng)?shù)男Ч瑯O大降低了處理推理所需的算力,每 token 僅需 2.78 萬(wàn)次浮點(diǎn)運(yùn)算,遠(yuǎn)低于行業(yè) 4 萬(wàn)次的標(biāo)準(zhǔn),還能在低配置硬件上有效運(yùn)行。
并且支持 Python、C++ 等多種語(yǔ)言,代碼編寫(xiě)、優(yōu)化及調(diào)試能力強(qiáng),多輪對(duì)話記憶上下文,數(shù)學(xué)推理能力出色,R1 模型在 MMLU 考試中得分達(dá) 90.8%,超越 GPT-4。
圖源:Google
當(dāng)然,出圈的AI不是沒(méi)有過(guò),但能像DeepSeek這樣,讓英偉達(dá)股價(jià)暴跌,OpenAI、Google連夜發(fā)布新產(chǎn)品,引發(fā)一系列事件的國(guó)產(chǎn)AI,好像僅此一家。
其次,以往美國(guó)的傳統(tǒng) AI 大模型多采取閉源策略,限制了技術(shù)的傳播和共享。而 DeepSeek 的開(kāi)源模式,讓全球開(kāi)發(fā)者能夠在此基礎(chǔ)上進(jìn)行創(chuàng)新和二次開(kāi)發(fā),加速 AI 技術(shù)的發(fā)展進(jìn)程。
因此,DeepSeek的成功不僅沖擊了美國(guó)AI公司長(zhǎng)期信奉的“算力至上”和“閉源優(yōu)于開(kāi)源”的理念,還顛覆了行業(yè)格局。
圖源:X平臺(tái)
簡(jiǎn)而言之,在硬件資源有限的情況下,DeepSeek通過(guò)“更聰明”的算法,消耗更少算力實(shí)現(xiàn)更好性能。由此看出,算力資源也的確面臨著缺乏國(guó)產(chǎn)化方案的現(xiàn)實(shí)難題,自主可控的需求也需要國(guó)產(chǎn)算力作為硬支撐。
隨著DeepSeek推出后,其開(kāi)源和低成本特性,國(guó)產(chǎn)顯卡用于推理的性價(jià)比急劇上升,進(jìn)一步鞏固中國(guó)算力自主可控的邏輯閉環(huán)逐漸形成,國(guó)產(chǎn)算力產(chǎn)業(yè)鏈發(fā)展將大幅加速。
由于篇幅受限,本次的DeepSeek爆火就先介紹這么多......
-
人工智能
+關(guān)注
關(guān)注
1796文章
47725瀏覽量
240375 -
DeepSeek
+關(guān)注
關(guān)注
1文章
95瀏覽量
25
原文標(biāo)題:驚!DeepSeek 這匹黑馬,如何 “煉就” 國(guó)產(chǎn)算力閉環(huán)?
文章出處:【微信號(hào):奇普樂(lè)芯片技術(shù),微信公眾號(hào):奇普樂(lè)芯片技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
“兆瀚”算力產(chǎn)品強(qiáng)力支持DeepSeek,共筑國(guó)產(chǎn)AI新生態(tài)!
![“兆瀚”<b class='flag-5'>算</b><b class='flag-5'>力</b>產(chǎn)品強(qiáng)力支持<b class='flag-5'>DeepSeek</b>,共筑<b class='flag-5'>國(guó)產(chǎn)</b>AI新生態(tài)!](https://file.elecfans.com/web2/M00/46/D0/pYYBAGKV5wiAQkFLAAA0HUPKaH4034.jpg)
DeepSeek對(duì)芯片算力的影響
![<b class='flag-5'>DeepSeek</b>對(duì)芯片<b class='flag-5'>算</b><b class='flag-5'>力</b>的影響](https://file.elecfans.com/web2/M00/43/36/poYBAGJ82TeAPsAHAAA_r6nG8nE277.jpg)
首發(fā) | 昆侖芯 | 國(guó)產(chǎn)AI卡Deepseek訓(xùn)練推理全版本適配、性能卓越,一鍵部署等您來(lái)(附文檔下載方式)
![首發(fā) | 昆侖芯 | <b class='flag-5'>國(guó)產(chǎn)</b>AI卡<b class='flag-5'>Deepseek</b>訓(xùn)練推理全版本適配、性能卓越,一鍵部署等您來(lái)(附文檔下載方式)](https://file1.elecfans.com/web3/M00/07/4B/wKgZPGekYe6ALgUoAAAaqqZWWfY490.jpg)
云天勵(lì)飛上線DeepSeek R1系列模型
![云天勵(lì)飛上線<b class='flag-5'>DeepSeek</b> R1系列模型](https://file1.elecfans.com/web3/M00/07/40/wKgZPGekIduALExKAAANc3crHk8806.png)
聯(lián)通云與DeepSeek實(shí)現(xiàn)深度對(duì)接
DeepSeek R1在壁仞科技AI算力平臺(tái)發(fā)布
![](https://file1.elecfans.com/web3/M00/06/DA/wKgZO2ePxA2AEaTzAAQet3Edt48898.jpg)
算智算中心的算力如何衡量?
![<b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量?](https://file.elecfans.com/web2/M00/4E/DC/poYBAGLCjeiALm_WAAAYmfR7Qec474.png)
北電數(shù)智前進(jìn)·AI異構(gòu)計(jì)算平臺(tái),繪制國(guó)產(chǎn)算力商業(yè)化落地新藍(lán)圖
GPU算力開(kāi)發(fā)平臺(tái)是什么
科華數(shù)據(jù)攜手希姆計(jì)算,推動(dòng)國(guó)產(chǎn)RISC-V開(kāi)源AI算力快速發(fā)展
![科華數(shù)據(jù)攜手希姆計(jì)算,推動(dòng)<b class='flag-5'>國(guó)產(chǎn)</b>RISC-V開(kāi)源AI<b class='flag-5'>算</b><b class='flag-5'>力</b>快速發(fā)展](https://file1.elecfans.com/web2/M00/E5/D3/wKgaomZBeIyADEqiAACsZ19UYWk044.png)
科華數(shù)據(jù)攜手希姆計(jì)算,推動(dòng)國(guó)產(chǎn)RISC-V開(kāi)源AI算力快速發(fā)展
![科華數(shù)據(jù)攜手希姆計(jì)算,推動(dòng)<b class='flag-5'>國(guó)產(chǎn)</b>RISC-V開(kāi)源AI<b class='flag-5'>算</b><b class='flag-5'>力</b>快速發(fā)展](https://file1.elecfans.com/web2/M00/E5/E7/wKgZomZFcsyAcT-5AAA2A4dQRkQ217.png)
江蘇省算力基礎(chǔ)設(shè)施發(fā)展專項(xiàng)規(guī)劃:打造算力供給服務(wù)新高地
廣東:到2025年,算力規(guī)模38E,智算50%,國(guó)產(chǎn)算力70%
![廣東:到2025年,<b class='flag-5'>算</b><b class='flag-5'>力</b>規(guī)模38E,智<b class='flag-5'>算</b>50%,<b class='flag-5'>國(guó)產(chǎn)</b><b class='flag-5'>算</b><b class='flag-5'>力</b>70%](https://file.elecfans.com/web2/M00/5A/44/pYYBAGLpEg2AcCg-AAAr4Mmgt_c862.png)
評(píng)論