在 2025 年春節(jié)期間,科技圈殺出一匹黑馬“DeepSeek”,其迅速火爆全網(wǎng),成為眾人熱議的焦點(diǎn);回溯過(guò)往,人工智能領(lǐng)域能引發(fā)如此廣泛關(guān)注與熱議的現(xiàn)象,或?qū)⒆匪葜?ChatGPT 橫空出世之際。
新春之際,人們的生活需求變得更加多元化和個(gè)性化,DeepSeek 的強(qiáng)大功能正好與這些需求高度契合。且超過(guò) 60% 的用戶利用它制定旅行攻略,為春節(jié)出行提供了便利。
其中,約 40% 的用戶用它學(xué)習(xí)各地的麻將規(guī)則,增加節(jié)日娛樂(lè)的趣味性。近 30% 的用戶借助它進(jìn)行 “賽博算命”,為春節(jié)增添了一份神秘和歡樂(lè)的氛圍。
圖源:Google
首先,DeepSeek是一家專注于開(kāi)發(fā)先進(jìn)大語(yǔ)言模型(LLM)和相關(guān)技術(shù)的創(chuàng)新型科技公司?。該公司成立于2023年7月17日,總部位于中國(guó)杭州?,聯(lián)合創(chuàng)始人梁文峰擔(dān)任首席執(zhí)行官。
梁文峰自 2007 - 2008 年金融危機(jī)期間在浙江大學(xué)就讀時(shí)就開(kāi)始從事交易,2016 年 2 月,他聯(lián)合創(chuàng)立了 High-Flyer,該公司起初主要使用基于 CPU 的線性模型進(jìn)行股票交易,2016 年 10 月 21 日開(kāi)始使用依賴 GPU 的深度學(xué)習(xí)模型進(jìn)行股票交易,到 2017 年底,大部分交易都由人工智能驅(qū)動(dòng)。
2019 年,梁文峰將 High-Flyer 確立為專注于開(kāi)發(fā)和使用人工智能交易算法的對(duì)沖基金,到 2021 年,該公司在交易中依賴人工智能,且常使用英偉達(dá)芯片。
DeepSeek 成立的契機(jī)是 2023 年 4 月 14 日,High-Flyer 宣布啟動(dòng)一個(gè)通用人工智能實(shí)驗(yàn)室,致力于研發(fā)與金融業(yè)務(wù)分離的人工智能工具。同年 7 月 17 日,在 High-Flyer 的投資和支持下,該實(shí)驗(yàn)室獨(dú)立成為 DeepSeek 公司。但由于風(fēng)險(xiǎn)投資公司認(rèn)為該項(xiàng)目難以迅速實(shí)現(xiàn) “退出”,所以不太愿意提供資金支持。
值得一提的是,DeepSeek 最吸睛之處的 “黑科技”,將打破常規(guī)的創(chuàng)新之舉。
圖源:X平臺(tái)
DeepSeek繞開(kāi)了主流的 CUDA 生態(tài),直接采用 GPU 低級(jí)匯編語(yǔ)言 PTX 對(duì)模型進(jìn)行優(yōu)化,這一操作在行業(yè)內(nèi)引發(fā)巨大轟動(dòng),甚至被不少人視為 “技術(shù)革命”。
尤其,從母公司幻方量化的背景來(lái)看,這技術(shù)突破有著一定的必然性。幻方作為頭部量化公司,在高頻交易領(lǐng)域長(zhǎng)期依賴匯編語(yǔ)言來(lái)榨取硬件的極限性能,這種對(duì)底層技術(shù)的深度掌控和極致優(yōu)化的基因,自然而然地移植到了 AI 領(lǐng)域。
然而,此操作也有著一定的偶然性,國(guó)內(nèi) GPU 算力受限的現(xiàn)狀,成為推動(dòng) DeepSeek 采用 PTX 優(yōu)化的重要因素。在算力資源緊張的情況下,尋求新的技術(shù)路徑成為了不二之選。
另外,與國(guó)外大廠擁有頂級(jí)算力集群不同,國(guó)內(nèi)企業(yè)需要另辟蹊徑,PTX 優(yōu)化雖然是一項(xiàng)艱苦的 “苦力活”,但卻為 DeepSeek 帶來(lái)了在算力受限環(huán)境下的競(jìng)爭(zhēng)優(yōu)勢(shì)。
與此同時(shí),DeepSeek 出圈的原因,各界已進(jìn)行了多輪剖析,相關(guān)討論與解讀屢見(jiàn)不鮮 。
圖源:App Store
由于,其模型訓(xùn)練成本大幅削減,僅訓(xùn)練 DeepSeek-V3 模型算力花費(fèi)不到 600 萬(wàn)美元,卻能達(dá)到與高價(jià)模型相當(dāng)?shù)男Ч瑯O大降低了處理推理所需的算力,每 token 僅需 2.78 萬(wàn)次浮點(diǎn)運(yùn)算,遠(yuǎn)低于行業(yè) 4 萬(wàn)次的標(biāo)準(zhǔn),還能在低配置硬件上有效運(yùn)行。
并且支持 Python、C++ 等多種語(yǔ)言,代碼編寫(xiě)、優(yōu)化及調(diào)試能力強(qiáng),多輪對(duì)話記憶上下文,數(shù)學(xué)推理能力出色,R1 模型在 MMLU 考試中得分達(dá) 90.8%,超越 GPT-4。
圖源:Google
當(dāng)然,出圈的AI不是沒(méi)有過(guò),但能像DeepSeek這樣,讓英偉達(dá)股價(jià)暴跌,OpenAI、Google連夜發(fā)布新產(chǎn)品,引發(fā)一系列事件的國(guó)產(chǎn)AI,好像僅此一家。
其次,以往美國(guó)的傳統(tǒng) AI 大模型多采取閉源策略,限制了技術(shù)的傳播和共享。而 DeepSeek 的開(kāi)源模式,讓全球開(kāi)發(fā)者能夠在此基礎(chǔ)上進(jìn)行創(chuàng)新和二次開(kāi)發(fā),加速 AI 技術(shù)的發(fā)展進(jìn)程。
因此,DeepSeek的成功不僅沖擊了美國(guó)AI公司長(zhǎng)期信奉的“算力至上”和“閉源優(yōu)于開(kāi)源”的理念,還顛覆了行業(yè)格局。
圖源:X平臺(tái)
簡(jiǎn)而言之,在硬件資源有限的情況下,DeepSeek通過(guò)“更聰明”的算法,消耗更少算力實(shí)現(xiàn)更好性能。由此看出,算力資源也的確面臨著缺乏國(guó)產(chǎn)化方案的現(xiàn)實(shí)難題,自主可控的需求也需要國(guó)產(chǎn)算力作為硬支撐。
隨著DeepSeek推出后,其開(kāi)源和低成本特性,國(guó)產(chǎn)顯卡用于推理的性價(jià)比急劇上升,進(jìn)一步鞏固中國(guó)算力自主可控的邏輯閉環(huán)逐漸形成,國(guó)產(chǎn)算力產(chǎn)業(yè)鏈發(fā)展將大幅加速。
由于篇幅受限,本次的DeepSeek爆火就先介紹這么多......
-
人工智能
+關(guān)注
關(guān)注
1805文章
48833瀏覽量
247343 -
DeepSeek
+關(guān)注
關(guān)注
1文章
785瀏覽量
1474
原文標(biāo)題:驚!DeepSeek 這匹黑馬,如何 “煉就” 國(guó)產(chǎn)算力閉環(huán)?
文章出處:【微信號(hào):奇普樂(lè)芯片技術(shù),微信公眾號(hào):奇普樂(lè)芯片技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
曙光全棧國(guó)產(chǎn)DeepSeek一體機(jī)方案落地高校
DeepSeek推動(dòng)AI算力需求:800G光模塊的關(guān)鍵作用
存力接棒算力,慧榮科技以主控技術(shù)突破AI存儲(chǔ)極限

智界無(wú)感·算力覺(jué)醒:DeepSeek與BLE技術(shù)融合引爆邊緣AI萬(wàn)億市場(chǎng)

DeepSeek驅(qū)動(dòng)AI算力市場(chǎng)升溫,智算中心利用率望提升
濟(jì)南市中區(qū)存算一體化智算中心上線DeepSeek
安霸大算力AI芯片接入DeepSeek R1
梯度科技推出DeepSeek智算一體機(jī)
添越智創(chuàng)基于 RK3588 開(kāi)發(fā)板部署測(cè)試 DeepSeek 模型全攻略
【實(shí)測(cè)】用全志A733平板搭建一個(gè)端側(cè)Deepseek算力平臺(tái)
deepseek國(guó)產(chǎn)芯片加速 DeepSeek的國(guó)產(chǎn)AI芯片天團(tuán)

軟通動(dòng)力天元智算接入DeepSeek系列模型
DeepSeek對(duì)芯片算力的影響


評(píng)論