在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

國(guó)內(nèi)公司自主研發(fā)GPU+:兼容CUDA、性能及能效超競(jìng)品

硬件世界 ? 來源:硬件世界 ? 2023-07-17 16:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,自稱為國(guó)內(nèi)自主創(chuàng)新的通用GPU領(lǐng)軍企業(yè)的登臨科技獲得中國(guó)互聯(lián)網(wǎng)投資基金(簡(jiǎn)稱“中網(wǎng)投”)獨(dú)家投資。

公司稱,這將為登臨新一代Goldwasser(高凜)規(guī)模化量產(chǎn)及商業(yè)化落地提供重要保障。

高凜是一款AI加速卡,首款產(chǎn)品2021年量產(chǎn)投入市場(chǎng),2022年銷售過萬片。

第二代產(chǎn)品2022年流片,2023年實(shí)現(xiàn)量產(chǎn)。根據(jù)現(xiàn)有客戶測(cè)試結(jié)果,二代產(chǎn)品針對(duì)基于transformer類型的模型提供3-5倍的性能提升,大幅降低類ChatGPT及生成式AI應(yīng)用的硬件成本。

在官網(wǎng),登臨介紹自己是國(guó)內(nèi)首家完全憑借自主創(chuàng)新,實(shí)現(xiàn)規(guī)模化商業(yè)落地的通用GPU企業(yè),登臨科技核心IP完全自主研發(fā),其自主創(chuàng)新的GPU+(基于GPGPU的軟件定義的片內(nèi)異構(gòu)計(jì)算架構(gòu)),在兼容 CUDA/OpenCL 在內(nèi)的編程模型和軟件生態(tài)的基礎(chǔ)上,通過架構(gòu)創(chuàng)新,解決了客戶核心關(guān)注的通用性和高效率的雙重難題。

其表示,經(jīng)過大量客戶產(chǎn)品化驗(yàn)證,針對(duì)AI計(jì)算,GPU+相比現(xiàn)有主流GPU在性能及能效上有顯著提升。

ba101482-23ef-11ee-962d-dac502259ad0.jpg

在AI市場(chǎng)上,NVIDIA現(xiàn)在是沒有對(duì)手的階段,AI顯卡份額估計(jì)在90%以上,AMD都很難競(jìng)爭(zhēng),現(xiàn)在Intel也加入這個(gè)市場(chǎng)了,而且找到了NVIDIA的一個(gè)痛點(diǎn),那就是性價(jià)比。

NVIDIA目前受追捧的AI顯卡主要是A100、H100,國(guó)內(nèi)有特供的閹割版A800、H800,性能比原版弱20%左右,但即便如此依然供不應(yīng)求,A800一周時(shí)間就從9萬元漲到11萬元以上,H100價(jià)格在25萬元以上,H800也要20萬出頭,而且不同經(jīng)銷商的價(jià)格差異很大。

Intel自然也不會(huì)放過這個(gè)市場(chǎng),日前在國(guó)內(nèi)舉行發(fā)布會(huì),也推出了AI顯卡Habana Gaudi2,這是去年底發(fā)布的AI推理加速芯片,從第一代的16nm工藝升級(jí)到7nm工藝,Tensor 處理器核心數(shù)量增至 24 個(gè),同時(shí)集成了多媒體處理引擎,內(nèi)存升級(jí)至 96GB HBM2E。

國(guó)內(nèi)版的Gaudi2主要是閹割了部分網(wǎng)絡(luò)接口,但也集成了21路100Gbps網(wǎng)絡(luò)接口,總體來說性能依然很可觀。

ba385da2-23ef-11ee-962d-dac502259ad0.jpg

Intel還公布了Gaudi2跟H100的AI性能對(duì)比,面對(duì)要求極為苛刻的、1750億參數(shù)的GPT-3模型,384個(gè)Gaudi2加速器上的訓(xùn)練時(shí)間僅為311.9分鐘,而且從256個(gè)加速器到384個(gè)加速器,性能擴(kuò)展幅度達(dá)95%。

NVIDIA這邊在512塊 H100 GPU上的訓(xùn)練時(shí)間則為64分鐘,論單卡性能的話是Gaudi2的3.6倍多,但是Intel不會(huì)跟H100拼極限性能,而是強(qiáng)調(diào)性價(jià)比。

Habana Labs 首席運(yùn)營(yíng)官 Eitan Medina 表示,性價(jià)比是影響H100和Gaudi2相對(duì)價(jià)值的重要考量因素,Gaudi2 服務(wù)器的成本要比H100低得多。

更重要的是,目前Gaudi2還沒有支持AI常用的FP8運(yùn)算格式,這種情況下Gaudi2 在性價(jià)比上也勝過了H100,今年3季度會(huì)升級(jí)支持FP8運(yùn)算,Gaudi2的性能將有明顯飛躍,性價(jià)比要比H100更高了。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4935

    瀏覽量

    131079
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    34936

    瀏覽量

    278307
  • ChatGPT
    +關(guān)注

    關(guān)注

    29

    文章

    1589

    瀏覽量

    9024

原文標(biāo)題:國(guó)內(nèi)公司自主研發(fā)GPU+:兼容CUDA、性能及能效超競(jìng)品

文章出處:【微信號(hào):hdworld16,微信公眾號(hào):硬件世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    CSS6404L 在物聯(lián)網(wǎng)設(shè)備中的應(yīng)用優(yōu)勢(shì):低功耗高可靠的存儲(chǔ)革新與競(jìng)對(duì)比

    CSS6404L 通過 “高集成度 + 低功耗 + 寬適應(yīng)” 的組合特性,在容量、功耗、性能及場(chǎng)景兼容性上全面超越同類競(jìng),尤其在需要兼顧長(zhǎng)續(xù)航、高速傳輸與緊湊設(shè)計(jì)的物聯(lián)網(wǎng)場(chǎng)景中,成為
    的頭像 發(fā)表于 06-06 15:35 ?215次閱讀
    CSS6404L 在物聯(lián)網(wǎng)設(shè)備中的應(yīng)用優(yōu)勢(shì):低功耗高可靠的存儲(chǔ)革新與<b class='flag-5'>競(jìng)</b><b class='flag-5'>品</b>對(duì)比

    TNC 連接器競(jìng)大對(duì)決,質(zhì)量誰更勝一籌?

    綜合來看,在與競(jìng)的質(zhì)量對(duì)決中,TNC 連接器在電氣性能、機(jī)械性能和環(huán)境適應(yīng)性等方面展現(xiàn)出了明顯的優(yōu)勢(shì),能夠?yàn)楦黝愲娮釉O(shè)備提供更為可靠、穩(wěn)定的連接解決方案,是追求高質(zhì)量連接器用戶的理想
    的頭像 發(fā)表于 03-06 08:43 ?457次閱讀
    TNC 連接器<b class='flag-5'>競(jìng)</b><b class='flag-5'>品</b>大對(duì)決,質(zhì)量誰更勝一籌?

    迅為3A6000開發(fā)板/龍芯3A6000與龍芯3A5000等龍架構(gòu)處理器軟件兼容

    龍芯 3A6000 處理器完全自主設(shè)計(jì)、性能優(yōu)異,代表了我國(guó)自主桌面 CPU 設(shè)計(jì)領(lǐng)域的最新里程碑成果。龍芯 3A6000 處理器的推出,說明國(guó)產(chǎn) CPU 在自主可控程度和產(chǎn)品
    發(fā)表于 02-12 15:06

    天璣8400 搭載G720 GPU性能雙飆,打造驚艷越級(jí)游戲體驗(yàn)

    一貫的強(qiáng)項(xiàng)方面,天璣8400更是帶來越級(jí)旗艦的體驗(yàn),尤其是游戲場(chǎng)景,直接越級(jí)競(jìng)8系芯片,功耗更低、溫控更出色,這顆冰封之芯太強(qiáng)了。除了碾壓同級(jí)的全大核CPU,
    的頭像 發(fā)表于 12-24 13:55 ?630次閱讀
    天璣8400 搭載G720 <b class='flag-5'>GPU</b><b class='flag-5'>性能</b><b class='flag-5'>能</b><b class='flag-5'>效</b>雙飆,打造驚艷越級(jí)游戲體驗(yàn)

    IO模塊助力PLC,全面提升中水處理設(shè)備

    隨著我國(guó)環(huán)保事業(yè)的不斷發(fā)展,中水處理技術(shù)在工業(yè)、生活等領(lǐng)域發(fā)揮著越來越重要的作用。如何提高中水處理設(shè)備的,成為行業(yè)關(guān)注的焦點(diǎn)。本文將為您介紹明達(dá)技術(shù)高效解決方案——利用自主研發(fā)的分
    的頭像 發(fā)表于 12-16 14:57 ?430次閱讀
    IO模塊助力PLC,全面提升中水處理設(shè)備<b class='flag-5'>能</b><b class='flag-5'>效</b>

    迅為3A6000_7A2000開發(fā)板龍芯全國(guó)產(chǎn)處理器與龍芯 3A5000完全兼容

    龍芯 3A6000 處理器完全自主設(shè)計(jì)、性能優(yōu)異,代表了我國(guó)自主桌面 CPU 設(shè)計(jì)領(lǐng)域的最新里程碑成果。龍芯 3A6000 處理器的推出,說明國(guó)產(chǎn) CPU 在自主可控程度和產(chǎn)品
    發(fā)表于 11-19 11:15

    上海貝嶺小封裝物聯(lián)網(wǎng)監(jiān)測(cè)芯片BL0971介紹

    為實(shí)現(xiàn)這些監(jiān)測(cè)及應(yīng)用需求,上海貝嶺在之前的物聯(lián)網(wǎng)監(jiān)測(cè)芯片BL0972的基礎(chǔ)上,針對(duì)直流充電樁的應(yīng)用需求,推出了小封裝的BL0971交直流
    的頭像 發(fā)表于 11-15 11:27 ?1237次閱讀
    上海貝嶺<b class='flag-5'>超</b>小封裝物聯(lián)網(wǎng)<b class='flag-5'>能</b><b class='flag-5'>效</b>監(jiān)測(cè)芯片BL0971介紹

    天璣9400技術(shù)詳解:如何蟬聯(lián)GPU性能雙冠軍

    全新高度,引發(fā)了廣泛好評(píng)。 天璣9400搭載全新頂級(jí)12核GPU G925,相較上代擁有超過41%的峰值性能飛躍,在保持與上一代相同的峰值性能下功耗節(jié)省接近一半。在媒體測(cè)評(píng)中,無論是極限性能
    的頭像 發(fā)表于 11-07 14:00 ?790次閱讀
    天璣9400技術(shù)詳解:如何蟬聯(lián)<b class='flag-5'>GPU</b><b class='flag-5'>性能</b>、<b class='flag-5'>能</b><b class='flag-5'>效</b>雙冠軍

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--了解算力芯片GPU

    每個(gè)CUDA單元在 OpenCL 編程框架中都有對(duì)應(yīng)的單元。 倒金字塔結(jié)構(gòu)GPU存儲(chǔ)體系 共享內(nèi)存是開發(fā)者可配置的編程資源,使用門檻較高,編程上需要更多的人工顯式處理。 在并行計(jì)算架構(gòu)中,線程
    發(fā)表于 11-03 12:55

    有沒有大佬知道NI vision 有沒有辦法通過gpucuda來加速圖像處理

    有沒有大佬知道NI vision 有沒有辦法通過gpucuda來加速圖像處理
    發(fā)表于 10-20 09:14

    國(guó)內(nèi)首款自主研發(fā)28nm顯示芯片量產(chǎn)

    近日,國(guó)內(nèi)半導(dǎo)體行業(yè)迎來重要里程碑,北京顯芯科技有限公司成功實(shí)現(xiàn)全球首款28納米內(nèi)嵌RRAM(阻變存儲(chǔ)器)畫質(zhì)調(diào)節(jié)芯片的量產(chǎn)。這款芯片不僅標(biāo)志著我國(guó)在顯示類芯片領(lǐng)域達(dá)到了新的半導(dǎo)體工藝高度,更是國(guó)內(nèi)首款
    的頭像 發(fā)表于 09-11 17:17 ?3248次閱讀

    新芯”賦水表行業(yè),國(guó)產(chǎn)替代與計(jì)量升級(jí) ——龍芯1D超聲波流量測(cè)計(jì)量芯片介紹

    。(2)迭代更新芯片迭代更新可以帶來性能提升、優(yōu)化、成本降低、集成度提高、軟件兼容性增強(qiáng)、市場(chǎng)適應(yīng)性提高等多方面的優(yōu)勢(shì)。(3)品牌優(yōu)勢(shì)國(guó)產(chǎn)CPU第一股;始終秉持為人民做龍芯的理念,
    發(fā)表于 08-14 10:46

    打破英偉達(dá)CUDA壁壘?AMD顯卡現(xiàn)在也無縫適配CUDA

    、英特爾等廠商雖然在努力追趕,但目前還未能看到有威脅英偉達(dá)地位的可能。 ? 最近一家英國(guó)公司Spectral Compute推出了一款方案,可以為AMD的GPU原生編譯CUDA源代碼,目前正在RNDA2、RDNA3上進(jìn)行規(guī)模測(cè)試
    的頭像 發(fā)表于 07-19 00:16 ?5876次閱讀

    英國(guó)公司實(shí)現(xiàn)英偉達(dá)CUDA軟件在AMD GPU上的無縫運(yùn)行

    7月18日最新資訊,英國(guó)創(chuàng)新科技企業(yè)Spectral Compute震撼發(fā)布了其革命性GPGPU編程工具包——“SCALE”,該工具包實(shí)現(xiàn)了英偉達(dá)CUDA軟件在AMD GPU上的無縫遷移與運(yùn)行,標(biāo)志著在GPU計(jì)算領(lǐng)域,NVIDI
    的頭像 發(fā)表于 07-18 14:40 ?1046次閱讀

    淺談建筑樓宇電氣安全與管理的應(yīng)用與選型

    程瑜 江蘇安科瑞電器制造有限公司 江蘇江陰 214405 摘要: 本文從電氣安全監(jiān)控系統(tǒng)應(yīng)用現(xiàn)狀,分析電氣安全事故隱患難以根除的原因入手,導(dǎo)出電氣安全與管理理念,通過探析電氣安全與
    的頭像 發(fā)表于 07-10 08:53 ?790次閱讀
    淺談建筑樓宇電氣安全與<b class='flag-5'>能</b><b class='flag-5'>效</b>管理的應(yīng)用與選型
    主站蜘蛛池模板: 日本免费不卡视频 | 久久久夜 | 国产亚洲精品自在久久77 | 欧美一级黄色片视频 | 高清视频免费观看 | 日本高清视频wwww色 | 一级毛片q片 | 一级特黄aaa大片在线观看 | 韩国三级hd中文字幕 | 夜夜夜夜夜操 | 美女视频网站色 | 四虎影院成人 | 国产三级在线观看免费 | 手机福利在线观看 | 经典三级一区二区三区视频 | 欧洲乱码专区一区二区三区四区 | 欧美一级免费观看 | 久久99国产亚洲高清观看首页 | 99精品国产第一福利网站 | 在线免费公开视频 | 国产理论最新国产精品视频 | 日韩在线免费看网站 | 日日干天天干 | 国产在线一区二区三区四区 | 在线一区二区观看 | 天堂最新版免费观看 | 亚洲成人免费观看 | 天天操天天干天天操 | 色cccwww在线播放 | 一本大道一卡二卡四卡 | 菲菲国产在线观看 | 久久久久国产精品四虎 | 国产视频分类 | 人人爱干 | 桃色婷婷 | 三级在线看 | 午夜影院在线观看视频 | www.亚洲色图.com | 亚洲天堂二区 | 午夜想想爱午夜剧场 | 成人国产精品一级毛片了 |