91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

只能跑Transformer的AI芯片,卻號(hào)稱全球最快?

E4Life ? 來(lái)源:電子發(fā)燒友 ? 作者:周凱揚(yáng) ? 2024-07-01 09:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))近日,一家由哈佛輟學(xué)生成立的初創(chuàng)公司Etched,宣布了他們?cè)诖蛟斓囊豢睢皩S谩?a href="http://m.xsypw.cn/tags/ai/" target="_blank">AI芯片Sohu。據(jù)其聲稱該芯片的速度將是英偉達(dá)H100的20倍,但只能跑transformer架構(gòu)的模型。

Sohu,比H100快上20倍

之所以打算Sohu這一自研ASIC AI芯片,是因?yàn)镋tched認(rèn)為GPU在性能升級(jí)上的速度太慢了。如果以H100的單位面積算力和交期作為參考,那么從2022年到2025年,英偉達(dá)的H100迭代至B200,2.5年的時(shí)間內(nèi)性能只有15%的提升。所以要想有效提高性能的方式,只有走特化的ASIC芯片一途。

現(xiàn)在發(fā)布的任何AI芯片,在提到性能時(shí),無(wú)疑都會(huì)把英偉達(dá)的H100作為對(duì)比參照,Etched的Sohu也不例外。根據(jù)Etched提供的數(shù)據(jù),單個(gè)Sohu服務(wù)器運(yùn)行Llama 70B時(shí)可以做到50萬(wàn)Tokens每秒,這一速度是單個(gè)H100服務(wù)器的20倍以上,也是單個(gè)B200服務(wù)器的10倍以上。

在服務(wù)器的配置上,Sohu服務(wù)器和H100服務(wù)器均采用的8卡的配置,所以Etched強(qiáng)調(diào)一個(gè)8xSohu的服務(wù)器就可以替換掉至少160個(gè)H100,大大降低成本的同時(shí),也不會(huì)有性能損失。

由于Sohu僅支持一種算法,所以絕大多數(shù)的控制流模塊都可以被剔除,芯片可以集成更多的數(shù)學(xué)計(jì)算單元,在算力利用率上可以達(dá)到90%以上,而GPU卻只能做到30%。這也是因?yàn)樵贕PU的電路設(shè)計(jì)上,用于矩陣乘法的晶體管數(shù)量甚至沒(méi)有占到10%。不過(guò)Etched對(duì)于英偉達(dá)的設(shè)計(jì)還是相當(dāng)佩服的,指出如果同時(shí)想支持CNN、LSTM、SSM等其他模型,確實(shí)很難做得比英偉達(dá)更好。

當(dāng)然了,這里的測(cè)試條件也必須做一個(gè)說(shuō)明,測(cè)試標(biāo)準(zhǔn)為FP8精度的Llama 70B,無(wú)稀疏,其中H100是基于最新版本的TensorRT-LLM測(cè)試的,而B200由于還未交付,所以其性能是預(yù)估的。

為何專攻Transformer模型

市面上的AI芯片和GPU產(chǎn)品為了覆蓋更靈活的客戶需求,盡管不少都采用了ASIC的設(shè)計(jì)方案,但支持的模型卻不會(huì)局限在一類。Etched也在其官網(wǎng)列出了市面上一些競(jìng)品方案,包括英偉達(dá)的GPU、谷歌的TPU、亞馬遜的Trainium、Graphcore的IPU、Tenstorrent的Grayskull和英特爾的Gaudi等等,這些方案無(wú)一不對(duì)廣泛的AI模型提供了支持。

但我們從市面上頭部的模型來(lái)看,幾乎占據(jù)主導(dǎo)地位的都是transformer架構(gòu)的模型,比如GPT、Sora、Gemini和Stable Diffusion。Etched很大方地表示,如果哪一天transformer被SSM、RWKV或其他新的架構(gòu)替代了,他們的芯片將變得一無(wú)是處,對(duì)于千變?nèi)f化的AI市場(chǎng)而言,絕大多數(shù)廠商都不敢沒(méi)法做出這樣的預(yù)測(cè)。

而Etched從2022年底,就賭transformer模型將會(huì)統(tǒng)治整個(gè)市場(chǎng)。這在當(dāng)時(shí)還沒(méi)有ChatGPT的年代,是一個(gè)大膽的預(yù)測(cè),畢竟當(dāng)時(shí)圖像生成還有基于CNN的U-Net,不少自動(dòng)駕駛的視覺處理也還在廣泛使用CNN。而且對(duì)于一個(gè)規(guī)模不算大的設(shè)計(jì)團(tuán)隊(duì)而言,維護(hù)單一架構(gòu)的軟件棧明顯壓力更小一些,他們只需要為transformer編寫驅(qū)動(dòng)、內(nèi)核即可。

寫在最后

至于Etched的這場(chǎng)豪賭是否能成功,還得看芯片的成品表現(xiàn)如何。雖然他們嘗試的這條路線沒(méi)人走過(guò),但財(cái)力和研發(fā)能力均在他們之上的廠商也沒(méi)能打造出超過(guò)英偉達(dá)GPU的競(jìng)品,硅谷的VC們能否造出新神,依然不能過(guò)早下定論。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Transformer
    +關(guān)注

    關(guān)注

    0

    文章

    151

    瀏覽量

    6526
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1983

    瀏覽量

    35935
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    語(yǔ)音助手只能聊天?啟明云端AI語(yǔ)音交互方案偷偷修煉了音樂(lè)才藝!

    “語(yǔ)音助手只能聊天?太out了!”語(yǔ)音交互的新樂(lè)章已經(jīng)奏響!啟明云端基于樂(lè)鑫科技芯片AI語(yǔ)音方案正式解鎖音樂(lè)技能樹,只需一句指令,智能設(shè)備即刻變身專屬點(diǎn)唱機(jī)。只要版權(quán)到位,想聽什么?您說(shuō)了算!多
    的頭像 發(fā)表于 06-27 18:03 ?173次閱讀
    語(yǔ)音助手<b class='flag-5'>只能</b>聊天?啟明云端<b class='flag-5'>AI</b>語(yǔ)音交互方案偷偷修煉了音樂(lè)才藝!

    全球首個(gè)AI設(shè)計(jì)芯片系統(tǒng)誕生,來(lái)自中科院

    電子發(fā)燒友網(wǎng)綜合報(bào)道,近日,中國(guó)科學(xué)院計(jì)算技術(shù)研究所處理器芯片全國(guó)重點(diǎn)實(shí)驗(yàn)室聯(lián)合軟件研究所,推出全球首個(gè)基于人工智能技術(shù)的處理器芯片軟硬件全自動(dòng)設(shè)計(jì)系統(tǒng) ——“啟蒙”。 ? 該系統(tǒng)實(shí)現(xiàn)從芯片
    的頭像 發(fā)表于 06-16 00:11 ?2271次閱讀

    Transformer架構(gòu)概述

    由于Transformer模型的出現(xiàn)和快速發(fā)展,深度學(xué)習(xí)領(lǐng)域正在經(jīng)歷一場(chǎng)翻天覆地的變化。這些突破性的架構(gòu)不僅重新定義了自然語(yǔ)言處理(NLP)的標(biāo)準(zhǔn),而且拓寬了視野,徹底改變了AI的許多方面。
    的頭像 發(fā)表于 06-10 14:24 ?359次閱讀
    <b class='flag-5'>Transformer</b>架構(gòu)概述

    大象機(jī)器人攜手進(jìn)迭時(shí)空推出 RISC-V 全棧開源六軸機(jī)械臂產(chǎn)品

    集成于同一硬件平臺(tái)。內(nèi)置RISC-V AI核,接入ONNXRuntime加速框架,可快速部署Transformer、CNN等主流算法,實(shí)現(xiàn)視覺跟蹤、語(yǔ)音交互與自主決策的一體化應(yīng)用。 低門檻開發(fā) 提供
    發(fā)表于 04-25 17:59

    科通技術(shù)推出DeepSeek+AI芯片全場(chǎng)景方案

    2025年,隨著DeepSeek新版本的開源,AI技術(shù)掀起了全球普及的浪潮。在這股浪潮中,AI芯片作為關(guān)鍵算力支撐,其應(yīng)用場(chǎng)景不斷拓展,從云端到本地,再到終端設(shè)備,
    的頭像 發(fā)表于 03-24 10:33 ?689次閱讀

    浙江大學(xué)杭州國(guó)際科創(chuàng)中心推出全球最快四足機(jī)器人

    2 月 8 日消息,據(jù)央視新聞今日?qǐng)?bào)道,浙江大學(xué)杭州國(guó)際科創(chuàng)中心最新推出了全球最快四足機(jī)器人“黑豹”,其整體重量為 38 公斤,站立高度 0.63 米。 科研人員介紹,在測(cè)試中黑豹可以穩(wěn)定地跑出
    的頭像 發(fā)表于 02-10 09:40 ?555次閱讀

    如何使用MATLAB構(gòu)建Transformer模型

    Transformer 模型在 2017 年由 Vaswani 等人在論文《Attentionis All You Need》中首次提出。其設(shè)計(jì)初衷是為了解決自然語(yǔ)言處理(Nature
    的頭像 發(fā)表于 02-06 10:21 ?4082次閱讀
    如何使用MATLAB構(gòu)建<b class='flag-5'>Transformer</b>模型

    transformer專用ASIC芯片Sohu說(shuō)明

    的舊圖像模型,也不能運(yùn)行CNN、RNN或LSTM。 但對(duì)于transformer來(lái)說(shuō),Sohu是有史以來(lái)最快芯片。 借助Llama 70B每秒超過(guò)50萬(wàn)個(gè)token的吞吐量,Sohu可以讓您構(gòu)建在GPU上無(wú)法實(shí)現(xiàn)的產(chǎn)品
    的頭像 發(fā)表于 01-06 09:13 ?1169次閱讀
    <b class='flag-5'>transformer</b>專用ASIC<b class='flag-5'>芯片</b>Sohu說(shuō)明

    Transformer模型的具體應(yīng)用

    如果想在 AI 領(lǐng)域引領(lǐng)一輪新浪潮,就需要使用到 Transformer
    的頭像 發(fā)表于 11-20 09:28 ?1575次閱讀
    <b class='flag-5'>Transformer</b>模型的具體應(yīng)用

    Transformer模型能夠做什么

    盡管名為 Transformer,但它們不是電視銀幕上的變形金剛,也不是電線桿上垃圾桶大小的變壓器。
    的頭像 發(fā)表于 11-20 09:27 ?1024次閱讀
    <b class='flag-5'>Transformer</b>模型能夠做什么

    英偉達(dá)推出歸一化Transformer,革命性提升LLM訓(xùn)練速度

    英偉達(dá)團(tuán)隊(duì)近日在AI領(lǐng)域投下了一枚震撼彈,他們提出了一種全新的神經(jīng)網(wǎng)絡(luò)架構(gòu)——?dú)w一化Transformer(nGPT)。這一創(chuàng)新架構(gòu)基于超球面(hypersphere)進(jìn)行表示學(xué)習(xí),為AI領(lǐng)域帶來(lái)
    的頭像 發(fā)表于 10-23 11:30 ?886次閱讀

    天璣9400權(quán)威測(cè)試AI能跑分第一,領(lǐng)跑行業(yè)

    聯(lián)發(fā)科近日隆重推出其最新旗艦芯片——天璣9400,這款芯片是天璣家族的第二代全大核SoC,并且成為首款集成智能體AI的5G旗艦芯片。在繼天璣9300成功將生成式
    的頭像 發(fā)表于 10-14 14:57 ?945次閱讀
    天璣9400權(quán)威測(cè)試<b class='flag-5'>AI</b>性<b class='flag-5'>能跑</b>分第一,領(lǐng)跑行業(yè)

    澎峰科技受邀參加全球AI芯片峰會(huì),探討大模型推理引擎PerfXLM面向RISC-V的移植和優(yōu)化

    2024全球AI芯片峰會(huì),9月6-7日北京開啟! 9月6-7日,2024全球AI芯片峰會(huì)(GAC
    的頭像 發(fā)表于 09-05 16:22 ?617次閱讀
    澎峰科技受邀參加<b class='flag-5'>全球</b><b class='flag-5'>AI</b><b class='flag-5'>芯片</b>峰會(huì),探討大模型推理引擎PerfXLM面向RISC-V的移植和優(yōu)化

    北京見 | 賽昉科技邀您參加2024全球AI芯片峰會(huì)

    9月6-7日,2024全球AI芯片峰會(huì)(GACS2024)將在北京遼寧大廈盛大舉辦。全球AI芯片
    的頭像 發(fā)表于 09-04 08:03 ?665次閱讀
    北京見 | 賽昉科技邀您參加2024<b class='flag-5'>全球</b><b class='flag-5'>AI</b><b class='flag-5'>芯片</b>峰會(huì)

    氟化液 | 液冷在AI芯片降溫的應(yīng)用

    當(dāng)前各種AI大模型如火如荼,推動(dòng)全球算力需求呈現(xiàn)爆炸式增長(zhǎng),伴隨著算力需求的增長(zhǎng),全球電力、功耗方面的成本不斷增加。據(jù)相關(guān)統(tǒng)計(jì),AI算力下主流芯片
    的頭像 發(fā)表于 07-27 08:10 ?1204次閱讀
    氟化液 | 液冷在<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>降溫的應(yīng)用
    主站蜘蛛池模板: 我把美女日出白浆 | 日本欧美强乱视频在线 | 我把美女日出白浆 | 午夜高清免费观看视频 | 琪琪see色原网一区二区 | 韩国三级hd中文字幕久久精品 | 康熙古代高h细节肉爽文全文 | 高清性色生活片欧美在线 | 国产免费一区二区三区香蕉精 | 你懂的网站在线 | 午夜精品久久久久久久久 | 欧美大香a蕉免费 | 欧美日韩一区二区三区视频在线观看 | 四虎国产一区二区三区 | japanese色系tube日本护士 | 欧美色影视 | 色秀视频免费网站在线观看 | 亚洲激情婷婷 | 国产精品丝袜在线观看 | 美国一级做a一级爱视频 | 国产一区中文字幕 | 韩国三级中文 | 午夜免费观看_视频在线观看 | 国产三级精品三级在线观看 | 欧美精品黑人性xxxx | 亚洲经典乱码在线播 | 国产女人伦码一区二区三区不卡 | 美女视频网站色 | 国产精品视频久久久久 | 色综合久久九月婷婷色综合 | 天堂视频免费在线观看 | jiuse在线| 色综合久久88色综合天天 | 伊人不卡久久大香线蕉综合影院 | 色老二精品视频在线观看 | 国产chinesetube | 亚洲已满18点击进入在线观看 | 婷婷色九月综合激情丁香 | 91大神在线观看精品一区 | 色婷婷亚洲 | 国产精品天天爽夜夜欢张柏芝 |