在日前舉辦的英偉達(dá) GTC China 2019大會上,“教主”黃仁勛發(fā)布了一系列新品,其中TensorRT 的最新版本TensorRT 7令人矚目,相比去年發(fā)布的TensorRT 5,TensorRT 7 可支持各種類型的 RNN、transformer、CNN,能夠融合水平與垂直方向的運(yùn)算,支持 1000 多種不同的計算變換和優(yōu)化。黃仁勛舉例,有了 TensorRT 7 的支持,在 GPU 上編譯會話模型只需要0.3秒。
TensorRT 7的典型應(yīng)用,是支持交互式會話AI,為實(shí)現(xiàn)更加智能的AI人機(jī)交互打開了新大門。在大會期間,英偉達(dá)加速計算產(chǎn)品管理總監(jiān)Paresh Kharya等人接受采訪,對TensorRT 7新平臺、兼容ARM等熱門話題進(jìn)行了解讀。
支撐會話式AI全流程
Paresh Kharya介紹,AI技術(shù)正在取得長足進(jìn)展,最新的應(yīng)用包括會話式AI和推薦系統(tǒng)。其中,會話式AI是一個非常復(fù)雜的任務(wù),需要AI理解語音、文本、語言,整個過程分為三個部分:識別你所說的,將你所說的話轉(zhuǎn)化為文字,理解這些文字并轉(zhuǎn)化成語言再說出來。隨著英偉達(dá)不斷發(fā)布新版本,TensorRT 7可以完成三個流程計算,從語音識別到語義理解再到語音輸出。
“要想把會話式AI做得有用,需要符合兩個條件,要在300毫秒內(nèi)將整個三部分完成,而且要完成的非常智能。在這個過程當(dāng)中,有非常多的復(fù)雜模型需要計算,Tensor RT也在不斷完善。” Paresh Kharya表示。
“推薦系統(tǒng)也是至關(guān)重要的一環(huán),甚至已成為了互聯(lián)網(wǎng)最重要的引擎。” Paresh Kharya強(qiáng)調(diào),用戶面臨的選擇越來越多,網(wǎng)絡(luò)的信息量呈現(xiàn)爆炸式增長,包括商品、視頻,以及各類選擇的參數(shù)的數(shù)量都在爆炸式增長。“商品達(dá)到數(shù)十億級別,網(wǎng)絡(luò)視頻百萬量級增長,新聞每天都在產(chǎn)生海量數(shù)據(jù)。阿里巴巴、百度,都使用了英偉達(dá)的平臺支持他們的推薦系統(tǒng)。”
這些信息在實(shí)時、動態(tài)的變化過程中,只有不斷對模型進(jìn)行訓(xùn)練,才可以有效地推薦。訓(xùn)練模型需要大量算力,英偉達(dá)提供了不斷更新的各類工具和軟件,比如最新的軟件Tensor RT 7,支持各類模型在各種情景下的部署,支持上百萬的用戶在每秒內(nèi)做數(shù)十億次的搜索。
例如,阿里的邊緣系統(tǒng)如果在英偉達(dá)的GPU上跑,每秒可以做780次查詢;但是如果用CPU,每秒只能做3次查詢。
與ARM合作,給客戶更多選擇
本次大會上,英偉達(dá)還宣布ARM處理器可以使用其GPU加速技術(shù)、NVIDIA Magnum IO套件,以及在Microsoft Azure上使用的新型云加速GPU超級計算機(jī)等。換句話說,英偉達(dá)將全方位擴(kuò)展高性能計算領(lǐng)域。
Paresh Kharya指出,ARM是被業(yè)界廣泛使用的架構(gòu),服務(wù)全球1500億臺設(shè)備。其成功的一個重要原因是開放平臺,各家公司都能夠在ARM架構(gòu)上進(jìn)行創(chuàng)新,ARM也能夠提供互聯(lián)、內(nèi)存、CPU內(nèi)核、計算能力等各種功能。英偉達(dá)將通過CUDA平臺和ARM架構(gòu)進(jìn)行兼容,在高性能計算領(lǐng)域,給客戶更多選擇。
“加速計算和過去以CPU為基礎(chǔ)的計算很不一樣,性能提升是20、30甚至是100倍的。原因不僅是在架構(gòu)上進(jìn)行了設(shè)計,更重要的是通過軟件優(yōu)化和支撐。比如我們有各種各樣的平臺,像應(yīng)用在醫(yī)療領(lǐng)域的Clara平臺,應(yīng)用在自動駕駛領(lǐng)域的Drive以及Isaac,做到了硬件和軟件的結(jié)合。” Paresh Kharya表示。
當(dāng)前,對于GPU,業(yè)界既用于圖像處理,也有一些特別的客戶會剝離圖像處理能力,專注于加速技術(shù)應(yīng)用。Paresh Kharya認(rèn)為,英偉達(dá)豐富的產(chǎn)品線,能夠滿足客戶的差異化需求,例如應(yīng)用于數(shù)據(jù)中心的GPU就沒有圖像處理部分,通過Tensor Core做AI加速計算。一些新品如RTX6000、RTX8000,則圖像處理和AI加速功能兼具。“我們的優(yōu)勢是統(tǒng)一的架構(gòu)應(yīng)用于各種工作負(fù)載當(dāng)中實(shí)現(xiàn)加速計算,這意味著在各個行業(yè)中、各種各樣的商業(yè)機(jī)會。”
業(yè)界人士云集GTC China 2019
責(zé)任編輯:gt
-
處理器
+關(guān)注
關(guān)注
68文章
19409瀏覽量
231189 -
ARM
+關(guān)注
關(guān)注
134文章
9168瀏覽量
369217 -
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3848瀏覽量
91977
發(fā)布評論請先 登錄
相關(guān)推薦
藍(lán)鵬測控數(shù)據(jù)采集新平臺適配機(jī)型 再添一款雙軸測徑儀
英偉達(dá)進(jìn)軍ARM架構(gòu)CPU市場,預(yù)計2025年推出新產(chǎn)品線
ARM進(jìn)軍GPU領(lǐng)域,挑戰(zhàn)英偉達(dá)與英特爾
英偉達(dá)驅(qū)動與舊處理器不兼容,致Windows系統(tǒng)頻繁藍(lán)屏
IR600怎樣從c.inhand.com.cn平臺遷移c.inhandcloud.com平臺
如何將IR912路由器從c.inhand.com.cn遷移至iot.inhand.com.cn平臺
谷歌數(shù)據(jù)中心處理器市占率躍升,超越AMD僅次于英偉達(dá)和英特爾
進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級芯片
聯(lián)發(fā)科或?qū)⑴c英偉達(dá)開發(fā)Arm架構(gòu)AI PC處理器
聯(lián)發(fā)科與英偉達(dá)聯(lián)手研發(fā)AI PC處理器
英偉達(dá)Blackwell新平臺使CoWoS封裝總產(chǎn)能提升150%
Arm推出汽車增強(qiáng)處理器及虛擬平臺,縮短人工智能汽車開發(fā)周期
英偉達(dá)推出有2080億晶體管的GB200處理器
英偉達(dá)推出有2080億晶體管的GB200處理器
新平臺全面升級:德承海量展示多款A(yù)lder Lake平臺工業(yè)電腦及工業(yè)平板電腦
![<b class='flag-5'>新平臺</b>全面升級:德承海量展示多款A(yù)lder Lake<b class='flag-5'>平臺</b>工業(yè)電腦及工業(yè)平板電腦](https://file1.elecfans.com/web2/M00/C2/4D/wKgaomXdlV-APdCwAALCZQK4JSk193.png)
評論