在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌Gemini模型AI網(wǎng)絡(luò)及TPU拆解

智能計(jì)算芯世界 ? 來源:智能計(jì)算芯世界 ? 2023-12-14 09:55 ? 次閱讀

Gemini 是一款新型的多模態(tài)大語言模型,此前多模態(tài)大模型在處理視頻、文字、圖像等多維度輸入信息時是采用分別訓(xùn)練分別輸出再進(jìn)行拼接的方式,這種方式的缺點(diǎn)在于面對復(fù)雜邏輯問題時,大模型的回復(fù)略顯遲鈍。

Gemini 采用了全新的訓(xùn)練方式,直接在多模態(tài)數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練,并利用額外的多模態(tài)數(shù)據(jù)進(jìn)行微調(diào),因而可在處理復(fù)雜邏輯問題上更加智能

下載鏈接:

Gemini 模型一共包括三個版本,可以在不同設(shè)備上進(jìn)行使用。

8765a7fc-9a11-11ee-8b88-92fbcf53809c.png

1)Gemini Nano—端側(cè)設(shè)備上最高效的模型。這款模型專為智能手機(jī)設(shè)計(jì),可以在沒有連接外部服務(wù)器的情況下完成 AI 處理任務(wù)。

2)Gemini Pro—運(yùn)行在谷歌數(shù)據(jù)中心。Pro 版本將在最新版本的 AI 聊天機(jī)器人 Bard 提供支持,是 Bard推出以來的最大升級。目前為 170 多個國家和地區(qū)提供英語服務(wù),計(jì)劃未來幾個月內(nèi)支持新的語言和地區(qū),并應(yīng)用于搜索、廣告、Chrome 和 Duet AI 等更多谷歌產(chǎn)品

3)Gemini Ultra —規(guī)模最大且功能最強(qiáng)大的模型,專用于高度復(fù)雜的任務(wù),會在完成當(dāng)前測試階段后的明年初向開發(fā)者和企業(yè)客戶提供。屆時還會推出基于 Gemini Ultra 的 Bard Advanced 更新版本。

Gemini 模型訓(xùn)練基于谷歌自研 TPU 芯片,發(fā)布 TPU v5P,性能全部升級。谷歌較早就開始布局 AI 市場,2015 年便發(fā)布了專門用于 AI 領(lǐng)域的專用芯片 TPU v1,2015 年至今,谷歌已經(jīng)完成了五個版本的迭代。目前現(xiàn)階段谷歌展示的 Gemini 1.0 模型就是基于 TPU v4 和 TPU v5e 兩類芯片來完成訓(xùn)練過程。

在發(fā)布 Gemini 模型的同時,谷歌發(fā)布了最新的 TPU v5p 系列。v5p 進(jìn)一步增強(qiáng)了方案可拓展性,并為了應(yīng)對復(fù)雜模型的推理訓(xùn)練與調(diào)整需求,設(shè)計(jì)了新的硬件架構(gòu)。在 v5p 構(gòu)建的集群,每個 Pod 計(jì)算單元由 8960顆芯片互聯(lián),數(shù)量較之前的版本翻倍。計(jì)算性能上,新的 pod 浮點(diǎn)運(yùn)算能力相比 v4 提升了兩倍,訓(xùn)練速度相比 v4 提升 2.8 倍以上。

谷歌 TPU:創(chuàng)新網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),采用光交換技術(shù)(OCS)。傳統(tǒng)數(shù)據(jù)中心網(wǎng)絡(luò)結(jié)構(gòu)為 leaf-spine 葉脊架構(gòu),英偉達(dá) AI 集群采用的是無收斂胖拓?fù)浣Y(jié)構(gòu),谷歌的 AI 網(wǎng)絡(luò)集群在 spine 層進(jìn)行創(chuàng)新,用 OCS 交換機(jī)(光路開關(guān),optical circuit switch)代替?zhèn)鹘y(tǒng)的電交換機(jī)(以太網(wǎng)交換機(jī))。傳統(tǒng)數(shù)據(jù)中心在 spine 層需要進(jìn)行大量的電光轉(zhuǎn)換,會產(chǎn)生較多的功耗,并且隨著數(shù)據(jù)量增加 spine 層每 2-3 年都需要進(jìn)行更換。谷歌的 OCS 的目的是替代當(dāng)下的電網(wǎng)絡(luò)交換機(jī),從而實(shí)現(xiàn)近一步成本和功耗的降低。

8782ff00-9a11-11ee-8b88-92fbcf53809c.png

谷歌的 OCS 稱為為 Palomar,內(nèi)部結(jié)構(gòu)為:輸入輸出為光纖準(zhǔn)直器陣列,光纖準(zhǔn)直器包括光纖陣列和微透鏡陣列,輸入和數(shù)據(jù)均為 136 個通道(128 個端口+8 個備用端口)。當(dāng)光通過光纖進(jìn)入 OCS 系統(tǒng)后,會通過兩個 2D 的 MEMS 陣列,每個 MEMS 陣列含有 136 個平面鏡,用于調(diào)整光的傳播方向。波長為 850nm。

87a4a9fc-9a11-11ee-8b88-92fbcf53809c.png

谷歌 AI 網(wǎng)絡(luò)結(jié)構(gòu)拆解:TPU v4 為例。在 TPU v4 網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)時候,每個基礎(chǔ)單元是 4*4*4=64 顆 TPU 組成,每個面有 16 個鏈路,因此每個單元一共有 16*6=96 個鏈路連接到 OCS 的光鏈路.此外因?yàn)樘峁?3D 環(huán)面的環(huán)繞鏈接,相對側(cè)的鏈接必須連接到同一個 OCS。因此,每個基礎(chǔ)單元需要 6×16/2=48 個 OCS。

87bcb236-9a11-11ee-8b88-92fbcf53809c.png

谷歌 TPU v4 支持 4096 顆 TPU 互聯(lián),具體方案為一共使用 64 個機(jī)柜,每個機(jī)柜內(nèi)部構(gòu)建 4*4*4=64 顆 TPU的 3D 網(wǎng)絡(luò)結(jié)構(gòu),其中 3D 結(jié)構(gòu)的外表部分連接到 OCS,中間部分采用無源電纜互聯(lián)。在 4096 顆 TPU 互聯(lián)的系統(tǒng)中一共使用 48 了個 OCS,每個 OCS128 個端口。此外因?yàn)?OCS 本身直接進(jìn)行光信號的傳輸,所以每個端口只需要 1 個光模塊。因?yàn)樵摷盒枰?48*128=6144 個光模塊。TPU:光模塊用量=4096:6144=1:1.5

AMD MI300X 對標(biāo)英偉達(dá) H100。MI300X 由臺積電代工,基于自研的第三代 CDNA 架構(gòu),集成了 1530 億個晶體管

對比英偉達(dá) H100,集成了 800 億個晶體管。在性能指標(biāo)上:1)AI 芯片算力:8 位精度浮點(diǎn)數(shù)(FP8)計(jì)算水平來看,MI300X 為 42petaFLOPs(每秒千萬億次浮點(diǎn)運(yùn)算),H100 則為 32petaFLOPs;2)內(nèi)存:MI300X為 192GB,英偉達(dá) H109 為 120GB。目前,集合 8 張 MI300X 的 Instinct 工作臺已經(jīng)可以支持運(yùn)行 Llama2(700 億參數(shù))、BLOOM(1760 億參數(shù))大模型的訓(xùn)練與推理。

MI300A:首款高性能 APU。具體參數(shù)上,MI300A 具有 228 個 CDNA3 架構(gòu)的計(jì)算核心,24 個 Zen4 架構(gòu)的 X86核心,4 個 I/O DIe,8 個 HBM3,128GB 顯存,5.3TB 峰值帶寬,256MB 的 Infinity 緩存,采用 3.5D 的封裝形式。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6196

    瀏覽量

    106017
  • Gemini
    +關(guān)注

    關(guān)注

    0

    文章

    56

    瀏覽量

    7617
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31536

    瀏覽量

    270344
  • 語言模型
    +關(guān)注

    關(guān)注

    0

    文章

    538

    瀏覽量

    10342
  • TPU
    TPU
    +關(guān)注

    關(guān)注

    0

    文章

    144

    瀏覽量

    20784

原文標(biāo)題:谷歌Gemini模型AI網(wǎng)絡(luò)及TPU拆解

文章出處:【微信號:AI_Architect,微信公眾號:智能計(jì)算芯世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    谷歌揭秘Gemini,AMD對峙英偉達(dá)

    今天,我們看到谷歌揭開了多模態(tài)AI模型Gemini的神秘面紗,AMD挑戰(zhàn)英偉達(dá)在AI芯片市場的霸主地位,微軟在英國
    的頭像 發(fā)表于 12-07 20:05 ?801次閱讀

    成都匯陽投資關(guān)于谷歌Gemini 王者歸來,AI 算力和應(yīng)用值得期待

    Gemini模型主打多模態(tài),性能對標(biāo)GPT-4】 當(dāng)?shù)貢r間12月6日, 谷歌公司宣布推出其規(guī)模最大、功能最強(qiáng)的多模態(tài)大模型 Gemini
    的頭像 發(fā)表于 12-11 14:40 ?958次閱讀
    成都匯陽投資關(guān)于<b class='flag-5'>谷歌</b>攜 <b class='flag-5'>Gemini</b> 王者歸來,<b class='flag-5'>AI</b> 算力和應(yīng)用值得期待

    谷歌發(fā)布多模態(tài)Gemini模型及新一代TPU系統(tǒng)Cloud TPU v5p

    谷歌亦發(fā)布新一代TPU 系統(tǒng)——Cloud TPU v5p,以幫助訓(xùn)練尖端的 AI 模型。目
    的頭像 發(fā)表于 12-12 10:50 ?1472次閱讀
    <b class='flag-5'>谷歌</b>發(fā)布多模態(tài)<b class='flag-5'>Gemini</b>大<b class='flag-5'>模型</b>及新一代<b class='flag-5'>TPU</b>系統(tǒng)Cloud <b class='flag-5'>TPU</b> v5p

    谷歌最新人工智能模型Gemini Pro已在歐洲上市

    近日,谷歌宣布其最新人工智能模型Gemini Pro已在歐洲市場上市,向歐洲用戶開放。Gemini Pro是谷歌最大的人工智能(
    的頭像 發(fā)表于 02-04 15:10 ?1286次閱讀

    谷歌AI聊天機(jī)器人改名為Gemini

    谷歌(Google)近日宣布,旗下備受矚目的AI聊天機(jī)器人Bard正式更名為Gemini,并推出了一款功能更加強(qiáng)大的付費(fèi)版本——Gemini Advanced。這一戰(zhàn)略調(diào)整旨在與微軟、
    的頭像 發(fā)表于 02-18 11:28 ?1203次閱讀

    谷歌計(jì)劃重新推出改進(jìn)后的Gemini AI模型人像生成功能

    谷歌DeepMind的首席執(zhí)行官德米斯·哈薩比斯在2月26日透露,公司計(jì)劃在接下來的幾周內(nèi)重新發(fā)布其備受關(guān)注的Gemini AI模型人像生成功能。此前,由于在某些歷史圖像生成描述中出現(xiàn)
    的頭像 發(fā)表于 02-28 10:17 ?659次閱讀

    蘋果與谷歌洽談合作,Gemini AI模型有望嵌入iPhone

    在人工智能領(lǐng)域日益升溫的競爭格局中,蘋果公司再次展現(xiàn)出其敏銳的戰(zhàn)略眼光。據(jù)可靠消息人士透露,蘋果正積極與谷歌展開談判,旨在將谷歌最新的生成式人工智能模型Gemini植入其iPhone系
    的頭像 發(fā)表于 03-20 10:05 ?582次閱讀

    谷歌Google Calendar、Tasks與Keep應(yīng)用中成功整合Gemini模型

    谷歌于今日發(fā)布的I/O 2024開發(fā)者大會新聞中展現(xiàn)了其在Google Calendar, Tasks以及Keep應(yīng)用中整合Gemini模型的最新進(jìn)展,為用戶呈現(xiàn)出更為智能化的使用體驗(yàn)。
    的頭像 發(fā)表于 05-15 11:10 ?401次閱讀

    谷歌發(fā)布新一代TPU芯片,欲挑戰(zhàn)OpenAI,挑戰(zhàn)語音助手市場

    當(dāng)日,谷歌在年度I/O開發(fā)者大會上展示了一系列人工智能產(chǎn)品,包括新增的旗艦級Gemini AI模型Gemini 1.5 Flash以及
    的頭像 發(fā)表于 05-17 09:36 ?481次閱讀

    谷歌Gemini 1.5 Flash模型升級,AI聊天速度飆升50%

    谷歌近期對其Gemini AI系列進(jìn)行了重大更新,推出了Gemini 1.5 Flash模型。此次升級的核心亮點(diǎn)在于顯著提升了
    的頭像 發(fā)表于 09-06 18:06 ?845次閱讀

    谷歌計(jì)劃12月發(fā)布Gemini 2.0模型

    近日,有消息稱谷歌計(jì)劃在12月發(fā)布其下一代人工智能模型——Gemini 2.0。這一消息引發(fā)了業(yè)界的廣泛關(guān)注,因?yàn)?b class='flag-5'>谷歌在人工智能領(lǐng)域一直保持著領(lǐng)先地位,而
    的頭像 發(fā)表于 10-29 11:02 ?755次閱讀

    谷歌發(fā)布Gemini 2.0 AI模型

    谷歌近日正式推出了新一代AI模型——Gemini 2.0。此次更新引入了名為“深度研究”的新特性,旨在為用戶提供更加全面和深入的復(fù)雜主題探索與報(bào)告撰寫輔助。
    的頭像 發(fā)表于 12-12 10:13 ?307次閱讀

    谷歌發(fā)布“深度研究”AI工具,利用Gemini模型進(jìn)行網(wǎng)絡(luò)信息檢索

    據(jù)外媒最新報(bào)道,谷歌近期發(fā)布了一款名為“深度研究”的先進(jìn)AI工具。這款工具借助其內(nèi)部的Gemini大型語言模型,實(shí)現(xiàn)了對網(wǎng)絡(luò)信息的高效檢索與
    的頭像 發(fā)表于 12-16 09:35 ?291次閱讀

    借助谷歌Gemini和Imagen模型生成高質(zhì)量圖像

    在快速發(fā)展的生成式 AI 領(lǐng)域,結(jié)合不同模型的優(yōu)勢可以帶來顯著的成果。通過利用谷歌Gemini 模型來制作詳細(xì)且富有創(chuàng)意的提示,然后使用
    的頭像 發(fā)表于 01-03 10:38 ?404次閱讀
    借助<b class='flag-5'>谷歌</b><b class='flag-5'>Gemini</b>和Imagen<b class='flag-5'>模型</b>生成高質(zhì)量圖像

    谷歌Gemini AI目標(biāo)年底用戶達(dá)5億

    近日,谷歌CEO桑達(dá)爾·皮查伊在內(nèi)部會議上向員工透露,他對公司自主研發(fā)的Gemini AI技術(shù)充滿信心,認(rèn)為其能力已經(jīng)超越了當(dāng)前的競爭對手。這一表態(tài)不僅彰顯了谷歌
    的頭像 發(fā)表于 01-18 11:30 ?546次閱讀
    主站蜘蛛池模板: 日本色婷婷 | 欧美疯狂爱爱xxxxbbbb | 亚洲综合丁香 | 成年ssswww日本 | 乱子伦xxxx厨房 | 天堂va欧美ⅴa亚洲va一国产 | 69japanese日本100 69ww免费视频播放器 | 免费视频播放 | 456性欧美欧美在线视频 | 亚洲一级影院 | 亚洲五月激情综合图片区 | 手机视频在线播放 | 天天干天天操天天舔 | 色系视频在线观看免费观看 | 天天做天天爰夜夜爽 | 午夜福利国产一级毛片 | 久久久噜噜噜久久中文字幕色伊伊 | 久久久夜色精品国产噜噜 | 色综合色综合色综合网址 | 人人干97| 免费人成黄页在线观看1024 | 玖玖精品国产 | 五月国产综合视频在线观看 | 天天综合网天天综合色不卡 | 午夜精品久久久久久91 | 亚洲国产成人精品不卡青青草原 | 手机在线看片你懂得 | 国产乱理论片在线观看理论 | 国内一级特黄女人精品毛片 | 天天草b| 亚洲三级免费 | 国产gaysexchina男同men1068 | 一区二区三区高清 | 九九涩 | 欧美成人天天综合天天在线 | 美女免费视频色在线观看 | 亚洲国产精品婷婷久久 | 狠狠摸狠狠操 | 日本加勒比在线视频 | 四虎精品影院2022 | 亚洲va中文字幕 |