在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

技術干貨 | AI浪潮下的光模塊可靠性

廣電計量 ? 2024-08-13 09:37 ? 次閱讀

人工智能AI)技術的快速發(fā)展對數(shù)據(jù)處理和傳輸提出了前所未有的挑戰(zhàn)。在深度學習、自然語言處理和計算機視覺等AI應用中,訓練和學習需要巨大的數(shù)據(jù)量傳遞和交互。2023年GPT-4模型所需訓練的參數(shù)量有1.8萬億,要完成這么大的數(shù)據(jù)量的運算,需要上萬個GPU同時工作。如此龐大的數(shù)據(jù)傳輸對于傳統(tǒng)銅纜而言是個巨大的挑戰(zhàn),因此光模塊在數(shù)據(jù)傳輸中發(fā)揮著非常重要的作用。光模塊在AI和數(shù)據(jù)中心中負責數(shù)據(jù)的轉換,將1bit的電信號轉為光信號,把1bit的光信號轉為電信號。400G模塊,能轉換0.4T bit,800G光模塊,轉換0.8T bit,以GPT-4的訓練參數(shù)計算,完成一次計算所需要調用的光模塊數(shù)量就可能多達數(shù)萬。而隨著大模型的不斷進化和訓練參數(shù)的急速增加,對光模塊的需求量只多不少。

AI場景對光模塊的故障率要求

因為訓練數(shù)據(jù)量大,所以AI場景架構采用GPU運算更合適,這與傳統(tǒng)的數(shù)據(jù)中心的服務器類型有所區(qū)別。CPU是串行運算,通常有較少的核心(一般在2到32個核心之間),每個核心都非常強大,適合執(zhí)行復雜的單線程任務,適用于傳統(tǒng)數(shù)據(jù)中心的串行結構。GPU是并行運算,擁有大量的核心(數(shù)百到數(shù)千個),每個核心較簡單,適合執(zhí)行大量的并行任務,因此更適用數(shù)據(jù)量超大的AI場景。傳統(tǒng)的數(shù)據(jù)中心結構,是基于串行方式的,對時延的要求雖然很看重,但不像AI場景中對時延的苛刻要求。并行任務的結果就是成千上萬的并行數(shù)據(jù)要傳輸,整個數(shù)據(jù)的完成是以時延最大,最慢的那個bit為準的。其他再快也不行。

光模塊的故障率比傳統(tǒng)的電學芯片的要高很多很多,光模塊選擇熱插拔,也是因為光學器件的故障率很高,用熱插拔方便維修和更換。傳統(tǒng)的數(shù)據(jù)中心,光模塊對于故障率的要求比傳統(tǒng)通信更寬松,少量的故障并不會影響到整體的運行傳輸,所以遇到光模塊故障后及時更換就可以了。但對于基于AI的這種場景就不適用,大數(shù)據(jù)量的并行計算,而且不是實時保存的。如果有任何一個數(shù)據(jù)傳錯了,那么整體要重來,重新計算一遍。中國移動也曾提到當前人工智能中主流萬卡集群的GPU網(wǎng)絡每月最大會發(fā)生上千次閃斷,其中34%是與網(wǎng)絡相關。其中每年大概會有60次左右的光模塊故障導致的訓練中斷,而且故障定位也通常會需要數(shù)天到數(shù)十天之久。所以光模塊失效率高會導致大的丟包率和維護成本,從而給設備服務商帶來巨大的運營壓力。因此在AI場景中對光模塊可靠性的要求非常苛刻。

AI大模型中丟包率導致訓練所需時間增長

圖1 AI大模型中丟包率導致訓練所需時間增長

AI場景光模塊的可靠性問題

綜上所述,對于傳統(tǒng)數(shù)據(jù)中心而言,一般會把可靠性的要求放寬,是因為通常在實際部署中,數(shù)據(jù)中心的樹形網(wǎng)絡結構是配置了冗余的,從而這此前提下放寬了對模塊故障率的要求。冗余越大,有更多的節(jié)點可以實現(xiàn)業(yè)務傳輸,光模塊的失效率略大一些是不影響整體通信的。因此傳統(tǒng)數(shù)據(jù)中心的光模塊,有很長一段時間,是非氣密封裝,因為非氣密封裝,故障率會高一些,但成本也會下降很多。

但AI大模型與傳統(tǒng)數(shù)據(jù)中心不同,AI場景所采用的并行計算,如上一節(jié)所講,對故障零容忍,對光模塊的穩(wěn)定性要求極高。因此,非氣密封裝已經不能滿足可靠性要求了,各家廠商又開始使用氣密封裝降低失效率。光模塊中產生的可靠性問題主要是光器件失效引起的,包括激光器、探測器和其他元器件,其中激光器失效最高。阿里曾經做過統(tǒng)計,在光模塊眾多的元器件中,超過90%以上的失效是與激光器相關的。

wKgaoma6uNSAfvtSAABrvbSmEgA777.png

圖2 阿里統(tǒng)計的光模塊各元件失效占比統(tǒng)計

光模塊自身已經面臨非常高的可靠性風險了,然而光模塊從400G、800G發(fā)展到1.6T,模塊功耗隨著芯片功率、射頻損耗,DSP補償?shù)妊杆僭黾樱脑黾犹岣吡斯饽K實際的工作溫度,同樣也使得光模塊壽命急速縮短,可靠性急劇下降。光模塊溫度升高,激光器芯片的發(fā)光效率降低,廢熱更大,也會帶來可靠性風險。

功耗增加機柜溫度升高可靠性下降

圖3 功耗增加機柜溫度升高可靠性下降

現(xiàn)行可供參考的可靠性標準如GR-468,一方面從標準提出到現(xiàn)在已有二十余年時間,另一方面該標準是作為通信用光電子器件的可靠性標準,對AI場景并不適用。近年來,大模型使用方以及光模塊廠商都對光器件提出了更嚴格的可靠性要求。在2023年CIOE上,阿里提出了自身對于光芯片可靠性的認證要求,要求光模塊FIT小于125,即有1000個光模塊在工作,5年后,只允許5個出現(xiàn)故障。同時也對激活能Ea,和n做了限定,限定激活能 Ea=0.35,n=0。老化公式的n,是加速壓力的指數(shù),可以是電流,溫度,或者濕度,關鍵取決于芯片設計里哪個因素的影響最大。以電流為例,如果n按照3取值,老化電流是工作電流的1.5倍,得出激光器工作壽命是10年。如果相同條件下n取為0,那么壽命就只有3年了。Ea和n都取最小值,會得到很小的加速系數(shù),最終會計算出很大的FIT值,這樣一來對可靠性的要求就更為苛刻了。

wKgZoma6uNSAeTRlAAA_SKky0L0632.png

圖4 可靠性中加速系數(shù)計算公式

如何提升光模塊可靠性

光模塊的可靠性重點關注的就是激光器。激光器從發(fā)光原理、制造工藝來看,降低優(yōu)化的程度有限,并不能完全達到電芯片的尺度,近期內也不會有顛覆性的技術改良大幅提高可靠性。對于光模塊的可靠性控制重點還是在實際使用時的早期失效和隨機失效,早期失效可以通過選用一定參數(shù)的加速老化進行剔除,老化的條件,時間都需要通過科學的計算,避免老化時間過短剔除不到位或者時間過長降低產品壽命。對于隨機失效,目前有些方案如finisar等公司采用的備份激光器,通過增加多組激光器作為備用降低失效率,一個壞了立刻切到另一個好的激光器去工作,但是增加一組備份,成本、空間、功耗,又增加了很多難度。海思設計過一種智能光模塊,通過實時監(jiān)控光模塊多種參數(shù)狀態(tài),采用大數(shù)據(jù)訓練主動對光模塊做預警,提前判斷光模塊即將失效,這要求廠家對自身產品數(shù)據(jù)要有十分全面的掌握。

廣電計量光電器件可靠性分析

光模塊市場近兩年隨著AI浪潮的出現(xiàn)展現(xiàn)出了廣闊的想象空間,但也給光模塊的可靠性帶來了更高的挑戰(zhàn)。過去廠家不重視模塊的可靠性,缺乏對產品的失效評估,而現(xiàn)在解決產品可靠性問題,將會是占領用戶市場,打通產品從送樣到批量供貨的關鍵。

廣電計量是國內第一家完成激光發(fā)射器、探測器全套AEC-Q102車規(guī)認證的國有第三方上市檢測機構,具備VCSEL、LED、APD、SPAD等激光器和探測器批次性驗證試驗能力,具有豐富的光電器件可靠性驗證經驗。在人才隊伍上,形成以博士、專家為核心的光電器件測試分析團隊,可以協(xié)助客戶定制可靠性評估方案,建立準確的產品失效模型,滿足客戶在可靠性、失效分析領域的認證檢測需求。

廣電計量半導體服務優(yōu)勢

  • 工業(yè)和信息化部“面向集成電路、芯片產業(yè)的公共服務平臺”
  • 工業(yè)和信息化部“面向制造業(yè)的傳感器等關鍵元器件創(chuàng)新成果產業(yè)化公共服務平臺”
  • 國家發(fā)展和改革委員會“導航產品板級組件質量檢測公共服務平臺”
  • 廣東省工業(yè)和信息化廳“汽車芯片檢測公共服務平臺”
  • 江蘇省發(fā)展和改革委員會“第三代半導體器件性能測試與材料分析工程研究中心”
  • 上海市科學技術委員會“大規(guī)模集成電路分析測試平臺”

在集成電路及SiC領域是技術能力最全面、知名度最高的第三方檢測機構之一,已完成MCU、AI芯片、安全芯片等上百個型號的芯片驗證,并支持完成多款型號芯片的工程化和量產。

在車規(guī)領域擁有AEC-Q及AQG324全套服務能力,獲得了近50家車廠的認可,出具近400份AEC-Q及AQG324報告,助力100多款車規(guī)元器件量產。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    88

    文章

    34421

    瀏覽量

    275747
  • SiC
    SiC
    +關注

    關注

    31

    文章

    3171

    瀏覽量

    64537
  • 光模塊
    +關注

    關注

    80

    文章

    1394

    瀏覽量

    60090
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    可靠性測試包括哪些測試和設備?

    在當今競爭激烈的市場環(huán)境中,產品質量的可靠性成為了企業(yè)立足的根本。無論是電子產品、汽車零部件,還是智能家居設備,都需要經過嚴格的可靠性測試,以確保在各種復雜環(huán)境都能穩(wěn)定運行,為用戶提供可靠
    的頭像 發(fā)表于 06-03 10:52 ?126次閱讀
    <b class='flag-5'>可靠性</b>測試包括哪些測試和設備?

    提供半導體工藝可靠性測試-WLR晶圓可靠性測試

    隨著半導體工藝復雜度提升,可靠性要求與測試成本及時間之間的矛盾日益凸顯。晶圓級可靠性(Wafer Level Reliability, WLR)技術通過直接在未封裝晶圓上施加加速應力,實現(xiàn)快速
    發(fā)表于 05-07 20:34

    電機微機控制系統(tǒng)可靠性分析

    針對性地研究提高電機微機控制系統(tǒng)可靠性的途徑及技術措施:硬件上,方法包括合理選擇篩選元器件、選擇合適的電源、采用保護電路以及制作可靠的印制電路板等;軟件上,則采用了固化程序和保護 RAM 區(qū)重要數(shù)據(jù)等
    發(fā)表于 04-29 16:14

    IGBT的應用可靠性與失效分析

    包括器件固有可靠性和使用可靠性。固有可靠性問題包括安全工作區(qū)、閂鎖效應、雪崩耐量、短路能力及功耗等,使用可靠性問題包括并聯(lián)均流、軟關斷、電磁干擾及散熱等。
    的頭像 發(fā)表于 04-25 09:38 ?662次閱讀
    IGBT的應用<b class='flag-5'>可靠性</b>與失效分析

    頡晶圓電阻:高可靠性和耐久助力電子設備穩(wěn)定運行

    頡科技(Viking)作為行業(yè)領先的電子元器件制造商,憑借其先進的制造技術和嚴格的質量控制標準,推出了高性能的晶圓電阻。這些電阻不僅在精度和穩(wěn)定性上表現(xiàn)出色,還在可靠性和耐久方面展
    的頭像 發(fā)表于 04-10 17:52 ?230次閱讀
    <b class='flag-5'>光</b>頡晶圓電阻:高<b class='flag-5'>可靠性</b>和耐久<b class='flag-5'>性</b>助力電子設備穩(wěn)定運行

    **【技術干貨】Nordic nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機器學習的完美結合**

    技術干貨】nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機器學習的完美結合 近期收到不少伙伴咨詢nRF54系列芯片的應用與技術細節(jié),今天我們整理幾個核心問題與解答,帶你快速掌握如何在nRF
    發(fā)表于 04-01 00:00

    從IGBT模塊大規(guī)模失效爆雷看國產SiC模塊可靠性實驗的重要

    深度分析:從IGBT模塊可靠性問題看國產SiC模塊可靠性實驗的重要 某廠商IGBT模塊曾因
    的頭像 發(fā)表于 03-31 07:04 ?334次閱讀

    詳解晶圓級可靠性評價技術

    隨著半導體工藝復雜度提升,可靠性要求與測試成本及時間之間的矛盾日益凸顯。晶圓級可靠性(Wafer Level Reliability, WLR)技術通過直接在未封裝晶圓上施加加速應力,實現(xiàn)快速、低成本的
    的頭像 發(fā)表于 03-26 09:50 ?529次閱讀
    詳解晶圓級<b class='flag-5'>可靠性</b>評價<b class='flag-5'>技術</b>

    DeepSeek推動AI算力需求:800G模塊的關鍵作用

    和性能方面展現(xiàn)了出色的優(yōu)勢,滿足當前AI算力需求的快速增長。 高可靠性模塊經過溫度、靜電放電及機械耐久等嚴格測試,確保在數(shù)據(jù)中
    發(fā)表于 03-25 12:00

    IGBT模塊封裝:高效散熱,可靠性再升級!

    在電力電子領域,IGBT(絕緣柵雙極型晶體管)模塊作為關鍵的功率半導體器件,扮演著至關重要的角色。其封裝技術不僅直接影響到IGBT模塊的性能、可靠性和使用壽命,還關系到整個電力電子系統(tǒng)
    的頭像 發(fā)表于 03-18 10:14 ?655次閱讀
    IGBT<b class='flag-5'>模塊</b>封裝:高效散熱,<b class='flag-5'>可靠性</b>再升級!

    半導體集成電路的可靠性評價

    半導體集成電路的可靠性評價是一個綜合的過程,涉及多個關鍵技術和層面,本文分述如下:可靠性評價技術概述、
    的頭像 發(fā)表于 03-04 09:17 ?424次閱讀
    半導體集成電路的<b class='flag-5'>可靠性</b>評價

    如何測試耦的性能與可靠性

    耦作為電氣隔離的關鍵組件,其性能和可靠性直接影響到整個系統(tǒng)的穩(wěn)定性和安全。因此,對光耦進行嚴格的性能測試和可靠性評估是必不可少的。
    的頭像 發(fā)表于 01-14 16:13 ?1126次閱讀

    不同制造商TOPCon伏組件的老化測試:性能、穩(wěn)定性與可靠性

    隨著TOPCon技術市場份額的快速增長,對其可靠性評估需求迫切。盡管早期報告認為TOPCon比PERC更可靠,但該技術伏組件
    的頭像 發(fā)表于 12-05 01:06 ?1437次閱讀
    不同制造商TOPCon<b class='flag-5'>光</b>伏組件的老化測試:性能、穩(wěn)定性與<b class='flag-5'>可靠性</b>

    PCB高可靠性化要求與發(fā)展——PCB高可靠性的影響因素(上)

    可靠性提出了更為嚴格的要求,特別是在焊接點的結合力、熱應力管理以及焊接點數(shù)量的增加等方面。本文將探討影響PCB可靠性的關鍵因素,并分析當前和未來提高PCB可靠性的制造技術發(fā)展趨勢。
    的頭像 發(fā)表于 10-11 11:20 ?998次閱讀
    PCB高<b class='flag-5'>可靠性</b>化要求與發(fā)展——PCB高<b class='flag-5'>可靠性</b>的影響因素(上)

    晶科能源榮獲2024年伏組件可靠性“表現(xiàn)最佳”榮譽

    近日,晶科能源宣布其在Kiwa PVEL發(fā)布的2024年伏組件可靠性記分卡報告中斬獲“表現(xiàn)最佳”榮譽。
    的頭像 發(fā)表于 06-19 09:58 ?1002次閱讀
    主站蜘蛛池模板: 性日韩| 色综合天天综合网国产成人 | 成人午夜大片免费7777 | 欧美怡红院免费全部视频 | 超色视频 | 男女性高爱潮免费的国产 | 一级片免费在线观看 | 国产毛片哪里有 | 毛片三级在线观看 | 在线免费看高清视频大全 | 午夜色大片在线观看 | 国产成人综合自拍 | 69国产视频 | 国产激情电影综合在线看 | a色在线 | 四虎永久免费在线观看 | 亚洲视频免费一区 | 天堂网2018 | 人人爱人人插 | 色批| 奇米一区二区三区四区久久 | 天天干天天骑 | 最新欧美精品一区二区三区 | 成人欧美一区二区三区小说 | 久久综合九色综合97婷婷群聊 | 精品一区二区三区免费爱 | 黄色片网站观看 | 久久国产美女 | 老师叫我下面含着精子去上课 | 国模在线视频一区二区三区 | 久久精品国产免费观看99 | 久久在精品线影院精品国产 | 在线黄视频 | 国产成人精品高清在线 | 免费看一级毛片 | 激情综合婷婷丁香六月花 | 手机看片日韩永久福利盒子 | 欧美生活性色 | 欧美色图日韩色图 | 夜夜爽夜夜爱 | 91婷婷色涩涩|