在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器越多越新越好?實測Calibre任務性能曲線

Spinal FPGA ? 來源:Spinal FPGA ? 2023-07-13 15:43 ? 次閱讀

Siemens的Calibre是業內權威的版圖驗證軟件,被各大Foundry廠廣泛認可。用戶可以直接在Virtuoso界面集成Calibre接口,調用版圖驗證結果數據,使用起來極為方便。

今天,我們就來聊聊這款軟件。

版圖驗證是芯片設計中非常重要的一環,一共包括三個環節。

DRC(Design RuleCheck):檢查版圖是否符合Foundry廠的制造工藝規則,確保芯片能被正確生產出來;

LVS(LayoutVersus Schematic):版圖工程師需要將畫好的版圖與原理圖對比,確保兩者所有連接保持一致;

寄生參數提取(Parasitic Extraction):將版圖中的寄生參數提取出來,在Virtuoso中反饋結果,前端工程師會進行后仿驗證,重新評估電路特性并進行修改,保證流片正確。

0a5f771a-1fd2-11ee-962d-dac502259ad0.jpg

這三個環節分別由Calibre的DRC、LVS、PEX三種工具來完成。

0a7dcc42-1fd2-11ee-962d-dac502259ad0.png

Calibre任務典型特性

重內存,可拆分,適合暴力堆機器

0a8c975e-1fd2-11ee-962d-dac502259ad0.png

Calibre任務有兩大特性:

1、重內存需求,2T或4T的超大型內存機器都有可能登場

版圖文件很大,需要處理的數據量非常大,但本身的邏輯判斷并不復雜,所以通常不剛需高主頻機型,但要求多核、大內存的機器。CPU與內存的比例通常能達到1:4或1:8,極端情況下這個比例會更高,2T或4T的超大型內存機器都有可能登場。

我們在下面兩篇文章里仔細盤過模擬&數字芯片設計全流程的業務場景、常用EDA工具、資源類型、算力需求、典型場景:

芯片設計五部曲之一 | 聲光魔法師——模擬IC

芯片設計五部曲之二 | 圖靈藝術家——數字IC

2、可拆分,無關聯,適合暴力堆機器

我們在模擬這篇文里寫過版圖驗證就像是一個“大家來找茬“的游戲。

在運行任務的時候,Calibre會把版圖切分成相互沒有邏輯關系的塊狀分區,這些分區之間彼此沒有相關性,互不干擾,所以可以同時進行。

切得越細,同時檢查的人更多,效率就越高。

0a9b0a5a-1fd2-11ee-962d-dac502259ad0.png

三體里的切法大家還記得吧,一字橫切。

而芯片只能豎著切,可以十字切法。橫切會影響到芯片層與層之間的連接關系。

0a7dcc42-1fd2-11ee-962d-dac502259ad0.png

暴力堆機器也是有技術含量的

0a8c975e-1fd2-11ee-962d-dac502259ad0.png

1、 首先,要有光,你得有大內存的機器

我們的全球資源池可以根據用戶需求在全球范圍內調度海量云端異構資源。GPU、TPU、FPGA,要啥都有。

0ac4ac70-1fd2-11ee-962d-dac502259ad0.jpg

其中,FCC-B產品提供準動態資源池,擁有行業特需的大內存機型,具有較低的整體擁有成本。而且,可以擴展到FCC-E使用彈性資源。

總之,大內存的機器,沒有問題。

那么,萬一不是一直不夠,是偶爾不夠怎么辦呢?

我們有一個小技巧,專門應用這種內存峰值場景。

Swap,交換分區,就是在內存不夠的情況下,操作系統先把內存中暫時不用的數據,存到硬盤的交換空間,騰出內存來讓別的程序運行。

比如跑一組Calibre任務需要10小時,其中9個小時的內存使用量都在200G左右,只有1個小時達到了260G。

0ada4cd8-1fd2-11ee-962d-dac502259ad0.png

如果選擇256G內存的機型配置,任務必崩無疑。

但要是為了這1小時不到10G的內存溢出而全程使用512G的配置,成本翻倍,未免有點太不劃算了。

使用Swap交換分區就可以無縫填補這一空缺,非常匹配這種內存峰值場景。

Swap的具體使用案例,戳這篇:Auto-Scale這支仙女棒如何大幅提升Virtuoso仿真效率?

注意:此方法不適合長期使用,磁盤的速度和內存相比慢了好幾個數量級,如果不停讀寫 Swap,對系統整體性能有影響。

2、 怎么把這些機器組隊管理起來?

有了機器,下一步當然是要把它們利用起來。

Calibre默認支持單機多核并行跑任務,這意味著只要機器足夠大,就可以同時處理很多任務。

但是,當你的大機器不夠多,或者根本拿不到大機器的時候,就很苦惱了。

我們的方法是:將所有機器組成一個集群——多機多核的方式同時跑多個任務。


關于單機、單核、單任務、多任務、集群化、并行化進一步的定義與區別,可以看這篇:揭秘20000個VCS任務背后的“搬桌子”系列故事

集群自動化管理,少量大機器需要,大量小機器就更需要了。

為啥?

理由一,能方便地自動化運維整個集群

比如軟件安裝配置、資源監控、集群管理等工作,是需要IT一臺臺機器去逐一手動操作,還是鼠標點幾下就可以完成?

理由二,能快速方便地分配業務,提高資源利用率

比如,臨時需要將一批機器從團隊A劃撥給團隊B使用,有沒有什么辦法可以讓IT快速方便地進行配置?

比如,因為資源使用的不透明和缺乏有序管理,會出現不同人對同一資源的爭搶,任務排隊等現象。同時,你會發現資源利用率還是不高。

3、怎么讓機器自動化干活,不用人操心?

自動化干活可太有必要了。

否則,那么多任務,那么多機器,需要多少雙手和眼睛才能忙得過來?

來,我們給你“手”和“眼睛”。

首先是我們的“手”——Auto-Scale功能。

來看一下本地手動跑任務與Auto-Scale自動化跑任務的區別:

0b11906c-1fd2-11ee-962d-dac502259ad0.png

基于我們自主研發的調度器——Fsched,Auto-Scale自動伸縮功能自動化創建集群,自動監控用戶提交的任務數量和資源需求,動態按需地開啟與關閉所需算力資源,做到分鐘級彈性伸縮,在提升效率的同時有效降低成本。

更多療效,戳這篇:Auto-Scale這支仙女棒如何大幅提升Virtuoso仿真效率?

有了“手”干活,還得有“眼睛”盯著防止出錯。

我們能多維度監控任務狀態,提供基于EDA任務層的監控、告警、數據統計分析功能與服務。

0b2593e6-1fd2-11ee-962d-dac502259ad0.jpg

如果沒有這雙“眼睛”,可能出現哪些問題?戳這篇:【案例】95后占半壁江山的浙桂,如何在百家爭鳴中快人一步

未來我們還會有一篇文章專門討論EDA領域基于業務的監控功能,敬請期待哦~

你看,不僅可以自動化跑任務,還能時刻幫你盯著任務是否出錯。

0a7dcc42-1fd2-11ee-962d-dac502259ad0.png

來,我們小暴力一下

0a8c975e-1fd2-11ee-962d-dac502259ad0.png

先說結論:

我們在單臺大機器和多臺小機器組合場景下分別跑了同一組Calibre任務。

單臺大機器場景下,隨著核數的增加,任務耗時呈現明顯的線性下降關系,整體性能曲線非常貼近基準線(單機核數有上限,本次實證中,我們使用的最大單機為128核,并根據32核、64核、128核的耗時規律預估了256核單機的耗時數據,僅供參考)。

多臺小機器組合場景下,隨著機器數量的翻倍,任務耗時同樣線性下降,但在后期倍數關系上有所損耗,多機性能曲線略低于基準線和單機性能曲線。

0b50488e-1fd2-11ee-962d-dac502259ad0.png

實證過程:

1、使用fastone云平臺調度32核、64核、128核單機分別運行一組Calibre任務,耗時分別為14小時57分49秒、7小時30分28秒、3小時50分11秒;

2、按上條實證數據,預估使用fastone云平臺調度256核單機運行一組Calibre任務的耗時為1小時58分6秒;

3、使用fastone云平臺調度2、4、8臺32核機器分別運行一組Calibre任務,耗時分別7小時43分51秒、4小時6分14秒、2小時15分34秒。

0a7dcc42-1fd2-11ee-962d-dac502259ad0.png

還有大家關心的Intel第四代機器

我們也搞來跑了一下

0a8c975e-1fd2-11ee-962d-dac502259ad0.png

在上一節中,我們使用的均為第三代英特爾至強可擴展處理器,而在2023年1月11日,英特爾正式推出了第四代至強可擴展處理器。

我們立馬搞來跑了一遍,為了對比參照,我們還拉上了第二代和第三代,并且把核數都按比例換算為48核。

實證過程:

1、使用fastone云平臺調度48核第二代英特爾處理器運行一組Calibre任務,耗時10小時46分26秒;

2、使用fastone云平臺調度48核第三代英特爾處理器運行一組Calibre任務,耗時9小時56分13秒,相比第二代提升7.77%;

3、使用fastone云平臺調度48核第四代英特爾處理器運行一組Calibre任務,耗時8小時18分43秒,相比第三代提升16.35%,比第二代提升22.85%。

0bb8389a-1fd2-11ee-962d-dac502259ad0.png

可以看到每一代都有提升,且型號越新,提升幅度越大,三代比二代提升了7.77%,四代比三代提升了16.35%。

而在價格上,目前四代和三代的類似機型換算一下,幾乎是相同的。

實證小結

1、Calibre DRC/LVS/PEX不剛需高主頻機型,但要求多核、大內存的機器,任務可拆分,適合暴力堆機器;

2、fastone云平臺的全球動態資源池、集群自動化管理能力、自動化跑任務并監控告警的功能可完美匹配Calibre的需求;

3、隨著計算資源的提升,Calibre的任務耗時呈現明顯的線性關系,其中單機整體性能曲線非常貼近基準線,多機效果后期會略有折損;

4、最新型號的處理器可以大幅提升Calibre的效率,可根據項目周期與實際預算綜合考量機型配置。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 電路
    +關注

    關注

    173

    文章

    5966

    瀏覽量

    172974
  • 數字IC
    +關注

    關注

    1

    文章

    38

    瀏覽量

    12636
  • Calibre
    +關注

    關注

    0

    文章

    18

    瀏覽量

    9784

原文標題:機器越多越新越好?實測Calibre任務性能曲線

文章出處:【微信號:Spinal FPGA,微信公眾號:Spinal FPGA】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    IMC到底是越好?還是越好

    ? 談起IMC這個問題,有點困惑 IMC到底是越好?還是越好? IMC全稱為intermetallic(金屬間化合物),金屬化合物是兩種不同金屬原子按照一定比例進行化合,形成與
    的頭像 發表于 11-27 11:23 ?686次閱讀
    IMC到底是<b class='flag-5'>越</b>厚<b class='flag-5'>越好</b>?還是<b class='flag-5'>越</b>薄<b class='flag-5'>越好</b>

    低壓側并聯的電容是越多越好嗎?

    低壓側并聯電容器在改善電能質量和提高系統效率方面發揮著重要的作用。許多企業在設計和實施電容器時都有這樣的疑問:“低壓側并聯的電容是越多越好嗎?” 一、低壓側并聯電容的數量與規格 1、數量的選擇
    的頭像 發表于 11-04 14:25 ?219次閱讀
    低壓側并聯的電容是<b class='flag-5'>越多越好</b>嗎?

    用EDA做了一張校園卡但是發現學校大門刷不進去,學校內充當飯卡時能正常識別,不知道哪里出問題了

    線圈共繞了14圈,長9.5cm,寬6.5cm,線圈間距約0.5cm,中間畫的學校地圖均為焊盤,反面為芯片和LED。 是因為焊盤太多導致渦流影響了感應電流,還是線圈不是繞的越多越越好。查了很多資料
    發表于 10-27 20:51

    溫度曲線以保持最佳FIT性能

    電子發燒友網站提供《溫度曲線以保持最佳FIT性能.pdf》資料免費下載
    發表于 09-23 11:43 ?0次下載
    溫度<b class='flag-5'>曲線</b>以保持最佳FIT<b class='flag-5'>性能</b>

    磁環繞線電感圈數越多越好

    電子發燒友網站提供《磁環繞線電感圈數越多越好嗎.docx》資料免費下載
    發表于 09-20 11:32 ?0次下載

    谷景揭秘直流流共模電感圈數繞制越多越好

    谷景揭秘直流流共模電感圈數繞制越多越好嗎 編輯:谷景電子 共模電感是電子電路中特別重要的一種電感元件,感值是它的一個重要性能參數,對選型和使用的影響非常大。影響共模電感的一個重要因素就是線圈繞制的圈
    的頭像 發表于 09-04 16:12 ?353次閱讀

    電阻率越大導電性能越好還是

    電阻率是描述材料導電性能的一個物理量,它表示單位長度、單位截面積的導體在單位電勢差下的電阻值。電阻率越大,表明材料的導電性能差;反之,電阻率越小,表明材料的導電性能
    的頭像 發表于 08-25 09:24 ?5316次閱讀

    使用TL082CDR時出現模擬量輸出實測偏低的現象,為什么?

    在使用TL082CDR時出現模擬量輸出實測偏低的現象,而在測試不良品I/V特性曲線時,測試輸入引腳對Vs+引腳斷路; 關于運放I/V特性曲線的測試一般測試的引腳數據有哪些? I/V特性曲線
    發表于 08-06 06:03

    避雷針的接閃概率越高越好還是越好

    電子發燒友網站提供《避雷針的接閃概率越高越好還是越好.docx》資料免費下載
    發表于 08-01 14:19 ?0次下載

    精準定位,激光領航——激光跟蹤儀助力服務機器人性能提升

    隨著人工智能和機器人技術的快速發展,服務機器人在各行各業得到了廣泛應用,服務機器人能夠自主完成各種服務任務,如導航、搬運、清潔等,為保證服務機器
    的頭像 發表于 07-26 14:27 ?612次閱讀
    精準定位,激光領航——激光跟蹤儀助力服務<b class='flag-5'>機器人性能</b>提升

    實測分享,瑞芯微RK3588八核國產處理器性能測評!確實“遙遙領先”!

    。 圖1 RK3588處理器典型應用領域 基于CoreMark與Glmark2工具的實測數據Coremark是一個基準測試工具,常用來評估嵌入式處理器CPU運算性能。它采用了一個標準的性能度量單位
    發表于 07-17 10:49

    工業機器任務編程基本流程

    隨著科技的迅猛發展,工業機器人在制造業中的應用越來廣泛。它們不僅能夠執行重復性、高精度的任務,還能在惡劣環境中代替人工進行作業,極大地提高了生產效率和安全性。要實現工業機器人的高效運
    的頭像 發表于 07-02 10:41 ?649次閱讀

    西門子推出Calibre 3DThermal軟件,持續布局3D IC熱分析

    Calibre 3DThermal可為3D?IC提供完整的芯片和封裝內部熱分析,幫助應對從芯片設計和3D組裝的早期探索到項目Signoff過程中的設計與驗證挑戰 ● 新軟件集成了西門子先進
    發表于 06-28 14:14 ?429次閱讀

    AnyWay功率分析儀帶寬是否越好

    功率分析儀帶寬寬,對被測對象的適用性越強,就這一點而言,帶寬越好!實際選購時,需要注意: 儀器的真實帶寬是多少?或者說,在實際使用中,儀器的寬頻帶性能能夠施展多少? 帶寬相關指標
    的頭像 發表于 06-03 10:59 ?410次閱讀
    AnyWay功率分析儀帶寬是否<b class='flag-5'>越</b>寬<b class='flag-5'>越好</b>?

    電感是越大越好還是越小越好呢?

    電感的選擇并不是簡單的“越大越好”或“越小越好”。電感器的大小(即電感值)應根據具體的應用需求、電路設計和性能要求來決定。
    的頭像 發表于 05-06 15:31 ?6346次閱讀
    主站蜘蛛池模板: 99精品在免费线视频 | 污污视频在线免费看 | 偷自在线| 久久精品国产亚洲婷婷 | 国模欢欢大尺度 | 在线免费色 | 新网球王子u17世界杯篇免费观看 | 亚洲激情网站 | 狠狠色狠狠色综合日日不卡 | 国产20岁美女一级毛片 | 亚洲欧美在线一区二区 | 久久久久毛片成人精品 | 91热成人精品国产免费 | 日韩一级生活片 | 亚洲免费福利视频 | 久精品视频村上里沙 | 久久天天躁夜夜躁狠狠躁2015 | 美日韩中文字幕 | 久久99精品国产麻豆宅宅 | 高级毛片 | 国产乱人视频免费播放 | 亚洲精品系列 | zsvdy午夜片| 你懂的视频在线观看资源 | 理论视频在线观看 | 波多野结衣一级毛片 | 午夜在线视频观看版 | 亚洲一区视频 | 中文网丁香综合网 | 久久中文字幕综合婷婷 | 韩国三级视频网站 | 国产黄视频在线观看 | 国产精品一久久香蕉产线看 | 久久大尺度 | 5g影院午夜伴侣 | 日本wwwxx| 五月婷婷综合激情网 | 免费一看一级毛片全播放 | 天天操天天插天天干 | 色多多www | 在线亚洲色图 |