在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

“一億”是“一千萬”的十倍嗎?顯然不是

CAE學習之家 ? 來源:恩宇科技 ? 作者:CAE學習之家 ? 2021-10-28 11:14 ? 次閱讀

-----1億是1千萬的10倍?-----

早期筆者使用矩量法求解線性方程組,在不使用快速多級方法,自由度達到3萬時,臺式機上已經無法求解出,8G的機器內存不夠用。對于滿秩矩陣的線性方程組,常規求解方法時間復雜度為n^3(n的3次方)。

對于自由度1千萬以下稀疏矩陣的求解,好的臺式機基本能應付,而當自由度達到1億的時候,簡單的將硬件乘以10倍完全不能滿足要求。因為計算的空間復雜度,時間復雜度并不是線性,通常是NlogN,N^2或者更高。當自由度達到1億時,不僅需要對硬件核心部件CPU,內存擴容,而且在磁盤陣列,I/O,并發計算,GPU,網絡,帶寬等方面都提出了更苛刻的要求。

算法方面看,減少網格密度,在物理量梯度大的地方加密,無變化的地方將網格變稀疏,可以有效減少計算量;另外優化求解算法本身,使其更加易于并行化計算。

從目前來看,計算機硬件計算能力的更新速度,跟不上指數級求解規模的增加速度。這也是量子力學發展的最大推動力!

-----------------

針對該問題,本文稍微展開一下。

這里的1億,主要指仿真中最終求解線性方程組的自由度個數,就是剛度矩陣的規模,即在方程Kx=b中,K的規模為1億*1億的方陣。

從硬件角度看,性能瓶頸首先在內存。目前臺式機的內存普遍在64G以下。對于1千萬的稀疏矩陣,存儲勉強夠用,加上計算,一般都不夠用,在windows系統上如果內存不夠用,會啟用虛擬內存,也就是用頁面交換把硬盤當內存使用,頻繁讀寫磁盤,這時候性能會大大降低。而對于1億自由度的矩陣,可能剛度矩陣組裝都不夠用。對于一億自由度的矩陣,首先要保證內存能夠存儲,一般的方法是使用具有超大內存的工作站服務器。

內存問題解決后,再就是CPU性能。前面講過,通常矩陣計算的空間復雜度,時間復雜度并不是線性,而是NlogN,N^2或者更高。使用單核單線程,耗費的時間是條曲線上升趨勢。雖然稀疏矩陣采用了CSR等方法壓縮數據,但自由度的平方數據仍然還是海量數據。現在的CPU普遍多核多個邏輯線程。這也要求在進行迭代法求解方程組時,合理的進行矩陣分解,參考一篇文章入門仿真軟件性能優化,采用分治的方法適應硬件的需求。

這里需要注意的是單核CPU的性能以及CPU的數量。根據實際情況進行分治!

在滿足了單機CPU運行之后,再就是集群分布式計算。采用多臺計算設備,比如刀片等專業服務器,超算等等,這里需要考量的是負載均衡和網絡帶寬,即保證單臺設備的利用率和整體進度保持一致。對于超大量的計算,最好能軟件實現動態規劃,對于頻繁交換數據的計算,要注意網絡帶寬的瓶頸。

再從軟件方面來看,根據筆者的研發經驗,相當一部分仿真的性能問題可以通過軟件以及改進算法解決。在前處理中,盡量避免軟件中高頻操作,大數據拷貝,大量細小數據操作等。如果必須有,對操作進行采樣性能評估,保證在可接受范圍內。在求解線性方程組前,提取矩陣特征,盡可能在最細度上根據矩陣特征,同時結合模型和業務的特點,選取最合適的求解方法。

其實目前對于數值計算方法而言,其算法都是公開透明的,商業軟件之間真正較量的是業務模型的準確性,算法的穩定性以及效率。而這也恰恰是每個軟件可以改進和提升的地方

2004年,ANSYS解出了1億自由度的模型,2008年,ANSYS解出了10億自由度的模型。即使現在來看,我們認為自由度超過1千萬的模型是個大模型,所以1億自由度的模型仍然可以認為是超大模型,且只能在超大的服務器上運行,可以想象,隨著硬件的提升和算法的改進,實際應用中會有越來越多的超1億自由度的模型求解。

回到開始的問題,“一億”是“一千萬”的十倍嗎?顯然不是。

最后還是以業內的一句話作為結束語:

“如果你的仿真還沒有受到硬件的限制,那說明你的仿真還沒有入門”。

編輯:fqj

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • CAE技術
    +關注

    關注

    0

    文章

    9

    瀏覽量

    7007
  • 數值計算
    +關注

    關注

    3

    文章

    5

    瀏覽量

    6905
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    AD8429無法放大成理想的倍數,如何解決?

    增益公式為G=1+6KΩ/R1 ,R1設置為650Ω時,電壓放大十倍還是比較理想的,但改為60.5時輸出電壓為15.546mV,放大了77.7不是理想的100,請問如何解決?請大
    發表于 04-24 07:45

    MAX1978為什么測試誤差放大五十倍的DIFOUT點會在直流偏置的基礎上疊加一個交流信號?

    你好,ADI,最近我們在使用MAX1978這款芯片的時候遇到一些問題如下: 測試環境為: +5V供電,開關頻率選擇1M,采用內部參考源1.5V,進行TEC控溫實驗, 問題為:為什么測試誤差放大五十倍的DIFOUT 點會在直流偏置的基礎上疊加一個交流信號,這個是由于我PID控制沒有控穩造成的嗎?
    發表于 04-18 06:57

    百度李彥宏稱自動駕駛比人類司機安全十倍

    在近日于阿聯酋迪拜開幕的“世界政府峰會”上,百度創始人李彥宏發表了關于自動駕駛技術的看法。他表示,隨著技術的飛速進步,自動駕駛的安全性已經遠超人類司機,其安全性可以達到人類司機的十倍
    的頭像 發表于 02-13 16:10 ?324次閱讀

    信號差值經INA143放大10送入ADS8505后,INA143的輸入偏執電壓對ADC的采集結果有沒有影響?

    十倍后,萬用表測是10V,沒什么問題; b、Vin+=5V,Vin-=4V,ref腳輸入1V,放大十倍后,萬用表測是11V; c、Vin+=5V,Vin-=4.5V,ref腳輸入2V,放大10
    發表于 12-26 07:31

    精科技”獲近千萬元天使輪融資

    近日,“精科技”成功完成了近千萬元的天使輪融資,本輪融資由麒麟創投及其基金聯合投資,德太資本則擔任公司的長期財務顧問。 這筆資金將主要用于公司的日常運營、產品研發和生產制造以及市場開拓等方面。隨著
    的頭像 發表于 12-18 10:48 ?421次閱讀

    馬斯克xAI計劃:孟菲斯超算集群將擴大十倍

    個增加到至少100萬個。這一舉措將標志著Colossus超級計算機集群的十倍擴張,彰顯出xAI在人工智能領域的雄心壯志。 據了解,Colossus超級計算機集群目前主要用于訓練xAI的聊天機器人Grok。通過大幅增加GPU數量,xAI將能夠顯著提升Grok的訓練速度和性能,使其能夠更快
    的頭像 發表于 12-05 11:23 ?620次閱讀

    做寬帶直流放大器末級功放,前三級放大輸出穩定波形,只要連接THS3091就會輸出失真,為什么?

    什么問題引起的不穩定,怎么解決?首先可以確定的是不是因為相移引起的不穩定,因為測過輸入信號和輸出信號基本沒有相位差;其次THS3091我是按照手冊選的反饋電阻,十倍放大。TINA仿真圖見附件。
    發表于 09-12 07:21

    INA333 RG接100歐不是放大1000嗎?怎么輸出才2左右?

    RG接100歐不是放大1000嗎?怎么輸出才2左右?請問要放大1000如何接才正確?
    發表于 09-11 07:25

    OPA657搭了數據手冊中提供的放大十倍的測試電路,結果輸出一直是7V多,為什么?

    我用OPA657,搭了數據手冊中提供的放大十倍的測試電路,結果輸出一直是7V多什么情況 , 求指教!!!
    發表于 09-05 08:21

    兩級AD603放大電路不能放大到所需值,最大十倍,這是為什么

    兩級AD603放大電路不能放大到所需值,最大十倍,這是為什么,用1M歐的示波器測得,沒加功率放大級???
    發表于 09-04 06:48

    使用THS3201遇到的問題求解

    今天調試了一塊THS3201的PCB,0.3MHZ~100MHZ,放大十倍,遇到了很多問題,雖然最后大致滿足了要求,但是還有一部分問題沒有想通: (信號源內阻50歐姆,示波器1M歐姆) 1.按照
    發表于 08-26 07:58

    請問FilterPro設計帶通濾波器需要如何設置?

    帶通濾波器設計要求:50~11000hz為帶通信號,放大倍數為40(32dB),帶通外的信號需要-40dB/十倍頻程的衰減。 我的設置為:中心頻率:(11000-50)/2=5475 通帶
    發表于 08-16 12:14

    INA132u的兩個輸入端都有個90K+10K的十倍衰減電阻,會不會對采集的信號有影響?

    INA132u的共模輸入阻抗只有80K,感覺輸入阻抗不是很大。而INA132u的兩個輸入端都有個90K+10K的十倍衰減電阻,不知道會不會對采集的信號有影響啊。這是第一個問題。 第二個問題就是,如果我們對運放
    發表于 08-12 06:41

    眾鑫創展----1080P十倍光學變焦攝像頭方案

    OZ003是一款1080P支持十倍光學變焦的高清攝像頭模組。由索尼200萬像素高性能感光芯片,以及集成了高性能的ISP圖像處理模塊和視頻壓縮編碼器的SoC芯片組成。具備優異的圖像處理能力、極高
    的頭像 發表于 05-11 16:34 ?654次閱讀
    眾鑫創展----1080P<b class='flag-5'>十倍</b>光學變焦攝像頭方案

    眾鑫創展----4K十倍光學變焦攝像頭方案

    OZ080(FH8898+IMX415)是一款800萬像素支持十倍光學變焦的高清攝像頭模組,由索尼800萬像素高性能感光芯片以及全高清實時高性能智能網絡處理器Soc芯片組成。具備優異的圖像處理能力
    的頭像 發表于 05-11 09:38 ?772次閱讀
    眾鑫創展----4K<b class='flag-5'>十倍</b>光學變焦攝像頭方案
    主站蜘蛛池模板: 亚洲欧美一区二区三区图片 | 久久视频免费看 | 国产簧片| 国产精品久久久亚洲第一牛牛 | 欧美黄色片网站 | 四虎免费久久影院 | 五月婷婷啪啪 | 国产黄色a三级三级三级 | 可以免费看黄的网站 | 国产精品yy9299在线观看 | 久久99热精品免费观看k影院 | 成人黄色免费看 | 最新版天堂资源官网 | 天天射天天爱天天干 | 日日摸人人拍人人澡 | 双性受粗大撑开白浊 | 亚洲三级在线视频 | 人与牲动交xxxxbbbb | 国产精品美女自在线观看免费 | 亚洲高清免费在线观看 | a成人在线 | 色婷婷一区二区三区四区成人 | 国产女主播在线播放一区二区 | 日本一本视频 | 免费观看激色视频网站bd | 国产成人永久免费视频 | 色色色色色色网 | 免费人成年短视频在线观看免费网站 | 成人影院久久久久久影院 | 精品视频在线观看视频免费视频 | 黄色的视频免费看 | 欧美色图综合网 | 天堂网中文| 亚洲性后网 | 49vv婷婷网 | 成人a大片高清在线观看 | 欧美成人天天综合天天在线 | 在线免费观看一级片 | 黄色一及毛片 | 天天艹天天艹 | 午夜剧场操一操 |