如果一件事在別人眼中是坐冷板凳,是做臟活、累活,你是否還會(huì)堅(jiān)持做下去呢?
石侃·中國(guó)科學(xué)院計(jì)算技術(shù)研究所副研究員格致論道第117期|2025年1月18日 北京
大家好,我是來(lái)自中國(guó)科學(xué)院計(jì)算技術(shù)研究所的石侃,一個(gè) “斜杠科技工作者”。我在芯片領(lǐng)域有十多年的從業(yè)經(jīng)驗(yàn),現(xiàn)在我在中國(guó)科學(xué)院從事芯片相關(guān)的學(xué)術(shù)研究;但同時(shí)我還是一個(gè)B站的科技UP主“老石談芯”,我的觀眾都叫我“老石”。
芯片:現(xiàn)代社會(huì)的基石
提到芯片,大家肯定都知道它的重要性。
不管是現(xiàn)在正熱的人工智能,還是生命醫(yī)藥、自動(dòng)駕駛、網(wǎng)絡(luò)通信等等,你能想象的現(xiàn)代社會(huì)的所有科技,幾乎都離不開芯片——這一信息時(shí)代的基石性技術(shù)。
我從事芯片工作已經(jīng)有很長(zhǎng)時(shí)間了,芯片研發(fā)的過(guò)程其實(shí)是個(gè)很有趣的過(guò)程,這主要源于兩個(gè)方面。
首先,芯片的應(yīng)用非常廣泛。一旦你從事了這個(gè)行業(yè),大概率不用擔(dān)心自己會(huì)失業(yè),因?yàn)楹芏嘈袠I(yè)都需要用到芯片技術(shù)。
第二個(gè)原因可能更重要:芯片研發(fā)是一個(gè)非常難的事情。作為芯片工程師,我們需要不斷地學(xué)習(xí)、不斷地充實(shí)自己,來(lái)應(yīng)對(duì)和迎接這個(gè)充滿機(jī)遇和挑戰(zhàn)的時(shí)代。
那么問(wèn)題就來(lái)了,芯片技術(shù)到底難在哪里?
芯片為什么這么難?
已完成:10%//////////
大家可能知道,一顆芯片的制造過(guò)程,本質(zhì)上其實(shí)是一粒沙子的進(jìn)化之旅。沙子可能是這個(gè)星球上取之不盡、用之不竭的東西;但把低價(jià)值的沙子做成高價(jià)值的芯片,附加的全部都是人類的智慧。
從沙子開始,我們需要對(duì)它進(jìn)行提純,得到晶圓。然后,再對(duì)晶圓進(jìn)行光刻、離子注入、刻蝕、封裝等一系列環(huán)節(jié),才能從取之不盡、用之不竭的沙子變成最終的一顆小小的芯片。
那么說(shuō)了這么多,有這么多的環(huán)節(jié),其實(shí)芯片制造只是整個(gè)芯片開發(fā)流程的一部分,它并不等于芯片開發(fā)本身。
還有一個(gè)非常重要的環(huán)節(jié),那就是芯片設(shè)計(jì)。它指的是根據(jù)需求完成電路設(shè)計(jì),并讓電路能正常工作。然后,我們把設(shè)計(jì)好的電路交給芯片制造商,讓他們進(jìn)行后期的制造,最終得到芯片的實(shí)體。
但這里還有另一個(gè)問(wèn)題:如何保證芯片的功能和你一開始的設(shè)計(jì)是一樣的?

這里有一個(gè)很有意思的小故事。在1947年,一位非常著名的女性程序員Grace Hopper發(fā)現(xiàn)自己的電腦不工作了。經(jīng)過(guò)仔細(xì)地排查和探索,她發(fā)現(xiàn)原來(lái)是電腦的繼電器里飛進(jìn)去了一只蛾子。于是,她用鑷子小心翼翼地把這只蛾子給夾出來(lái),然后貼到了一張紙上。
這有可能是我們整個(gè)計(jì)算機(jī)發(fā)展歷史上發(fā)現(xiàn)的第一個(gè)“bug”(蟲子),也就是漏洞。

如果說(shuō)前面的例子過(guò)于久遠(yuǎn),那我們其實(shí)還有更多的例子。這里給各位出一個(gè)數(shù)學(xué)題,請(qǐng)問(wèn)這個(gè)式子最終的結(jié)果等于多少?其實(shí)這個(gè)題目很簡(jiǎn)單,因?yàn)樵诤竺媸阶永铮肿雍头帜钙鋵?shí)是一樣的,可以消掉;然后減號(hào)前面的數(shù)和后面的數(shù)其實(shí)也是一樣的,所以同樣的數(shù)字相減,最后的答案應(yīng)該等于0。但是,在實(shí)際的計(jì)算機(jī)和芯片當(dāng)中,有可能得出來(lái)的結(jié)果并不是這樣。

比如,在英特爾的一個(gè)奔騰芯片中,得到的結(jié)果是255.00000000。這是怎么回事呢?原來(lái)有一個(gè)美國(guó)科學(xué)家在做科學(xué)研究時(shí),當(dāng)他運(yùn)行這個(gè)式子的時(shí)候,怎么算都算不對(duì)。最后他才發(fā)現(xiàn),原來(lái)在這顆芯片的一個(gè)浮點(diǎn)除法運(yùn)算單元里,存在著一個(gè)沒有被發(fā)現(xiàn)的設(shè)計(jì)漏洞。
可不要小看這個(gè)設(shè)計(jì)漏洞,它帶來(lái)的后果其實(shí)是非常嚴(yán)重的。在20世紀(jì)90年代,英特爾花了4.75億美元在全球范圍內(nèi)召回了所有出現(xiàn)這個(gè)問(wèn)題的奔騰芯片。
所以回到剛才的問(wèn)題,芯片技術(shù)到底難在哪里?在我看來(lái),芯片的難點(diǎn)在于它需要一次性成功。做芯片不像軟件,你可以后期通過(guò)打補(bǔ)丁的方式,去修復(fù)各種問(wèn)題。相比之下,芯片一旦走完了從沙子到芯片的進(jìn)化之旅,你可能就已經(jīng)花費(fèi)成千上萬(wàn),甚至上億元去完成芯片的流片和制造,很難再修改了。
那么,下一個(gè)問(wèn)題就是:現(xiàn)在有多少芯片項(xiàng)目能夠?qū)崿F(xiàn)一次性成功?
“卡脖子”的芯片驗(yàn)證
已完成:40% //////////
根據(jù)調(diào)查結(jié)果的數(shù)據(jù),只有24%的芯片項(xiàng)目可以實(shí)現(xiàn)一次性成功。也就是說(shuō),有3/4的芯片項(xiàng)目由于存在著各種各樣的、大大小小的、沒有被發(fā)現(xiàn)的設(shè)計(jì)漏洞,所以至少需要再去開展一次流片,這就會(huì)花費(fèi)大量的時(shí)間和金錢。

所以,問(wèn)題的關(guān)鍵在于:我們?nèi)绾文軌虮M可能保證芯片在流片制造之前盡可能少有、或者是盡可能沒有bug、沒有設(shè)計(jì)漏洞。也就是我過(guò)去幾年一直在致力研究的方向。

同樣是根據(jù)這個(gè)研究數(shù)據(jù),在整個(gè)芯片開發(fā)過(guò)程中,特別是隨著現(xiàn)在人工智能以及各種高新技術(shù)的發(fā)展,芯片變得越來(lái)越復(fù)雜。芯片驗(yàn)證也由此成為整個(gè)芯片開發(fā)周期中占比非常高的環(huán)節(jié),甚至超過(guò)了一半,達(dá)到了整個(gè)芯片設(shè)計(jì)周期的70%。
但很遺憾,芯片驗(yàn)證也是一件很難的事情。我這里列出了一些天文數(shù)字,比如地球的周長(zhǎng)、銀河系里可能存在的星星數(shù)量,或者是光年的長(zhǎng)度。
在芯片驗(yàn)證里,其實(shí)也存在著一個(gè)天文數(shù)字,那就是完全驗(yàn)證一顆CPU核心所需要的周期數(shù)。這個(gè)天文數(shù)字到底代表什么意義呢?
如果我們用現(xiàn)在最先進(jìn)的軟件仿真技術(shù)去完全驗(yàn)證一顆CPU核心,需要至少15000年。而使用現(xiàn)在最先進(jìn)的硬件仿真技術(shù),可以把這個(gè)時(shí)間稍微縮短到30年。但我們都知道,開發(fā)一顆芯片不可能等15000年,也不可能等30年。
那么,問(wèn)題的本質(zhì)到底是什么?過(guò)去幾年我們其實(shí)一直在研究。我們發(fā)現(xiàn),在芯片驗(yàn)證中存在著一個(gè)所謂的“不可能三角”,也就是芯片驗(yàn)證的高性能、良好的調(diào)試能力以及低成本;而這三個(gè)對(duì)芯片驗(yàn)證至關(guān)重要的因素不可能同時(shí)滿足。對(duì)于現(xiàn)在主流的研究或方法來(lái)說(shuō),最多就是三者取其二,而這也就是導(dǎo)致芯片驗(yàn)證效率非常低的一個(gè)本質(zhì)原因。
總要有人去做一些不一樣的事情
已完成:60%//////////
由于這些原因,芯片驗(yàn)證在過(guò)去一段時(shí)間里并沒有很大的發(fā)展。
在芯片公司里,芯片工程師可能更多地是在寫測(cè)試用例、跑回歸驗(yàn)證。本質(zhì)上,這是一個(gè)臟活累活。在學(xué)術(shù)領(lǐng)域也是如此,投身于芯片驗(yàn)證研究的學(xué)者其實(shí)很少,特別是和現(xiàn)在大火的人工智能等熱門領(lǐng)域的研究相比,芯片驗(yàn)證相關(guān)的研究是非常少的。
所以,有學(xué)術(shù)大佬跟我說(shuō)過(guò),在同樣的時(shí)間內(nèi),我能夠在人工智能領(lǐng)域發(fā)三篇甚至是更多的論文,但芯片驗(yàn)證可能一篇也發(fā)不出來(lái)。
很遺憾,他說(shuō)的是對(duì)的。
不過(guò),總要有人去做一些不一樣的事情。
所以,在過(guò)去的幾年中,我一直帶領(lǐng)團(tuán)隊(duì)從事芯片驗(yàn)證的相關(guān)研究,并且從零到一構(gòu)建了一個(gè)敏捷驗(yàn)證研究體系。這個(gè)研究體系的核心是一個(gè)名叫ENCORE的驗(yàn)證平臺(tái),它基于一個(gè)特殊的芯片——現(xiàn)場(chǎng)可編程門陣列(FPGA)。ENCORE能夠大幅提升驗(yàn)證效率,同時(shí)實(shí)現(xiàn)較好的驗(yàn)證可調(diào)試性。
為了構(gòu)建這個(gè)敏捷驗(yàn)證研究體系,我們一方面需要在算法層面不斷優(yōu)化漏洞挖掘、調(diào)試以及修復(fù)的效率;另一方面,我們也希望能夠構(gòu)建一套端到端的基于可編程邏輯芯片(FPGA)的敏捷驗(yàn)證加速平臺(tái)。在應(yīng)用層面,我們希望這個(gè)平臺(tái)既能適用于通用處理器的驗(yàn)證,比如CPU或GPU,也能適用于專用芯片的驗(yàn)證,比如現(xiàn)在非常流行的AI加速器。
在過(guò)去一段時(shí)間里,我們?cè)谶@個(gè)領(lǐng)域做了很多前沿的探索工作,包括前面提到的ENCORE以及很多的新研究。我們也把這些研究成果發(fā)表在了很多國(guó)際知名的學(xué)術(shù)會(huì)議上。
后面我們其實(shí)也在進(jìn)行一些很有趣的工作,由于這些工作現(xiàn)在還沒有發(fā)表,所以就先不跟大家一一展示了。
如果大家對(duì)我們的工作感興趣,可以去我的B站主頁(yè),或者是通過(guò)B站的后臺(tái)私信聯(lián)系我。現(xiàn)在,也有很多同學(xué)也想要參與進(jìn)來(lái),歡迎大家加入我們的團(tuán)隊(duì),一起從事這種很有趣的敏捷驗(yàn)證學(xué)術(shù)研究。
讓更多人更了解芯片
已完成:80%//////////
但是在研究過(guò)程中,我逐漸發(fā)現(xiàn)這些科研成果或?qū)W術(shù)成果,主要是給我們這個(gè)小圈子里那些只懂芯片驗(yàn)證以及相關(guān)領(lǐng)域的人看的。那么,如何能讓更多的人看到我們的工作、了解我們的科研、甚至參與到我們的工作當(dāng)中來(lái)?
于是,我自然而然地想到了芯片科普,這同樣讓我感覺非常有意思。我從事科普已經(jīng)四五年了,從一開始的文字,到后來(lái)在B站做視頻。芯片科普不僅給我?guī)?lái)了很多收獲,也幫我結(jié)識(shí)了很多志同道合的朋友,以及喜歡并支持我的觀眾朋友們。

但是,做芯片科普視頻并不是一件簡(jiǎn)單的事情,特別是在短視頻泛濫的今天。有同樣做科普的博主大佬也跟我說(shuō),在同樣的時(shí)間內(nèi),我做一期芯片硬核科普的長(zhǎng)視頻,他可能能做10期,甚至是更多和熱點(diǎn)相關(guān)的短視頻,而且流量可能是我的很多倍。
很遺憾,他說(shuō)的其實(shí)也是對(duì)的。
但在這個(gè)基礎(chǔ)上,我覺得還是需要有人堅(jiān)持做一些難的事情。我就希望能夠把芯片科普和芯片驗(yàn)證這兩個(gè)同樣難但同樣有趣的事情結(jié)合在一起,通過(guò)視頻和文字的形式向大家展示我們做的東西、發(fā)過(guò)的論文以及我們整個(gè)大團(tuán)隊(duì)正在研究的開源芯片等內(nèi)容。
除了芯片以外,我還會(huì)跟大家分享人工智能、計(jì)算機(jī)等硬核科技,也會(huì)和大家分享我的成長(zhǎng)經(jīng)歷、我讀過(guò)的書、我學(xué)到的知識(shí)。我知道,我自己其實(shí)并不是一個(gè)天才,也不是所謂的全面全能的專家和大牛。我更希望能夠作為大家的一個(gè)“向?qū)А保蠹曳窒砦易哌^(guò)的路。
在這個(gè)過(guò)程中,我也很有幸采訪到了很多資深的專家以及業(yè)界的大咖,讓觀眾能夠更好地、更全面地去感受和理解芯片以及科技未來(lái)的發(fā)展趨勢(shì)。比如說(shuō)在2024年,我有幸采訪到了AMD的CEO蘇姿豐博士。我就問(wèn)她:“你覺得人工智能對(duì)于芯片的設(shè)計(jì)和驗(yàn)證,會(huì)不會(huì)讓這個(gè)過(guò)程變得更加簡(jiǎn)單和更加高效?”如果你想知道她是怎么回答的,可以去B站看這期的采訪視頻。
所以,回到今天想和大家分享的這個(gè)問(wèn)題:芯片的科研和芯片的科普,到底哪個(gè)更有趣?當(dāng)然,對(duì)我來(lái)說(shuō)其實(shí)兩個(gè)都同樣有趣。原因很簡(jiǎn)單,因?yàn)樗鼈兺瑯雍茈y。同時(shí),它們都需要我非常長(zhǎng)期、長(zhǎng)久地去堅(jiān)持下去。
很多人都說(shuō),我們需要做難而正確的事情。但是其實(shí)問(wèn)題在于,在你做一件事情之前,你如何去判斷這件事情是正確的呢?如果一件事在別人眼中是坐冷板凳,在別人眼中是做臟活、累活,你是否還會(huì)堅(jiān)持做下去呢?
所以,我更希望做難而長(zhǎng)期的事情,比如芯片驗(yàn)證的學(xué)術(shù)研究,比如做芯片硬核科普的長(zhǎng)視頻。因?yàn)槿绻患虑樗y而且需要長(zhǎng)期堅(jiān)持的話,那它大概率就是正確的。
以上就是我今天想跟大家分享的全部?jī)?nèi)容。我是老石,謝謝大家!
-END-
聲明:
本號(hào)對(duì)所有原創(chuàng)、轉(zhuǎn)載文章的陳述與觀點(diǎn)均保持中立,推送文章僅供讀者學(xué)習(xí)和交流。文章、圖片等版權(quán)歸原作者享有,如有侵權(quán),聯(lián)系刪除。
-
芯片
+關(guān)注
關(guān)注
459文章
51910瀏覽量
433432 -
芯片設(shè)計(jì)
+關(guān)注
關(guān)注
15文章
1056瀏覽量
55382 -
芯片制造
+關(guān)注
關(guān)注
10文章
661瀏覽量
29396
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
芯片不能窮測(cè)試

2024深圳機(jī)器人協(xié)會(huì)年度評(píng)選揭曉!艾而特獲得“應(yīng)用典型案例獎(jiǎng)”

恒玄科技研發(fā)AI眼鏡專用芯片
ADA4941-1芯片DIS管腳如何正確對(duì)外連接控制其使能狀態(tài)和禁用狀態(tài)?

東風(fēng)汽車已成功研發(fā)出三款車規(guī)級(jí)芯片
求助,TPA3116D2做的功放,輸入為正弦波,請(qǐng)幫忙看下輸出波形是否正確?
理想汽車籌建香港芯片研發(fā)辦公室,智駕芯片研發(fā)取得新進(jìn)展
美國(guó) inTEST 高低溫沖擊熱流儀助力半導(dǎo)體芯片研發(fā)

為什么我做的OPA657帶寬非常的小、而卻通帶內(nèi)抖動(dòng)很大?
芯片熱管理,倒裝芯片封裝“難”在哪?

OpenAI與博通攜手探索新AI芯片研發(fā)
如何打造芯片國(guó)產(chǎn)化開源生態(tài)?Model系列HMI芯片:平頭哥內(nèi)核,SDK開源貫徹到底!

評(píng)論