2018年,AI的大主題是“行業落地”,AI的多元場景呼喚更加專精的硬件,一股“AI芯片”創業浪潮興起,涌現了寒武紀、地平線、深鑒、耐能、比特大陸等明星創業公司。傳統上非芯片領域的科技巨頭如Google、百度、阿里也紛紛布局AI芯片。
根據騰訊研究院發布的《中美兩國人工智能產業發展全面解讀》,2017 年美國已有33家芯片新創公司,中國有14家。這在多年來都是“巨頭游樂場”的芯片行業是一個驚人的數字。
今天「甲子光年」的公司案例分析,聚焦一家2017年6月成立于硅谷,尚未在公開報道中亮相過的AI芯片公司“龍加智”( DinoPlusAI),它有兩大特點:一是定義了特定需求下的芯片新類型——“關鍵任務芯片”;二是團隊突出的工程能力——匯聚了15位在硅谷有多年一線工程經驗的芯片工程師。
龍加智天使輪投資機構翊翎資本董事長王斌評價:“是否有足夠成熟、穩定的工程經驗,是判斷一個芯片項目的核心。所以我們選擇了龍加智。”
新物種:“關鍵任務”AI芯片
2017年3月,浦東張江。龍加智的創始人胡遇杰定好了目標:如果三個月內招到滿意的芯片工程師,就把公司芯片研發團隊定在上海。
17年前,在上海交通大學念完自動化控制碩士的胡遇杰進入中興上海第二研究所工作。2003年2月,交大微電子學院院長陳進教授發布了中國第一個完全擁有自主知識產權的DSP芯片(數字信號微處理器)——漢芯一號。
這直接激發了胡遇杰對芯片的興趣,他由此知道,原來國內一直沒有自主研發芯片的核心能力,技術比國外落后三十年,他申請了美國半導體方向的博士,立志要學一身本領。
2006年,已在美國愛立信成為一名芯片設計工程師的胡遇杰震驚得知,曾讓國人備受鼓舞的“漢芯一號”,是陳進將摩托羅拉的芯片用砂紙磨去logo,騙取上億經費的造假事件。
扼腕之余,胡遇杰更加扎實地投入到一線的工程工作中,從2005到2016年,他先后在愛立信、博通、Cadence工作,分別從事數據中心多核網絡處理器芯片、數據中心硬件流水線交換機芯片、DSP內核的核心研發。
他在愛立信參與開發的芯片廣泛應用在愛立信邊界路由器上,被美國通訊公司AT&T大量采用;他在博通參與開發的Trident/Tomahawk系列芯片占據了全球數據中心交換芯片80%以上的市場份額;他在Cadence參與開發的Tensilica DSP內核是全球最流行最靈活的DSP內核,被微軟等公司集成到高性能、低功耗的芯片產品中。
這三種芯片各有技術側重:“多核網絡處理器”包含幾百顆CPU內核,CPU核和硬件引擎通過片上網絡連接,架構復雜又具有靈活性;“數據中心硬件流水線網絡處理器”強調高速、高密度和低時延;而“DSP內核”要求性能和拓展性的同時極度重視功耗和面積。
2015-2016年,人工智能和無人駕駛漸漸興起。胡遇杰注意到,有客戶把他們的DSP應用在無人駕駛場景。
順著這種應用思路深究,這一輪AI芯片的開發競賽,一個明顯趨勢是AI應用場景的多元化要求硬件也更加“專精”化——需求倒逼芯片,芯片最終要為場景服務,而不再是通用架構壟斷一切,這是目前AI芯片產生新商業機會的底層邏輯。
但現有的解決方案中,不管是被英偉達把持的GPU還是各家創業公司發力的ASIC(專用集成電路,AI芯片中的ASIC指專門對AI算法進行優化的AISC),都忽視或無法滿足一些關鍵場景下的需求。
第一,是對低時延和低“時延抖動”(單次請求的時延波動值)的需求。目前AI芯片普遍有幾毫秒的延遲。在一些場景下,延遲可能會造成重大的問題。在自動駕駛中,幾毫秒的延時反應可能造成車毀人亡;在同聲傳譯中,時延和時延抖動將極大影響體驗。
第二,對高可靠性的需求。目前對宕機情況下的數據保護,一般用軟件方案來解決;然而,軟件方案速度慢,數據有丟失、出錯的風險。
第三,對數據安全的需求。多個虛擬機之間的隔離,目前也是用軟件方案解決,有數據泄露的風險。
胡遇杰把以上需求定義為關鍵任務:相比其他情況,以上問題造成的后果極為嚴重,因此需要更強大的保障,這就呼喚一種新的芯片類型——低時延、高可靠的“關鍵任務芯片”(Mission-Critical AI Processor)。龍加智的第一代“關鍵任務芯片”被命名為“Dino-TPU”,將最先應用于云端的數據中心場景。
胡遇杰的設計思路和云腦科技創始人張本宇的需求不謀而合。
張本宇有19年人工智能和大數據研發經驗,先后就職于微軟亞研院、Google和Facebook。2015年,張本宇創立了云腦科技,為行業用戶提供AI技術平臺。云腦科技的業務目前主要覆蓋通信、金融監管、人才教育和能源制造四個領域,其合作伙伴包括中國銀聯、上海證券交易所、浪潮軟件集團、中國電信、中海油等。
張本宇告訴「甲子光年」,云腦科技深耕的金融領域對實時性要求特別高,目前的主流GPU更適合做批量處理任務,但并沒有對單個請求的延時性做優化,所以在做推理任務時,單個請求的延時性較長且“時延抖動”大,這不利于金融監管場景下及時作出阻斷和預警。
“未來,我們要做到把現在使用GPU的場景全部替換成龍加智的TPU,云腦會聯合龍加智為合作伙伴提供軟硬結合的整體方案,同時我們也可以攜手拓展更多場景。”張本宇說。
一線工程師組團突圍
從上海出發,又想回到上海創業的胡遇杰最終未能如愿。因為他發現,在上海無法完成自己的最初設想——“招到滿意的芯片工程師”。
胡遇杰對“滿意的工程師”的定義是:至少有一個大芯片從頭到尾的設計經驗,有一次性流片成功的經驗。但這樣的人在國內太難找了。
知乎上,一位名叫“Yufeng Bai”的IC設計工程師說道:“在數字邏輯設計能力方面,國內公司和國外公司差別不大,國外能做的國內公司一樣能做。而最大的區別在于經驗,犯錯的經驗。能用和做好是不一樣的。”
胡遇杰告訴「甲子光年」,在硅谷,芯片設計采用 “師徒制”。 師父手把手帶徒弟,幾十年代代傳承,積累了大量芯片制造的工程師智慧。這也是美國芯片行業相比中國的一大優勢所在:大量經驗豐富、從業年限較長的一線工程師,能把芯片復雜的設計、實現、驗證和調試過程落到實處。
胡遇杰最終無功而返,并于6月在硅谷重新組建團隊,創立了現在的龍加智。目前,除有豐富芯片設計經驗的胡遇杰本人外,龍加智還匯聚了15位在硅谷有15年以上經驗的芯片工程師,成立一年來,無一人離職。
團隊中有畢業于卡耐基梅隆大學,有20多年網絡處理器芯片設計經驗、擁有11項專利的Ken Chin。他曾幫助TeraBlaze公司設計一款芯片,該公司后被杰爾系統收購。
同樣擁有11項專利的Cliff Gold是寬帶互聯網軟件提供商2Wire的ASIC技術總監,管理過70多人的芯片設計團隊。
前同事王曉松則是博通的高級主任芯片設計工程師,參與博通旗艦產品Trident/Tomhark 的設計,對datapath延遲和性能進行優化。
龍加智的天使輪投資機構為摯信資本和翊翎資本。翊翎資本董事長王斌告訴「甲子光年」,“是否有足夠成熟、穩定的工程經驗,是我們判斷一個芯片項目的核心。”
翊翎資本已布局了人工智能領域的數據、算力、算法、應用、平臺、安全等相對完整的產業鏈,投資了十幾家公司,如云腦科技、聚合數據、泰迪熊智能等。
王斌說,龍加智有兩大核心價值最打動他:一是“關鍵任務芯片”的設計思路,且團隊已對核心技術提交專利申請;通過對自己所投AI公司的需求的了解,翊翎資本確認了“關鍵任務”的必要性——如工業等重要場景下,不僅追求算力、功耗,也對穩定性和低時延有很高要求。
第二就是團隊強大的工程能力,“他們很接地氣,都是一線工程師出身,有成熟經驗。我們判斷,龍加智的落地性會更好。”王斌認為,對龍加智來說,做AI芯片不是摸索前行,而是把多年積累的經驗成果輸出。
目前,龍加智已啟動新一輪融資,同時接觸國內外的投資者。王斌在溝通中發現,國內外投資機構判斷一個芯片團隊是否有能力的時間點不太一樣。
他告訴「甲子光年」,國內很多機構會把AI芯片團隊是否流片成功當做一個重要時間點,流片成功了,就敢給高估值;但芯片是需要不斷迭代的,流片成功只是證明了基礎能力。國外機構則敢于在更早期做判斷,判斷依據是團隊以往的背景及接下來對市場需求的把控。王斌把國內投資者“不敢判斷”歸結于中國半導體行業工程能力、工程氛圍長期落于人后。
“都等流片成功了,那還有早期投資人的機會嗎?”王斌表態,翊翎資本將在新一輪融資中繼續投資龍加智,“我們很有信心。”
從第一天起就軟硬兼備
由于AISC需要針對AI算法做加速和優化,需求→算法→芯片層層傳導,一家聲稱要做AI芯片的公司一定要同時具備硬件和軟件兩類資深人才。
在胡遇杰的設計思路中,龍加智的“Dino-TPU”還具備二次開發的能力,可以適用多個人工智能場景,這也需要團隊內有精通算法能力、軟件能力的牛人。
所以胡遇杰創業時,第一個想到的人不是芯片工程師,而是精通算法的吳彤。
吳彤與胡遇杰研究生時同一個學院,住同一層宿舍,在硅谷的十多年來也一直互相照應。吳彤畢業于上海交大試點班,成績名列前茅;他曾參與亞馬遜Echo的早期開發,擔任過思科資深技術領導、軟件架構師。吳彤成了龍加智的聯合創始人和首席軟件架構師。
龍加智也邀請了云腦科技創始人張本宇和清華大學電子工程系博士生導師歐智堅擔任算法顧問。
張本宇告訴「甲子光年」,他現在會定期和龍加智方面交流,分享算法的前沿發展,及其對芯片設計的機會和挑戰。不同場景的不同算法,對芯片的性能側重有差異化要求,有的場景看中低時延,有的場景則看中高穩定性。
在具體的研發設計過程中,龍加智采取了“軟硬件并行開發”的工程安排。即在ASIC流片前的硬件設計、驗證階段,同時用可重復燒錄的FPGA做軟件系統的開發平臺。這其中的關鍵是做好軟件和硬件的任務分解,清晰知道哪些任務劃給軟件,哪些劃給硬件。長期的芯片工程經驗讓團隊能快速、清楚地做出拆分判斷。
在開發生態層面,龍加智的Dino-TPU提前考慮了兼容性。Dino-TPU同時支持TensorFlow和Caffe兩大主流開源框架。用戶也可以使用龍加智自己的SDK(軟件開發工具包)來開發芯片應用。
創始人的芯片工程師硬件背景,加聯合創始人的軟件背景,龍加智成立之初就是一家軟硬兼備的AI芯片公司。
“龍加智未來將有很多可延展性。”翊翎資本王斌評價。
快節奏背后的工程力量
組建好團隊的龍加智迅速出發,用吳彤的話說是“節奏很快”。
團隊的溝通方式扁平、公開,每個人都會坦誠自己的看法,不一致的地方就一起討論和沙盤推演,他們很快定義出了實現“關鍵任務芯片”低時延、高可靠的技術路線——
高可靠,是通過冗余設計,實現納秒級錯誤檢測和錯誤恢復能力,保障芯片不宕機,數據不丟失,并以硬件加軟件的解決方案,來支持虛擬化后用戶之間的隔離;低時延則是通過片上大量內存的架構,提供很高的memory帶寬。
龍加智開發的第一款架構完美達到了胡遇杰的設想:
主要AI芯片性能、時延、冗余設計與Dino-TPU的對比
根據測算,“Dino-TPU”算力超過了除最新款Volta之外的所有GPU;時延僅為英偉達Volta V100的十分之一;功耗僅為75W,且可根據實際需求用軟件調節;而冗余備份和數據安全保障,是市場上的AI芯片中獨有的。
目前,團隊已提交了8項專利申請,保護核心技術,接下來將和業內企業合作推動關鍵任務芯片的行業標準,這將進一步給公司帶來專利收益。
值得注意的另一個情況是,按照龍加智的開發計劃,他們將在2018年底完成第一款ASIC的流片。這意味著從設計到流片才一年半時間,是一個超過行業一般情況的數字,快到讓人懷疑。
“我在中國融資的時候,說流片100%成功,他們覺得我在吹牛。后來我就說99%、97%可以成功。”胡遇杰說,質疑是因為大多數行外人不理解工程經驗的力量。
他告訴「甲子光年」,快是因為兩個工程安排,一是上文提到過的“軟硬件并行開發”,這能縮短設計周期;二是“模塊化開發”。
模塊化開發能最大程度確保“一次性正確”。經驗豐富的工程師,在設計時,腦中就會考慮這個架構是否容易被驗證,會預判corner case(邊角案例,指特殊情況)和哪里可能出錯。
把任務拆解為簡潔、明了、可靠、可復用的小模塊,就是掌控corner case、清楚知道“邊界”的方法之一。模塊化設計將縮短驗證時間。有的團隊在設計時經驗不足,導致驗證環節依賴大量隨機測試,不停冒出bug,這才把周期拉長。
“所以為什么別人問我流片要幾次?我說肯定只有一次。如果一個架構師做的東西要流兩次片,那他以后找工作就難了,更別說流三次。”胡遇杰說。
未來的征途是行業落地
今年4月,龍加智Dino-TPU已完成demo測試,進入為流片做準備的環節。到目前為止,開發計劃未出現延遲。
接下來公司發展的三件大事是:流片、新一輪融資和組建國內團隊。
龍加智團隊將按部就班地走完開發流程,按計劃流片。
組建國內團隊則關系著未來的商業化。中國有龐大的AI市場空間,且正處于各產業科技升級的大浪潮中。
王斌指出,在FPGA已經開發完畢,流片之前的階段,龍加智團隊需要進一步做“產業鏈磨合”,補充、加強和目標客戶做溝通的能力及團隊,然后根據需求對設計進行相應微調。在這個過程中,云腦科技等公司可以和龍加智開展深度合作,產生協同效應。
從整個AI芯片創業賽道來看,先入場的玩家紛紛到了切進應用場景的階段。如地平線聚焦自動駕駛和安防;深鑒做數據中心和安防,同時發力云端和終端;寒武紀著重發力云端訓練;西井科技在芯片之外,開發了港口自動駕駛應用產品,深挖智慧港口服務。AI芯片未來真正的機會和競爭將發生在商業系統層面。
“今年很多公司都會流片,大家會往各個場景里沉。因為場景需求的差異化,AI芯片的未來肯定不是CPU時代的一家獨大。”王斌說。
目前,龍加智的“關鍵任務芯片”已在美國市場激起了一些水花。美國老牌芯片后端服務公司eSilicon,積極幫助龍加智對接美國投資機構,以期后續展開更多合作。eSilicon此前合作過的公司還包括被Intel收購的Nervana等。
“低時延”的特點,也打動了美國網絡安全公司FireEye的工程負責人,兩家公司已初步對接了后續合作意向。
組建中的國內團隊未來將給龍加智的商業化發展帶來更多期待。
其實這其中還有一層胡遇杰的“私心”—— 他希望回到中國的龍加智,能夠為中國芯片培養出一批真正優秀的工程師,幫助推動行業工程水平的發展、推動對工程的重視。
這不僅是這家名字里帶“龍”字的公司的創立初衷之一;也是17年前,去國離鄉的那個年輕人的初心。
-
AI芯片
+關注
關注
17文章
1914瀏覽量
35270
原文標題:龍加智:硅谷工程師的AI芯片突圍 | 甲子光年
文章出處:【微信號:jazzyear,微信公眾號:甲子光年】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
電子工程師的電源設計經驗
![](https://file1.elecfans.com/web3/M00/05/24/wKgZPGd9BIKAasMYAAP9Ml_injM792.jpg)
![](https://file1.elecfans.com/web3/M00/03/3A/wKgZPGdlPVGAXA8HABFHYewc6WA055.png)
![](https://file1.elecfans.com/web1/M00/F3/FA/wKgaoWciDI6ABdEhAAJtvu-cw_c556.jpg)
![](https://file1.elecfans.com/web2/M00/07/FB/wKgZombz6VuAFeotAAIjSCj1HKI007.jpg)
神話游戲熱浪推動文化輸出,第一線全棧云網安服務助力游戲企業加速全球化部署
![神話游戲熱浪推動文化輸出,第<b class='flag-5'>一線</b>全棧云網安服務助力游戲企業加速全球化部署](https://file1.elecfans.com/web2/M00/ED/12/wKgaomZhWtGAN7ziAABBwDapvOc215.png)
![](https://file1.elecfans.com/web2/M00/FF/40/wKgaomahti2AV26dAAMiNIjdnKg435.jpg)
![](https://file1.elecfans.com/web2/M00/EB/14/wKgaomZXAd-AWEwjAAuV2RdwuSM130.png)
嵌入式軟件工程師和硬件工程師的區別?
![](https://file1.elecfans.com/web2/M00/E5/09/wKgZomZB1aqAfoLMAALwKMk88bw153.jpg)
![](https://file1.elecfans.com/web2/M00/DF/FB/wKgZomY1H9uAdzzJAAMwQMmJ0js548.jpg)
![](https://file1.elecfans.com/web2/M00/DE/DE/wKgZomYwuQ-AegjsAAISSibiD4I286.jpg)
![](https://file1.elecfans.com/web2/M00/C5/1E/wKgaomXxdsmAENR6AAKEdyutPEU736.jpg)
![](https://file1.elecfans.com/web2/M00/C1/46/wKgaomXUeXuAXDwNAAJ_XqvplMU996.jpg)
評論