a11處理器內部圖
蘋果A11仿生芯片內置一系列為特定任務設計的處理核心和強大的控制器。對于這個處理器我們目前了解的不多,而隨著新iPhone的上市,今天我們終于可以對它的GPU、神經引擎、6核CPU、NVMe SSD控制器和新的定制視頻編碼器進行更深入的了解。
新的3核GPU
這是蘋果首次在旗下A系列芯片中整合自主定制的GPU,相比iPhone 7中本就是智能手機圖形架構佼佼者的Imagination GPU,前者的速度提升了30%。
蘋果的新款GPU不僅速度更快了,能效也更高了,相同的工作量下它的能耗只是A10 Fusion處理器的一半。
當初行業開發GPU是為了給圖形加速,可多年來它也開始承擔其他具有相似重復性質的數學運算任務,所以也被稱為“通用GPU(General Purpose GPU)”。蘋果當初開發OpenCL作為API去執行GPGPU,不過后來他們已經將GPGPU計算整合到Metal API中,后者專為iOS和Mac設備中的GPU優化。在今年6月份的WWDC上,Metal API已經更新到Metal 2版本。
現在蘋果同時自主設計圖形芯片及管理它的芯片,那我們可以期待GPU和GPGPU的發展會更快。另外蘋果也同時在研究機器學習,這是GPU最擅長的任務之一。機器學習只在一系列已知的東西)上建立模型,然后利用這個“知識”模型去尋找識別出匹配的東西。比如已知的東西是各種花的照片,那它就可以利用模型在新的照片或者相機取景器中尋找可能是花朵的東西。
蘋果僅表示新GPU有3個核心,并沒有提供其他關于新GPU設計的詳細技術信息。不同的GPU設計需為特定任務和戰略優化,這些設計也讓核心的定義有極大的差別,所以無法直接將蘋果的GPU和英特爾、英偉達、AMD、高通、ARM Mali以及其他廠商的GPU作有意義的對比。
TBDR
值得指出的是,蘋果表示A11仿生芯片GPU圖形架構基于區塊延遲渲染(Tile Based Deferred Rendering)。TBDR渲染技術是專為資源有限的移動設備設計的。它能夠有效地僅渲染3D場景中人眼可見的場景。桌面PC GPU(以及高通Adreno和ARM Mali移動GPU)的IMR立即渲染模式IMR實行的是無差別對待,那些遮蔽處理的部分依然會被渲染處理器,這也導致無意義的讀寫操作更多,浪費了大量性能和帶寬,移動GPU一般無法接受這種簡單粗暴的方式。
TBDR則跳過用戶看不到的東西,將場景分成不同的區塊,分析哪些區塊需要渲染,節省了性能和寬帶,區塊內存速度更快、延遲率低。這種處理流程能讓它異步執行頂點和片段,有利于更好地利用整個GPU。蘋果指出:執行頂點通常需要大量使用固定功能硬件,而執行片段時需要使用數學運算和帶寬。完全重疊能讓設備同時利用GPU上的所有硬件區塊。
TBDR作為一項技術,和Imagination的PowerVR有著緊密的聯系。后者選擇了比較與眾不同的方式,與桌面GPU并行開發,在第一代iPhone問世時嶄露頭角,是專為移動平臺優化的完美GPU架構,它的能效有著PC GPU無法企及的優勢。
不過雖然今年春天Imagination說了,蘋果還沒有證明他們沒有侵犯Imagination知識產品,但是現在Imagination好像已經不再絮絮叨叨地稱蘋果新GPU使用了任何未獲得授權的PowerVR技術,相反Imagination現在已是自身難保,在沒有了蘋果的訂單之后情況急轉直下,最近有消息稱他們已經把自己賣出去了。
另外雖然目前成功的GPU架構不多(很多嘗試最終都以失敗告終),可TBDR也不是Imagination完全獨有的。這就跟CPU行業一樣,雖有很多競爭者都嘗試打破現狀,但是目前移動設備CPU還是ARM架構主導,PC和服務器還是英特爾的x86架構主導。
蘋果的Metal 2向開發者提供了TBDR的細節,以便開發者優化內存使用,提供更細粒度的同步讓GPU可以完成更多工作。蘋果還表示新GPU有一些特性能夠極大強化TBDR,能讓第三方應用和游戲的性能和功能達到一個新的層次。
四核ISP神經引擎
開發全新的GPU架構“還不是那么具有創造性”,所以A11仿生芯片的圖形信號處理器ISP中還有全新的神經引擎,它能夠解決各種特定任務,比如匹配、分析和計算攝像頭傳感器圖像數據中的數千個參照點。
這些任務其實可以由GPU來完成,但是網絡引擎已特別針對矩陣乘法和浮點處理進行邏輯優化,所以它特別擅長處理這些任務。
網絡引擎本身有兩個平行核心,用于處理實時就算,每秒能夠執行6000億次運算。也就是說除了能夠像上一代ISP一樣,在照片上使用復雜的效果之外,它也能夠對實時視頻使用效果。除了使用各種效果,它也能夠讓相機系統識別場景中的物體及結構構成,以追蹤和聚焦用戶當前拍攝的物體。
網絡引擎也是A11仿生芯片的名字來源。“仿生”通常是指人獲得電機、電子裝置增強生物功能,即因為這些增強而有了超人能力。而對于A11仿生芯片,你可以反過來理解它。它其實是機器獲得類人類功能增強。你還可以這樣理解:對于使用這塊芯片的人而言,它就是仿生學增強,能讓用戶完成一般機器人無法完成的任務。
6個新的CPU核心、第二代性能控制器
A11仿生芯片的第三個重點是蘋果自助設計的ARM架構CPU核心。蘋果自2010年開始推出定制A4 SoC,在隨后幾年迅速完善其設計。2013年推出首款64位ARM A7芯片,行業競爭對手一時之間都傻眼了。
去年的A10 Fusion之名源于一個新的架構,它實際上由2個高性能核心和2個高能效核心組成,兩組不同性能的CPU內核設計就可以很好的解決,每一組內核所起到的作用明顯不同,更多是為了在性能和效能之間非常平衡。簡單的說,通過內藏于A10內部定制的硬件級別的管理器,可以讓芯片更好地管理、組織、協調和分配設備上的各項任務,根據最大處理能力或者節能任務要求,決定如何分配CPU內核的使用。
今年蘋果指出,他們的第二代性能控制器能夠在更低能耗的核心上執行任務,或者在更快的高性能核心上加快流程,甚至能夠讓整個6核CPU火力全開。使用不對稱多任務處理設計,A11仿生芯片就能夠根據需要處理的任務,按比例單獨激活任意數量的內核。
在多個核心上處理多個任務需要的不僅僅是SoC上的多個核心,應用和OS特性也需要有針對性設計,以充分利用這些核心。而其實早在iPhone問世之前多年,蘋果在操作系統層面就有這樣的針對性設計,蘋果第三方開發者也是如此。
蘋果已經詳細介紹過他們的軟件操作系統戰略:關閉不必要的處理器單元,對進程進行有效定序,這樣它們的調度運行就能在最大程度實現快速、高效。如今芯片硬件中也采用相似的戰略。其他移動設備廠商,比如三星和LG等則永遠不要開發自己的PC OS平臺。
谷歌從一開始就是往便攜移動平臺的方向對Android進行調整,并不適合那些對性能有要求的用戶。谷歌并沒有真正意義上的平板電腦或桌面計算業務,手機平臺也是針對平均售價低于300美元的手機——Android One價格是100美元,可以說很有競爭力了。Android買家其實是廣告的受眾,而不是對UI、應用性能或多任務處理支持等復雜特性要求比較高的用。Android應用還是為了便于廣告投放而優化。
A11兩個性能優化的通用CPU相比去年A10的,速度有了25%的提升,能效核心則有更大的提高,A11能效核心增加到4個,速度提升了70%。
Geekbench跑分中,同等配置的iPhone 7和iPhone 8在有著明顯的差異,單核速度后者比前者快25%,多核快80%。
這值得特別提出來,因為蘋果的這款芯片還有新的神經引擎、GPU、相機ISP以及其他功能,超出了一般處理器跑分測試有效測試的范圍。
多年來三星也在營銷他們的八核處理器,然而三星處理器和蘋果的對比實在太鮮明,三星單核其實很慢,操作系統沒有優化,無法有效利用多核性能。谷歌甚至還宣稱Nexus 7有16核(CPU和GPU核心總和),然并卵,營銷始終只是營銷,設備并不會因此變得更快一點。其實設備不僅一點都沒有變快,隨著使用時間越來越長,設備的性能不斷減弱。
相比各種吹噓營銷,蘋果則突出產品在實際應用中的表現,比如A11仿生芯片為3D游戲和AR體驗進行了優化。
除了CPU,蘋果在A7中還設計了Secure Enclave來存儲敏感數據。蘋果表示A11仿生芯片在這方面有了提升,不過沒有詳細介紹。
SSD、安全存儲
A11仿生芯片中還有其他特別的特性比如超快SSD存儲控制器集成了定制ECC算法。這不僅僅是為了提升速度。蘋果硬件技術高級副總裁強尼·斯洛基(Johny Srouji)表示:“用戶購買設備,存儲的耐用性和性能應該與設備保持一致。”
也就是說設備上存儲的數據(文件、應用和照片)能得到更好的保護,盡量避免錯誤或者存儲失敗等問題,降低丟失內存和文件的風險,也避免設備使用一段時間之后莫名其妙變慢的問題。這是很多Android設備的通病。
蘋果在2015年MacBook上首推定制NVMe SSD存儲控制器,在硬件層面優化SSD讀寫。然后在A9芯片中將這項技術引入iOS設備中。當初開發NVMe是為了企業市場,而不是消費者電子產品。因為沒有適合的解決方案可將NVMe控制器添加到手機上,有比較便宜的、現成的(有一定年代的)協議可訪問SSD存儲。蘋果就自己開發了。
A11使用的是蘋果第三代iOS存儲控制器,不過需要介紹的東西實在太多,蘋果在發布會上也沒有對它進行介紹。
新的蘋果視頻編碼器
兩年前,蘋果A9帶來了基于硬件的HEVC解碼器,支持設備播放H.265 / High Efficiency視頻內容。去年A10中引入硬件編碼器,支持iPhone 7以那個格式創建和保存內容。
iOS 11也支持這些新特性,并在相機設置中添加了相應的“高效視頻捕捉”選項。打開這個選項,照片就會使用HEIF格式,視頻使用HEVC格式壓縮。
這些High Efficiency格式的優點在于能夠極大減小高像素照片和視頻占據的空間。
蘋果表示,HEVC格式下1分鐘的4K 30fps視頻大小為170MB,H.264格式的話同樣的視頻大小為350MB,后者是前者的2倍。
要播放這些HEVC視頻內容自然需要能夠解碼它們的設備。A9之前的iOS設備可以軟解,可是相比硬解,軟件需要的時間更長,而且非常耗電。
HEIF視頻可以轉換成H.264視頻,或者用戶可以默認“大部分兼容”,從而繼續以JPG格式保存圖片,以H.264格式來保存視頻。但這也就意味著禁用4K 60fp(以及24fps電影設置)來錄制視頻。
蘋果為A11開發專屬視頻編碼器,還公開了這一點,著實有趣啊!以前在iPod和其他設備中,蘋果會直接使用行業中已有的標準,整合支持各種音頻和視頻編解碼器,包括微軟的WMA、WMV和VC-1等。蘋果沒有激活這個動能,而是選擇使用MPEG LA合作伙伴開發的行業標準。
我們不知道微軟是否獲得Windows Media IP對蘋果所購買芯片的授權,可還有一個更大的問題就是蘋果需要問他們不想使用的東西付錢。如今蘋果自己開發視頻編碼器,他們就只需要針對支持的格式優化,而不是芯片供應商選擇的所有編解碼器。
谷歌的YouTube起初是與蘋果合作為iOS用戶提供H.264視頻內容。不過谷歌有意完善他們從On2收購來的VP8和VP9編解碼器。雖然YouTube還是繼續為iOS用戶提供H.264視頻,可是YouTube視頻沒有H.264格式或者更新的H.265/HEVC格式,所以Safari用戶無法在網頁上查看4K YouTube視頻。
所以你會看到Apple TV 4K也無法播放YouTube 4K內容,這其實還是因為谷歌不提供Apple TV 4K可以解碼的內容。現在還不知道蘋果和谷歌會如何解決這個問題,谷歌是不是繼續拒絕對iOS設備提供4K支持。
iPhone 7、iPhone 8和iPhone X中整合了高效、專門優化的HEVC編碼器后,用戶存儲更多照片和視頻需要的空間卻更少。可以想到的是,這也能夠降低SSD存儲磨損,因為有大約一半東西會被寫出、移動然后突然抹去。
HEVC還支持錄制更高幀率的內容。iPhone 8和iPhone X支持錄制4K 60fps視頻。iPhone 7錄制的4K視頻雖然也很清晰,但是如果錄制過程中攝像頭或拍攝對象的移動速度過快,畫面就會出現抖動。支持60fps幀率的話,視頻看起來就會更好。
不過幀率越好,如果沒有先進的壓縮技術,一分鐘的視頻可能會占據800MB空間。使用HEVC,4K 60fps視頻相比4K 30fps視頻占據的空間也沒有增加很多。在這里要提醒用戶,HEVC 60fps視頻需要強大的處理能力或者專門的硬件解碼器才能播放。舊款Mac播放iPhone 7錄制的4K視頻已經非常吃力了。
雖然我們介紹了這么多關于A11仿生芯片的內容,但是這塊芯片里還有很多未被公開的秘密。
拆解iPhone8A11處理器內部構造
iPhone 8、iPhone 8 Plus和iPhone X均使用Apple A11 Bionic處理器,究竟這個處理器內部有什么構造,可以做到2+4核超強性能?最近有專業芯片拆解研究網站拆解了iPhone 8 Plus,看看A11處理器的構造。
TechInsights(在2016年與Chipworks合并的研究機構)為iPhone 8 Plus作一次詳細的拆解,Chipworks過去多次拆解iPhone解構處理器以及其他芯片的構造,在2016年9月與TechInsights合并之后,兩者一起繼續拆解iPhone。在拆解了iPhone 8 Plus后,發現Apple A11 Bionic處理器的面積比Apple A10 Fusion少足30%,原因是A11用上更先進的10nm制程以及遷就iPhone X主板大小,導致面積縮小。
A11處理器擁有6核心,2核高效4核省電,就算面積縮小,處理器仍內藏復雜的結構,從TechInsights的圖片顯示A11處理器的6核分布在整體芯片的右方,2個CPU1是高效處理核心,占用面積較大,4個CPU2是省電處理核心,面積較小。總結而言處理核心占A11處理器面積的15%。
而A11處理器伺用較大的卻是圖像處理核心,占20%面積,擁有6核心,位置與A10 Fusion處理器相似。
iPhone 8 Plus主板芯片逐一踢爆
除了A11處理器之外,TechInsights也拍下了iPhone 8 Plus的主機板正反兩面照片,在A11處理器背面就有SK Hynix的3D NAND快閃儲存芯片和BCM59355無線充電芯片,而A11處理器那一面就分布了Micron 3GB LPDDR4 SDRAM、和NXP,有一點要留意的是因為蘋果和高通的官司關系iPhone 8 Plus嘗試擺脫高通,在Baseband以及LTE部分均用上了Intel芯片。
評論
查看更多