老板氣勢洶洶走進質檢室:“你都在瞎折騰啥,電腦主板修好了嗎,客戶一直催我發貨,有進展沒?”吳解兩手一攤:“還真有,絕對是物理損傷,報廢吧。”老板:“報廢!說得輕松,你又不是不知道一塊板子多貴!頂得你半年的工資。”話一出口老板意識自己說多了。
還有其他同事在場,話落同事的眼睛都盯著吳解,露出一副羨慕嫉妒恨的眼神,我打著圓場:“老板,我的工資好多年沒變,你剛剛莫非說的是我的調薪計劃?現在就能答復你——我接受計劃,哈哈哈”吳解是一名程序員,老板始終以為電腦沒跑起來是主板內存啟動參數設置錯誤導致,揪著他不放,施壓勢必要修好。
公司只為大客戶生產電腦主板,什么是大客戶呢?那就是它的稀缺性,客戶定制的主板應用于專用領域,不同于家用的電腦。客戶有多大呢?客戶一下單可以保證公司三年渠道不愁。機會和風險并存,如果設備出了設計缺陷問題,客戶不高興可能三年的產品都要一次性退回,公司就歇菜咯。
產品賣得也老貴了。老板:“你再查查是哪個器件壞了,換掉它。”吳解再三確認老板的態度:“還能再更換器件嗎?之前板子已經更換過一次,高度懷疑電路板走線斷,換其他器件無效。”聽老板口氣是想對返修規程開綠燈,按照規程,電路板維修最多只能更換一次器件,否則的電路板不允許發貨。
老板:“更換器件也是下下策,你再嘗試調試軟件行不行,說不定就好了呢,目前你必須在不改變電路器件的情況下確定是哪個器件損壞,確認不出你下個月沒績效。”給出電路板斷線的結論老板是聽不進去的,沒有直接證據擺在他面前,光憑借個人經驗說服不了。
如果不把老板說服,扣績效就不是停留在口頭上的威脅,好肉疼啊。吳解思緒片刻轉身走出質檢室。老板在后面指他的背影著嚷著道:“喂你去哪,你是不是忘記拿故障板了!”吳解:“已經定位故障,我得找一家有X光資質的企業。我的話在你這里沒有權重,給電路板拍一張X光,是不是布線斷一目了然。《訴訟法》把這稱啥來著,零口供定罪。”
2. 拓撲
家用計算機CPU和內存的連接方式簡要圖是這樣的:
內存顆粒的16根公共地址總線A0~A15連接到CPU的16個地址端口上,結構都一樣我僅畫出一根示意,控制地址線的IO口看成有上下拉的電阻,電阻兩端接數字地和1.5V上拉電源;顆內存顆粒組成一條內存,末端電阻連接0.75V電壓,因為它必須放在最后一顆內存顆粒后,所以也叫端接電阻。其實還有數據信號、控制信號、時鐘信號,它們都和本文關注點關系不大就省略,避免閱讀疲勞。
主板內存要能運行必須保證4部分同時正常:
CPU、內存顆粒、供電、信號通路。電腦主板的故障現象一句話描述就是“電路板受熱后內存數據訪問錯位” ,具體的錯位現象在之前發過視頻,即使不看視頻也不影響下文的閱讀,具體排查思路我將在另一篇文章里詳細描述,讀者暫時接受我的結論——故障由于地址線A0信號通路斷路引起。
3. X光拍照
委托機構聊天群里傳回電路板X光俯視圖,黑色實心的圓點是BGA焊盤,兩焊錫求之間有個淚滴形狀的長方形是0402封裝的陶瓷電容,置于芯片背面起到濾波作用;與BGA焊盤矩陣成45度錯位整齊排列的小圓形是過孔;某些芯片內部還能看到若干弧形飛線;交錯縱橫灰蒙蒙的線條是電路板走線銅箔,它們的寬度只有BGA焊盤直徑的1/6。
走線的清晰度不是太高,反復在電腦端查看PCB圖核對X光下若有若無的走線陰影,尤其是在大面積網格覆銅的情況下,假如斷路位置在它上方,X光是無能為力的。或許CT可以排上用場,電路板拍照最大的好處是可以充分發揮放射儀器的分辨率特性,分辨率和什么有關系?
斷層數唄。拍攝CT時候醫生會考慮到照射部位的變異敏感性,特意降低放射計量、盡量少的斷層照射。電路板幾乎沒有放射計量的顧慮,直接以最小斷層去采集數據。
期初故障僅在受熱情況下發生,證明斷路位置僅僅微弱的斷裂,銅箔微變形才斷開。幸運的是,反復用風筒加熱電路板已經超過產品器件的耐受溫循次數,最終即使在常溫情況下也能復現故障,希望裂縫能更明顯。傳統電子企業做溫度控制篩選需把產品放入一個像冰箱的設備,稱之為溫箱,溫箱能制冷也能加熱,溫度控制在-50~80℃,大的溫箱有一個房間大小,人可以直接進入,稱為步入式溫箱。
傳統冰箱的方式對整個產品放入溫箱整體溫控,電子產品出現問題后很難定位是哪個器件溫度明感,一直很希望能有一種可以給單獨器件加熱、制冷的溫箱。2019年就有一家國內企業研發了相關產品《一種溫度控制系統設計及在高低溫測試中的應用》,可惜產品不對外銷售。既然市面上買不到理想的單點溫控設備,退而求其次DIY一個用模板隔絕器件之間溫度傳遞的想法。
回想排查過程,猜測斷路點更靠近CPU側面,哪來的結論呢?在用風筒給電路板加熱時,風筒中心對著CPU,CPU和內存條之間用一塊木板隔離,風筒熱度和風速都沒開到最大檔位,試圖一定程度上做到單獨給某區域加熱,進一步縮小懷疑區域。究竟斷路點更靠近CPU側還是更靠近內存條側。
吳解提醒同事在EDA軟件上操作:高亮地址線A0的整條鏈路,核對A0信號腳途經的焊盤、過孔、走線。用于連通雙面板和多層板各層之間的印制導線,在各層需要連通的導線的交匯處鉆上一個公共孔,即過孔。在工藝上,過孔的孔壁圓柱面上用化學沉積的方法鍍上一層金屬,用以連通中間各層需要連通的銅箔,而過孔的上下兩面做成圓形焊盤形狀,過孔的參數主要有孔的外徑和鉆孔尺寸。
過孔在線路板中,一條線路從板的一面跳到另一面,連接兩條連線的孔也叫過孔,區別于焊盤,邊上沒有助焊層。過孔不僅可以是通孔,還可以是掩埋式。所謂通孔式過孔是指穿通所有覆銅層的過孔;掩埋式過孔則僅穿通中間幾個覆銅層面,仿佛被其它覆銅層掩埋起來。
發現離CPU BGA焊盤最近的過孔影像和其他過孔有明顯差異,理想狀態下過孔影像應該是垂直圓筒狀、或空心圓形,具體形狀依據拍攝視角而定,影像上兩層過孔邊沿并不是相互垂直的,略有些偏移,看起來像兩個套在一起啊的奧運五環,疑似過孔工藝有瑕疵。EDA上顯示A0的過孔屬于Top(頂)層到Bottom(底)層的通孔,接著在疑似瑕疵過孔旁邊查詢有沒有連通同樣兩層的同規格過孔:有,還很多,離得也很近。選擇最近的幾個過孔影像與A0比較也存在明顯差異。
為什么要和它們對比呢?在歐式空間中,同一平面上的兩條平行線永不相交。這是每個受過九年義務教育的人都知道的常識,這一常識在射影空間中不再成立,兩條相互平行的鐵軌離觀察者越遠鐵軌間距越窄,在無限遠處相交于一點。X光垂直照射也存在細微的射影空間視覺差,相機正下方的過孔呈空心圓狀,距離遠的過孔呈圓筒狀,找幾個與A0較近的過孔是為了識別射影空間的視覺欺騙。拿起手機在聊天群里輸入:“請傾斜些角度拍攝電路板CPU位置,角度盡可能多。”
換角度拍證實地址線A0信號斷路的猜想。除了瑕疵過孔外,其他的過孔都成圓筒狀,瑕疵過孔的圓筒內壁陰影深度既不同于正常過孔的深,也沒有無銅區域暗淡,推測渡金屬工序鍍層厚度不足。懷疑經歷多次高低溫應力實驗,最終使得過孔內壁撕裂。
撕裂的位置位于BGA焊盤到第一顆內存顆粒之間,具體可以參看文章的第一張圖。猜想是建立在X光照片之前的思考實驗,最終照片證實猜想的成立。相比于先看到照片后天馬行空的揣測,前者更具說服力。
4. 對峙
向電路板制作廠家展示疑似瑕疵過孔的照片,希望的得到他們的確認,故障板卡就能蓋棺定論。“故障板疑似瑕疵過孔與同類型過孔有點區別,請你們協助分析是否存在異常,還需要做哪些驗證?可否形成相應的結果及報告?”叮咚——30分鐘后得到對方的信息恢復,還未看清文字內容對方居然撤回消息,對方沒立即編輯新消息。
同事調侃道:“廠家是不想認賬咯,欲言又止。”繼續等待15分鐘后廠家回復一段更加正式、避重就輕的答復。“你好,就目前檢查的結果,并未在表面焊接部分發現質量問題,過孔是否存在異常需要相關檢驗設備,拆卸器件,PCB逐層打磨拍照銅箔是否存在缺失,我司不具備相關設備條件,沒法針對故障給出分析報告。”廠家是非但不承認質量缺陷還試圖毀尸滅跡,誘導破壞實驗,實驗結束后再出具報告產品質量完整,鍋甩得賊溜。
其實排除過孔是否存在瑕疵還沒到破壞實驗的地步,卸掉CPU是必要的操作,萬用表兩端分別接觸A0的BGA焊盤,另一端接觸內存顆粒末端電阻,如果蜂鳴器發出“嗶”,就證明沒有斷路。再次拆卸CPU觸發第二次維修跟換器件條件,得結果老板的同意,無論是否能修好都不允許售賣,為的是死的明明白白。老板的思想工作請其他同事去做,X光照片擺在這里,耗在這也不可能有結果,真要是過孔瑕疵老板給客戶的答復也輕松,上游廠商的疏忽打板子總不至于打到自己頭上。
老板無奈同意:“卸吧。”雖說吳解有著十足的把握是線路肯定是斷的,在用萬用表測試前依舊存在些許忐忑,萬一響了,幾星期的奮戰豈不是顆粒無收。加之報廢一塊電路板,老板必定會記在賬上,就算是賣不出去老板也會讓他繼續排查找到真實故障原因。沒響。吳解可以暫停腦子里的小劇場,抬起頭嘴角上翹:“老板,來聽聽,我沒說錯吧,就是斷了”。老板接過吳解手中的萬用表:“剛剛碰哪了?讓我來測試。”
5. 老板的奇思妙想
老板不甘心直接報廢電路板,提出一個大膽的想法試圖挽回損失,“既然瑕疵過孔是一個通孔,或許還有挽救的措施,”老板在紙上畫著草圖給大伙解釋道。
“在原來過孔的位置用電鉆前后打通,電路板已經不是裸板沒法用電鍍的方式重新補過孔金屬,嘗試這網過孔里灌入融化的焊錫,刮掉過孔附加頂層和底層綠油保護層,焊錫兩端掛在兩層電路板末端銅箔上。”
吳解也不反駁,只提醒幾個風險:“第一過孔中間板材沒有金屬,焊錫根本無法附著全靠兩端零星的銅箔支撐;第二過孔處理好后,旁邊可是BGA焊盤呢,CPU還要重新焊接上去,加溫后灌入的焊錫是否還能牢靠抓住銅箔不確定,大概率會受到液體張力脫離銅箔形成膠囊狀;第三就算重復修復3-5次成功了,電路板能否經受得住震動實驗呢?”電路板制作廠家不敢承接老板的大膽想法,以鉆頭精細度不足、從未有類似返修先例為由拒絕。
6. 下期預告
還記得前文提醒“排查過程”放在另一篇文章嗎,并不是我特意而為之,排查過程閱讀起來沒有本文輕松,涉及到不少計算機接口原理和軟硬件調試方法,合成一篇文章讀者閱讀會失去興趣,在這里首先高能預警,系列文章你將要了解到:
為什么內存條都是單面4或8顆排列?
BIOS怎么適配不同內存條?
購買內存條2根套裝比單根貴的原因?家用主板究竟是否真有必要購買套裝內存?
怎么讓CPU停止下來?
主板只有一顆16位位寬的內存顆粒,64位CPU能否運行?
責任編輯:haq
-
cpu
+關注
關注
68文章
10929瀏覽量
213430 -
內存
+關注
關注
8文章
3074瀏覽量
74456
原文標題:6. 下期預告
文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論