為幫助讀者在即將到來的2021春招中斬獲心儀offer,我們將整理一系列求職文章。
本文介紹騰訊、百度、滴滴三家大廠NLP算法的最新面試經驗,其中前兩家公司給了ssp offer。
騰訊TEG實習
視頻一面
1、自我介紹
自我介紹即開場白需要提前準備并多次練習,內容不用太多,言簡意賅地講清楚學校、專業、研究方向,概括介紹實習/論文/比賽等亮點即可,細節可以根據面試官的興趣再深入。
2、項目/實習經歷
這部分主要根據簡歷上的實習/項目進行,可能會問背景、怎么做、為什么這樣做、最終結果、是否成功上線等,再深挖一些技術細節,或順帶考察ML、DL等知識點。
由于校招同學沒有工作經驗,所以項目和實習是展示自身能力的最好亮點(一堆CCF-A的大佬請忽略并接受我的膝蓋)。面試官可以從介紹中了解你的工程能力、抗壓能力、溝通能力、思維方式等等,如果吸引到面試官肯定能加分,要是面試官覺得索然無味估計面試也就到這兒了...
所以對于簡歷上的內容要滾瓜爛熟,能知其然知其所以然最佳。如果問到簡歷上的內容沒答上或吞吞嗚嗚,將非常打臉,造成硬傷(簡歷上自己寫的都不會,別的還用問嗎╮( ̄▽ ̄)╭)。
切忌在簡歷上洋洋灑灑地寫“熟悉Xgboost、SVM、Bayes、HMM、CRF、KNN、LR、CNN、Attention等算法”。是聽過名字就算熟悉?還是啃過源碼、理解背后原理?即便真的對這些算法理解透徹,最好也能結合例子來說明,而不是窮舉。
而對于沒有項目/實習/比賽經歷的同學,這一部分時間只能由考察基礎算法來彌補了,這樣一來隨機性、難度都提升了不少;所以平時盡可能多積累這方面的經驗,讓簡歷充實起來。
“項目 or 實習 or 比賽 or 論文”最好為真,這是底線。
3、介紹一個比賽
我從簡歷上3個比賽中,選擇了一個最有亮點的比賽,從數據、模型、提分trick三方面做了介紹。
4、如何實現知識蒸餾,loss怎么選擇
5、介紹TinyBert的工作原理
6-9考察機器學習基礎
6、LR是線性模型嗎,為什么?
7、梯度下降和隨機梯度下降的區別
8、GBDT和XGBoost的區別(至少3方面)
9、偏差和方差的區別
10-11考察深度學習基礎
10、怎么理解XLNet的,XLNet的輸入是什么?
11、一個二分類任務,假設只有一個維度的特征,取值范圍是0~正無窮,如何實現二分類?
12、手撕代碼:兩個數組求交集
只能使用 list,如果要用其他數據結構(比如字典)需要自己實現;時間復雜度盡可能低。
騰訊一面難度中規中矩,量比較多但基本都在考察基礎。
關于手撕代碼,今年應該是非常關鍵也是必做的環節,很多公司直接將編程題作為通過面試與否的硬性指標。刷題要趁早!
電話二面
1、詢問兩個實習項目,詳細考察細節
2、介紹textcnn實現過程,池化時loss如何反向傳播
3、假如不用bert,一大堆文本有幾百萬個詞,直接訓練詞向量很困難,如何去做特征選擇
4、LSTM門控機制是怎樣的
5、LTSM主要解決了RNN什么問題,為什么能解決
6-9重點考察語言模型
6、介紹GPT2如何寫詩、寫對聯
7、GPT2如何圍繞一個主題/關鍵詞寫詩
8、ELMO、BERT、GPT模型彼此之間有什么區別
9、word2vec和ELMO主要有什么不同,為什么elmo效果更好
hr視頻面
1、詢問導師、實驗室的研究方向
2、智能客服系統中,你主要負責哪些模塊?
3、base在深圳能否接受,多久可以來實習?
面試結束后過了2天,成功收到TEG的offer call。
百度自然語言處理
視頻一面
1、手撕代碼:
給定一個字符串S和一個字符C。返回一個代表字符串S中每個字符到C的最短距離的數組。
# inputS="paddlepaddle",C='d'# output[2,1,0,0,1,2,2,1,0,0,1,2]
2、介紹簡歷上的2個項目和1個比賽
3、介紹bert和TinyBert
4、bert如何實現微調
5、fasttext的實現原理
6、文本匹配如何實現
7、手推信息增益、信息增益率、Gini指數公式
8、ngram如何過濾不合理的組合
9、還有什么想和我分享的?
面試官給了一個展現自我的機會,我介紹了一個最近在實驗室新做的項目(簡歷上沒有)。
視頻二面
1、手撕代碼:
word2vec負采樣具體怎么做的(知識點:累積概率分布、二分區間查找)
2、文本匹配怎么做
3、文本匹配不當分類來做,loss怎么設計?
4、bert在中文和英文場景下使用,有什么區別
5、介紹一下在開源組織CLUE的工作
6、假如給offer,什么時候能來實習
hr視頻面
聊個人特質、看重公司哪些方面、個人職業規劃等
滴滴出行規劃
視頻一面
1、詳細介紹1個項目和1個比賽
面試官讓現場打開比賽鏈接查看排名和解決方案
2、手撕代碼:
因式分解
判斷年份是否為閏年
視頻二面
1、介紹1個項目
2、介紹transformer
3、介紹常用的聚類算法(KMeans、DBSCAN、Mean Shift)
4、介紹word2vec2種實現模型、區別以及和fasttext的區別
5、手撕代碼:并查集
視頻三面
1、介紹1個項目
2、手撕代碼:
兩個有序數組,求第k大,時間復雜度盡可能低(log(m+n))
總結
近兩年AI算法崗非常內卷,加上疫情影響給找好工作都增加了難度。但身邊的朋友基本都在頭部大廠收獲了1+offer。實習和項目經驗仍然很重要,ACL、NIPS等論文近些年在貶值。扎實的理論基礎和coding能力可以讓你進大廠后繼續保持足夠的競爭力。
手撕代碼是面試的一道坎,要早做準備。同時,盡可能把握住可以跳過筆試(大部分公司)的提前批面試。
祝大家在新的一年offer多多,好運連連。
責任編輯:xj
原文標題:騰訊、百度、滴滴最新NLP算法面經
文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。
-
百度
+關注
關注
9文章
2297瀏覽量
90877 -
騰訊
+關注
關注
7文章
1672瀏覽量
49663 -
自然語言處理
+關注
關注
1文章
622瀏覽量
13672 -
nlp
+關注
關注
1文章
489瀏覽量
22131
原文標題:騰訊、百度、滴滴最新NLP算法面經
文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
百度成功點亮國內首個昆侖芯三代萬卡集群
百度智能云點亮昆侖芯三代萬卡集群
百度百科啟動“繁星計劃”
百度正式回應進軍短劇領域
百度文心大模型日均調用量超15億
百度小度將發布AI智能眼鏡
百度云智大會開幕 三星攜手百度共探AI新機遇

百度百舸AI計算平臺4.0震撼發布
百度健康推出五款大模型應用產品
百度智能云升級3款大模型應用:面向三類場景打造企業“超級員工”
百度申請文小言商標
2024百度移動生態萬象大會:百度新搜索11%內容已AI生成
百度與特斯拉探討Robotaxi合作新機遇
百度智能云正式發布了《百度智能云水業大模型白皮書》

評論