幾個機(jī)器學(xué)習(xí)面試問題解析從容應(yīng)對面試
▍目錄
全局
優(yōu)化
數(shù)據(jù)預(yù)處理
抽樣和拆分
監(jiān)督學(xué)習(xí)
無監(jiān)督學(xué)習(xí)
模型評估
集成學(xué)習(xí)
商業(yè)應(yīng)用
▍全局
基本的ML理論,如偏差方差權(quán)衡。
向外行人解釋機(jī)器學(xué)習(xí)。
想象一個好奇的孩子,將他的手掌放在蠟燭火焰上,并在感受到短暫的灼熱后立刻把手縮回來。第二天,他碰到一個熱的爐子,頂部看到紅色,感覺到前一天像蠟燭一樣的熱浪。
這個孩子從來沒有碰過爐灶,但幸運(yùn)的是,他從以前的數(shù)據(jù)中學(xué)到了,避免了紅色的灼傷。
“擬合”模型意味著什么?超參數(shù)如何相關(guān)?
擬合模型是使用訓(xùn)練數(shù)據(jù)學(xué)習(xí)模型參數(shù)的過程。
參數(shù)有助于定義機(jī)器學(xué)習(xí)模型的數(shù)學(xué)公式。
然而,還有一些稱為超參數(shù)的數(shù)據(jù)不能被學(xué)習(xí)的“較高級”參數(shù)。
超參數(shù)定義模型的屬性,如模型復(fù)雜度或?qū)W習(xí)率。
解釋偏差方差權(quán)衡。
預(yù)測模型在偏差(擬合模型數(shù)據(jù)的方式)和方差(基于輸入變化的多少)之間有權(quán)衡。
更簡單的模型是穩(wěn)定的(低方差),但它們不接近真相(高偏差)。
更復(fù)雜的模型更容易被過度使用(高差異),但它們具有足夠的表達(dá)能夠接近真實性(低偏倚)。
給定問題的最佳模式通常位于中間的某處。
▍優(yōu)化
找到模型最佳參數(shù)的算法。
隨機(jī)梯度下降(SGD)和梯度下降(GD)之間有什么區(qū)別?
兩種算法都是通過對數(shù)據(jù)進(jìn)行參數(shù)評估,然后進(jìn)行調(diào)整,找到一組最小化損失函數(shù)的參數(shù)的方法。
在標(biāo)準(zhǔn)梯度下降中,您將評估每組參數(shù)的所有訓(xùn)練樣本。這類似于為解決這個問題而采取了大而緩慢的步驟。
在隨機(jī)梯度下降中,在更新參數(shù)集之前,您只需評估1個訓(xùn)練樣本。這類似于向解決方案邁出的小步驟。
什么時候使用GD超過SDG,反之亦然?
GD理論上最大限度地減少誤差函數(shù)比SGD更好。然而,一旦數(shù)據(jù)集變大,SGD就會收斂得更快。
這意味著GD對于小數(shù)據(jù)集是優(yōu)選的,而SGD對于較大的數(shù)據(jù)是優(yōu)選的。
然而,實際上,SGD用于大多數(shù)應(yīng)用程序,因為它可以將誤差函數(shù)最小化,同時為大型數(shù)據(jù)集提供更快的速度和更高的內(nèi)存效率。
▍數(shù)據(jù)預(yù)處理
處理丟失的數(shù)據(jù),偏態(tài)分布,異常值等
什么是Box-Cox轉(zhuǎn)換?
Box-Cox轉(zhuǎn)換是一種廣泛的“權(quán)力轉(zhuǎn)型”,它轉(zhuǎn)換數(shù)據(jù),使分布更加正常。
例如,當(dāng)lambda參數(shù)為0時,它相當(dāng)于對數(shù)轉(zhuǎn)換。
它用于穩(wěn)定方差(消除異方差)并使分布正常化。
什么是3種數(shù)據(jù)預(yù)處理技術(shù)來處理異常值?
1.Winsorize(cap 閾值)。
2.轉(zhuǎn)換以減少偏態(tài)(使用Box-Cox或類似的)。
3.如果你確定它們是異常或測量錯誤,請刪除異常值。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
幾個機(jī)器學(xué)習(xí)面試問題解析從容應(yīng)對面試下載
相關(guān)電子資料下載
- 如何創(chuàng)建FPGA控制的機(jī)器人手臂 49
- 機(jī)器學(xué)習(xí)需要掌握的九種工具盤點 16
- Hugging Face被限制訪問 404
- 《人工智能在指揮和控制系統(tǒng)中的決策支持》 133
- 生成式人工智能和機(jī)器學(xué)習(xí)正在這9個學(xué)科中打造未來 216
- 智慧礦山AI算法帶你解決皮帶運(yùn)行難題! 51
- 人工智能領(lǐng)域存在第一性原理嗎? 53
- 英特爾啟動首個AI PC加速計劃,目標(biāo)2025年前為超100萬臺PC提供AI特性 223
- PLC就是邏輯控制嗎?PLC的網(wǎng)絡(luò)通信怎么樣? 51
- 機(jī)器學(xué)習(xí)常用的5種采樣方法盤點 45