導(dǎo)讀
這個(gè)checklist能幫助你邁出做一個(gè)成功的機(jī)器學(xué)習(xí)項(xiàng)目第一步。
避免混淆,用這個(gè)簡(jiǎn)單的清單來計(jì)劃你的 AI 項(xiàng)目。
對(duì)許多人來說,機(jī)器學(xué)習(xí)仍然是一項(xiàng)新技術(shù),這可能會(huì)讓它難以管理。
項(xiàng)目經(jīng)理通常不知道如何與數(shù)據(jù)科學(xué)家談?wù)撍麄兊南敕ā?/p>
在我們規(guī)劃 30 多個(gè)機(jī)器學(xué)習(xí)項(xiàng)目的經(jīng)驗(yàn)中,我們提煉出了一個(gè)簡(jiǎn)單有效的checklist。
1. 項(xiàng)目動(dòng)機(jī)
明確你的項(xiàng)目的更廣泛的意義。
你要解決的問題是什么?What is theproblemyou want to solve?
相關(guān)聯(lián)的目標(biāo)策略是什么?
如果項(xiàng)目團(tuán)隊(duì)不理解你的動(dòng)機(jī),那么他們就很難提出好的建議。
有很多方法可以解決機(jī)器學(xué)習(xí)的問題。所以幫助你的團(tuán)隊(duì)以你最感興趣的方式工作 —— 退一步告訴他們?yōu)槭裁催@個(gè)項(xiàng)目是重要的。
2. 問題定義
你想要預(yù)測(cè)的具體輸出是什么?
對(duì)于給定的輸入,你的機(jī)器學(xué)習(xí)模型將理想地學(xué)會(huì)預(yù)測(cè)非常具體的輸出。
所以這里你要盡可能的清楚。“預(yù)測(cè)機(jī)器故障”可能意味著很多事情 —— “告訴我,在未來 24 小時(shí)內(nèi),意外停機(jī)的風(fēng)險(xiǎn)何時(shí)增加 50%以上”更好。
你的算法有什么輸入數(shù)據(jù)?
模型預(yù)測(cè)輸出的唯一方法是從模型的輸入因子中派生出來。所以,為了有機(jī)會(huì)做出好的預(yù)測(cè),你必須有與輸出相關(guān)的數(shù)據(jù)。數(shù)據(jù)越多越好。
什么是預(yù)測(cè)你的具體輸出的最相關(guān)因素?
算法不能理解我們的世界。重要的是,你要給數(shù)據(jù)科學(xué)家一些提示,告訴他哪些數(shù)據(jù)實(shí)際上是相關(guān)的,這樣他就可以用算法能夠理解的方式選擇和分割數(shù)據(jù)。
你能提供多少訓(xùn)練樣本?
一個(gè)算法需要的練習(xí)比一個(gè)人要多得多。你最少需要 200 個(gè)樣本。越多越好。
3. 性能度量
你怎么知道什么是好的結(jié)果?
你有一個(gè)簡(jiǎn)單的基準(zhǔn)測(cè)試來比較你的結(jié)果嗎?
有沒有一種簡(jiǎn)單的方法來利用你已有的數(shù)據(jù)進(jìn)行預(yù)測(cè)?也許你可以根據(jù)去年的數(shù)字預(yù)測(cè)銷售額,或者通過計(jì)算客戶上一次登錄后的天數(shù)來評(píng)估客戶離開的風(fēng)險(xiǎn)。一個(gè)簡(jiǎn)單的基準(zhǔn)測(cè)試可以為你的團(tuán)隊(duì)提供有價(jià)值的問題洞察力。它給你一些東西來衡量模型。
你將如何衡量預(yù)測(cè)的準(zhǔn)確性?
你期望的最低準(zhǔn)確度是多少?
你希望預(yù)測(cè)的準(zhǔn)確率平均在 5% 以內(nèi),還是更重要的是預(yù)測(cè)誤差不超過 10%?你的模型可以以任何一種方式進(jìn)行調(diào)優(yōu)。哪種方式更好取決于什么對(duì)你來說是重要的。
一個(gè)完美的解決方案是什么樣的?
即使這對(duì)你來說是顯而易見的,把它寫在紙上也能幫助你理清思路。
是否有參考解決方案(如研究論文)?
如果有人以前解決過類似的問題,就把他們的解決方案當(dāng)作靈感。這為每個(gè)人提供了一個(gè)共同的起點(diǎn),這樣他們就可以看到要使用哪些數(shù)據(jù),可能會(huì)出現(xiàn)哪些問題,以及要嘗試哪些算法。
4. 時(shí)間線
一個(gè)性能驗(yàn)證項(xiàng)目的時(shí)間線示例。
是否有截止日期需要注意?
你什么時(shí)候需要看到第一個(gè)結(jié)果?
你想什么時(shí)候有一個(gè)完整的解決方案?
人工智能解決方案可以無限地改進(jìn)。明確的最后期限有助于讓團(tuán)隊(duì)集中精力。
5. 聯(lián)系人
誰負(fù)責(zé)項(xiàng)目(PM)?
誰可以授權(quán)訪問數(shù)據(jù)集?
誰能幫助理解當(dāng)前的流程和/或簡(jiǎn)單的基準(zhǔn)測(cè)試(領(lǐng)域?qū)<??
在一個(gè)項(xiàng)目的過程中會(huì)出現(xiàn)許多問題。明確你的工程師可以向誰求助。
6. 合作
在業(yè)務(wù)和工程團(tuán)隊(duì)之間建立一個(gè)雙/周的更新。
每周安排一次會(huì)議來查看當(dāng)前的結(jié)果,并討論那些不需要通過電子郵件來回答的問題。
應(yīng)該涉及誰?
他們應(yīng)該學(xué)什么?
在學(xué)習(xí)如何管理人工智能方面,沒有什么比實(shí)際項(xiàng)目的實(shí)踐經(jīng)驗(yàn)更有價(jià)值。如果你想讓你的團(tuán)隊(duì)的其他成員學(xué)習(xí),從一開始就要說清楚。
定義代碼和問題的位置以及如何訪問代碼。
讓所有的開發(fā)從一開始就透明。這樣任何人都可以很容易地加入,給出提示,并檢查進(jìn)展。
回答這個(gè)清單上的問題,并與大家分享
世界仍在研究如何最好地運(yùn)行人工智能/機(jī)器學(xué)習(xí)項(xiàng)目。填寫這份清單將會(huì)給你所有成功的機(jī)器學(xué)習(xí)項(xiàng)目的要素之一:理解。
-
AI
+關(guān)注
關(guān)注
87文章
31155瀏覽量
269485 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8425瀏覽量
132773
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
構(gòu)建云原生機(jī)器學(xué)習(xí)平臺(tái)流程
傅立葉變換在機(jī)器學(xué)習(xí)中的應(yīng)用 常見傅立葉變換的誤區(qū)解析
自然語言處理與機(jī)器學(xué)習(xí)的關(guān)系 自然語言處理的基本概念及步驟
NPU與機(jī)器學(xué)習(xí)算法的關(guān)系
eda在機(jī)器學(xué)習(xí)中的應(yīng)用
【每天學(xué)點(diǎn)AI】KNN算法:簡(jiǎn)單有效的機(jī)器學(xué)習(xí)分類器
![【每天學(xué)點(diǎn)AI】KNN算法:<b class='flag-5'>簡(jiǎn)單</b><b class='flag-5'>有效</b>的<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>分類器](https://file1.elecfans.com/web1/M00/F4/08/wKgaoWcjHw2Afh8GAABiK2PIrq8889.png)
智能照明控制系統(tǒng)在體育場(chǎng)館項(xiàng)目中的應(yīng)用
![智能照明控制系統(tǒng)在體育場(chǎng)館<b class='flag-5'>項(xiàng)目中</b>的應(yīng)用](https://file1.elecfans.com//web2/M00/07/E8/wKgZombzp9OAJWwBAALSDzm5oks282.png)
【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】時(shí)間序列的信息提取
【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 時(shí)間序列的信息提取
【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】+ 簡(jiǎn)單建議
【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 了解時(shí)間序列
【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】全書概覽與時(shí)間序列概述
原理圖及PCB Checklist大放送~
![原理圖及PCB <b class='flag-5'>Checklist</b>大放送~](https://file.elecfans.com/web2/M00/20/B3/pYYBAGGfNNmAK-PZAAJsGM5Cgk0227.jpg)
評(píng)論