91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機器學(xué)習(xí)項目難管理的原因是什么

汽車玩家 ? 來源: AI公園 ? 作者:Lukas Biewald ? 2020-04-19 11:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

我看到過很多公司嘗試使用機器學(xué)習(xí) —— 有些大獲成功,有些慘敗。一個不變的事實是,機器學(xué)習(xí)團隊很難設(shè)定目標(biāo)和期望。這是為什么呢?

機器學(xué)習(xí)項目難管理的原因是什么

1. 很難預(yù)先分辨出什么是難的,什么是容易的

是在國際象棋中擊敗卡斯帕羅夫更困難,還是撿起棋子并移動棋子更困難?計算機在二十多年前打敗了國際象棋世界冠軍,但是可靠地抓取和舉起物體仍然是一個未解決的研究問題。人類不擅長評估什么對人工智能來說是困難的,什么是容易的。即使在一個領(lǐng)域中,性能也可能有很大差異。預(yù)測情緒的準(zhǔn)確性有多高?在影評中,有大量的文本和作者很容易搞清楚他們的想法,現(xiàn)在能期待的準(zhǔn)確率是90-95%。在推特上,兩個人在80%的情況下對一條推文的觀點是一致的。在推文中,只要是關(guān)于航空公司的,那么總是把這條推文的情緒預(yù)測成負面的,就可以達到95%以上的準(zhǔn)確率。

度量標(biāo)準(zhǔn)也可能在項目的早期提升很多,然后突然碰壁。我曾經(jīng)舉辦過一場Kaggle競賽,全世界成千上萬的人競相為我的數(shù)據(jù)建模。在第一周,準(zhǔn)確率從35%上升到65%,但在接下來的幾個月里,準(zhǔn)確率從未超過68%。68%的準(zhǔn)確率顯然是數(shù)據(jù)對于最先進的機器學(xué)習(xí)技術(shù)的限制。那些在Kaggle競賽中競爭的人非常努力地獲得了68%的正確率,我確信這是一個巨大的成就。但在大多數(shù)情況下,65%和68%是完全無法區(qū)分的。如果這是一個內(nèi)部項目,我肯定會對結(jié)果感到失望。

我的朋友Pete Skomoroch最近告訴我,作為一名研究機器學(xué)習(xí)的數(shù)據(jù)科學(xué)家,在工程部門工作是多么令人沮喪。工程項目通常會向前推進,但機器學(xué)習(xí)項目可能會完全停滯。花一周時間對數(shù)據(jù)進行建模,結(jié)果可能(甚至很常見)沒有任何改進。

機器學(xué)習(xí)項目難管理的原因是什么

2. 機器學(xué)習(xí)很容易以意想不到的方式失敗.

機器學(xué)習(xí)通常工作得很好,只要你有大量的訓(xùn)練數(shù)據(jù)以及你在生產(chǎn)中運行的數(shù)據(jù)看起來很像你的訓(xùn)練數(shù)據(jù)。人類非常善于從訓(xùn)練數(shù)據(jù)中歸納歸納,因此我們對此有著可怕的直覺。我做了一個小機器人,帶著攝像機和一個視覺模型,這個模型是根據(jù)從網(wǎng)上獲取的成百萬的ImageNet圖像制作的。我對我的機器人相機上的圖像進行了預(yù)處理,使其看起來像來自網(wǎng)絡(luò)的圖像,但準(zhǔn)確性比我預(yù)期的要差得多。為什么?網(wǎng)絡(luò)上的圖片往往會針對目標(biāo)物體進行構(gòu)圖,但是我的機器人不一定會像人類攝影師那樣直視一個物體。人類甚至可能都沒有注意到這種差異,但使用現(xiàn)代深度學(xué)習(xí)網(wǎng)絡(luò)的時候就會非常痛苦。有很多方法可以處理這種現(xiàn)象,但我之所以注意到它,只是因為它的性能下降非常嚴(yán)重,我花了很多時間調(diào)試它。

更厲害的是,導(dǎo)致性能下降的細微差異很難被發(fā)現(xiàn)。接受《紐約時報》訓(xùn)練的語言模型不能很好地概括社交媒體文本。我們可以預(yù)料到。但很顯然,從2017年開始接受文本訓(xùn)練的模型,在2018年寫的文本中表現(xiàn)不佳。上游分布隨時間以多種方式變化。當(dāng)對手適應(yīng)了欺詐模型所做的事情時,欺詐模型就會完全崩潰。

3. 機器學(xué)習(xí)需要大量相關(guān)的訓(xùn)練數(shù)據(jù).

每個人都知道這一點,但這是一個巨大的障礙。如果你能夠收集并標(biāo)記大量的訓(xùn)練數(shù)據(jù),計算機視覺可以做很多驚人的事情。對于某些用例,數(shù)據(jù)是某些業(yè)務(wù)流程的副產(chǎn)品。這就是機器學(xué)習(xí)真正發(fā)揮作用的地方。對于許多其他用例來說,收集訓(xùn)練數(shù)據(jù)是非常昂貴和具有挑戰(zhàn)性的。許多醫(yī)療用例對于機器學(xué)習(xí)來說似乎是完美的 —— 使用許多微弱的信號和清晰的結(jié)果來做出關(guān)鍵的決策 —— 但是數(shù)據(jù)由于重要的隱私問題而被鎖定,或者一開始就沒有被統(tǒng)一的進行收集。

許多公司不知道從哪里開始投資收集訓(xùn)練數(shù)據(jù)。這是一項重要的工作,很難預(yù)先預(yù)測該模型將如何工作。

解決這些問題的最佳實踐是什么?

1. 多注意你的訓(xùn)練數(shù)據(jù).

看看這個算法對它所訓(xùn)練的數(shù)據(jù)進行錯誤分類的情況。這樣的錯誤幾乎總是標(biāo)注錯誤或者一些邊界樣本。不管怎樣,你都想了解他們。讓每個構(gòu)建模型的人都查看一下訓(xùn)練數(shù)據(jù)并自己標(biāo)注一些訓(xùn)練數(shù)據(jù)。對于許多用例來說,一個模型不太可能比兩個獨立的人達成一致的效果更好。

2. 先做端到端的工作,然后一次改進一件事.

從可能有效的最簡單的事情開始,然后部署它。你會從中學(xué)到很多。過程中任何階段的額外復(fù)雜性都會改進研究論文中的模型,但很少會改進現(xiàn)實世界中的模型。每一個額外的復(fù)雜性都需要驗證。

將一些東西交到最終用戶手中,可以幫助你盡早了解模型可能工作得有多好,并且它可能會帶來一些關(guān)鍵問題,比如模型正在優(yōu)化的內(nèi)容與最終用戶想要的內(nèi)容之間的分歧。它還可能使你重新評估你正在收集的訓(xùn)練數(shù)據(jù)的類型。最好能盡快發(fā)現(xiàn)這些問題。

3. 尋找優(yōu)雅的方法來處理不可避免的算法失敗的情況.

幾乎所有的機器學(xué)習(xí)模型在相當(dāng)長的時間內(nèi)都會失敗,如何處理這一問題絕對是至關(guān)重要的。模型通常有一個可以使用的可靠的置信度評分。使用批處理過程,你可以構(gòu)建包含人在里面的循環(huán)系統(tǒng),將低可信度的預(yù)測發(fā)送給操作員,使系統(tǒng)能夠可靠地端到端工作,并收集高質(zhì)量的訓(xùn)練數(shù)據(jù)。對于其他用例,你可以使用一種標(biāo)記潛在錯誤的方式,或者對最終用戶來說不那么惱人的方式,來呈現(xiàn)低可信度的預(yù)測。

下面是一個沒有被妥善處理的失敗例子。微軟沒有預(yù)料到他們的Tay機器人能多快從推特上的噴子那里學(xué)會不良行為。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    213

    文章

    29741

    瀏覽量

    212869
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8503

    瀏覽量

    134612
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    AI項目管理平臺有什么用

    當(dāng)今,AI項目的復(fù)雜性和多變性給項目管理帶來了前所未有的挑戰(zhàn)。為了有效應(yīng)對這些挑戰(zhàn),AI項目管理平臺應(yīng)運而生。那么,AI
    的頭像 發(fā)表于 02-19 11:16 ?370次閱讀

    ADC的諧波產(chǎn)生的原因是什么?

    ADC的諧波產(chǎn)生的原因是什么
    發(fā)表于 02-08 08:25

    開源項目!能夠精確地行走、跳舞和執(zhí)行復(fù)雜動作的機器人—Tillu

    的語音識別系統(tǒng)響應(yīng)語音指令 為什么打造Tillu? 打造Tillu不僅是一個項目,更是一次學(xué)習(xí)體驗。通過深入探索機器人技術(shù)、編程細節(jié)以及自定義動作和表情,釋放你的創(chuàng)造力。無論你是學(xué)生、愛好者還是創(chuàng)
    發(fā)表于 01-02 17:24

    測試項目管理系統(tǒng) - TPA

    面對當(dāng)今汽車行業(yè)高速迭代的研發(fā)節(jié)奏,測試業(yè)務(wù)的復(fù)雜性和高標(biāo)準(zhǔn)使得傳統(tǒng)的手動管理方式面臨巨大挑戰(zhàn)。經(jīng)緯恒潤基于多年測試管理經(jīng)驗,推出了測試項目管理系統(tǒng)INTEWORK-TPA產(chǎn)品(以下簡
    的頭像 發(fā)表于 01-02 09:58 ?544次閱讀
    測試<b class='flag-5'>項目</b><b class='flag-5'>管理</b>系統(tǒng) - TPA

    傳統(tǒng)機器學(xué)習(xí)方法和應(yīng)用指導(dǎo)

    在上一篇文章中,我們介紹了機器學(xué)習(xí)的關(guān)鍵概念術(shù)語。在本文中,我們會介紹傳統(tǒng)機器學(xué)習(xí)的基礎(chǔ)知識和多種算法特征,供各位老師選擇。 01 傳統(tǒng)機器
    的頭像 發(fā)表于 12-30 09:16 ?1186次閱讀
    傳統(tǒng)<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>方法和應(yīng)用指導(dǎo)

    如何選擇云原生機器學(xué)習(xí)平臺

    當(dāng)今,云原生機器學(xué)習(xí)平臺因其彈性擴展、高效部署、低成本運營等優(yōu)勢,逐漸成為企業(yè)構(gòu)建和部署機器學(xué)習(xí)應(yīng)用的首選。然而,市場上的云原生機器
    的頭像 發(fā)表于 12-25 11:54 ?456次閱讀

    cmp項目管理工具的優(yōu)缺點

    CMP項目管理工具,在不同的語境下有不同的含義。一種是指綜合項目管理平臺(Comprehensive Management Platform),它旨在整合和優(yōu)化
    的頭像 發(fā)表于 12-17 09:42 ?818次閱讀

    什么是機器學(xué)習(xí)?通過機器學(xué)習(xí)方法能解決哪些問題?

    來源:Master編程樹“機器學(xué)習(xí)”最初的研究動機是讓計算機系統(tǒng)具有人的學(xué)習(xí)能力以便實現(xiàn)人工智能。因為沒有學(xué)習(xí)能力的系統(tǒng)很難被認為是具有智能的。目前被廣泛采用的
    的頭像 發(fā)表于 11-16 01:07 ?965次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問題?

    NPU與機器學(xué)習(xí)算法的關(guān)系

    緊密。 NPU的起源與特點 NPU的概念最早由谷歌在其TPU(Tensor Processing Unit)項目中提出,旨在為TensorFlow框架提供專用的硬件加速。NPU的設(shè)計目標(biāo)是提高機器學(xué)習(xí)算法的運行效率,特別是在處理
    的頭像 發(fā)表于 11-15 09:19 ?1217次閱讀

    eda在機器學(xué)習(xí)中的應(yīng)用

    機器學(xué)習(xí)項目中,數(shù)據(jù)預(yù)處理和理解是成功構(gòu)建模型的關(guān)鍵。探索性數(shù)據(jù)分析(EDA)是這一過程中不可或缺的一部分。 1. 數(shù)據(jù)清洗 數(shù)據(jù)清洗 是機器學(xué)習(xí)
    的頭像 發(fā)表于 11-13 10:42 ?902次閱讀

    AI項目管理平臺怎么用

    AI項目管理平臺是一種集成了項目管理工具、AI開發(fā)環(huán)境和數(shù)據(jù)分析能力的綜合性平臺。接下來,AI部落小編為您梳理AI項目
    的頭像 發(fā)表于 11-13 09:38 ?671次閱讀

    華納云:企業(yè)遷移到云端的主要原因是什么?

    企業(yè)遷移到云端的主要原因是什么?原因不止一個。削減成本通常被認為是主要原因——但盡管通過云遷移降低成本無疑是一種誘人的可能性,但創(chuàng)新潛力才是更大的獎勵。云計算通過支持企業(yè)創(chuàng)新而產(chǎn)生的價值是僅僅通過 降低 IT 成本所能實現(xiàn)的價值
    的頭像 發(fā)表于 09-14 17:38 ?529次閱讀

    請問為什么vca810會產(chǎn)生諧波,原因是啥?

    vca810做的壓控放大,產(chǎn)生了諧波,使得波形發(fā)生了失真,請問為什么vca810會產(chǎn)生諧波,原因是啥。
    發(fā)表于 08-28 07:00

    OPA828ID發(fā)燙的原因是什么?

    你好,下面是我的DAC部分電路圖,運放用的是OPA828ID,封裝SOIC-8,±15V供電,現(xiàn)在一上電就發(fā)燙,用紅外成像儀顯示能達到67℃,網(wǎng)上查詢了解到,運放發(fā)熱的主要原因是自激振蕩和負載過大(電流過大),但電路功能目前正常,且工作電流最大6m 請問此電路中運放發(fā)燙的原因
    發(fā)表于 08-09 08:10

    XTR105不能正常工作的原因是什么?

    XTR105不能正常工作的原因是什么?
    發(fā)表于 08-08 08:23
    主站蜘蛛池模板: 看片国产 | 日本高清一本视频 | 日日干狠狠操 | 色多多在线播放 | www毛片 | 中文字幕精品一区二区三区视频 | 特毛片 | 亚洲黄色三级 | 日日噜噜爽爽狠狠视频 | 男人不识本网站上遍色站也枉然 | 美女用手扒开尿口给男生桶爽 | 亚洲国产成人在线 | 69xxx视频hd| 免费大片黄日本在线观看 | 国产精品嫩草影院一二三区入口 | 在线免费黄色网址 | 男人操女人的网站 | 四虎永久在线免费观看 | 免费 视频 | 最新日本免费一区二区三区中文 | 免费看h的网站 | 美女一级毛片毛片在线播放 | 国产h视频在线观看高清 | 久久草在线播放 | 欧美性videofree精品 | 国产精品久久久亚洲 | 国产亚洲综合一区 柠檬导航 | 日本一区二区三区不卡在线看 | 免费看男女做好爽好硬视频 | 国产激情久久久久影院小草 | 天天干天天干天天干 | 六月婷婷啪啪 | 午夜69成人做爰视频网站 | 亚洲免费网 | 久久99国产精品久久99 | 久久天天躁狠狠躁夜夜呲 | 色黄网站 | 免费观看a黄一级视频 | 99热网址| 成人久久网站 | 午夜视频在线观看一区二区 |