任何致力于將機器學習應用于現實世界問題的研究人員都可能會收到這樣的答復:“作者提出了針對原始且具有高度動機的問題的解決方案,但這是一種應用,對于機器來說,其意義似乎是有限的,學習社區。”
這些話直接來自對我提交給NeurIPS(神經信息處理系統)會議(機器學習研究的頂級場所)的論文的評論。我在論文的評論中一再看到這種限制,我和我的合著者提出了一種受應用程序啟發的方法,而且我也聽到過無數其他人的類似故事。
這讓我感到奇怪:如果社區認為以機器學習解決高影響力的現實世界問題的意義有限,那么我們要努力實現什么?
人工智能(pdf)的目標是推動機器智能的前沿。在機器學習領域,新穎的開發通常意味著新的算法或過程,或者在深度學習的情況下,意味著新的網絡體系結構。正如其他人所指出的那樣,這種對新穎方法的過度關注導致論文泛濫成災,這些論文報告了基準數據集的邊際或增量改進,并且隨著研究人員爭奪排行榜的頭銜而出現了獎學金不足(pdf)。
同時,許多描述新應用的論文都提出了新穎的概念和高影響力的結果。但是,即使是“申請”一詞的暗示,也似乎使審稿人看不慣論文。結果,這樣的研究在主要會議上被邊緣化了。他們的作者唯一真正的希望是讓他們的論文在研討會上被接受,而這些研討會卻很少受到社區的關注。
這是一個問題,因為機器學習在促進健康,農業,科學發現等方面具有廣闊的前景。黑洞的第一個圖像是使用機器學習生成的。蛋白質結構的最準確預測是藥物發現的重要步驟,它是使用機器學習進行的。如果該領域的其他人優先考慮現實世界的應用程序,那么到現在我們還會做出哪些突破性的發現?
這不是新的啟示。引用美國宇航局計算機科學家Kiri Wagstaf f的經典論文“重要的機器學習”(pdf):“當前的許多機器學習研究都與廣泛的科學和社會的引入問題失去聯系。” 瓦格斯塔夫(Wagstaff)發表論文的同一年,一個名為AlexNet的卷積神經網絡贏得了以流行的ImageNet數據集為中心的備受矚目的圖像識別競賽,這引起了對深度學習的興趣激增。不幸的是,自那以后,她描述的脫節似乎變得更加嚴重。
錯誤的問題
邊緣化應用研究具有真正的意義。基準數據集(例如ImageNet或COCO)是推進機器學習的關鍵。它們使算法能夠在相同數據上進行訓練和比較。但是,這些數據集包含可以建立到結果模型中的偏差。
-
人工智能
+關注
關注
1799文章
47965瀏覽量
241277 -
應用程序
+關注
關注
38文章
3301瀏覽量
58053 -
機器學習
+關注
關注
66文章
8458瀏覽量
133232
發布評論請先 登錄
相關推薦
評論