劍橋大學(xué)數(shù)據(jù)科學(xué)家Marek Rei在個人博客上發(fā)布了2018年國際頂尖學(xué)術(shù)會議上發(fā)表的機(jī)器學(xué)習(xí)和NLP相關(guān)論文的數(shù)據(jù)統(tǒng)計(jì)。數(shù)據(jù)顯示,無論是頂會論文發(fā)表數(shù)量還是會議出席人數(shù),都表明AI領(lǐng)域仍處于快速的增長期,“AI寒冬”并未到來。
2018年已過經(jīng)去,各類盤點(diǎn)還在繼續(xù)。
近日,劍橋大學(xué)數(shù)據(jù)科學(xué)家Marek Rei在個人博客上更新了2018年國際頂尖學(xué)術(shù)會議上發(fā)表的機(jī)器學(xué)習(xí)和NLP相關(guān)論文的數(shù)據(jù)統(tǒng)計(jì)。
雖然2018年“AI寒冬”的警告不絕于耳,但Marek Rei的這份數(shù)據(jù)顯示,去年在AI相關(guān)領(lǐng)域,無論是頂會論文發(fā)表數(shù)量還是會議出席人數(shù),都表明AI領(lǐng)域仍處于快速的增長期,2018年的統(tǒng)計(jì)數(shù)據(jù)打破了此前的多項(xiàng)紀(jì)錄。
最值得注意的是,今年的NeurIPS會議的門票在開票后僅11分38秒即告售罄,堪比春運(yùn)火車票,令無數(shù)準(zhǔn)備參會或圍觀大牛的熱心觀眾唏噓不已。
本文提供了關(guān)于這些統(tǒng)計(jì)數(shù)字的更精細(xì)的分類數(shù)據(jù)信息,一起來看看哪些作者和機(jī)構(gòu)在特定的學(xué)術(shù)會議上發(fā)表的論文數(shù)最多。
今年的統(tǒng)計(jì)信息中涵蓋了下列會議/期刊:
ACL、EMNLP、NAACL、EACL、COLING、TACL、CL,CoNLL、NeurIPS、ICML、ICLR和AAAI。
上述會議/期刊基本涵蓋了全球最知名、級別最高的機(jī)器學(xué)習(xí)自然語言語言技術(shù)成果出處。與2017年的數(shù)據(jù)相比去掉了SemEval,因?yàn)樵摃h主要關(guān)注共享作者的論文,本次統(tǒng)計(jì)也沒有將合作成果的數(shù)據(jù)收錄在其他會議中。
今年的統(tǒng)計(jì)數(shù)據(jù)中新收錄了AAAI,這是一個規(guī)模較大的會議,之前的統(tǒng)計(jì)中未收錄。 NeurIPS(前NIPS)去年進(jìn)行了更名,但為了保持一致性,在之前年份的數(shù)據(jù)內(nèi)容中一律統(tǒng)一使用新名稱。
統(tǒng)計(jì)數(shù)據(jù)的抓取和分析是通過一系列腳本自動完成的,多年來,這些自動腳本一直在不斷改進(jìn)。論文列表是通過在線程序抓取的,通常也附帶有作者信息。組織機(jī)構(gòu)名稱需要直接從PDF中提取,這可能會導(dǎo)致一些錯誤。為此我已經(jīng)采取各種方法來檢測和映射不同類型的機(jī)構(gòu)名,來盡量避免這些錯誤。
這篇文章重點(diǎn)介紹了近年來發(fā)表論文數(shù)量最多的作者和機(jī)構(gòu),但這里要指出,不能將發(fā)表論文的數(shù)量作為研究領(lǐng)域中一味追求或獎勵的目標(biāo),而且論文數(shù)量的快速增長,并不代表研究質(zhì)量的快速提高。
寫出一篇具有開創(chuàng)性意義的論文,要比發(fā)表10篇很快就被人遺忘的論文更了不起。此文的目的是為了給相關(guān)領(lǐng)域的人員提供一個更廣的視角,也可能為心懷優(yōu)秀創(chuàng)意的新研究人員提供一些靈感。
關(guān)注每位作者在不同年份發(fā)表的論文數(shù)量,按照兩年為單位,Chris Dyer仍然顯得一枝獨(dú)秀,Yue Zhang和 Ming Zhou緊隨其后。
2012-2018年全球會議/期刊論文數(shù)量變化情況
先來看看2012-2018年間統(tǒng)計(jì)收錄的會議上的會議論文。大多數(shù)機(jī)器學(xué)習(xí)會議上發(fā)表的論文數(shù)量都呈現(xiàn)持續(xù)增長態(tài)勢,其中發(fā)表在AAAI和NeurIPS上的論文超過1000篇。 EMNLP和NAACL也逐年連創(chuàng)新高。ACL和COLING則變化不是很大。 EACL今年休會,TACL和CL的論文數(shù)量多年來保持相對平穩(wěn)。
作者情況統(tǒng)計(jì)
接下來,看看2018年在這些會議上發(fā)表過論文的作者情況。有三位研究人員分別發(fā)表了22篇論文,論文數(shù)量排名并列第一,分別是:周明(微軟),格雷厄姆·紐比格(卡內(nèi)基梅隆大學(xué))和謝爾蓋·萊文(加州大學(xué)伯克利分校) 。緊隨其后的是張潼(曾供職騰訊AI,最近離職),孫茂松(清華大學(xué))和Iryna Gurevych(達(dá)姆施塔特工業(yè)大學(xué))。
再來看看2012-2018之間的發(fā)表論文總數(shù),Chris Dyer(DeepMind)以97篇排名榜首。緊隨其后的是周明(微軟)、Yoshua Bengio(蒙特利爾大學(xué)),張?jiān)溃ㄎ骱髮W(xué))和Noah A.Smith(華盛頓大學(xué))。大多數(shù)作者明顯更傾向于在自然語言處理或機(jī)器學(xué)習(xí)的核心會議,Percy Liang可能是個例外,在期刊和會議上發(fā)表的論文數(shù)量基本差不多。
還可以查看不同年份每位作者的論文數(shù)量。可以看到,Chris Dyer在2015-2016年間發(fā)表的論文數(shù)量增長驚人。
一作情況統(tǒng)計(jì)
接下來是關(guān)于論文第一作者的統(tǒng)計(jì)數(shù)據(jù)。論文的第一作者通常是那些實(shí)際操作、實(shí)驗(yàn)并撰寫論文的大部分內(nèi)容的人,是反映作者對論文成果貢獻(xiàn)度的重要指標(biāo)之一。
在這項(xiàng)統(tǒng)計(jì)中,位列榜首的是Yi Tay(南洋理工大學(xué)),他是一名三年級博士生,在2018年的學(xué)術(shù)會議上共發(fā)表了10篇一作論文,令人印象深刻。第二名為朱澤園(Zeyuan Allen-Zhu),去年共發(fā)表6篇一作論文。排在之后的分別是Mikel Artetxe,Jiatao Gu(香港大學(xué)),Dinghan Shen(杜克大學(xué))和Nathan Kallus(康奈爾大學(xué))去年共發(fā)表5篇一作論文。
再來看看發(fā)表論文總數(shù),李紀(jì)為(香儂科技)發(fā)表了 22 篇一作論文。其后是朱澤園(微軟)、Young-Bum Kim(亞馬遜)、Ryan Cotterell(劍橋大學(xué))和 Ivan Vuli?(劍橋大學(xué))。
組織機(jī)構(gòu)發(fā)表論文情況
接下來是企業(yè)和研究機(jī)構(gòu)發(fā)表論文的統(tǒng)計(jì)數(shù)據(jù)。與前兩年一樣,CMU在2018年發(fā)文數(shù)仍然位居第一,自然語言處理和機(jī)器學(xué)習(xí)主題之間的論文數(shù)量差距相對均勻。從企業(yè)方面來看,谷歌和微軟仍然是行業(yè)的領(lǐng)導(dǎo)者,清華大學(xué)、斯坦福大學(xué)、北京大學(xué)、麻省理工學(xué)院和加州大學(xué)伯克利分校都位列頂級機(jī)構(gòu)之列。
從2012年至2018年的整個時段來看,排名實(shí)際上沒有太多變化。CMU仍然處高居第一,微軟和谷歌得而排名則換了個位置。普林斯頓大學(xué)、INRIA和杜克大學(xué)似乎專注于機(jī)器學(xué)習(xí)領(lǐng)域,幾乎沒有在NLP領(lǐng)域發(fā)表文章。相比之下,北京大學(xué)、中科院和愛丁堡大學(xué)似乎更重視NLP方向,沒有在NeurIPS /ICML上發(fā)表什么文章。
從時間分布來看,CMU在過去幾年內(nèi)一直保持高產(chǎn),并且仍在繼續(xù)增長。谷歌和微軟一直在爭奪企業(yè)界的榜首位置,但目前谷歌似乎取得了領(lǐng)先地位。清華、北大等中國大學(xué)目前的論文發(fā)表數(shù)量正在迅猛上漲。
論文研究話題的分布
最后是關(guān)于論文作者和組織機(jī)構(gòu)發(fā)表論文主題的一些分類。我收集了與指定作者/組織機(jī)構(gòu)相關(guān)的所有論文,全部小寫處理,加上標(biāo)記,然后傳遞給LDA,再用t-SNE進(jìn)行可視化,顯示出了他們的論文內(nèi)容與圖中其他人內(nèi)容的相似關(guān)系。結(jié)果如下:
-
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8453瀏覽量
133154 -
自然語言處理
+關(guān)注
關(guān)注
1文章
620瀏覽量
13663 -
nlp
+關(guān)注
關(guān)注
1文章
489瀏覽量
22125
原文標(biāo)題:機(jī)器學(xué)習(xí)和NLP頂會論文大王:周明、張潼、孫茂松等上榜
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
IEEE MEMS 2025 中國大陸地區(qū)論文錄用情況:北京大學(xué)/中科院微系統(tǒng)所/上海交大排名前三
![IEEE MEMS 2025 中國大陸地區(qū)<b class='flag-5'>論文</b>錄用情況:北京大學(xué)/中科院微系統(tǒng)所/上海交大排名前三](https://file1.elecfans.com//web3/M00/02/47/wKgZO2dcBtaAMfIkAAInuwE80nY111.png)
潤和軟件出席中華預(yù)防醫(yī)學(xué)會環(huán)境衛(wèi)生分會2024年學(xué)術(shù)會議
Nullmax視覺感知能力再獲國際頂級學(xué)術(shù)會議認(rèn)可
邀請函| Aigtek安泰電子攜經(jīng)典產(chǎn)品,亮相第二屆波動力學(xué)前沿與應(yīng)用學(xué)術(shù)會議!
![邀請函| Aigtek安泰電子攜經(jīng)典產(chǎn)品,亮相第二屆波動力學(xué)前沿與應(yīng)用<b class='flag-5'>學(xué)術(shù)會議</b>!](https://file.elecfans.com/web2/M00/43/14/pYYBAGJ8ZjKAAv8ZAAAYa7MwZKc717.jpg)
中微公司受邀出席第十八屆全國MOCVD學(xué)術(shù)會議
CET中電技術(shù)邀您參加第八屆全國電能質(zhì)量學(xué)術(shù)會議暨電能質(zhì)量行業(yè)發(fā)展論壇
![CET中電技術(shù)邀您參加第八屆全國電能質(zhì)量<b class='flag-5'>學(xué)術(shù)會議</b>暨電能質(zhì)量行業(yè)發(fā)展論壇](https://file1.elecfans.com/web2/M00/C6/A0/wKgZomYLYZeAKGeVAAAmjZlQczk971.png)
芯動力科技論文入選ISCA 2024,與國際巨頭同臺交流研究成果
![芯動力科技<b class='flag-5'>論文</b>入選ISCA 2024,與<b class='flag-5'>國際</b>巨頭同臺交流研究成果](https://file1.elecfans.com//web2/M00/FD/27/wKgZomaYiQeAYTBmAApB716skyk618.png)
深度學(xué)習(xí)與nlp的區(qū)別在哪
名單公布!【書籍評測活動NO.35】如何用「時間序列與機(jī)器學(xué)習(xí)」解鎖未來?
OpenHarmony 成功亮相國際學(xué)術(shù)會議 ASPLOS 2024
![OpenHarmony 成功亮相<b class='flag-5'>國際</b><b class='flag-5'>學(xué)術(shù)會議</b> ASPLOS 2024](https://file1.elecfans.com//web2/M00/E6/C9/wKgaomZFYSCAHogvAAImv_Hx5ZA79.jpeg)
國科微即將出席國際頂級學(xué)術(shù)會議CPS-IoT Week2024
電壓敏學(xué)術(shù)研討委員會暨學(xué)習(xí)交流專題會議圓滿召開
![電壓敏<b class='flag-5'>學(xué)術(shù)</b>研討委員會暨<b class='flag-5'>學(xué)習(xí)</b>交流專題<b class='flag-5'>會議</b>圓滿召開](https://file1.elecfans.com//web2/M00/DE/ED/wKgZomYwv5iAE8CHABMNlV_nc2w069.jpg)
OpenHarmony即將首次亮相國際頂級學(xué)術(shù)會議
Aigtek安泰電子第一屆全國等離子體生物醫(yī)學(xué)學(xué)術(shù)會議圓滿結(jié)束!
![Aigtek安泰電子第一屆全國等離子體生物醫(yī)學(xué)<b class='flag-5'>學(xué)術(shù)會議</b>圓滿結(jié)束!](https://file.elecfans.com/web2/M00/43/14/pYYBAGJ8ZjKAAv8ZAAAYa7MwZKc717.jpg)
3月15-17日 與Aigtek相約第一屆全國等離子體生物醫(yī)學(xué)學(xué)術(shù)會議!
![3月15-17日 與Aigtek相約第一屆全國等離子體生物醫(yī)學(xué)<b class='flag-5'>學(xué)術(shù)會議</b>!](https://file.elecfans.com/web2/M00/43/14/pYYBAGJ8ZjKAAv8ZAAAYa7MwZKc717.jpg)
評論