在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

向來提倡open的谷歌,現在也玩兒“自閉”?

DPVg_AI_era ? 來源:lq ? 2019-01-20 08:56 ? 次閱讀

谷歌AI又成了話題。Reddit網友找到了谷歌AI一個名叫Conceptual Captions的數據集,發現該數據集并不完善,于是乎聯系谷歌AI相關人員,卻慘遭三連拒。

向來提倡open的谷歌,現在也玩兒“自閉”?

昨天谷歌AI大佬Jeff Dean剛剛發表長文總結了2018年的主要研究成果,其中包括“開源軟件和數據集”:

發布開源軟件和創建新的公共數據集是我們為研究和軟件工程社區做出貢獻的兩種主要方式。

然而細心的Reddit網友卻發現,谷歌AI并沒有那么“開源”,反而還拒絕共享數據:

事情是這樣的。

這位網友發現了谷歌AI一個叫Conceptual Captions數據集相關的比賽,以及描述這個數據集的論文(ACL 2018):

論文地址:

http://aclweb.org/anthology/P18-1238

在GitHub中對此數據集的描述為:一種包含330萬張圖像的大規模圖像數據集,專門用于機器學習圖像字幕系統的訓練和評估。

GitHub地址:

https://github.com/google-research-datasets/conceptual-captions

然而,當這位網友躍躍欲試想要拿這個數據集操練一番時卻發現了一些問題:這個數據集全部圖像都是托管的,一些鏈接現在已經失效。

于是,這位網友開始試圖聯系谷歌AI相關人員。

結果,真可謂是大跌眼鏡。

慘遭三連拒,熱心研究者被潑冷水

第一拒:拒絕分享預訓練模型

這就使得基準測試和論文里的結果數字變得非常難以復現。畢竟,不是每個人都有1k的TPU。

地址:https://github.com/google-research-datasets/conceptual-captions/issues/3

問:哪里可以找到基于Conceptual Captions數據集的預訓練模型(RNN-,Transformer-based)?

答:預訓練模型沒有發布。

第二拒:拒絕分享與每個圖像關聯的Alt-text

諷刺的是,這篇論文標題是“Conceptual Captions: A Cleaned, Hypernymed, Image Alt-text Dataset For Automatic Image Captioning”。

地址:https://github.com/google-research-datasets/conceptual-captions/issues/6

問:是否會發布與每個圖像關聯的Alt-text?用于生成字幕的代碼也會公開嗎?

答:沒有發布Alt-text或代碼的計劃。

第三拒:拒絕分享圖像/鏡像鏈接

這位網友表示:雖然我同意存在法律問題,但數據集中缺少數百張圖像,其他研究人員要想比較模型變得超級困難。

地址:https://github.com/google-research-datasets/conceptual-captions/issues/1

問:您能提供從tsv文件通過url下載圖像的示例代碼嗎?Python的urllib無法下載某些url (IOError: [Errno socket error] [Errno 110] Connection timed out)。但是我可以在瀏覽器中看到這些圖像。

答:謝謝你的關注!不幸的是,由于版權/法律問題,我們無法提供通過url從tsv文件下載圖像的代碼。

谷歌AI“自閉”拒共享,引網友熱議

這位熱心網友在慘遭三連拒后表示對這樣的事情非常痛心:

一篇數據集論文對于復現結果非常重要,如果存在阻礙數據集共享的法律問題,那么發表私人數據集論文就好了(有些領域不公開Alt-text),但基于一個不公開預訓練模型、不完全共享的數據集舉辦挑戰賽,我認為這就不太酷了。

而后,其它網友們也炸鍋了。

熱心網友1:_michaelx99

Deepmind的一些論文也是這樣,僅僅根據他們發表的論文,完全不可能把結果復現出來。我花了一段時間才意識到Arxiv或他們網站上的一篇“論文”并不是真正的出版物,因此它的主要目標是展示公司已經開發了某種能力。這與其他人能夠證實或否認他們在科學過程中所做的事情關系不大。我并不是說大公司在網上發布的所有論文都是這樣,但正如你剛剛發現的,其中一些論文確實如此。

熱心網友2:duckbill_principate

據我所知,四分之一的ML論文本質上是美化的廣告。

熱心網友3:GoAwayStupidAI

可重復性是科學的標志。沒有這些數據,這個結果是不可復制的,所以科學會很糟糕。

熱心網友4:Silver5005

這是ML論文最大的問題。我一直在嘗試實現一個股票預測的LSTM,你可以找到數百篇論文都在做同樣的概念。但它們都沒有數據集,也不會談論它們如何清理或標準化它們的數據。

熱心網友5:duckbill_principate

人們不分享他們的模型、代碼或數據集,這本身并不困擾我。令我困擾的是,這種情況發生了,而這些論文仍然被接受。這是同行評審過程的絕對失敗,它的責任完全落在審查員(和我們)的肩上。這些論文是在信任的基礎上被接受的,在某些情況下甚至是權威(我們都知道,盡管存在著雙盲的本質,但不難推斷出某些論文可能來自哪個群體),這是絕對不可接受的。

這更接近于廣告而不是科學。

熱心網友6:epic

我不知道為什么有這么多谷歌的辯護者。這對科學和機器學習都不利。是的,我們都明白為什么,但這仍然很糟糕。特別是像這樣的論文,如果不能從數據中分離出來的話,再現性是非常困難的。有機會的組織和個人應該以一個好榜樣來領導這個領域,而不是反過來。

對此,你怎么看?

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6207

    瀏覽量

    106148
  • AI
    AI
    +關注

    關注

    87

    文章

    31844

    瀏覽量

    270639
  • 數據集
    +關注

    關注

    4

    文章

    1210

    瀏覽量

    24861

原文標題:谷歌AI遭猛懟!發布數據集論文和挑戰賽,卻拒絕公開數據集

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    Open AI 將在德國投資

    美國人工智能軟件巨頭 Open AI 將在慕尼黑設立其首個德國子公司 柏林2025年2月8日 ?/美通社/ --?作為 Chat GPT 的創造者而聞名全球的 Open AI 公司表示,新辦事處將在
    的頭像 發表于 02-08 12:27 ?123次閱讀

    Open-E JovianDSS Up31增強的功能和新特性

    我們非常高興地宣布發布 Open-E JovianDSS Up31 版本,該版本包含多項強大的增強功能和新特性,旨在提高數據存儲基礎架構的性能、安全性和集成能力。以下是最新更新的詳細概述
    的頭像 發表于 01-24 11:20 ?145次閱讀

    不會Lua又想Open開發,怎么辦?

    本次我把收藏已久的LuatOS具體應用示例特分享個大家,希望不會Lua又想Open開發的朋友有收獲。
    的頭像 發表于 12-09 14:43 ?217次閱讀
    不會Lua又想<b class='flag-5'>Open</b>開發,怎么辦?

    TAS5411-Q1 open load不管接不接喇叭都是open,重啟不變,為什么?

    TAS5411應用有個問題煩請問一下,Open Load和shorted load兩個狀態 不更新,open load不管接不接喇叭都是open,重啟不變,不知道需不需要經行其他設
    發表于 09-29 06:56

    谷歌獲Character.AI大模型技術授權,創始人重歸谷歌懷抱

    8月5日最新資訊,創新企業Character.AI在上周五正式宣布,他們已經與科技巨頭谷歌的母公司Alphabet達成了一項重要合作,非獨家授權谷歌使用其先進的大型語言模型技術。此次合作不僅標志著雙方在人工智能領域的深度合作,
    的頭像 發表于 08-05 14:35 ?503次閱讀

    單北斗定位智能終端提倡應用的重要性

    單北斗定位智能終端的提倡應用具有重要意義,主要體現在以下幾個方面:一、國家安全與自主可控自主可控:北斗衛星導航系統是我國自主研發的全球衛星導航系統,全面推廣使用國產單北斗定位智能終端,意味著我們將
    的頭像 發表于 07-08 15:08 ?562次閱讀
    單北斗定位智能終端<b class='flag-5'>提倡</b>應用的重要性

    蘋果確認未來將與谷歌Gemini合作

    在備受矚目的2024年全球開發者大會(WWDC)上,蘋果公司高級副總裁Craig Federighi透露了一項引人注目的新計劃。他表示,蘋果正在與谷歌人工智能部門緊鑼密鼓地籌劃合作,旨在將谷歌的Gemini大型語言模型融入蘋果的智能生態系統。
    的頭像 發表于 06-12 17:36 ?652次閱讀

    兩小時“吼出”121次AI,谷歌背后埋伏著Open AI的幽靈

    谷歌做AI依舊不痛不癢谷歌和OpenAI的又一次對陣,剛剛落幕了。北京時間5月14日凌晨,OpenAI發布端到端多模態AI大模型GPT-4o,酷似科幻電影《Her》的AI語音對話迅速成為關注焦點
    的頭像 發表于 05-19 08:05 ?391次閱讀
    兩小時“吼出”121次AI,<b class='flag-5'>谷歌</b>背后埋伏著<b class='flag-5'>Open</b> AI的幽靈

    中國電信和GSMA成立全球首個Open Gateway聯合開放實驗室

    GSMA與中國電信在北京攜手共創,正式成立了全球首個Open Gateway聯合開放實驗室,即GSMA-中國電信Open Gateway Open Lab。這一創舉旨在為廣大開發者提供一個全面、專業的技術平臺,助力他們充分挖掘和
    的頭像 發表于 05-14 09:25 ?548次閱讀

    opc ua open62541.c和open62541.h如何移植到stm32中?

    如題 想問各位大神 opc ua open62541.c和open62541.h 如何移植到stm32中
    發表于 04-15 07:37

    Open RAN的未來及其對AT&amp;T的意義

    3月14日消息,在“Connected America 2024”會議上,AT&T高級副總裁兼網絡首席技術官Yigal Elbaz討論了Open RAN 的未來及其對AT&T的意義。
    的頭像 發表于 03-14 14:40 ?855次閱讀

    谷歌模型合成軟件有哪些

    谷歌模型合成軟件通常指的是谷歌提供的用于創建、修改和共享3D模型的軟件。目前,谷歌推出的模型合成軟件中最知名的是Google SketchUp。
    的頭像 發表于 02-29 18:20 ?1488次閱讀

    谷歌模型怎么用手機打開文件

    要用手機打開谷歌模型文件,首先需要確定該文件的具體類型和格式。谷歌模型文件可能是以各種格式存在的,比如.pb(Protocol Buffers)、.h5(Keras/TensorFlow
    的頭像 發表于 02-29 18:17 ?1535次閱讀

    谷歌交互世界模型重磅發布

    谷歌模型
    北京中科同志科技股份有限公司
    發布于 :2024年02月28日 09:13:06

    消息稱Reddit與谷歌達成協議

    相關服務。同時,Reddit將獲得訪問谷歌人工智能模型的機會,旨在提升其自身的內部網站搜索及其他功能。
    的頭像 發表于 02-23 11:12 ?807次閱讀
    主站蜘蛛池模板: 在线视频这里只有精品 | 天堂网中文在线 | 欧美性受xxxx| 四虎在线视频 | 丰满年轻岳欲乱中文字幕 | 天天艹天天 | 欧美伊人久久大香线蕉综合69 | 老司机精品视频免费 | 美女扒开尿囗给男生桶爽 | 高清不卡日本v在线二区 | 色婷婷5月精品久久久久 | 天天综合网网欲色 | 五月婷婷中文字幕 | 久久天天躁夜夜躁狠狠85台湾 | 久久青草91免费观看 | 69日本xxxxxxxxx56 69日本xxxxxxxxx78 | 国产区精品高清在线观看 | 美女扒开尿口让男生添 漫画 | 欧美一级精品高清在线观看 | 午夜污片 | 精品二区 | 一级网站片 | 国产黄色三级网站 | 视频免费在线观看 | 国内精品久久久久影 | 最新sss华人 | 久久精品乱子伦免费 | 天天插伊人 | 午夜在线视频国产 | 狼人 成人 综合 亚洲 | a免费网站| 特黄特色网站 | 天堂资源最新版在线www | 国产一级特黄毛片 | 黄色午夜剧场 | 国产精品久久免费观看 | 在线免费观看你懂的 | 一级黄色毛片播放 | 久久久综合久久 | 免费黄色在线观看 | 欧美日本一区二区三区生 |