在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

八大機(jī)器學(xué)習(xí)數(shù)據(jù)集

DPVg_AI_era ? 來源:lq ? 2019-01-18 09:52 ? 次閱讀

近日,Medium上的一位用戶整理了一份機(jī)器學(xué)習(xí)大型數(shù)據(jù)集清單,包括八大數(shù)據(jù)集資源庫。總有一款適合你,快來收藏吧!

下面的ML大型數(shù)據(jù)集,總有一款適合你。

就目前來看,找到一個(gè)特定的數(shù)據(jù)集來解決各種機(jī)器學(xué)習(xí)問題,甚至進(jìn)行實(shí)驗(yàn)還是比較困難的。

本文作者Will Badr便列舉了八大機(jī)器學(xué)習(xí)數(shù)據(jù)集。

不僅包含用于實(shí)驗(yàn)的大型數(shù)據(jù)集,還附帶對(duì)數(shù)據(jù)集的描述以及使用示例。有的還包含用于解決與該數(shù)據(jù)集相關(guān)機(jī)器學(xué)習(xí)問題的算法代碼。

話不多說,上數(shù)據(jù)集!

1、Kaggle數(shù)據(jù)集

數(shù)據(jù)集地址:

https://www.kaggle.com/datasets

這是作者最喜歡的數(shù)據(jù)集之一。

每個(gè)數(shù)據(jù)集都是一個(gè)小型社區(qū),用戶可以在其中討論數(shù)據(jù)、查找公共代碼或在內(nèi)核中創(chuàng)建自己的項(xiàng)目。包含各式各樣的真實(shí)數(shù)據(jù)集。

用戶還可以看到與每個(gè)數(shù)據(jù)集相關(guān)的“內(nèi)核”,許多數(shù)據(jù)科學(xué)家還提供了相關(guān)手冊(cè)來分析數(shù)據(jù)集。

2、Amazon數(shù)據(jù)集

數(shù)據(jù)集地址:

https://registry.opendata.aws/

該數(shù)據(jù)源包含多個(gè)不同領(lǐng)域的數(shù)據(jù)集,如:公共交通、生態(tài)資源、衛(wèi)星圖像等。

網(wǎng)頁中也有一個(gè)搜索框來幫助用戶尋找想要的數(shù)據(jù)集,還有所有數(shù)據(jù)集的描述和使用示例,這些數(shù)據(jù)集信息豐富且易于使用!

數(shù)據(jù)集存儲(chǔ)在Amazon Web Services (AWS)資源中,比如Amazon S3——云中的一個(gè)高度可伸縮的對(duì)象存儲(chǔ)服務(wù)。

如果用戶正在使用AWS進(jìn)行機(jī)器學(xué)習(xí)實(shí)驗(yàn)和開發(fā),這將非常方便,由于它是AWS網(wǎng)絡(luò)的本地?cái)?shù)據(jù),因此數(shù)據(jù)集的傳輸將非常快。

3、UCI機(jī)器學(xué)習(xí)資源庫

數(shù)據(jù)集地址:

https://archive.ics.uci.edu/ml/datasets.html

另一個(gè)來自加州大學(xué)信息與計(jì)算機(jī)科學(xué)學(xué)院的大型資源庫,包含100多個(gè)數(shù)據(jù)集。

用戶可以找到單變量和多變量時(shí)間序列數(shù)據(jù)集,分類、回歸或推薦系統(tǒng)的數(shù)據(jù)集。

有些UCI的數(shù)據(jù)集已經(jīng)是被清洗過的。

4、谷歌數(shù)據(jù)集搜索引

數(shù)據(jù)集地址:

https://toolbox.google.com/datasetsearch

在2018年末,谷歌做了他們最擅長(zhǎng)的事情,推出了另一項(xiàng)偉大的服務(wù)——它是一個(gè)可以按名稱搜索數(shù)據(jù)集的工具箱。

他們的目標(biāo)是統(tǒng)一成千上萬個(gè)不同的數(shù)據(jù)集存儲(chǔ)庫,使這些數(shù)據(jù)能夠且易被發(fā)現(xiàn)。

5、微軟數(shù)據(jù)集

數(shù)據(jù)集地址:

https://msropendata.com/

2018年7月,微軟與外部研究社區(qū)共同宣布推出“Microsoft Research Open Data”。

它在云中包含一個(gè)數(shù)據(jù)存儲(chǔ)庫,用于促進(jìn)全球研究社區(qū)之間的協(xié)作。它提供了一系列用于已發(fā)表研究的、經(jīng)過處理的數(shù)據(jù)集。

6、Awesome Public Datasets Collection

數(shù)據(jù)集地址:

https://github.com/awesomedata/awesome-public-datasets

這是一個(gè)按“主題”組織的數(shù)據(jù)集,比如生物學(xué)、經(jīng)濟(jì)學(xué)、教育學(xué)等。

這里列出的大多數(shù)數(shù)據(jù)集都是免費(fèi)的,但是在使用任何數(shù)據(jù)集之前,用戶需要檢查一下許可要求。

7、政府?dāng)?shù)據(jù)集

政府相關(guān)數(shù)據(jù)集也很容易找到的。

許多國(guó)家為了提高透明度,向公眾分享了各種數(shù)據(jù)集。以下是一些例子:

歐盟開放數(shù)據(jù)門戶:歐洲政府?dāng)?shù)據(jù)集。

數(shù)據(jù)集地址:

https://data.europa.eu/euodp/data/dataset

美國(guó)政府?dāng)?shù)據(jù):目前由于一些非政治性原因,暫時(shí)無法訪問。

數(shù)據(jù)集地址:

https://www.data.gov/

新西蘭政府?dāng)?shù)據(jù)集:

數(shù)據(jù)集地址:

https://catalogue.data.govt.nz/dataset

印度政府?dāng)?shù)據(jù)集:

數(shù)據(jù)集地址:

https://data.gov.in/

8、計(jì)算機(jī)視覺數(shù)據(jù)集

數(shù)據(jù)集地址:

https://www.visualdata.io/

Visual Data包含一些可以用來構(gòu)建計(jì)算機(jī)視覺(CV)模型的大型數(shù)據(jù)集。

用戶可以通過特定的CV主題查找特定的數(shù)據(jù)集,如語義分割、圖像標(biāo)題、圖像生成,甚至可以通過解決方案(自動(dòng)駕駛汽車數(shù)據(jù)集)查找特定的數(shù)據(jù)集。

總結(jié)

從上述作者所觀察到數(shù)據(jù)集情況來看,似乎是涵蓋各個(gè)方向和領(lǐng)域。

這些新數(shù)據(jù)集的社區(qū)將繼續(xù)發(fā)展,使數(shù)據(jù)更容易被獲取,使眾包和計(jì)算機(jī)科學(xué)社區(qū)能夠繼續(xù)快速創(chuàng)新,為生活帶來更多創(chuàng)造性的解決方案。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4631

    瀏覽量

    93421
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8444

    瀏覽量

    133117
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1209

    瀏覽量

    24848

原文標(biāo)題:【收藏】8款大型機(jī)器學(xué)習(xí)數(shù)據(jù)集頂級(jí)資源

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    最新!智慧燈桿八大應(yīng)用場(chǎng)景案例獨(dú)家匯總

    最新!智慧燈桿八大應(yīng)用場(chǎng)景案例獨(dú)家匯總
    的頭像 發(fā)表于 01-14 12:47 ?131次閱讀
    最新!智慧燈桿<b class='flag-5'>八大</b>應(yīng)用場(chǎng)景案例獨(dú)家匯總

    2025年全球半導(dǎo)體八大趨勢(shì),萬年芯蓄勢(shì)待發(fā)

    近日,國(guó)際數(shù)據(jù)公司(IDC)發(fā)布了2025年全球半導(dǎo)體市場(chǎng)的八大趨勢(shì)預(yù)測(cè),顯示出對(duì)半導(dǎo)體市場(chǎng)回暖的信心,為業(yè)界提供了寶貴的市場(chǎng)洞察。在全球范圍內(nèi),特別是在人工智能(AI)和高性能運(yùn)算(HPC)需求
    的頭像 發(fā)表于 12-17 16:53 ?1043次閱讀
    2025年全球半導(dǎo)體<b class='flag-5'>八大</b>趨勢(shì),萬年芯蓄勢(shì)待發(fā)

    cmp在機(jī)器學(xué)習(xí)中的作用 如何使用cmp進(jìn)行數(shù)據(jù)對(duì)比

    機(jī)器學(xué)習(xí)領(lǐng)域,"cmp"這個(gè)術(shù)語可能并不是一個(gè)常見的術(shù)語,它可能是指"比較"(comparison)的縮寫。 比較在機(jī)器學(xué)習(xí)中的作用 模型評(píng)估 :比較不同模型的性能是
    的頭像 發(fā)表于 12-17 09:35 ?326次閱讀

    盤點(diǎn)圖像傳感器選型八大要點(diǎn)

    ,成為了一個(gè)值得深入探討的話題。本文將為您揭示圖像傳感器選型的八大要點(diǎn),幫助您精準(zhǔn)捕捉世界的奧秘。 一、分辨率:細(xì)節(jié)與清晰度的關(guān)鍵 分辨率是評(píng)估圖像傳感器性能的首要指標(biāo),決定了圖像的細(xì)節(jié)和清晰度。高分辨率傳
    的頭像 發(fā)表于 12-02 01:02 ?333次閱讀

    什么是機(jī)器學(xué)習(xí)?通過機(jī)器學(xué)習(xí)方法能解決哪些問題?

    計(jì)算機(jī)系統(tǒng)自身的性能”。事實(shí)上,由于“經(jīng)驗(yàn)”在計(jì)算機(jī)系統(tǒng)中主要以數(shù)據(jù)的形式存在,因此機(jī)器學(xué)習(xí)需要設(shè)法對(duì)數(shù)據(jù)進(jìn)行分析學(xué)習(xí),這就使得它逐漸成為智
    的頭像 發(fā)表于 11-16 01:07 ?529次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?通過<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問題?

    NPU與機(jī)器學(xué)習(xí)算法的關(guān)系

    緊密。 NPU的起源與特點(diǎn) NPU的概念最早由谷歌在其TPU(Tensor Processing Unit)項(xiàng)目中提出,旨在為TensorFlow框架提供專用的硬件加速。NPU的設(shè)計(jì)目標(biāo)是提高機(jī)器學(xué)習(xí)算法的運(yùn)行效率,特別是在處理大規(guī)模數(shù)
    的頭像 發(fā)表于 11-15 09:19 ?628次閱讀

    【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 時(shí)間序列的信息提取

    提高機(jī)器學(xué)習(xí)模型效果與性能的過程。 而我對(duì)特征工程的理解就是從一堆數(shù)據(jù)里找出能表示這堆數(shù)據(jù)的最小數(shù)據(jù)
    發(fā)表于 08-14 18:00

    米思米直線電機(jī)模組的八大核心優(yōu)勢(shì),你知道嗎?

    米思米直線電機(jī)模組憑借其價(jià)格親民、高精度、高速運(yùn)行、低噪音、長(zhǎng)壽命、多動(dòng)子配置、選型便捷以及品類豐富等八大核心優(yōu)勢(shì),在自動(dòng)化與精密制造領(lǐng)域展現(xiàn)出了強(qiáng)大的競(jìng)爭(zhēng)力和廣闊的應(yīng)用前景。
    的頭像 發(fā)表于 07-25 10:57 ?582次閱讀
    米思米直線電機(jī)模組的<b class='flag-5'>八大</b>核心優(yōu)勢(shì),你知道嗎?

    pycharm怎么訓(xùn)練數(shù)據(jù)

    在本文中,我們將介紹如何在PyCharm中訓(xùn)練數(shù)據(jù)。PyCharm是一款流行的Python集成開發(fā)環(huán)境,提供了許多用于數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 07-11 10:10 ?744次閱讀

    機(jī)器學(xué)習(xí)中的數(shù)據(jù)分割方法

    機(jī)器學(xué)習(xí)中,數(shù)據(jù)分割是一項(xiàng)至關(guān)重要的任務(wù),它直接影響到模型的訓(xùn)練效果、泛化能力以及最終的性能評(píng)估。本文將從多個(gè)方面詳細(xì)探討機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 07-10 16:10 ?2161次閱讀

    如何理解機(jī)器學(xué)習(xí)中的訓(xùn)練、驗(yàn)證和測(cè)試

    理解機(jī)器學(xué)習(xí)中的訓(xùn)練、驗(yàn)證和測(cè)試,是掌握機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 07-10 15:45 ?4702次閱讀

    PyTorch如何訓(xùn)練自己的數(shù)據(jù)

    PyTorch是一個(gè)廣泛使用的深度學(xué)習(xí)框架,它以其靈活性、易用性和強(qiáng)大的動(dòng)態(tài)圖特性而聞名。在訓(xùn)練深度學(xué)習(xí)模型時(shí),數(shù)據(jù)是不可或缺的組成部分。然而,很多時(shí)候,我們可能需要使用自己的
    的頭像 發(fā)表于 07-02 14:09 ?2079次閱讀

    機(jī)器學(xué)習(xí)數(shù)據(jù)分析中的應(yīng)用

    隨著大數(shù)據(jù)時(shí)代的到來,數(shù)據(jù)量的爆炸性增長(zhǎng)對(duì)數(shù)據(jù)分析提出了更高的要求。機(jī)器學(xué)習(xí)作為一種強(qiáng)大的工具,通過訓(xùn)練模型從
    的頭像 發(fā)表于 07-02 11:22 ?846次閱讀

    機(jī)器學(xué)習(xí)的經(jīng)典算法與應(yīng)用

    關(guān)于數(shù)據(jù)機(jī)器學(xué)習(xí)就是喂入算法和數(shù)據(jù),讓算法從數(shù)據(jù)中尋找一種相應(yīng)的關(guān)系。Iris鳶尾花數(shù)據(jù)是一個(gè)
    的頭像 發(fā)表于 06-27 08:27 ?1734次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>的經(jīng)典算法與應(yīng)用

    華為發(fā)布5G-A八大創(chuàng)新實(shí)踐,助力全球運(yùn)營(yíng)商因地制宜

    MWC24 巴塞羅那期間,華為發(fā)布了5G-A八大創(chuàng)新實(shí)踐,助力全球運(yùn)營(yíng)商因地制宜,基于自身網(wǎng)絡(luò)情況多路徑構(gòu)建5G-A網(wǎng)絡(luò)。
    的頭像 發(fā)表于 02-29 10:00 ?722次閱讀
    主站蜘蛛池模板: 国产精品视频一区二区三区 | 人人澡人人草 | 日本高清加勒比 | 狠狠的日视频 | 人操人碰| 亚洲三级在线看 | 四虎影院新网址 | 国产特级毛片 | 日韩欧美黄色 | 国产高清色播视频免费看 | 婷婷色在线观看 | 综合激情婷婷 | www.亚洲天堂 | 无毒不卡在线观看 | 寄宿日记免费看 | 久久免费精品高清麻豆 | 国产一级免费视频 | 国产 高清 在线 | 在线免费看视频 | 国产一区二区三区在线观看影院 | 狼狼鲁狼狼色 | 久久久久性 | 久久99精品久久久久久久不卡 | 看黄a大片 免费 | 久久免费观看国产精品 | aⅴ天堂 | 干天天| 日韩毛片 | 欧美美女被日 | 99午夜高清在线视频在观看 | 亚洲最大的成人网 | 婷婷激情综合五月天 | 欧美午夜电影 | 亚洲成在线观看 | 欧美成人免费高清网站 | 婷婷六月久久综合丁香一二 | 精品一区二区三区三区 | 九九国产精品 | 九九热视频免费在线观看 | 四虎国产精品永久地址51 | 天天干天天操天天 |