前方高能預(yù)警,非戰(zhàn)斗人士請(qǐng)火速撤離……
今天給大家介紹一個(gè)在 GitHub 上一個(gè)開(kāi)源的鑒黃圖像數(shù)據(jù)集,它擁有 158萬(wàn)的數(shù)據(jù)量,叫做 NSFW data source URLs,目前該項(xiàng)目已收獲 918 star 了。
項(xiàng)目地址:
https://github.com/EBazarov/nsfw_data_source_urls
在 raw_data 文件夾里,可以找到不同的 .txt 格式的文檔,每個(gè)文檔都含有一組 URL,以下是關(guān)于該數(shù)據(jù)集的一些統(tǒng)計(jì)信息:
159個(gè) 不同的類別
158.9331 萬(wàn)個(gè) URL
下載并清洗后大約有 500GB,或者說(shuō)有 130 萬(wàn)張 NSFW 圖像
以下為項(xiàng)目中圖片截圖示例:
注意事項(xiàng):
1. 建議下載后清洗下數(shù)據(jù)集,例如:
刪除重復(fù)圖片
移動(dòng)被禁止/刪除掉的圖片(它們有一個(gè)特殊的圖像占位符)
找出損壞的數(shù)據(jù)并將其刪除
2. 注意噪聲,一些資源提供了 NSFW 和中性圖像的高度混合數(shù)據(jù)。
3. 該庫(kù)還可以幫助檢索 NSFW 圖像,針對(duì)中性圖像沒(méi)有專用的 URL。
值得一提的是,在該項(xiàng)目之前還有一個(gè)類似的開(kāi)源項(xiàng)目 nsfw_data_scrapper,里面有 22 萬(wàn)張圖像,同樣也可以用來(lái)檢測(cè)或訓(xùn)練鑒黃系統(tǒng)。
-
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1209瀏覽量
24838 -
GitHub
+關(guān)注
關(guān)注
3文章
473瀏覽量
16583
原文標(biāo)題:上班時(shí)間請(qǐng)勿打開(kāi),158萬(wàn)張鑒黃圖片數(shù)據(jù)集來(lái)嘍~
文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
DAC8728多通道輸出數(shù)據(jù),不能保持上一個(gè)數(shù)據(jù)嗎?
gitee 與 GitHub 的比較
華為云 Flexus X 實(shí)例部署安裝 HivisionIDPhoto 一個(gè)輕量級(jí)的 AI 證件照制作算法
![華為云 Flexus X 實(shí)例部署安裝 HivisionIDPhoto <b class='flag-5'>一</b><b class='flag-5'>個(gè)</b>輕量級(jí)的 AI 證件照制作算法](https://file1.elecfans.com//web3/M00/03/BE/wKgZPGdry4iAZ2NwAAF6RInC7ME304.png)
一個(gè)月速成python+OpenCV圖像處理
![<b class='flag-5'>一個(gè)</b>月速成python+OpenCV<b class='flag-5'>圖像</b>處理](https://file1.elecfans.com/web3/M00/00/7F/wKgZPGdJlvGANv8EAAAl3WfWse8658.png)
OPA690設(shè)計(jì)一個(gè)簡(jiǎn)單的同向比例放大器,如果負(fù)載加上一個(gè)50歐姆的電阻,輸出波形即失真了怎么解決?
晶振電路旁邊為何要并上一個(gè)電阻?
![晶振電路旁邊為何要并<b class='flag-5'>上一個(gè)</b>電阻?](https://file1.elecfans.com/web2/M00/A3/A2/wKgaomT67ZGAW5nQAAAgfBtwHT4841.png)
上傳本地項(xiàng)目代碼到github
freertos和rtthread哪一個(gè)更好
一個(gè)socket對(duì)應(yīng)一個(gè)連接嗎
開(kāi)源項(xiàng)目!自制一個(gè)太陽(yáng)能電子墨水屏氣象站
20個(gè)數(shù)據(jù)可以訓(xùn)練神經(jīng)網(wǎng)絡(luò)嗎
esp32無(wú)法燒錄github上的一個(gè)固件,為什么?
【開(kāi)源項(xiàng)目】自制一個(gè)創(chuàng)客專屬的無(wú)反相機(jī)
好,自制一個(gè)桌面萌寵
![好,自制<b class='flag-5'>一</b><b class='flag-5'>個(gè)</b>桌面萌寵](https://file.elecfans.com/web2/M00/43/7B/pYYBAGJ-B6aAHuNPAAAf8J1Ebk4778.jpg)
評(píng)論