來自特拉維夫大學(xué)的一組研究人員開發(fā)了一種神經(jīng)網(wǎng)絡(luò),能夠讀取食譜并生成烹飪完成后的熟食產(chǎn)品的圖像。嗯,好像可以更換人頭拍色情片的DeepFakes還不夠糟糕,現(xiàn)在我們無法確定我們?cè)诰W(wǎng)上看到的美味食物都是否是真實(shí)的了。由研究人員Ori Bar El,Ori Licht和Netanel Yosephian組成的特拉維夫團(tuán)隊(duì)使用名為StackGAN V2的生成對(duì)抗網(wǎng)絡(luò)(GAN)的修改版本和巨大的recipe1M數(shù)據(jù)集中的52K圖像/配方組合創(chuàng)建了他們的AI。
該團(tuán)隊(duì)開發(fā)了一種人工智能,只需要列出任何配方和說明清單,就可以運(yùn)算成品食品的樣子。
這一切都是一名研究人員在向祖母詢問她傳統(tǒng)的番茄醬炸魚排配方時(shí)開始的。由于她年事已高,她不記得確切的食譜,所以吃貨科學(xué)家就建立了一個(gè)能夠給出食物圖像的系統(tǒng),方便輸出食譜。由于人們很難從飯菜中獲得具有實(shí)際數(shù)量和“隱藏”成分的精確配方,如鹽,胡椒,黃油,面粉等。因此基于配方生成食物圖像就成了有用的做法,這項(xiàng)任務(wù)對(duì)于人類來說非常具有挑戰(zhàn)性,對(duì)于計(jì)算機(jī)更是如此。
由于目前大多數(shù)人工智能系統(tǒng)都試圖在人類易于完成的任務(wù)中取代人類專家,解決一項(xiàng)甚至超出人類能力的任務(wù)會(huì)很有趣。
值得一提的是,與CUB和Oxford102數(shù)據(jù)集中的圖像相比,recipe1M數(shù)據(jù)集中的圖像質(zhì)量較低。這反映在許多模糊的圖像上,光照條件差,“粥狀圖像”以及圖像不是方形(這使得訓(xùn)練模型變得困難)。這個(gè)事實(shí)可能會(huì)解釋這兩個(gè)模型成功生成“類似粥”的食物圖像(例如面食,米飯,湯,沙拉),但卻難以生成具有獨(dú)特形狀的食物圖像(例如漢堡包,雞肉,飲料) )。
如果有足夠的配方,特拉維夫團(tuán)隊(duì)的人工智能現(xiàn)在可以將它變成一個(gè)看起來足夠好的圖像,根據(jù)研究論文顯示,在盲測(cè)中,人類有時(shí)更喜歡計(jì)算機(jī)生成的圖片而不是真實(shí)照片。
該團(tuán)隊(duì)打算繼續(xù)開發(fā)該系統(tǒng),希望擴(kuò)展到超越食物的領(lǐng)域。包括完善當(dāng)前的數(shù)據(jù)集質(zhì)量,還考慮構(gòu)建一個(gè)包含兒童書籍文本和相應(yīng)圖像的數(shù)據(jù)集,這樣就可以讓計(jì)算機(jī)看文章畫插畫了。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4785瀏覽量
101273 -
人工智能
+關(guān)注
關(guān)注
1797文章
47867瀏覽量
240779 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1210瀏覽量
24861
原文標(biāo)題:研究人員開發(fā)神經(jīng)網(wǎng)絡(luò) 可讀取食譜并生成熟食產(chǎn)品的圖像
文章出處:【微信號(hào):worldofai,微信公眾號(hào):worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論