Nvidia發展新的資料增強技術,可以大幅減少訓練人工智能模型所需要的資料量,研究人員僅使用來自大都會藝術博物館的一個小型資料集,就讓人工智能模型能夠創造出,過去可能需要數萬,甚至可能超過10萬訓練圖像,才能產生的精美圖像結果,而這項研究成果可用于廣泛的領域上,包括醫療保健等應用。
Nvidia將一種稱為ADA(Adaptive Discriminator Augmentation)的技術,應用在生成對抗網絡StyleGAN2模型上,使得訓練圖像的資料量,可大幅減少10到20倍,而且獲得同樣良好的效果。生成對抗網絡(GAN)的特性之一,便是訓練資料越多,模型產生的結果越好,生成對抗網絡由生成器(Generator)與判別器(Discriminator)兩個組件組成,生成器負責合成圖像,而判別器則要識別出圖像真偽,并反饋有用的參數給生成器,使得生成器之后能夠產生更好的結果。
但是一旦訓練資料不足,判別器便無法提供生成器足夠的信息產生好結果,就像是新手教練沒有夠多的經驗指導球員,球員也就難以精進球技一樣。因此生成對抗網絡通常需要5萬到10萬的訓練圖像,才能訓練出高品質的模型,但問題是,在許多使用案例上,并沒有足夠多的樣本圖像可以取用,僅以數千張圖像訓練生成對抗網絡,通常無法產生逼真的結果,而且會出現過適(Overfitting)的現象。
過去的研究也曾經以資料增強的方法,減少訓練生成對抗網絡所需要的資料量,但是結果并不好,因為生成對抗網絡反而學習了圖像旋轉變形等失真情形,無法產生逼真的合成圖像。而現在Nvidia所提出的ADA方法,可以適應性地應用資料增強方法,避免過適現象,而使得StyleGAN2等模型,可以使用更少的訓練圖像,并獲得良好的結果。
研究人員將這項結果應用在過去因為訓練資料太少,而難以實現的使用案例上,像是藝術家便使用StyleGAN進行創作,產生出各種精美繪畫,或是以傳奇插畫家Osamu Tezuka的風格,搭建新的漫畫,Adobe也應用該項技術,提供新的人工智能工具Neural Filters。
研究人員也提到,該項技術還有望應用在醫療保健領域,因為罕見疾病的醫學圖像很少,而且每個案例差異度很大,要大量收集有用的病理切片資料集很困難,而使用ADA技術的生成對抗網絡,則可改善這樣的問題。
責任編輯:YYX
-
NVIDIA
+關注
關注
14文章
5038瀏覽量
103306 -
人工智能
+關注
關注
1792文章
47454瀏覽量
239080
發布評論請先 登錄
相關推薦
【「具身智能機器人系統」閱讀體驗】+數據在具身人工智能中的價值
【每天學點AI】實戰圖像增強技術在人工智能圖像處理中的應用
![【每天學點AI】實戰圖像<b class='flag-5'>增強</b><b class='flag-5'>技術</b>在<b class='flag-5'>人工智能</b>圖像處理中的應用](https://file1.elecfans.com/web2/M00/0D/16/wKgaomdAS1qAYCH9AAC-8aLppE0815.png)
嵌入式和人工智能究竟是什么關系?
《AI for Science:人工智能驅動科學創新》第6章人AI與能源科學讀后感
AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感
《AI for Science:人工智能驅動科學創新》第二章AI for Science的技術支撐學習心得
《AI for Science:人工智能驅動科學創新》第一章人工智能驅動的科學創新學習心得
risc-v在人工智能圖像處理應用前景分析
名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅動科學創新
報名開啟!深圳(國際)通用人工智能大會將啟幕,國內外大咖齊聚話AI
FPGA在人工智能中的應用有哪些?
進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片
5G智能物聯網課程之Aidlux下人工智能開發(SC171開發套件V2)
基于NVIDIA Megatron Core的MOE LLM實現和訓練優化
![基于<b class='flag-5'>NVIDIA</b> Megatron Core的MOE LLM實現和<b class='flag-5'>訓練</b>優化](https://file1.elecfans.com/web2/M00/C6/46/wKgaomX85HSAYXw6AAANlNSD8a0224.jpg)
評論