人工智能三大支柱,即算力、算法、數(shù)據(jù),都離不開算力支撐。
最近,AI繪畫大熱,我們所說的“AI繪畫”的概念,指的是基于深度學(xué)習(xí)模型來進項自動作圖的計算機程序。
2012年,Google兩位大名鼎鼎的AI大神使用1.6萬個CPU訓(xùn)練了一個當(dāng)時世界上最大的深度學(xué)習(xí)網(wǎng)絡(luò), 用來指導(dǎo)計算機畫出貓臉圖片. 當(dāng)時他們使用了1000萬個貓臉圖片, 1.6萬個CPU整整訓(xùn)練了3天, 最終生成到了一個非常模糊的貓臉。
是不是感覺有點不可思議,2012年大規(guī)模計算機集群已經(jīng)處于很現(xiàn)代水平了,可是結(jié)果確如此模糊。
大家或許有個基本概念, 深度學(xué)習(xí)模型的訓(xùn)練簡單說來就是利用外部大量標(biāo)注好的訓(xùn)練數(shù)據(jù)輸入, 根據(jù)輸入和所對應(yīng)的預(yù)期輸出, 反復(fù)調(diào)整模型內(nèi)部參數(shù)加以匹配的過程。
那么讓AI學(xué)會繪畫的過程, 就是構(gòu)建已有畫作的訓(xùn)練數(shù)據(jù), 輸入AI模型進行參數(shù)迭代調(diào)整的過程。
一幅畫帶有多少信息呢? 首先就是長x寬個RGB像素點.再是繪畫中每一筆的位置、形狀、顏色等多個方面的參數(shù), 這里涉及到的參數(shù)組合是非常龐大的. 而深度模型訓(xùn)練的計算復(fù)雜度隨著參數(shù)輸入組合的增長
而
急劇增長。
AI訓(xùn)練所需要的時間,取決于背后的GPU性能。
北鯤云怎么幫你畫畫?
以
Disco Diffusion
為例,基于CLIP-Guided Diffusion網(wǎng)絡(luò),這是輸入以下文字輸出一張的圖片,其實還可以選不同的畫家風(fēng)格。這個可以自己探索~
artstation,GregRutkowski,sea,dikel,ship,industrialization,cloud,time,future,afternoon
接下來就一起看看怎么
在北鯤云超算平臺上實現(xiàn)AI繪畫。
北鯤云超算平臺可以提供高性價比的一站式AI計算服務(wù),根據(jù)平時的操作習(xí)慣,可以直接通過命令行提交作業(yè)。平臺同時還有大量可供調(diào)用的GPU資源,
例如32G顯存的V100、40G和80G顯存的A100。
啟動一個T4的Jupyter Notebook Desktop,連接后Notebook會自動打開。
連接后先打開終端,將Notebook(Disco_Diffusion.ipynb)復(fù)制到本地
gitclonehttps://github.com/alembics/disco-diffusion.git
由于項目要用pytorch,涉及到很多庫的安裝,最好使用Anaconda。Anaconda已經(jīng)在平臺上預(yù)裝好了,可以通過以下命令進行加載
moduleaddAnaconda3sourceactivate
我們可以創(chuàng)建一個獨立的環(huán)境用來diffusion,python版本選3.9即可,并將該環(huán)境加到ipykernel中。
condacreate-ndiffusionpython=3.9condaactivatecondainstall-canacondaipykernelpython-mipykernelinstall--user--name=diffusion
這時候即可打開Disco_Diffusion.ipynb,并選擇diffusion作為kernel。
運行Notebook,分為四步:
環(huán)境搭建、模型設(shè)置、生成文字設(shè)置、生成圖片
。
第一個單元檢測本地的GPU。
第二個單元會提示沒有檢測到colab,模型會選擇本地的models文件夾。
第三個單元檢測一些必須的依賴包,沒裝成的直接conda安裝即可。由于這一步會下載文件,請耐心等待。
以下列出本例中安裝的package和命令:
condainstall-cpytorchpytorchtorchvisiontorchaudiocudatoolkit=10.2condainstall-cconda-forgeopencvtimmlpipsftfyeinopsomegaconfpandas
后面三個單元定義了一些方法和模型,可以直接運行。
這里要注意默認用的是512*512的模型會比較吃顯卡,前面可以調(diào)成256*256的。
然后就是模型設(shè)置,這里batch_name是文件夾名,里面的圖片也會根據(jù)這個命名。
width_height是期望的最終圖像大小,應(yīng)該設(shè)置為64px的倍數(shù),并且在默認的CLIP模型設(shè)置上至少設(shè)置為512px。如果忘記使用64px的倍數(shù),DD會調(diào)整圖像尺寸。
steps是迭代步數(shù),越高細節(jié)越多。
然后Animation Settings和 Extra Settings,這兩個可以先不動。
最關(guān)鍵的短語設(shè)置部分,text_prompts就是短語,0:是第一幀,如果是動畫可以設(shè)置從哪一幀開始變風(fēng)格,單個圖片就設(shè)置一句就行。
image_prompts是基于哪張圖片進行生成,這個也很有意思可以自己選圖片實驗。
怎么設(shè)置好的確是門藝術(shù),不過大概有場景描述就可以生成,有喜歡的藝術(shù)家也可以加上,還有時間,地點也可以。
官方的例子描述是:"A beautiful painting of a singular lighthouse, shining its light across a tumultuous sea of blood by greg rutkowski and thomas kinkade, Trending on artstation.”
就是說:“greg rutkowski和thomas kinkade在Trending on artstation上繪制的一幅美麗的燈塔畫,它的光芒照耀著一片喧囂的血海。”
這里引入了兩位藝術(shù)家,想查看其他藝術(shù)家可以看下方表格,兩千多位藝術(shù)家可以選擇:
https://docs.google.com/spreadsheets/d/14xTqtuV3BuKDNhLotB_d1aFlBGnDJOY0BRXJ8-86GpA/edit#gid=0
我們在此用的關(guān)鍵詞是:high,performance,computing,cloud, scientist,drug,time,future,cyberpunk
然后就是激動人心的生成了, n_batches是要生成的圖片個數(shù),默認是50會比較久,可以先設(shè)置1個測一下速度。點擊運行后,圖片就開始生成,并會一點一點變清晰。
此時可以在終端里通過nvidia-smi查看GPU的使用率。
等計算完成后,可以到北鯤云控制臺首頁—
文件傳輸
里下載生成好的圖片。
清華大學(xué)某課題組正面臨管理難、科研效率慢等問題,在多方對比后選擇了北鯤云AI計算云平臺。
據(jù)小鯤得知,以下幾點是北鯤云打動課題組的關(guān)鍵點:
1 滿足每個賬號有云主機多卡多節(jié)點并行
2 已預(yù)裝多種環(huán)境及數(shù)據(jù)集,可直接在平臺上使用
3 支持圖形化界面操作
除此之外,北鯤云豐富的資源、一致的使用體驗及極致的數(shù)據(jù)安全保障措施都獲得了老師的好評。
基于北鯤云超算平臺開發(fā)的北鯤云AI計算平臺幫助用戶無憂上云,大大提升計算效率。歡迎有相關(guān)需求的同學(xué)來找鯤寶咨詢。
審核編輯 黃昊宇
-
人工智能
+關(guān)注
關(guān)注
1806文章
49011瀏覽量
249356
發(fā)布評論請先 登錄
一句話讓你理解線程和進程

用一句話描述電機控制、PLC和單片機的關(guān)系
論壇有獎?wù)骷顒樱?b class='flag-5'>一句話贏獎品!
如何用一句話證明你是程序員?41 個答案揭曉!精選資料分享
Linux一句話精彩問答 pdf
一句話點評2012年20大技術(shù)前瞻
一句話解決嵌入式開發(fā)ping問題

評論