音樂這門生意越來越引起巨頭的關注。以往,比較音樂平臺靠的是曲目數量、藝人進駐數量,后來更看重版權的獨家。現在,以深度神經網絡為代表的AI技術逐漸逼近落地,放眼全球,音樂平臺的AI大戰一觸即發。
2016年,谷歌大腦推出Magenta項目,從早期的NSynth神經網絡音頻合成算法到如今從殘缺片段中恢復巴赫音樂的Coconet機器學習模型,更多以學術研究為導向。
世界三大音樂版權商之一的索尼,在音樂內容本身上占據了極大的優勢局面。2016年,索尼計算機科學實驗推出的大型歌曲和風格數據庫Flow Machines,創作出了“披頭士”風格的旋律。
谷歌與索尼旗下都擁有相應的流媒體產品,如YouTube音樂服務和索尼精選Hi-Res。二者相似的是,流媒體或將顛覆傳統唱片公司和詞曲版權代理的地位,它們勢必要搶占一個新的產業協作模式“領頭羊”。不同之處在于,索尼更需要尋找音樂版權業務收入放緩后的下一個增長點。
智能音箱的普及下,谷歌還能以自家的智能音箱Home為核心,借此拉動智能家居生態,但依靠低價補貼以吸引消費者的智能音箱走勢如今并不理想,未來終究依賴智能交互和整個場景的覆蓋。
面向中國市場的微軟“小冰”,如今已成長到第七代,基于Avatar Framework人工智能框架,除了智能對話、語音交互外,還主打模擬人類真聲、寫詞作曲。2018年,微軟小冰也提出了Dual AI半開放生態的戰略,并與多家國內公司達成平臺化戰略,但仍未勾勒出清晰的商業邏輯。
一心野望海外市場的字節跳動,在完成對初創公司Jukedeck的收購后,又拿到了印度兩大唱片公司T-Series和Times Music的音樂版權,試圖在旗下TikTok短視頻產品中利用神經網絡合成音樂。短視頻承載了AI作曲實現大規模音樂的有效途徑,或許能緩解其在音樂版權上的壓力。
目前來看,谷歌、索尼、微軟小冰、字節跳動正全面發力AI,但落到AI音樂這個層次上,卻是參差不齊的。早期研究人員更多是讓計算機模仿現有的音樂片段,通過分析其中的規律來制作音樂旋律;AI創作音樂的不同之處在于,能讓計算機真正通過學習大量音樂片段,“自動”創作出相對復雜且富有故事性的樂曲。這個方向上,谷歌、索尼早早開始AI音樂創作性的探索;相比之下,被字節跳動收購的Jukedeck則更多停留在模仿階段,只能作為音樂流水線上的批量生產工具。
一定意義上,技術的進步推動著音樂產業的每一次進步,從最早的CD唱片到如今的AI音樂,音樂的生產、分發和消費形式呈現明顯的迭代升級。據國際唱片業協會(IFPI)報告數據,2018年全球音樂市場收入同比增長9.7%,達到191億美元。這對于謀求業務深層次進化的科技巨頭來講,最終能否取勝將取決于對先機的把握。更重要的是,以AI驅動的音樂市場變革將會隨著巨頭們的頻繁動作而掀起新一輪的競爭。
AI正影響全球企業的競爭格局,音樂產業也進入由AI激活多元化價值的關鍵時期。
如今,中國平安在AI音樂展現出的實力,已遠超人們的想象。
10月11日,為新中國成立七十周年獻禮,平安人工智能研究院打造的全球首部AI交響變奏曲《我和我的祖國》由深圳交響樂團進行全球首次公演。
AI交響變奏曲《我和我的祖國》以中國近現代史為創作藍本,包含鴉片戰爭、新中國成立、共和國曲折發展、改革開放、民族復興等五大樂章,表現一序列歷史變遷。伴隨音頻演奏一段段歷史故事呈現其中,以表達對祖國深厚的感情。
可以說,這在交響變奏曲的音樂史上尚屬首例。音樂層面,它超越了此前的單維度、短篇幅、娛樂性的范圍,突圍多維度、長篇幅、經典式交響樂曲;更重要的是,在AI技術的融入上,平安科技自研AVM自動變奏模型訓練系統,再利用深度學習對音樂實現特征學習與提取,并結合強化學習技術讓機器學會變奏手法。
廣義上講,AI作曲并不是一個新名詞。從最早使用隨機統計模型,到如今深度神經網絡的應用,利用AI實現智能創作已成為世界范圍內科學家廣泛探索的事情。盡管如此,在研究方法層面,我們仍看到許多反復出現的問題:以數據驅動的算法,如何避免同質化的音樂風格?如何讓AI更好地“理解”音樂?
帶著這個問題,雷鋒網對AI交響變奏曲《我和我的祖國》曲目團隊技術負責人進行了專訪。
“除了算法和數據標注上的一些技術手段,我們也在考慮直接對音樂的音頻做相應的分析,目的也是能夠讓AI能對音樂本身的理解和認知變得越來越深刻。”該技術負責人表示。
雄厚技術鋪墊助力,勇攀AI音樂無人區
其實早在一年前,平安AI作曲就在由瑞士聯邦理工學院(EPFL)舉辦的世界AI作曲國際大賽中獲得第一名。今年2月,平安科技再次憑借AI創作的流行樂曲《青春記憶》拿下由清華大學藝術與科學研究中心等聯合舉辦的全球AI藝術大賽(GAAC)的第一名。
頻率頗高的成果突破背后,離不開平安AI團隊過去兩年多在智能創作領域的探索積淀。早在2017年,平安科技就啟動了音樂畫像臉譜、音樂流行預測以及人工智能作曲三大音樂發展方向,嘗試用AI融入音樂領域。目前團隊已積累了大量標注分析數據、自主研發可完成特定任務的生成模型,并構建了符合音樂理論的評價體系。
此次創作籌備近兩個月,其中最核心的部分模型訓練則用了近一個半月時間。
AI交響變奏曲《我和我的祖國》曲目團隊技術負責人解釋道,“通常來講,一首交響曲的整個創作周期長達一年,這次創作實際上僅用一個半月,但其背后是長達兩年的技術儲備、模型學習和數據積淀。從交響變奏曲創作的技術角度來講,AI作曲仍存在很大的挑戰,尤其是創作出一個滿意的作品交由人類指揮家認可并演奏?!币?,交響變奏曲不同于一般的音樂生成過程,它有故事脈絡,有強烈的情感抒發訴求。為此,項目組從以下三個層次進行技術演化:
自研AVM自動變奏模型
基于節奏、和聲、織體、配器等方面建立專家變奏規則庫,用于基礎模型訓練,然后利用深度學習和強化學習技術對音樂作品做多維度的特征學習與提取,訓練出具有風格融合能力的AVM自動變奏模型。
訓練超70萬首樂曲數據集,打造海量維度音樂標簽體系
為了讓機器學習及理解音樂的重要特征,團隊訓練數據使用了超過70萬首樂曲,包括各類題材的古典音樂作品、紅色歌曲、民歌等。并且,音樂標簽的標注遵循樂理知識,除了情緒、風格的標簽以外,也包含主題、發展手法、和聲、曲式、對位、配器、調性、調式、拍號等各類音樂元素。
靈活運用音樂評價模型和專家規則
對機器進行深度學習和強化學習訓練的還有音樂評價模型,即基于大量作曲家的作品學習所構建的評價網絡。原則是遵循主流審美的同時,又需要兼顧作曲專家的評價標準。同時,為防止AI作曲生成過于自由,平安在人工智能樂曲創作的過程中融入了包含和聲約束、對位約束、曲式結構約束等規則在內的專家規則。
總的來說,在《我和我的祖國》這首改編作品中,除了開頭與結束采用了原始旋律外,中間融入了AI變奏的創作。在AI應用的過程中,團隊綜合運用深度學習、強化學習和遷移學習的聯合方案,搭建自動變奏模型、音樂評價模型、專家規則系統,基于對海量歷史音樂作品的數據庫和體系化的音樂標簽工程,拆解樂曲音符組合空間,優選最佳音樂片段,從而完成本次創作。
平安AI+的獨特基因
那么,為什么一家外人眼中搞金融、醫療、智慧城市的綜合金融服務集團,竟然也涉足了音樂這一看似不相關的藝術領域?
翻看平安集團過去30年的跨越式發展,不難發現隱藏其后的推動力量。目前,平安用科技賦能金融,以平臺建設為主,搭建了金融、醫療、汽車、房產、智慧城市等五大生態圈,整體的業務布局已然浮現,而平安人工智能研究院恰恰是集團底層技術儲備和應用落地上的重要一環。
AI交響變奏曲《我和我的祖國》曲目團隊技術負責人表示:“平安人工智能研究院的建立,主要有兩件事:一是深入底層技術的研究和能力儲備;二是與當前企業應用的場景結合起來?!痹谒磥?,AI智能創作是研究院項目板塊中重要的組成部分之一。盡管落地上尚未清晰,更多還是一個相對比較初期、嘗試摸索和論證驗證的階段,但在底層技術的支撐是通用的。
此前,與金融、醫療、健康等業務的結合落地上,平安推出了智能閃賠、平安聲紋、平安票據OCR識別、平安語音識別、平安語音合成、平安醫療影像等產品。
在雷鋒網看來,平安“AI+音樂”領域探索的成功將主要歸于三點因素:
一是不僅擁有深度學習技術的儲備,更重要的還是團隊對音樂的深刻理解。
平安人工智能研究院的AI作曲項目團隊有大量的既懂得音樂理論又了解計算機算法的復合型人才,能夠將前沿的AI技術與柔性的音樂情感相融合,不斷突破人工智能技術的邊界,挖掘AI技術在音樂領域的潛能,實現AI作曲創作的最優發展。
二是有相對可以落地的場景呈現,并懂得如何去挖掘,如音樂治療、智能作曲。
從形式上看,AI變奏曲之后,平安科技也將會在古典樂、流行樂、作詞作曲演唱等方面做更多的嘗試和突破。AI融入藝術創作,大大降低了普通大眾的創作門檻,可以讓更多人加入到音樂創作,探索更多的音樂形式,極大地豐富了人們的生活。
三是數據和場景的不斷積累,將反哺集團在其他產業鏈條上的技術縱深,從某種意義上講,這將會是一種降維突破。
事實上,平安科技已經在嘗試挖掘一些有趣的場景,把更多、更豐富、更個性化的藝術作品,通過AI的形式釋放出來。目前,從全行業來看,短視頻配樂、游戲配樂、影視配樂等場景中已涌現出了諸多對AI作曲的需求。未來,利用AI技術打造諸多應用產品,實現產品輸出和業務輸出,通過構建多角度一體化解決方案助力主營業務和生態圈層向更多元和精深的方向發展。
或許,在平安科技構筑差異化優勢的思考下,AI音樂創作僅是一小步的嘗試,但這不影響其結合自身科技積淀、主營業務以及所在行業的優勢開始有側重點的發力。除卻商業層面的因素外,企業也會因其承擔的社會價值層次的不同,從不同的角度去定義,對AI藝術的發展產生不同程度的影響。
一不小心,AI讓我們認識了全新的自己
未來,平安將進一步拓展AI音樂應用的場景和領域,例如音樂鑒賞、音樂教育、音樂治療等,此外,人工智能技術又進一步滲透到人類意識形態的藝術多維領域,如繪畫、作詩等。
不難預想,AI不僅改變了我們的創造能力,而且還提出了關鍵技術突破問題。未來,AI如何拓展人類的創造力?如何利用技術拓展藝術的邊界,豐富藝術的多元性? AI可以繪畫、編曲,但能否跟人類創作的作品一樣動人?
在談及AI對藝術產業的變革時,項目技術負責人認為,利用AI實現智能創作,實際上可以幫助作曲家、藝術家更高效地創作,探索他們原本不可能的作品、風格嘗試。但這其中,人的因素仍是藝術創作中最核心最重要的一環。
這一回答,無疑道出了未來人工智能發展的最大空間,AI所實現的東西越多,人類對創造力的標準也就越高。如何能夠最貼近人類的意識形態,實現思維的豐富和想象力的突破,是AI技術面臨的最大難點。在更多的藝術領域,AI技術的介入極大地降低了藝術準入門檻,也讓藝術領域以更多樣的形式深入生活、產業,甚至在某種程度上改善人類精神世界的發展進程。
其實AI承載歷史的案例一直在持續:故宮博物院因為AI技術變成了網紅,《清明上河圖》因AI、3D、VR技術讓歷史“真實地”流動在眼前,而被熊熊大火重挫的巴黎圣母院也會在AI技術里找到另一個新的“自己”。
《我和我的祖國》AI交響變奏曲也是這種浪漫藝術與嚴謹科學的完美融合。
我們還看到,在新中國成立70周年的長篇卷軸上,我國的多項技術曾都帶來過革命性的突破。比如早期基于控制論的核技術,到打破封鎖的超級計算機技術,再到載人航天衛星技術,均讓國家實力大幅躍升。
走過工業化和信息化的70年后,我們進入了嶄新的智能化時代,平安《我和我的祖國》AI交響變奏曲克服了技術壁壘,某種程度上,也將人工智能技術帶進了嶄新領地,勢必會在偉大歷史節點上留下其濃墨重彩的一筆。
來源:雷鋒網
評論