豆豆小说阅读网,欢乐颂,盛世嫡妃凤轻小说

音樂AI技術(shù)正在快速發(fā)展。

在預(yù)印平臺(tái)Arxiv.org上發(fā)布的一項(xiàng)研究中，約翰內(nèi)斯·開普勒大學(xué)林茨計(jì)算感知研究所和奧地利人工智能研究所的研究人員介紹了一個(gè)可以預(yù)測(cè)活頁樂譜中和目標(biāo)錄音匹配度最高的的位置的AI系統(tǒng)。表面上，其對(duì)齊精度高于當(dāng)前基于圖像的最新樂譜追蹤器。

樂譜追蹤技術(shù)是很多應(yīng)用程序的基礎(chǔ)。這些應(yīng)用包括自動(dòng)伴奏、翻頁以及將現(xiàn)場(chǎng)表演與可視化圖像同步等等。現(xiàn)有的系統(tǒng)要么依賴于固定長短的小片段樂譜圖像，要么需要光學(xué)音樂識(shí)別技術(shù)所提取出的計(jì)算機(jī)可讀的樂譜。但是這些研究人員的AI系統(tǒng)可以以獨(dú)特的方式觀察整頁樂譜，從而從頭到尾地追蹤任意長度的音樂表演。

這個(gè)研究團(tuán)隊(duì)將樂譜追蹤當(dāng)作一種圖像分割任務(wù)。根據(jù)特定時(shí)間的某個(gè)音樂表演，他們的系統(tǒng)針對(duì)當(dāng)前正在播放的音樂相對(duì)應(yīng)的樂譜預(yù)測(cè)分段蒙版（即小片段）。研究人員說，僅僅利用固定大小音頻輸入的樂譜追蹤器無法在超過特定環(huán)境的情況下區(qū)分重復(fù)的音符，然而他們提出的AI系統(tǒng)在處理較長時(shí)間的樂譜時(shí)都不會(huì)有問題。

在實(shí)驗(yàn)過程中，研究人員們從多模型樂譜數(shù)據(jù)集（MSMD）中獲取了一些復(fù)音鋼琴樣本，其中包括巴赫、莫扎特、貝多芬等多個(gè)作曲家的作品。在手動(dòng)識(shí)別并且糾正一些對(duì)齊上的錯(cuò)誤后，他們通過353對(duì)樂譜和MIDI音頻信息訓(xùn)練了AI系統(tǒng)。

該AI系統(tǒng)的另一位作者說，除了最高的門檻以外（沒搞懂highest threshold是啥），他們的系統(tǒng)擁有比基準(zhǔn)線更高的性能，并能在時(shí)間差方面得出更精確的結(jié)果（即對(duì)于更嚴(yán)格的容錯(cuò)率，百分比更高）。它偶爾也會(huì)產(chǎn)生一些錯(cuò)誤，研究人員將其歸因于系統(tǒng)可能會(huì)在圖像紙上 “大幅跳躍”。但是他們斷言，種種試驗(yàn)結(jié)果都表明這個(gè)AI系統(tǒng)在大多數(shù)情況下都是“非常精確的”。

“未來的工作會(huì)需要對(duì)掃描圖像或照片進(jìn)行測(cè)試，以評(píng)估該AI系統(tǒng)在視覺領(lǐng)域的泛化能力。”研究人員寫道，“成就功能更強(qiáng)大的系統(tǒng)的下一步是顯式或隱式地結(jié)合某種機(jī)制來處理樂譜和演奏中重復(fù)的音符。盡管我們也懷疑其性能會(huì)很大程度上取決于迄今為止音頻的隱式編碼。舉例來說，循環(huán)網(wǎng)絡(luò)中能夠存儲(chǔ)多大的聽覺環(huán)境將成為很重要的一個(gè)因素，但我們相信，我們所提出的方法能夠從合適的（經(jīng)受過訓(xùn)練的）的數(shù)據(jù)中很自然地獲得這種功能。”

音樂AI技術(shù)正在快速發(fā)展。OpenAI最近發(fā)布了一款叫做Jukebox的機(jī)器學(xué)習(xí)框架，它可以生成包括基本歌曲在內(nèi)的音樂作為各種音樂類型和音樂風(fēng)格的原始音頻。在2018年末，Google Brain的“Project Magenta”項(xiàng)目致力于“探索機(jī)器學(xué)習(xí)在創(chuàng)作過程中的作用”，提出了一個(gè)叫做“Musical Transformer”的模型。該模型能夠生成可識(shí)別的重復(fù)性歌曲。不僅如此，去年三月，谷歌發(fā)布了一種算法“Google Doodle”，讓用戶能夠創(chuàng)造向巴赫致敬的旋律。

責(zé)任編輯：lq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

音頻

音頻

+關(guān)注

關(guān)注
29

文章
3030

瀏覽量
83248
數(shù)據(jù)集

數(shù)據(jù)集

+關(guān)注

關(guān)注
4

文章
1223

瀏覽量
25368
ai技術(shù)

ai技術(shù)

+關(guān)注

關(guān)注
1

文章
1308

瀏覽量
25085

原文標(biāo)題：研究人員的AI技術(shù)能夠?qū)崟r(shí)匹配活頁樂譜與MIDI音頻

文章出處：【微信號(hào)：livevideostack，微信公眾號(hào)：LiveVideoStack】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

一個(gè)可以預(yù)測(cè)活頁樂譜中和目標(biāo)錄音匹配度最高的的位置的AI系統(tǒng)

評(píng)論