很多時(shí)候,機(jī)器學(xué)習(xí)和人工智能像是在遠(yuǎn)程、復(fù)雜的超級(jí)計(jì)算機(jī)上運(yùn)行的高端技術(shù),以解決棘手的問題。然而最近,我有幸與一群了不起的工程師和科學(xué)家合作,共同開展了一個(gè)將人工智能融入日常生活的重大項(xiàng)目。
從2019年開始,在ML Commons的支持下成立了一個(gè)工作組,旨在通過創(chuàng)建大規(guī)模、多樣化和公開許可的語音數(shù)據(jù)集來增強(qiáng)并普及語音識(shí)別技術(shù)。迄今為止,該項(xiàng)目已經(jīng)產(chǎn)生了兩個(gè)頂級(jí)數(shù)據(jù)集,涵蓋了全球數(shù)十個(gè)語種。該小組的成員來自英特爾、哈佛大學(xué)、阿里巴巴、甲骨文、Landing AI、密歇根大學(xué)、谷歌、百度等。
介紹這些口語數(shù)據(jù)集的兩份白皮書——《人的語言》和《多語種口語語料庫》,已于12月7日舉辦的NeurIPS大會(huì)上發(fā)布。其中,《人的語言》主要針對(duì)“自動(dòng)語音識(shí)別”任務(wù);《多語種口語語料庫》則包含“關(guān)鍵詞識(shí)別”。這兩個(gè)項(xiàng)目的數(shù)據(jù)集都貢獻(xiàn)了大量豐富的音頻數(shù)據(jù),且每個(gè)數(shù)據(jù)集在同類中都擁有最大的可用體量。
這將會(huì)對(duì)人們的日常生活產(chǎn)生哪些影響?通過對(duì)這些數(shù)據(jù)集的訓(xùn)練,計(jì)算機(jī)或其他設(shè)備可以“聽到”口頭語言并采取適當(dāng)?shù)男袆?dòng),例如響應(yīng)用戶的查詢或生成自動(dòng)轉(zhuǎn)錄文本。在當(dāng)今多元化、國際化、多語言的工作環(huán)境中,準(zhǔn)確轉(zhuǎn)錄和翻譯的能力愈發(fā)重要。
這兩個(gè)項(xiàng)目都運(yùn)用了“多樣化語音”,這意味著它們更好地展現(xiàn)自然環(huán)境音,如背景噪音、非正式語言模式、錄音設(shè)備混音以及其他聲學(xué)環(huán)境等。這與諸如有聲讀物之類的高度受控的內(nèi)容不同,后者產(chǎn)生的聲音更加“純凈”。然而,在實(shí)際應(yīng)用中,多樣化語音訓(xùn)練有助于提高識(shí)別的準(zhǔn)確性。
“人的語言”項(xiàng)目內(nèi)含數(shù)萬小時(shí)的對(duì)話音頻。如今,它是世界上最大的、可免費(fèi)下載的、用于學(xué)術(shù)和商用的英語語音識(shí)別數(shù)據(jù)集之一。
“多語種口語語料庫”是一個(gè)音頻語音數(shù)據(jù)集,不僅擁有超過30萬個(gè)關(guān)鍵字的數(shù)十種語言,能夠通過智能設(shè)備訪問,還涵蓋了50多億用戶的日常對(duì)話,有助于推動(dòng)全球范圍內(nèi)受眾語音應(yīng)用的研發(fā)。
開發(fā)這些數(shù)據(jù)集的研究人員來自于一個(gè)跨越多個(gè)大洲的國際小組。多年來,我們每周通過電話會(huì)議會(huì)面,每個(gè)人都為項(xiàng)目貢獻(xiàn)特定專業(yè)知識(shí)。
這兩個(gè)數(shù)據(jù)集都將被研究人員和開發(fā)者廣泛使用,而且它們包括商用在內(nèi)的授權(quán)許可條款都相對(duì)較為寬松。適當(dāng)開放授權(quán)的重要性被無意識(shí)地低估了,導(dǎo)致許多有應(yīng)用前景的數(shù)據(jù)集在可用性和適用規(guī)模方面受到限制。
這兩個(gè)數(shù)據(jù)集將由MLCommons進(jìn)行長期維護(hù)。MLCommons是一個(gè)由全球技術(shù)提供商、學(xué)者和研究人員組成的聯(lián)盟,而英特爾是聯(lián)盟的創(chuàng)始成員之一。
在語言的人工智能領(lǐng)域,這個(gè)項(xiàng)目是一個(gè)飛躍,同時(shí)它也為未來開啟了諸多可能性。未來,我期待與同事們繼續(xù)合作,將其推向新的階段。
原文標(biāo)題:傾聽世界:人工智能的突破
文章出處:【微信公眾號(hào):英特爾中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
審核編輯:湯梓紅
-
英特爾
+關(guān)注
關(guān)注
61文章
10043瀏覽量
172589 -
計(jì)算機(jī)
+關(guān)注
關(guān)注
19文章
7565瀏覽量
88853 -
人工智能
+關(guān)注
關(guān)注
1799文章
47958瀏覽量
241156
原文標(biāo)題:傾聽世界:人工智能的突破
文章出處:【微信號(hào):英特爾中國,微信公眾號(hào):英特爾中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
英特爾2024全球影響力嘉年華,激發(fā)AI創(chuàng)新力量,讓技術(shù)更有溫度!

《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感
《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得
人工智能技術(shù)躍進(jìn):英特爾引領(lǐng)AI無處不在新紀(jì)元
英特爾IT的發(fā)展現(xiàn)狀和創(chuàng)新動(dòng)向
英特爾發(fā)布第一代車載銳炫獨(dú)立顯卡
商湯科技加入中國移動(dòng)人工智能大模型評(píng)測聯(lián)盟
英特爾帕特·基辛格:讓AI無處不在
英特爾人工智能創(chuàng)新應(yīng)用大賽最終獎(jiǎng)項(xiàng)揭曉!酷睿Ultra助力選手創(chuàng)意開發(fā)

評(píng)論