在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Facebook發(fā)布全卷積神經(jīng)網(wǎng)絡(luò)語(yǔ)音識(shí)別模型,開源語(yǔ)音處理深度學(xué)習(xí)工具包

nlfO_thejiangme ? 來(lái)源:lq ? 2018-12-26 09:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

語(yǔ)音識(shí)別領(lǐng)域先進(jìn)的神經(jīng)網(wǎng)絡(luò)一般使用rnn來(lái)構(gòu)建聲學(xué)或者語(yǔ)言模型,并基于特征抽取的方式來(lái)進(jìn)行抽取梅爾濾波器特征或者倒譜系數(shù)。但在最近的研究工作中,F(xiàn)acebook的研究人員提出了完全基于卷積神經(jīng)網(wǎng)絡(luò)的全卷積語(yǔ)音識(shí)別模型,充分利用了在聲學(xué)模型和語(yǔ)言模型方面的最新進(jìn)展。這一全卷積神經(jīng)網(wǎng)絡(luò)通過端到端的訓(xùn)練可以直接從原始波形預(yù)測(cè)出語(yǔ)言字符,移除了特征抽取的過程。同時(shí)利用一個(gè)外部的卷積語(yǔ)言模型來(lái)進(jìn)行單詞解碼。這一模型在多個(gè)數(shù)據(jù)集上都取得了優(yōu)異的表現(xiàn)。

模型

整個(gè)模型由四部分組成,分別是卷積前端、聲學(xué)模型、語(yǔ)言模型和集束搜索的解碼器(Beam-search)組成,如下圖所示。

在可學(xué)習(xí)的前端中,原始音頻首先輸入到一個(gè)寬度為2的卷積中,用于模仿梅爾濾波器特征中的前處理步驟。隨后應(yīng)用了寬度為25ms的k復(fù)卷積濾波器。隨后利用平方取絕對(duì)值并通過低通濾波器,其寬度為25ms步長(zhǎng)為10ms。最后利用對(duì)數(shù)壓縮,并對(duì)每個(gè)通道進(jìn)行了均方歸一化。緊隨其后的是聲學(xué)模型,包含了線性門的卷積神經(jīng)網(wǎng)絡(luò),同時(shí)使用了dropout來(lái)實(shí)現(xiàn)正則化。這一模型的目的在于直接預(yù)測(cè)出字母。在隨后的語(yǔ)言模型中,研究人員利用了GCNN-14B,其中包含了14個(gè)卷積殘差模塊和逐漸增長(zhǎng)的通道數(shù),并利用了線性門控單元作為激活函數(shù)。語(yǔ)言模型的主要目的在于為備選的句子輸出打分,這一模型允許更大的上下文。最后,基于集束搜索的解碼器用于生成最合適的句子輸出。

其工作的過程在于最大化上面的表達(dá)式。

工具

這一模型的實(shí)現(xiàn)使用了Facebook最新開源的兩個(gè)工具:其中使用了wav2letter建立聲學(xué)模型,fairseq建立了語(yǔ)言模型。

fairseq 原理圖

同時(shí)推出的升級(jí)版深度學(xué)習(xí)自動(dòng)語(yǔ)音識(shí)別工具框架wav2letter++,在之前wav2letter的基礎(chǔ)上進(jìn)行和很多的改進(jìn)和優(yōu)化。

wav2letter++ 工具包架構(gòu)

這一版的工具箱由C++實(shí)現(xiàn),并利用了ArrayFire張量庫(kù)來(lái)提高了運(yùn)算效率。研究團(tuán)隊(duì)表示,在某些情況下wav2letter++在訓(xùn)練端到端的語(yǔ)音識(shí)別神經(jīng)網(wǎng)絡(luò)時(shí)將提速2倍。

wav2letter++ 與其他語(yǔ)言工具的性能比較

端到端的語(yǔ)音識(shí)別使得其在多語(yǔ)言上的大規(guī)模應(yīng)用變得可行。同時(shí)直接從原始音頻上進(jìn)行學(xué)習(xí)可以充分發(fā)揮高質(zhì)量音頻的效果。端到端的算法加上高效的工具框架,將有效促進(jìn)這一領(lǐng)域的研究,希望全卷積神經(jīng)網(wǎng)絡(luò)的語(yǔ)音識(shí)別和wav2letter工具為小伙伴們的研究帶來(lái)新的幫助。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:新模型、新工具,F(xiàn)acebook在語(yǔ)音識(shí)別領(lǐng)域的新動(dòng)作!

文章出處:【微信號(hào):thejiangmen,微信公眾號(hào):將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    卷積神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)工具與框架

    卷積神經(jīng)網(wǎng)絡(luò)因其在圖像和視頻處理任務(wù)中的卓越性能而廣受歡迎。隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展,多種實(shí)現(xiàn)工具
    的頭像 發(fā)表于 11-15 15:20 ?632次閱讀

    深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)模型

    深度學(xué)習(xí)近年來(lái)在多個(gè)領(lǐng)域取得了顯著的進(jìn)展,尤其是在圖像識(shí)別、語(yǔ)音識(shí)別和自然語(yǔ)言處理等方面。
    的頭像 發(fā)表于 11-15 14:52 ?792次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)共包括哪些層級(jí)

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像
    的頭像 發(fā)表于 07-11 15:58 ?2737次閱讀

    pytorch中有神經(jīng)網(wǎng)絡(luò)模型

    處理、語(yǔ)音識(shí)別等領(lǐng)域取得了顯著的成果。PyTorch是一個(gè)開源深度學(xué)習(xí)框架,由
    的頭像 發(fā)表于 07-11 09:59 ?1668次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)和工作原理

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡(jiǎn)稱CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像
    的頭像 發(fā)表于 07-03 09:38 ?1640次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)激活函數(shù)的作用

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNNs)是深度學(xué)習(xí)中一種重要的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),廣泛應(yīng)用于圖像
    的頭像 發(fā)表于 07-03 09:18 ?1860次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練的是什么

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡(jiǎn)稱CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像
    的頭像 發(fā)表于 07-03 09:15 ?910次閱讀

    深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)作為其中的重要分支,已經(jīng)在多個(gè)領(lǐng)域取得了顯著的應(yīng)用成果。從圖像
    的頭像 發(fā)表于 07-02 18:19 ?1387次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的原理與實(shí)現(xiàn)

    1.卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡(jiǎn)稱CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像
    的頭像 發(fā)表于 07-02 16:47 ?1234次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本原理和應(yīng)用范圍

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡(jiǎn)稱CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像
    的頭像 發(fā)表于 07-02 15:30 ?2002次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)及其功能

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡(jiǎn)稱CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像
    的頭像 發(fā)表于 07-02 14:45 ?3524次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的原理是什么

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡(jiǎn)稱CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像
    的頭像 發(fā)表于 07-02 14:44 ?1278次閱讀

    深度神經(jīng)網(wǎng)絡(luò)模型有哪些

    深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks,DNNs)是一類具有多個(gè)隱藏層的神經(jīng)網(wǎng)絡(luò),它們?cè)谠S多領(lǐng)域取得了顯著的成功,如計(jì)算機(jī)視覺、自然語(yǔ)言處理、
    的頭像 發(fā)表于 07-02 10:00 ?2385次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)語(yǔ)音識(shí)別中的應(yīng)用

    (Convolutional Neural Networks, CNN)憑借其強(qiáng)大的特征提取和學(xué)習(xí)能力,為語(yǔ)音識(shí)別領(lǐng)域帶來(lái)了革命性的進(jìn)步。本文將從卷積
    的頭像 發(fā)表于 07-01 16:01 ?1465次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)

    隨著大數(shù)據(jù)和計(jì)算機(jī)硬件技術(shù)的飛速發(fā)展,深度學(xué)習(xí)已成為人工智能領(lǐng)域的重要分支,而卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡(jiǎn)稱CNN)作為
    的頭像 發(fā)表于 07-01 15:58 ?1035次閱讀
    主站蜘蛛池模板: 久草婷婷| 黄色二级视频 | 天天艹夜夜 | 久久99精品国产麻豆宅宅 | 免费的色网站 | 韩漫免费网站无遮挡羞羞漫画 | 亚洲欧美一区二区三区麻豆 | 欧美黑人性xxx猛交 欧美黑人性受xxxx精品 | 天天干天天射天天舔 | 成人看的一级毛片 | 久久精品人人爽人人爽 | 一级不卡毛片 | 极品色天使在线婷婷天堂亚洲 | 色综合天天综合网站中国 | 亚洲偷图色综合色就色 | 日日干干夜夜 | 欧美电影一区二区 | 天天爱天天做色综合 | 欧美日韩一卡2卡三卡4卡新区 | 深夜视频在线免费 | 夜夜做日日做夜夜爽 | 国产亚洲欧美一区二区 | 国产黄色小视频 | 在线免费日韩 | 2022国产情侣真实露脸在线 | 四虎影视永久在线观看 | 男人的天堂免费网站 | 精品四虎免费观看国产高清午夜 | 国产手机在线国内精品 | 双性受粗大撑开白浊 | 亚洲伊人99综合网 | 高清一级做a爱免费视 | 成人的天堂视频一区二区三区 | 亚洲一区二区在线 | 三级视频网 | 91大神在线观看精品一区 | 中文字幕在线看视频一区二区三区 | 精品福利在线视频 | 亚色国产| 午夜视频在线观看视频 | 久操中文 |