在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于Coretex-M3 Design Start的語音識別和聲源定位識別系統

安芯教育科技 ? 來源:安芯教育科技 ? 作者:安芯教育科技 ? 2022-04-08 10:10 ? 次閱讀

寫在前面

能獲得企業大獎其實是出乎預料的,論復雜程度我自己認為可能也無法比的上其他學校的朋友們的(不過是因為今年沒有線下交流,著實無法看到大家的作品),但我覺得組委會能選擇我們組作為企業大獎,可能也是想通過我們來拓寬大家的思路,而并不一定是我們的作品做的是多么完美。

學習了近幾年ARM杯的作品,感覺大家都是在同一個領域做文章(當然去年那組BLDC的hxd例外),那就是視覺和圖像處理方面。這方面感覺大家做的都非常好了,無論是用現成的算法拆分成verilog中的矩陣運算,還是利用HLS這類高層次綜合工具,我覺得如果繼續做視覺方面的內容我們可能再怎么努力也無法達到他人積累多年經驗的程度,所以我們選擇換一個角度。

人類有五種感官,嗅覺和味覺目前來說無法做到輔助(笑,還剩下聽覺、視覺和觸覺,視覺被我們直接否定了,那么觸覺呢?目前高精度傳感器也不是我們能企及做到的了,這和生物醫學電子有關,那么我們的眼前就只有一個選擇了:聽覺。

這也正是我們選擇做這個系統的原因之一,還有一個原因是我們能感覺得到現在的消費電子都逐漸在向聲學方面走,例如蘋果的HomePod,華為的Sound X,還有小米最近剛推出的小米Sound,這些都是非常高端的走計算聲學方向的家居產品,它們的受眾非常廣,而且在這兩年疫情的影響下,更多的人會選擇在線會議,那么一個優秀的聲學處理裝置就顯得更為重要了。

1.設計簡介

1.1 總體介紹

本作品是基于Coretex-M3 Design Start的語音識別和聲源定位識別系統,包括Digilent NexysVideo開發板、自制麥克風矩陣模塊、ESP8266無線互聯模塊、LCD屏幕、載體小車以及安卓端APP組成。

本系統在Xilinx Artix-7中搭建ARM Cortex-M3軟核作為中央處理器,使用自制的MEMS硅片麥克風陣列作為聲音信號采集器,利用Artix-7中自帶的XADC將麥克風輸出的模擬量信號轉換為數字信號并通過AXI4-FULL傳輸給DDR3控制器,DDR3控制器根據用戶的控制選擇輸入和輸出,當開始語音識別后,將開啟后1s內的數據從DDR3中直接利用Burst讀入語音識別模塊,該模塊利用HLS綜合,包括語音的MFCC特征提取、BP神經網絡的執行等過程,將最終得出的語音識別結果保存在寄存器中并能使CPU通過AXI4-Lite讀取;當開啟聲源定位后,數據利用AXI4-Stream直接搬移到算法電路模塊,對四路麥克風同時進行流水線處理,經過信號的處理和變換后得到聲源方位數據通過UART串口輸出到ESP8266,ESP8266利用局域網將數據傳至安卓APP。

有一點我們的體會可以分享給其他朋友們,如果我們在一段時間內只需要處理一段定長的數據,那么我們可以不利用DMA,而是僅僅利用AXI的Burst傳輸即可,例如采集1s的信號寸到DDR中一段連續區域以后,將這些的音頻信號數據整個Burst到加速器中,這樣可以充分發揮總線橋的作用,并節省一個DMA的資源,還可以減小數據搬移過來過去的時延。

1.2 硬件架構

d9baacbc-b6a8-11ec-aa7f-dac502259ad0.jpg

在本系統中,由于最終制作的語音識別加速器和聲源定位加速器都使用AXI系列總線配置寄存器和讀寫數據,同時DDR3由AXI總線接口的MIG管理,因此為了方便實用和同一總線,使整個架構簡潔,我們將除了ITCM和DTCM外的所有外設連接在由AHB轉換之后的AXI總線橋上。

1.3 語音識別加速器

語音識別采用的方案是利用MFCC提取特征,之后利用BP神經網絡擬合特征系數對應的神經網絡隱含層參數。首先輸入的語音數據從DDR經過Burst傳輸到信號處理模塊中,經過預處理(去工頻噪聲、音量均衡)后提取MFCC,再利用BP網絡將MFCC系數與訓練過的語句一一對應輸出對應的結果。語音識別的網絡的權重參數采用的是MATLAB離線訓練的方法,然后把訓練的權重數據保存在coe文件中,利用HLS綜合出IP。

流程圖如下:

d9d13f68-b6a8-11ec-aa7f-dac502259ad0.png

1.4 聲源定位加速器

聲源定位加速器融合了TDOA(Time Difference of Arrival 到達時間差)和空域波束指向性加權的方法。

由四個全向性麥克風M1, M2, M3, M4組成的差分麥克風列,如圖2.10所示。四麥克風等間隔的分布在直徑為D的圓周上。

d9f2eb04-b6a8-11ec-aa7f-dac502259ad0.png

差分麥克風陣列的輸出信號包括原點處的聲壓信號和原點處振速的兩個正交分量,可以得到聲源在原點處的聲強,進而由聲強的方向得到目標方位的估計值。需要指出的是,基于聲強估計的聲源定位方法通常只適用于單聲源的情況。同時,對于全向麥克風而言(不同于“心”形指向麥克風),并沒有對特定角度的聲源信號進行增強或削弱,這就使得在進行聲源定位時往往受到其他方向的干擾。采用空域波束指向性加權的方法,可以只增強期望方向上的信號,削弱其他方向上的干擾信號,提高信干比,使得輸出結果中特定方向上的信息能量增大。

2.作品外觀和使用體驗

作品成品外觀如下:

da0d74ba-b6a8-11ec-aa7f-dac502259ad0.jpg

da457626-b6a8-11ec-aa7f-dac502259ad0.jpg

da692fa8-b6a8-11ec-aa7f-dac502259ad0.jpg

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 語音識別
    +關注

    關注

    38

    文章

    1742

    瀏覽量

    112935
  • 識別系統
    +關注

    關注

    1

    文章

    138

    瀏覽量

    18851
  • CORETEX
    +關注

    關注

    0

    文章

    2

    瀏覽量

    6325

原文標題:【2021集創賽作品分享】第三期 | Cortex-M3語音識別聲源定位系統

文章出處:【微信號:Ithingedu,微信公眾號:安芯教育科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    新唐科技基于NuMaker-M55M1平臺的人臉識別系統

    人臉識別技術已成為現代科技的重要基石,廣泛應用于安全監控、門禁系統以及用戶身份認證等領域。新唐科技基于 NuMaker-M55M1 平臺的人臉識別系統,結合多種核心技術組件,包括圖像處
    的頭像 發表于 01-20 10:31 ?166次閱讀

    幾款性價比很不錯的門禁人臉識別系統及其常見應用

    在當今智能化時代,門禁系統作為安全管理的重要一環,正逐步向更高效、更便捷的人臉識別技術轉型。其中,遠景達物聯網推出的F3與F6門禁人臉識別系統,憑借其卓越的性能與廣泛的應用領域,成為了
    的頭像 發表于 01-03 14:49 ?171次閱讀
    幾款性價比很不錯的門禁人臉<b class='flag-5'>識別系統</b>及其常見應用

    基于語音識別的智能會議系統具備哪些交互功能

    標貝科技專注智能語音交互領域多年,在語音識別語音合成領域有著多項大型企業合作案例,標貝與多個智能會議系統廠商合作,成功將
    的頭像 發表于 12-20 10:35 ?205次閱讀

    RFID識別系統

    隨著信息技術的快速發展,RFID(射頻識別)技術在各行各業的應用日益廣泛,其中RFID識別系統作為核心應用,已經成為智能化管理不可或缺的基石。通過無線射頻信號的非接觸式識別與數據傳輸,RFID
    的頭像 發表于 12-06 17:57 ?348次閱讀
    RFID<b class='flag-5'>識別系統</b>

    物聯網系統智能控制產品的語音識別方案_離線語音識別芯片分析

    01 物聯網系統中為什么要使用離線語音識別芯片 物聯網系統中使用離線語音識別芯片的原因主要基于以
    的頭像 發表于 09-26 17:56 ?790次閱讀
    物聯網<b class='flag-5'>系統</b>智能控制產品的<b class='flag-5'>語音</b><b class='flag-5'>識別</b>方案_離線<b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片分析

    WTK6900FC語音識別模塊

    語音識別
    WT-深圳唯創知音電子有限公司
    發布于 :2024年09月25日 17:35:07

    智能玩具用離線語音識別芯片有什么優勢

    語音識別系統,應用場景相對單一。典型應用:智能家電、語音遙控器、智能玩具、車載聲控、智能家居等當離線語音識別芯片應用在智能玩具中,能夠提供
    的頭像 發表于 09-20 10:00 ?341次閱讀
    智能玩具用離線<b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片有什么優勢

    基于FPGA的指紋識別系統設計

    隨著人們對安全問題的日益重視,指紋識別作為一種高效、可靠的生物識別技術,在多個領域得到了廣泛應用。本文設計并實現了一種基于FPGA的嵌入式指紋識別系統,該系統利用FPGA的高集成度、低
    的頭像 發表于 07-17 16:33 ?1495次閱讀

    多目標智能識別系統

    智慧華盛恒輝多目標智能識別系統是一種利用現代計算機視覺技術和人工智能算法,從圖像或視頻中同時識別和分類多個目標物體的系統。這種系統廣泛應用于自動駕駛、智能監控、人機交互、軍事偵察、災害
    的頭像 發表于 07-16 10:42 ?1.6w次閱讀

    基于OpenCV的人臉識別系統設計

    基于OpenCV的人臉識別系統是一個復雜但功能強大的系統,廣泛應用于安全監控、人機交互、智能家居等多個領域。下面將詳細介紹基于OpenCV的人臉識別系統的基本原理、實現步驟,并附上具體的代碼示例。
    的頭像 發表于 07-11 15:37 ?1.5w次閱讀

    語音識別和自然語言處理的區別和聯系

    Recognition) 1. 定義 語音識別,又稱為自動語音識別(Automatic Speech Recognition, ASR),是指將人類的
    的頭像 發表于 07-05 10:09 ?2006次閱讀

    基于GIS的SAR多目標智能識別系統

    智慧華盛恒輝基于GIS的SAR多目標智能識別系統是一個集成了合成孔徑雷達(SAR)和地理信息系統(GIS)技術的先進系統,旨在實現高分辨率雷達圖像中的多目標智能識別。以下是該
    的頭像 發表于 06-26 14:26 ?559次閱讀

    車載語音識別系統語音數據采集標注案例

    車載語音識別系統是指利用機器學習算法實現的一種自然語言處理技術,載語音識別系統通過辨別聲音的語調、語速和音量,將所聽到的語音轉化成可讀取的語
    的頭像 發表于 06-19 15:52 ?411次閱讀
    車載<b class='flag-5'>語音</b><b class='flag-5'>識別系統</b><b class='flag-5'>語音</b>數據采集標注案例

    車載語音識別系統語音數據采集標注案例

    車載語音識別系統是指利用機器學習算法實現的一種自然語言處理技術,載語音識別系統通過辨別聲音的語調、語速和音量,將所聽到的語音轉化成可讀取的語
    的頭像 發表于 06-19 15:49 ?575次閱讀

    基于深度學習的鳥類聲音識別系統

    : 與人聲識別不同,本文的鳥聲識別更多地關注鳥聲的特征,而不是鳥聲的內容。為了簡化特征融合算法的復雜度,降低模型的計算量,選擇語音識別系統中廣泛使用的梅爾譜作為鳥類音頻信號的特征。提取
    發表于 05-30 20:30
    主站蜘蛛池模板: 夜夜夜夜夜夜夜猛噜噜噜噜噜噜 | 久久激情综合网 | 日本免费大黄在线观看 | 天天舔天天射天天操 | 91最新网站免费 | ts 人妖 另类 在线 | 中文一级黄色片 | 久久久午夜影院 | 国产一级大片在线观看 | 人人揉揉香蕉大免费不卡 | 午夜美女影院 | www.亚洲天堂.com | 色噜噜狠狠网站 | 视频在线观看高清免费看 | 色综合天天综合网国产国产人 | 欧美视频一区二区三区四区 | 欧美日韩亚洲一区 | 欧美一级日韩一级亚洲一级 | 噜噜色小说 | 福利片免费一区二区三区 | 国产综合色精品一区二区三区 | 国产色婷婷免费视频 | 欧美日韩国产成人高清视频 | 亚洲人成77777在线观看网 | 天天av天天翘天天综合网 | 久热草在线 | 国产午夜毛片v一区二区三区 | 天天躁狠狠躁夜夜躁 | 色多多福利网站 | 69hdxxxx日本 | 日本黄色视屏 | 亚洲欧美日韩在线精品2021 | 手机看片国产福利 | 在线视频网址 | 亚洲国产女人aaa毛片在线 | 人与性www | 簧 色 成 人| 日本xxxⅹ69xxxx护士 | 亚洲日本一区二区三区 | 欧美videosex性欧美成人 | 天天摸夜夜爽 |