在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

小米AI實驗室聲學團隊 獲嬰兒啼哭聲識別的挑戰賽任務第一名

小米公司 ? 來源:小米公司 ? 作者:小米公司 ? 2020-11-13 10:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

對嬰兒來說,啼哭聲是一種通訊的方式,一個非常有限、但類似成年人進行交流的方式。它也是一種生物報警器,向外界傳達著嬰兒生理和心理的需求。 基于啼哭聲聲波攜帶的信息,嬰兒的身體狀況才能被確定,疾病才能被檢測出來。因此,有效辨識啼哭聲,成功地將嬰兒啼哭聲“翻譯”成“成人語言”,讓成年人讀懂啼哭聲的含義,有重大的實際意義。 2020 iFLYTEK A.I.開發者大賽中,有一項關于嬰兒啼哭聲識別的挑戰賽任務。本次競賽總共吸引了678只隊伍參賽,分別來自國內不同的公司和高校。最終小米AI實驗室聲學團隊以0.99123分的高分奪得第一名。

比賽的訓練數據集包含了awake(蘇醒)、diaper(換尿布)、hug(要抱抱)、hungry(饑餓)、sleepy(困乏)和uncomfortable(不舒服)六類哭聲,并且人工添加了來自Noisex-92標準數據庫的噪聲。 這項任務旨在判別嬰兒啼哭聲所傳遞的信息,需要分別在簡單噪聲環境和復雜噪聲環境下對嬰兒啼哭進行識別,判斷容易引起混淆的啼哭聲,分析各類啼哭聲的明顯特征及簡單直接的判別方式。 初賽訓練數據包含918條音頻,測試集包含228條。復賽賽方提供了添加不同噪聲的30294條訓練數據,需對7524條測試音頻進行識別。

嬰兒啼哭比賽背后的技術原理 小米AI實驗室聲學團隊借鑒說話人確認的方法,訓練網絡使得vector的余弦距在離類間間距拉大而類內間距減小。 在模型的訓練過程中,首先使用VAD算法對嬰兒啼哭音頻中的靜音部分進行剔除。去除靜音后隨機選取160幀,不足160幀的語音采用Cycle Padding方式,利用中間特征進行循環填充,相比與傳統的補0或用尾部填充的方式,特征更加豐富。 模型采用3 層 LSTM+256Dense 層,每層節點為 512。初賽訓練集中的所有純凈語音均看作 enroll 語料,所有訓練集中每個類別的 embedding 由該類別中的所有語音過模型求整體平均得到。測試集中的每條語音過模型后得到的 embedding與 enroll 中的每類 embedding 求余弦距離,分數對應最高的類別為預測類別。 訓練策略為:首先迭代第一個 5000 次,學習率設置為 1e-3,第二次加載預訓練模型(mAp 分數高的),調整學習率,再迭代 5000 次,最終交叉加載預訓練模型在不同的 part 上訓練。

模型的選擇和推理過程分為以下4個步驟:

測試集統計分析:首先統計測試集語音的信噪比、時長、靜音占比及語音相似度。通過對比分析,對相似數據進行歸類,選取最高信噪比數據進行預測。

模型選擇:在 5 個訓練集上分別擇優選取 2 個模型作為備用。

推理:計算測試語料經模型推理得到的vector 與每類哭聲embedding間的余弦距離,取分數最高的對應類為備選結果。

投票:根據單個模型預測的結果投票得到最終結果。

聲學感知技術未來將如何發展? 當前主流的聲學感知技術使用的是強監督的深度學習方法,隨著數據量的增大和技術的發展,未來監督學習的方法將逐漸過度為半監督甚至無監督學習。其中半監督學習正是當前聲音事件檢測技術的研究重點。 不僅如此,深度學習的網絡模型也從人工專家設計逐漸轉變為自動搜索架構,而元學習等小樣本學習方法也開始逐步應用在聲學感知方向。 嬰兒哭聲分析只是聲學感知技術的其中一個應用。當前的聲音場景分類和聲音事件檢測技術已能在設備端上實時分析當前用戶所處的場景和識別出各式各樣的聲音,如貓狗寵物叫聲、警報聲、汽車鳴笛聲等。

不僅如此,聲學感知技術還能分析出一些連人耳也無法聽出的聲音,如本次競賽的嬰兒啼哭意圖,以及應用在工業上,通過分析機器發出的聲音來判斷機器保養狀態的聲學分析技術。聲音作為一種最常見的傳感媒介之一,聲音感知技術在智能家庭、自動駕駛、智能工業化等領域都有廣泛的應用場景。 手機xAIoT小米AI全力打造小米智能家居 隨著小米最新的手機xAIoT戰略,智能家居環境是手機設備與全部智能家居設備聯動最全面的使用場景。手機、TWS耳機和越來越多的智能家居設備比如智能音箱、智能電視、米家IoT設備等都具有麥克風拾音功能。 我們獲得了足夠多場景下的聲音數據時,構建基于設備端的場景感知、事件感知、人體感知和空間感知能力成為了可能。 依賴于全球第一的AIoT平臺,小米可以實現對家中每一個角落無處不在的感知能力,并完成手機端事件提醒與多事件時間線回溯,聲學作為智能感知的一種手段,在未來與UWB技術、視覺圖像技術相結合,相互取長補短將成為主流的趨勢。

責任編輯:xj

原文標題:小米AI實驗室聲學團隊榮獲2020 iFLYTEK A.I.開發者大賽嬰兒啼哭聲識別挑戰賽冠軍

文章出處:【微信公眾號:小米公司】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    88

    文章

    34990

    瀏覽量

    278651
  • 智能語音
    +關注

    關注

    11

    文章

    803

    瀏覽量

    49490
  • 小米
    +關注

    關注

    70

    文章

    14469

    瀏覽量

    147137

原文標題:小米AI實驗室聲學團隊榮獲2020 iFLYTEK A.I.開發者大賽嬰兒啼哭聲識別挑戰賽冠軍

文章出處:【微信號:xiaomigongsi0406,微信公眾號:小米公司】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    傳音多媒體團隊CVPR NTIRE 2025兩項挑戰賽冠亞軍,推動視頻畫質升級

    (NTIRE2025EfficientSuper-ResolutionChallenge)第一名,短視頻UGC圖像超分辨率挑戰賽(NTIRE2025Short-formUGCImageSuper-Reso
    的頭像 發表于 06-24 17:03 ?337次閱讀
    傳音多媒體<b class='flag-5'>團隊</b>攬<b class='flag-5'>獲</b>CVPR NTIRE 2025兩項<b class='flag-5'>挑戰賽</b>冠亞軍,推動視頻畫質升級

    傳音多媒體團隊CVPR NTIRE 2025兩項挑戰賽冠亞軍

    Efficient Super-Resolution Challenge)第一名,短視頻UGC圖像超分辨率挑戰賽(NTIRE 2025 Short-form UGC Image Super-Resolution
    的頭像 發表于 06-24 16:08 ?634次閱讀
    傳音多媒體<b class='flag-5'>團隊</b>攬<b class='flag-5'>獲</b>CVPR NTIRE 2025兩項<b class='flag-5'>挑戰賽</b>冠亞軍

    華為榮登GlobalData運營商基礎設施管理服務排名報告Leader象限第一名

    象限第一名。 報告對通信服務商從商業模式、解決方案、網絡設計與優化、網絡轉型能力、服務規模、和業務敏捷性六個維度進行了全面評估,華為綜合得分第一。這印證了華為在對全球運營商客戶提供領先服務解決方案、網絡極致性能和數智化轉型等方面做出了卓越
    的頭像 發表于 05-22 18:43 ?576次閱讀
    華為榮登GlobalData運營商基礎設施管理服務排名報告Leader象限<b class='flag-5'>第一名</b>

    實驗室安全管理成焦點,漢威科技賦能實驗室安全升級

    實驗室是國家科技創新體系的重要組成部分,是國家組織高水平基礎研究和應用基礎研究、聚集和培養優秀科學家、開展學術交流的重要基地。近年來,各高校、研究院所、科創園區、高新產業園區相關企業的實驗室呈現爆發
    的頭像 發表于 04-10 10:41 ?400次閱讀
    <b class='flag-5'>實驗室</b>安全管理成焦點,漢威科技賦能<b class='flag-5'>實驗室</b>安全升級

    微軟AI開發者挑戰賽即將開啟

    人工智能,正在重塑世界。2 月 5 日至 4 月 23 日,加入我們,共赴場聚焦 AI 技術的開發者挑戰賽!在這里,創意、技術和無限可能將碰撞出耀眼火花。無論你是開發新秀還是經驗豐富的技術專家,這場由微軟 Azure 驅動的在
    的頭像 發表于 02-12 16:18 ?437次閱讀

    達實再度榮獲十大出入口控制品牌第一名

    近日,被譽為智能建筑行業“奧斯卡”的中國智能建筑品牌獎頒獎典禮于廣州盛大舉行。達實智能子公司——深圳達實物聯網技術有限公司 連續14年 “十大出入口控制品牌第一名”榮譽,與此同時還攬“2024年優秀AIoT智控平臺品牌”等兩
    的頭像 發表于 12-11 10:23 ?696次閱讀

    蔚來獲得CACSI車型滿意度和售后服務滿意度第一名

    近日,由中國質量協會發布的2024年中國新能源汽車用戶滿意度測評結果(CACSI)出爐。蔚來ET5T榮獲純電動中型轎車滿意度第一名,蔚來品牌榮獲售后服務滿意度第一名。蔚來已連續兩年獲得CACSI車型滿意度和售后服務滿意度第一名
    的頭像 發表于 12-06 17:19 ?1989次閱讀

    理想L6和理想L8榮獲中國新能源汽車用戶滿意度測評第一名

    近日,中國質量協會發布2024年中國新能源汽車行業用戶滿意度測評(NEV-CACSI)結果,理想L62024年市場關注新車(SUV) 第一名,理想L8也成為混動中大型SUV第一名。雙雙登頂,證明著
    的頭像 發表于 12-05 14:00 ?1068次閱讀

    小米與聚飛光電成立聯合實驗室

    近日,“小米&聚飛聯合實驗室”在惠州聚飛正式揭牌成立。該實驗室將以Mini背光技術創新為主要方向,進步強化雙方在顯示終端領域的多元化合作。
    的頭像 發表于 11-27 10:45 ?620次閱讀

    蘋果深圳實驗室運營,強化iPhone等產品測試

    10月10日,蘋果公司宣布其位于深圳河套深港科技創新合作區深圳園區的應用研究實驗室正式啟用。該實驗室斥資超過10億人民幣,旨在組建支由超過1000中外高端人才構成的研發
    的頭像 發表于 10-11 15:41 ?828次閱讀

    TüV萊茵授予聯想合作實驗室資質

    聯想(北京)有限公司近日迎來重要里程碑,其聲學實驗室與安規實驗室成功獲得德國萊茵TüV大中華區頒發的合作實驗室資質證書。這殊榮不僅標志著聯
    的頭像 發表于 09-20 18:23 ?1247次閱讀

    NVIDIA為AI城市挑戰賽構建合成數據集

    一年一度的 AI 城市挑戰賽中,來自世界各地的數百支參賽隊伍在 NVIDIA Omniverse 生成的基于物理學的數據集上測試了他們的 AI 模型。
    的頭像 發表于 09-09 10:04 ?874次閱讀

    AI4Science黑客松光子計算挑戰賽成功舉辦

    經過數月角逐,第二屆AI4Science黑客松競賽日前落下帷幕。在曦智科技主持的光子計算挑戰賽中,參賽選手何自強和來自東北大學的參賽隊伍The Power of Light獲得完優勝獎。
    的頭像 發表于 08-07 09:58 ?1003次閱讀

    軟通動力榮獲2023年中國IT服務市場第一名

    近日,迪顧問最新發布《2023-2024年中國IT服務市場研究年度報告》。報告中,軟通動力憑借在數字化轉型浪潮中卓越的數字化能力和表現,持續領跑IT服務市場,位列2023年中國IT服務市場第一名
    的頭像 發表于 07-31 10:18 ?843次閱讀

    潤和軟件連續四年蟬聯數字業務類解決方案市場第一名

    ,連續四年蟬聯數字業務類解決方案市場第一名。在細分領域:數字信貸系統解決方案子市場持續保持第一名,數字銀行解決方案子市場穩居第二,開放銀行解決方案子市場上升至第三。 ? 數字業務類
    的頭像 發表于 07-31 10:10 ?1061次閱讀
    主站蜘蛛池模板: 男人你懂的在线观看视频 | 日韩三级在线免费观看 | 国产精品久久婷婷六月丁香 | 精品国产三级在线观看 | 日本一卡二卡3卡四卡网站精品 | 看黄视频免费 | 国产精品美女久久久 | 欧美福利网| 免费观看一级成人毛片 | 日本成人免费网站 | 国产一级αv片免费观看 | 人人澡 人人澡 人人看 | 边做饭边被躁欧美三级小说 | 午夜啪视频 | 免费无码看av的网站 | 最新黄色大片 | 欧美人交性视频在线香蕉 | 色天使色婷婷丁香久久综合 | 免看一级a毛片一片成人不卡 | 高清视频在线播放 | 亚洲一区二区三区中文字幕 | 日韩伦| 日韩特级毛片 | 福利视频自拍 | 色噜噜狠狠狠色综合久 | 天堂网欧美 | 中文字幕不卡在线播放 | 免费精品一区二区三区在线观看 | 国产黄色在线网站 | 中文字幕二区三区 | 黄色短视频软件 | 亚洲人成人网毛片在线播放 | 色婷婷激情五月综合 | 国产成人v爽在线免播放观看 | 喷潮白浆直流在线播放 | 五月婷婷电影 | 黄视频在线播放 | 四虎影院免费在线 | 久久国产免费福利永久 | 日本成人黄色网址 | 成人午夜大片免费7777 |