在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

未來機(jī)器智能時(shí)代:如何讓機(jī)器聽懂世界

HOPE開放創(chuàng)新平臺(tái) ? 2017-12-08 10:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

語言承載了人類文化,人類需要通過語言學(xué)習(xí)知識(shí)和傳遞信息,這是人類區(qū)別于動(dòng)物界最重要的特性之一。

因此,未來的機(jī)器智能時(shí)代,機(jī)器也必然需要通過語言實(shí)現(xiàn)與人類之間的交互,似乎最近的科幻片都已經(jīng)暗示了這個(gè)問題。

現(xiàn)在的科幻就是未來的現(xiàn)實(shí),因此,讓機(jī)器聽懂世界,這是未來機(jī)器智能時(shí)代的關(guān)鍵問題,也是人類一個(gè)更大的夢想,但是,我們距離人類的這個(gè)夢想還有多遠(yuǎn)呢?

01讓機(jī)器聽懂世界承載了人類千年夢想

首先明確一個(gè)概念,讓機(jī)器聽懂世界,這里面其實(shí)蘊(yùn)含了多個(gè)歷程,包括聽懂人類語言,進(jìn)而聽懂動(dòng)物叫聲,甚至聽懂自然聲音,亦或類似地球的耳朵LIGO那樣聆聽宇宙的“聲音”。

所有這些都是極其復(fù)雜的過程,因?yàn)槲覀內(nèi)祟悓?shí)際上也沒有達(dá)到這種能力,但是我們期望機(jī)器能夠延伸人類的能力,從而實(shí)現(xiàn)人類的夢想。所以語音智能事實(shí)上承載的是幾千年來人類的偉大夢想。

那么,如何才能讓機(jī)器聽懂人類語言呢?這需要解決三個(gè)核心關(guān)鍵問題:聽見、聽準(zhǔn)和聽懂,從技術(shù)角度來看,就是拾音、識(shí)別和理解三個(gè)關(guān)鍵技術(shù)環(huán)節(jié)。

拾音是最為基礎(chǔ)的環(huán)節(jié),必須保證讓機(jī)器聽得見聲音,這部分主要是聲學(xué)問題;

識(shí)別是將符合要求的聲音轉(zhuǎn)化成文字,這部分主要是語音識(shí)別的問題;

理解則是根據(jù)識(shí)別出來的文字,準(zhǔn)確理解人類的指令甚或情感。

鑒于語音智能設(shè)備已經(jīng)大量出現(xiàn)在我們生活場景之中,當(dāng)前技術(shù)的核心關(guān)鍵就是聲學(xué)問題和語義理解。

02近場語音是機(jī)器聽懂人類的率先嘗試

近場語音交互主要是指人類距離機(jī)器不超過30厘米范圍的語音識(shí)別技術(shù),這項(xiàng)技術(shù)利用距離巧妙回避了真實(shí)場景下復(fù)雜的聲學(xué)問題,可以理解為一種實(shí)驗(yàn)室理想環(huán)境下的語音交互技術(shù)。

近場語音識(shí)別從上世紀(jì)五十年代就開始研究,但是長期沒有實(shí)質(zhì)性進(jìn)展,直到蘋果在2010年推出Siri的應(yīng)用,這才引起了全球的關(guān)注。到現(xiàn)在為止,近場語音交互技術(shù)已經(jīng)比較成熟,平均識(shí)別率可以達(dá)到95%以上。

但是近場語音交互受到了真實(shí)場景的巨大制約,并沒有展現(xiàn)出來語音交互可以解放雙手的先進(jìn)性,因此在很多場景中,事實(shí)上近場語音交互都是雞肋一般的存在,并沒有發(fā)揮出真正的威力。

直到遠(yuǎn)場語音交互技術(shù)的出現(xiàn),成功解決了真實(shí)場景下的復(fù)雜聲學(xué)問題以后,至少技術(shù)達(dá)到了用戶認(rèn)可的門檻,語音交互才真正出現(xiàn)了替代鍵盤鼠標(biāo)和觸摸屏的可能性。

03遠(yuǎn)場語音將語音智能落地到真實(shí)場景

遠(yuǎn)場語音交互主要解決30厘米到5米范圍內(nèi)的語音交互問題,這個(gè)范圍事實(shí)上就是人類之間溝通交流的最佳距離,距離太近容易觸發(fā)自我保護(hù)意識(shí),而距離太遠(yuǎn)則會(huì)增大交流難度。

注意語音交互并非只是語音問題,人類的交互其實(shí)是一個(gè)綜合的過程,包括了表情、眼神、肢體動(dòng)作等等一系列影響因素。

遠(yuǎn)場語音交互的歷史是比較短暫的,這項(xiàng)技術(shù)以前長期沒有實(shí)質(zhì)性突破,直到2016年末,全球才真正開始重視這項(xiàng)技術(shù),并且短短一年時(shí)間,引領(lǐng)全球市場都進(jìn)入了激烈博弈的階段。

遠(yuǎn)場語音交互的代表產(chǎn)品自然就是智能音箱,盤點(diǎn)一下全球巨頭在智能音箱的布局就可窺得一二。亞馬遜的Echo發(fā)布四年已然影響深遠(yuǎn),谷歌的Home劍走偏鋒以技術(shù)做博弈,微軟的Invoke則仍然堅(jiān)持工程師定義產(chǎn)品的文化......

注意,這里還是特別強(qiáng)調(diào)智能音箱只是遠(yuǎn)場語音交互的突破口,并非什么語音的唯一入口,因?yàn)槲磥淼臋C(jī)器智能時(shí)代,比如電視、冰箱、汽車都有可能成為重要入口。但是智能音箱又是非常重要的,因?yàn)椴还墚a(chǎn)品形態(tài)怎樣變化,其本質(zhì)的核心其實(shí)還是智能音箱的技術(shù)架構(gòu)。

04聽懂世界還有哪些必須解決的問題?

若讓機(jī)器聽懂世界,遠(yuǎn)場語音交互技術(shù)也僅是個(gè)嘗試而已,事實(shí)上遠(yuǎn)場語音技術(shù)本身也只是剛剛起步,即便5米以內(nèi),其噪聲抑制、回聲抵消、混響去除、遠(yuǎn)場喚醒和遠(yuǎn)場識(shí)別等核心技術(shù)還存在諸多缺陷。

但是技術(shù)一直在迭代發(fā)展,特別是當(dāng)技術(shù)落地場景以后,源源不斷的真實(shí)數(shù)據(jù)和客戶需求將帶動(dòng)技術(shù)更加快速的發(fā)展。

從技術(shù)層面來看,讓機(jī)器聽懂世界涉及了數(shù)學(xué)、物理學(xué)、語言學(xué)、醫(yī)學(xué)、計(jì)算機(jī)學(xué)等各學(xué)科的知識(shí),很難一一枚舉出來,但是若從應(yīng)用場景來看,則相對比較簡單,讓機(jī)器聽懂世界包括了人類語言、人類情感、動(dòng)物聲音和自然聲音。

讓機(jī)器聽懂世界的技術(shù)正在全球快速的演化,相信不久的將來,我們肯定能看到更加智能的機(jī)器。

因此,既不要抨擊當(dāng)前的人工智能技術(shù),也不要盛贊現(xiàn)在的基礎(chǔ)科技技術(shù),保持一顆平靜的心,正確給予科技界和產(chǎn)業(yè)界的支持才是對于未來最大的投資。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    29694

    瀏覽量

    212590
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    48983

    瀏覽量

    248869
  • 智能語音
    +關(guān)注

    關(guān)注

    11

    文章

    803

    瀏覽量

    49491

原文標(biāo)題:讓機(jī)器聽懂世界,觸及人類夢想還有多遠(yuǎn)?

文章出處:【微信號(hào):haierhope,微信公眾號(hào):HOPE開放創(chuàng)新平臺(tái)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    盤點(diǎn)#機(jī)器人開發(fā)平臺(tái)

    Athena機(jī)器人****開發(fā)平臺(tái)思嵐推出Athena機(jī)器人開發(fā)平臺(tái),有望主導(dǎo)機(jī)器人開發(fā)平臺(tái)未來市場-電子發(fā)燒友網(wǎng)AUTO CUBEROS機(jī)器
    發(fā)表于 05-13 15:02

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】機(jī)器人入門的引路書

    ROS的全稱:Robot Operating System 機(jī)器人操作系統(tǒng) ROS的 目的 :ROS支持通用庫,是通信總線,協(xié)調(diào)多個(gè)傳感器 為了解決機(jī)器人里各廠商模塊不通用的問題,機(jī)器
    發(fā)表于 04-30 01:05

    智能投遞機(jī)器人為什么采用鋁型材質(zhì)?揭秘輕量化時(shí)代的效率革命

    智能投遞機(jī)器人為什么采用鋁型材質(zhì)?答案不僅是技術(shù)選擇,更是對效率、靈活性與可持續(xù)未來的深度洞察。富唯智能以鋁為翼,賦能機(jī)器人突破物理邊界,
    的頭像 發(fā)表于 04-28 16:17 ?186次閱讀
    <b class='flag-5'>智能</b>投遞<b class='flag-5'>機(jī)器</b>人為什么采用鋁型材質(zhì)?揭秘輕量化<b class='flag-5'>時(shí)代</b>的效率革命

    機(jī)器人和自動(dòng)化的未來(2)

    本文是第二屆電力電子科普征文大賽的獲獎(jiǎng)作品,來自西南交通大學(xué)黃雯珂的投稿。3機(jī)器人與自動(dòng)化的未來展望隨著機(jī)器人和自動(dòng)化技術(shù)的不斷進(jìn)步,未來世界
    的頭像 發(fā)表于 04-26 08:33 ?318次閱讀
    <b class='flag-5'>機(jī)器</b>人和自動(dòng)化的<b class='flag-5'>未來</b>(2)

    名單公布!【書籍評測活動(dòng)NO.58】ROS 2智能機(jī)器人開發(fā)實(shí)踐

    資格! 從 PC 到智能手機(jī),下一個(gè)更大的計(jì)算平臺(tái)是什么? 最佳答案可能是 機(jī)器人 ! 如果設(shè)想成真,則需要有人為機(jī)器人“造腦”,即打造適配的計(jì)算平臺(tái)及操作系統(tǒng)。 就像以計(jì)算機(jī)為平臺(tái)的計(jì)算機(jī)時(shí)
    發(fā)表于 03-03 14:18

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預(yù)測......

    ”“大模型圈的大黑馬”“硅谷震驚了”“來自中國的學(xué)霸級AI”…… 從智能手機(jī)到自動(dòng)駕駛,從數(shù)據(jù)中心到物聯(lián)網(wǎng),F(xiàn)PGA 正悄然改變著我們的生活。未來,F(xiàn)PGA 又將如何塑造世界?DeepSeek 帶你一起
    發(fā)表于 03-03 11:21

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】2.具身智能機(jī)器人的基礎(chǔ)模塊

    非常重要的地位。 先說這個(gè)自主機(jī)器人的計(jì)算系統(tǒng)。計(jì)算系統(tǒng)是自主機(jī)器人的關(guān)鍵部件。自主機(jī)器人通過智能計(jì)算系統(tǒng)與物理世界交互,自主地完成任務(wù)。通
    發(fā)表于 01-04 19:22

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】2.具身智能機(jī)器人大模型

    中取得了令人矚目的效果。 閱讀感悟 從傳統(tǒng)的手動(dòng)編程到借助大模型實(shí)現(xiàn)智能化、自主化,從單一模態(tài)的交互到多模態(tài)信息的深度融合,再到擴(kuò)散模型的應(yīng)用,機(jī)器人控制技術(shù)正在以驚人的速度進(jìn)化。這不僅機(jī)器
    發(fā)表于 12-29 23:04

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】1.初步理解具身智能

    對人工智能機(jī)器人技術(shù)和計(jì)算系統(tǒng)交叉領(lǐng)域感興趣的讀者來說不可或缺的書。這本書深入探討了具身智能這一結(jié)合物理機(jī)器人和智能算法的領(lǐng)域,該領(lǐng)域正在
    發(fā)表于 12-28 21:12

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】1.全書概覽與第一章學(xué)習(xí)

    非常感謝電子發(fā)燒友提供的這次書籍測評活動(dòng)!最近,我一直在學(xué)習(xí)大模型和人工智能的相關(guān)知識(shí),深刻體會(huì)到機(jī)器人技術(shù)是一個(gè)極具潛力的未來方向,甚至可以說是推動(dòng)時(shí)代變革的重要力量。能參與這次活動(dòng)
    發(fā)表于 12-27 14:50

    《具身智能機(jī)器人系統(tǒng)》第7-9章閱讀心得之具身智能機(jī)器人與大模型

    研讀《具身智能機(jī)器人系統(tǒng)》第7-9章,我被書中對大模型與機(jī)器人技術(shù)融合的深入分析所吸引。第7章詳細(xì)闡述了ChatGPT for Robotics的核心技術(shù)創(chuàng)新:它摒棄了傳統(tǒng)的分層控制架構(gòu),創(chuàng)造性地
    發(fā)表于 12-24 15:03

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+數(shù)據(jù)在具身人工智能中的價(jià)值

    嵌入式人工智能(EAI)將人工智能集成到機(jī)器人等物理實(shí)體中,使它們能夠感知、學(xué)習(xí)環(huán)境并與之動(dòng)態(tài)交互。這種能力使此類機(jī)器人能夠在人類社會(huì)中有效地提供商品及服務(wù)。 數(shù)據(jù)是一種貨幣化工具 數(shù)
    發(fā)表于 12-24 00:33

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+初品的體驗(yàn)

    的快速發(fā)展,相關(guān)人才的需求也在不斷增加,通過閱讀該書可以幫助大家系統(tǒng)性地了解和分析當(dāng)前具身智能機(jī)器人系統(tǒng)的發(fā)展現(xiàn)狀和前沿研究,為未來的研究和開發(fā)工作提供指導(dǎo)。此外,本書還可以為研究人員和工程師提供具體
    發(fā)表于 12-20 19:17

    《具身智能機(jī)器人系統(tǒng)》第1-6章閱讀心得之具身智能機(jī)器人系統(tǒng)背景知識(shí)與基礎(chǔ)模塊

    意味著在“具身智能”領(lǐng)域,還沒有哪一個(gè)玩家能像O社那樣能站在AGI的制高點(diǎn)。 具身智能從字面上拆解為“具身+智能”,指的是一種將機(jī)器學(xué)習(xí)算法適配至物理實(shí)體,從而與物理
    發(fā)表于 12-19 22:26

    名單公布!【書籍評測活動(dòng)NO.51】具身智能機(jī)器人系統(tǒng) | 了解AI的下一個(gè)浪潮!

    試用評測資格! 早就聽大佬們說,具身智能是人工智能的下一波浪潮,也是AI未來的趨勢! 最近,具身智能的概念更是炙手可熱,備受矚目! 不論是這幾天稚暉君開源人形
    發(fā)表于 11-11 10:20
    主站蜘蛛池模板: 美女国产视频 | aaaaa特级毛片 | 色视频一区二区三区 | 久久青草国产免费观看 | 第四色男人天堂 | 国产破苞合集 magnet | 丁香婷婷亚洲六月综合色 | 天天草夜夜骑 | 欧美综合成人网 | 一本到中文字幕高清不卡在线 | 狂捣猛撞侍卫攻双性王爷受 | 欧美一级黄色片视频 | 天天摸夜夜添狠狠添2018 | 视频一区二区在线播放 | 国产高清色视频免费看的网址 | 国产小毛片 | 一级高清| 亚洲国产精品嫩草影院 | 国产精品不卡片视频免费观看 | 在线播放ww| 成人自拍视频 | 午夜在线免费观看 | 四虎永久在线视频 | 一级特黄aaa大片29 | 午夜精品一区二区三区在线视 | 中文在线1区二区六区 | 男人扒开美女尿口无遮挡图片 | 亚洲天堂二区 | 在线播放91灌醉迷j高跟美女 | 国久久 | 免费看国产精品久久久久 | 欧美美女福利视频 | 色婷婷一区二区三区四区成人 | 每日最新avhd101天天看新片 | 男女视频免费观看 | h视频免费看 | 天天色天天综合网 | 久久青青草原精品老司机 | 另类毛片 | 久久成人亚洲 | 色五月视频 |