91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

云知聲數(shù)據(jù)標注團隊--關(guān)于研究機器人說話的研究

云知聲 ? 來源:djl ? 作者:云知聲 ? 2019-08-08 16:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

“如果機器在某些現(xiàn)實的條件下,能夠非常好地模仿人回答問題,讓提問者在相當長時間里誤認它不是機器,那么機器就可以被認為是能夠思維的。”

—— 阿蘭·圖靈

人機對話是人類對人工智能最初的設想,也一直是人工智能領(lǐng)域的目標之一。

即使我們經(jīng)常聽到“這個問題我還沒有學會”,但是不可否認,人工智能已經(jīng)基本實現(xiàn)”可以說話”了。那么,機器人是怎樣學習的呢?這就需要提到人工智能需求下誕生的一個新職業(yè),也是人工智能背后的“隱形者”——數(shù)據(jù)標注專員。

眾所周知,我們教小孩子認識海豚,就要拿海豚的圖片告訴他,這是海豚。久而久之,他記住了海豚的特征,當他去動物園看到了海豚,就知道那是海豚。類比機器人,為了讓機器人“像人一樣說話”,我們先要教它學習,通過大量的學習之后,它才能對事物做出分辨。

AI 領(lǐng)域,教機器人學習必須有大量的訓練集和測試集,訓練集通俗說就像是我們學習時做的習題集,測試集像我們考試做的試題。測試集和訓練集里的數(shù)據(jù)必須是支持算法可用的標注數(shù)據(jù),而將采集的原始數(shù)據(jù)變成算法可用數(shù)據(jù)的過程叫做“數(shù)據(jù)標注”。即對采集來的文本、圖片、語音數(shù)據(jù)進行梳理、整理、定性的過程。而數(shù)據(jù)標注專員就成了為人工智能的發(fā)展供應重要且源源不斷的“數(shù)據(jù)燃料”的人。

云知聲就有一個龐大的數(shù)據(jù)標注團隊從事數(shù)據(jù)服務工作,并且,僅有的數(shù)據(jù)標注團隊還在云知聲的東南總部廈門公司哦。團隊的小伙伴幾乎每天默默戴著耳機對著電腦 7-8 小時,真的是此處無聲勝有聲!

數(shù)據(jù)標注是一項重復且繁瑣的工作,如果把人工智能比作金字塔,最頂端的是人工智能應用(比如機器人、無人駕駛等),而最底端的則是數(shù)據(jù)服務,數(shù)據(jù)服務既是根基,也是人工智能必要且必不可少的一環(huán)。

數(shù)據(jù)標注工作真的像是工廠里的流水線操作嗎?只是重復性地對數(shù)據(jù)進行標注嗎?

云知聲數(shù)據(jù)標注團隊的負責人許建說,目前人工智能領(lǐng)域?qū)τ跀?shù)據(jù)采集和標注的需求量非常大,數(shù)據(jù)采集后首先進行數(shù)據(jù)清洗,清洗之后才是數(shù)據(jù)標注,標注要求盡可能地詳盡、清楚,最后的審查階段對標記的數(shù)據(jù)進行正確率、精確度、完備性等方面的審查。實際是,數(shù)據(jù)質(zhì)量會影響到算法效果,一旦標注人員出現(xiàn)了錯誤,也會影響到機器犯錯。

目前主要有語音、圖像、文本、視頻數(shù)據(jù)的采集標注。云知聲日常所涉及的是語音的標注,與智能產(chǎn)品進行語音交互和我們平時與人的交流對話相似,在生活中,你可能突然問你身邊的人,“小云,現(xiàn)在幾點了”,現(xiàn)在 3 點 15 分”,“小云”就是喚醒詞,“現(xiàn)在幾點了”就是命令詞,喚醒詞和命令詞均要采集。

為了讓即便帶有背景嘈雜聲、或是略帶方言口音也能準確識別,這背后有一個數(shù)量龐大的數(shù)據(jù)訓練集支撐。每個語音命令需要采集至少 100 人的語音數(shù)據(jù),既要羅列出所有可能的句子,又要搜集盡可能多的人不同的說話方式,覆蓋到地域、性別、各年齡段。

比如我們的 Pandora A1 客房智能管家,當查詢酒店服務時,就有多種表達方式,“提供什么服務”、“包括哪些服務”、“有哪些服務”、“有什么服務”等。同時,會有嚴格的性別、年齡段、口音采集人數(shù)占比,以保證最終的精準識別。

對每一個采集的詞句,都要做到精細標注,采集的語音需要符合相應的技術(shù)要求,標注的時間點要精準控制在 100 毫秒以內(nèi)。數(shù)據(jù)標注的速度決定了 AI 產(chǎn)品的研發(fā)速度,提高標注的效率也就顯得很重要。

為了配合數(shù)據(jù)標注團隊的工作廈門展廳還藏著一個神秘的聲學實驗室,這里可以說是整個公司最安靜的地方了。

聲學實驗室的主要用途是采集原始聲音數(shù)據(jù),為了貼近產(chǎn)品實際使用場景,整個裝修布置符合家居場景。

實驗室采用減振隔聲墻體,房間被墻體隔開,墻面、吊頂與外部房間沒有任何剛性連接,完全與外界隔絕。墻內(nèi)的吸聲材料主要由多孔的玻璃纖維板組成,具有較好的聲音吸收能力,除了吸聲材料外,聲學實驗室四周還布置了窗簾,可以讓聲音充分擴散,使整個空間內(nèi)的聲場均勻分布。地板采用的是地磚和吸聲地毯,實現(xiàn)實驗室與建筑基座的分隔,無反射和回聲。

聲學實驗室內(nèi)五臟俱全—標準麥克風、高保真音箱、聲卡……應有盡有。

許建說,為了達到設備在實際應用場景中達到最優(yōu)效果,在聲學實驗室采集時就要模擬真實環(huán)境,需要覆蓋不同的噪音、信噪比、距離和角度。

為了保證支持遠講的語音產(chǎn)品出廠前的效果,在前期的采集階段就要把產(chǎn)品在實際應用中受到的噪音干擾和不同距離、角度的聲音效果考慮進去。

像我們有些設備是支持 5 米遠講識別的,就要求錄音人距離錄音設備一米、三米、五米距離的錄音數(shù)據(jù),同時會設置 0° 、 -30° 、 -60° 等不同角度的設備疊加采集。經(jīng)常在采集的過程中根據(jù)場景需要加入音樂噪聲、電視噪聲、辦公噪聲、室外噪聲等,模擬出真實場景的噪音干擾。

人工智能的發(fā)展,催生了數(shù)據(jù)標注這個新職業(yè),隨著人工智能大規(guī)模的落地應用,至少在未來的五六年內(nèi),人工智能像是一個嗷嗷待哺的嬰兒,等待著數(shù)據(jù)的喂養(yǎng)。數(shù)據(jù)標注專員賦予冷冰冰的機器以鮮活的“生命”,教他們我們的知識,讓他們變得有“溫度”。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    213

    文章

    29748

    瀏覽量

    212977
  • 智能語音
    +關(guān)注

    關(guān)注

    11

    文章

    804

    瀏覽量

    49531
  • 語音交互
    +關(guān)注

    關(guān)注

    3

    文章

    307

    瀏覽量

    28624
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    基于結(jié)構(gòu)自適應的多機器人協(xié)作機制研究

    基于結(jié)構(gòu)自適應的多機器人協(xié)作機制研究
    發(fā)表于 08-20 13:43

    機器人足球識別算法研究

    `機器人足球識別算法研究`
    發(fā)表于 08-20 19:59

    美國最著名的十所機器人研究頂尖高校

    美國總統(tǒng)是該校的畢業(yè)生。此外,學校的醫(yī)學、法學、商學和新聞學院都名列前茅,其新聞學院頒發(fā)的普利策獎是美國新聞界的最高榮譽。  據(jù)網(wǎng)上評價,哥倫比亞大學的機器人研究團隊令人印象深刻。該校學生已經(jīng)制造適合
    發(fā)表于 01-13 17:15

    【Aworks申請】基于ARM的智能清掃機器人研究

    申請理由:現(xiàn)正在進行一個關(guān)于智能清掃機器人的項目研究,希望基于ARM搭建一款可以實現(xiàn)自動清掃和自動返回充電的,具有自主管理能力的清掃機器人,同時對相應功能進行改造完善。需要用到ARM芯
    發(fā)表于 07-06 10:59

    【MiCOKit申請】關(guān)于機器人熱感應系統(tǒng)的開發(fā)與研究

    申請理由:本人是一研究生,研究的是機器人方向,里面需要的很多參數(shù)和MiCOKit 開發(fā)板有關(guān),很希望能申請到,謝謝.項目描述:這是一款基于F2812DSP的一款和熱感應有關(guān)的機器人系統(tǒng)
    發(fā)表于 07-24 07:18

    智易申請】智能控制機器人-腦存儲

    申請理由:目前我們團隊正在研發(fā)的這個腦存儲智能機器人,原則上需要大量的內(nèi)存空間,所以需要進行儲存,wifi連接,通訊等方面的硬件開發(fā)板需要。目前也正在尋找這樣一款合適的開發(fā)板能夠搭配我們團隊
    發(fā)表于 07-24 10:07

    OFweek行業(yè)研究中心:服務機器人將成為新一代智能終端

    概要:從產(chǎn)業(yè)生命周期來看,服務機器人正處于市場導入期,在計算和大數(shù)據(jù)日趨成熟的背景下,深度學習等人工智能關(guān)鍵技術(shù)取得一定實質(zhì)性的進展,語音和圖片系統(tǒng)的識別率得到大大的提高。OFweek行業(yè)
    發(fā)表于 01-26 14:11

    機器人在線】工業(yè)噴涂機器人誤差修正方法發(fā)展趨勢

    的運動學問題進行了研究,但由于研究對象適用于Pieper準則,故逆解可以運動封閉解法來求解,沒有對于不滿足Pieper的情況進行進一步討論,且由于關(guān)于機器人加速度的理論
    發(fā)表于 07-13 16:03

    LabVIEW 的Tripod 機器人視覺處理和定位研究

    針對傳統(tǒng)的物流分揀過程效率低、成本高的現(xiàn)狀以及利用機器視覺進行分揀快速、可靠的優(yōu)點對機器視覺、圖像處理和Tiropd機器人進行了研究基于LabVIEW設計了Tripod
    發(fā)表于 06-01 06:00

    基于CAN總線和雙傳感器仿人機器人運動控制系統(tǒng)的研究

    一。引言  機器人研究是自動化領(lǐng)域最復雜。最具挑戰(zhàn)性的課題,它集機械。電子。計算機。材料。傳感器。控制技術(shù)等多門學科于一體,是多學科高技術(shù)成果的集中體現(xiàn)。而仿步行機器人技術(shù)的
    發(fā)表于 08-19 06:57

    功率放大器基于振動驅(qū)動的旋轉(zhuǎn)及攀爬軟體機器人研究

    實驗名稱:基于振動驅(qū)動的旋轉(zhuǎn)及攀爬軟體機器人研究研究方向:利用振動驅(qū)動原理,設計了能夠?qū)崿F(xiàn)快速旋轉(zhuǎn)運動和攀爬運動的兩種軟體驅(qū)動結(jié)構(gòu)。實驗內(nèi)容:旋轉(zhuǎn)軟體機器人具有可實現(xiàn)大變形、柔性接觸
    發(fā)表于 04-09 10:02

    功率放大器基于振動驅(qū)動的旋轉(zhuǎn)及攀爬軟體機器人研究

    實驗名稱:基于振動驅(qū)動的旋轉(zhuǎn)及攀爬軟體機器人研究研究方向:利用振動驅(qū)動原理,設計了能夠?qū)崿F(xiàn)快速旋轉(zhuǎn)運動和攀爬運動的兩種軟體驅(qū)動結(jié)構(gòu)。實驗內(nèi)容:旋轉(zhuǎn)軟體機器人具有可實現(xiàn)大變形、柔性接觸
    發(fā)表于 04-14 09:56

    機器人視覺系統(tǒng)研究

    視覺系統(tǒng)成為研究的新課題。1965年, Stanford建立機器人實驗室開始研究機器人機器人的定義:【
    發(fā)表于 09-07 08:37

    基于TRIZ輪式機器人驅(qū)動輪的研究

    基于TRIZ輪式機器人驅(qū)動輪的研究 根據(jù)亞太機器人大賽規(guī)則,要求機器人車輪與地面有較大的摩擦力,以保證機器人在規(guī)定的時間內(nèi)完成比賽任務。文中
    發(fā)表于 09-13 07:12

    智慧醫(yī)療解決方案詳細介紹與分享

    值得一提的是,除以上幾大智慧醫(yī)療產(chǎn)品與方案外,本次展會上還首次公布了旗下最新醫(yī)療產(chǎn)品——
    的頭像 發(fā)表于 08-08 17:03 ?5001次閱讀
    主站蜘蛛池模板: 婷婷影院在线综合免费视频 | 午夜小视频男女在线观看 | 美女黄页免费 | 男人天堂网2021 | 特黄一级视频 | 五月天丁香婷婷综合 | 日本一区二区在线免费观看 | 久久久久大香线焦 | 天堂网在线观看 | h视频在线免费观看 | 99精品国产第一福利网站 | 天天射狠狠干 | 久久99国产亚洲高清观看首页 | 噜噜噜噜噜噜色 | 亚洲国产成人久久一区久久 | 手机精品视频在线观看免费 | 色多多视频网站 | 亚洲禁片 | 亚洲成a人片在线看 | 人人看操 | 国产伦精品一区二区三区在线观看 | 国模视频一区二区 | 国产成人综合欧美精品久久 | 四虎永久精品免费网址大全 | 日韩一级在线视频 | 热99热| 黄频免费 | 天天干天天做天天操 | 久久99精品国产麻豆宅宅 | 嫩草网| 国产三级在线观看免费 | 久久精品视频7 | 亚洲欧美性另类春色 | 97成人资源 | 高清不卡一区 | 六月婷操 | 日本不卡视频在线播放 | 久久久久久国产精品mv | chinesevideo普通话对白 | 黄色三级网站 | 久久精品国产6699国产精 |