在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

微軟黃學東:企業(yè)應用最后一個痛點是會議中的語音

DPVg_AI_era ? 來源:未知 ? 作者:胡薇 ? 2018-05-23 16:07 ? 次閱讀

昨天下午,微軟全球技術院士黃學東博士、微軟大中華區(qū)副總裁兼市場營銷及運營總經(jīng)理康容、ROOBO CTO雷宇接受了包括新智元在內(nèi)的媒體專訪,詳細解答了微軟的語音技術、產(chǎn)品落地以及生態(tài)合作。

在昨天的微軟人工智能大會上,微軟全球技術院士黃學東展示了微軟多項語音、翻譯等技術,微軟Build大會上的“黑科技”全球首創(chuàng)AI會議系統(tǒng)再次被演示。

昨天下午,黃學東博士、微軟大中華區(qū)副總裁兼市場營銷及運營總經(jīng)理康容、ROOBO CTO雷宇接受了包括新智元在內(nèi)的媒體專訪,詳細解答了微軟的語音技術、產(chǎn)品落地以及生態(tài)合作。

新智元根據(jù)現(xiàn)場速記進行整理,部分內(nèi)容有刪節(jié)。

黃學東:評價谷歌沒有什么意思,微軟的“全武功”最有意思

問:您一直關注語音技術,現(xiàn)在很多搜索引擎還是通過輸入文字來進行交互,什么時候我們能夠看到像語音識別或圖像技術真正改變到搜索引擎現(xiàn)在的狀況?

黃學東:搜索引擎現(xiàn)在很復雜,我做語音之前做過搜索引擎,后臺要完全了解所有的文件內(nèi)容和關鍵是字是什么東西,還要匹配用戶意圖,找到相應的文本,它也有很多人工智能深度學習的技術。

語音識別在現(xiàn)在的媒體階段,是文本輸入還是語音輸入還是圖像輸入?基本上還是一個相對比較松的耦合。語音進步的主要標桿是把波形轉(zhuǎn)換成文字,這個過程中中文字也可以有不同的選擇,因為語音識別不是完全的準確,就像搜索引擎一樣,有第一個好結(jié)果,有第二好結(jié)果、第三結(jié)果,把整個結(jié)果給搜索引擎,搜索引擎在搜索的時候可以搜索不僅僅是第一好的結(jié)果,而且把語音識別第二好的結(jié)果也考慮進去。現(xiàn)在工業(yè)界的狀態(tài)基本上是這樣。

問:麥克風陣列部分經(jīng)常在語音識別場景下遇到噪音問題,微軟可以解決這個問題嗎?還是說未來我們可以有更好的方法?

黃學東:我們有麥克風陣列的核心技術,并且已經(jīng)有長足的進步,在業(yè)界是領先的。再加上360度的攝像頭,這兩者的結(jié)合讓會議“AI神器”達到了很高的高度。不管是講了什么話,各方面的指標都上了一個臺階。今后,我們的前景非常非常樂觀。

問:之前谷歌Duplex打電話號稱已經(jīng)通過了圖靈測試,你對這個怎么評價?

黃學東:不敢評價。媒體上很多評價說他們在作假,很多人質(zhì)疑谷歌,讓谷歌發(fā)言人出來認證,他們不出來認證,也不說話。

微軟會議“AI神器”在多人自由交談的情況下能知道誰在說話,而且知道說了什么話,做了現(xiàn)場演示。不僅做了中文,還做了英文,這是我們要表達的微軟在語音識別業(yè)界的領導地位,是全武功,那個武是武力的“武”,不是一二三四五的五。

所以說批評谷歌沒有什么意思,我們的“全武功”最有意思。

不僅能支持全雙工,而且能支持“全武功”

問:上午微軟展示了人工智能的系統(tǒng),有哪些東西是微軟從底層基礎研發(fā)到開放再到產(chǎn)品的生產(chǎn)制造?有哪些是把底層的技術開放給伙伴,他們基于平臺和技術做產(chǎn)品的研發(fā)和人工智能應用產(chǎn)品?

黃學東:首先,這些是研究的演示,微軟從來不預先宣布我們產(chǎn)品什么時候出來、以什么方式出來。我們產(chǎn)品有幾個東西可以講,第一是我們的認知服務,語音這一部分云的API、模型、服務,有一套新的規(guī)律,這是在微軟Build大會上已經(jīng)宣布了的。

第二是定制服務增加了語音合成,想要換成自己想要聽的聲音,可以上傳三個小時、十個小時,越多質(zhì)量越好,可以定制到你想要的聲音。所以我們?nèi)€語音和翻譯都實現(xiàn)了量身定制。

現(xiàn)在如果你是開發(fā)商要開發(fā)自己的音箱,可以用微軟剛剛推出來的MSDDK,這是我們和ROOBO合作推出來的一個最新解決方案,不僅僅有微軟和ROOBO合作推出來的硬件,而且有最新的麥克風陣列,包括四麥線性的和七麥原型的麥克風陣列。這個黑科技是絕對引導業(yè)界潮流的,我們不僅能支持全雙工,而且能支持“全武功”。

康容:我補充一下,因為微軟是一個平臺和工具的企業(yè),我們是提供平臺和工具,我們的黑科技、研發(fā)團隊、我們的大咖博士發(fā)明的東西,他們漸漸的會落地到我們自己的產(chǎn)品中,也會提供給我們的生態(tài)合作伙伴讓他們來開發(fā)。

微軟大中華區(qū)副總裁兼市場營銷及運營總經(jīng)理康容

今天早上看到哪一個黑科技會在什么時候落地,很難講出來,但是遲早會發(fā)生。我們會盡快的落地,我們會看市場的需求。所以,我們聽到越多的客戶和合作伙伴的聲音,我們就會加速某某功能盡量落地。我們一系列的很多新東西都會提供給生態(tài)一起來合作。

問:ROOBO本身是針對不同的應用場景解決人工智能軟硬結(jié)合方案的設計,然后去生產(chǎn)銷售,過去這幾年做這種場景化的人工智能設計,然后再去推廣。人工智能產(chǎn)品怎么更成功的被市場接受,讓消費者更容易去掏錢買?如何落地和激活?為什么這次和微軟合作語音的開發(fā)及機會在哪里?微軟的技術怎么獨特的激活這個市場?

雷宇:其實這兩個問題是一個問題。我們知道AI落地沒有一個通用AI可以應用到每個垂直領域,這里面最核心的問題是如何產(chǎn)品化。

康容與雷宇(右)

在我們創(chuàng)業(yè)過程中我們發(fā)現(xiàn),所有的方案只考慮技術,不考慮內(nèi)容和服務。這在本質(zhì)上違反了市場原則,用戶永遠要的是服務和功能,我覺得技術只是提升它的體驗,我覺得這是一個本質(zhì)的問題。

我們的痛點是在通用AI技術上,沒有達到我們滿意的效果,所以我們需要和國際上最頂尖的公司進行合作。

微軟認知服務是全面性,微軟服務本身也是有機體,本身考慮的就很完善。我們和微軟的合作,因為我們看到了“明天”的東西,可以少走一些彎路,多模態(tài)和多場景的東西必然帶來很大的變革。

企業(yè)應用最后一個痛點:會議中的語音

問:微軟開發(fā)出了很好的語音識別等的技術,你們打算用這些技術開發(fā)出一些什么樣的產(chǎn)品?智能音箱有很多企業(yè)都在做,但是具體的有沒有什么更好的應用可以為大家更好的服務呢?

黃學東:語音交互過程中,在所有的商業(yè)場景中,用電子郵件、微信等等其他的產(chǎn)品都已經(jīng)數(shù)字化了,會議中的語音是現(xiàn)在沒有數(shù)字化的一個主要媒體,這對生產(chǎn)力的提高、對消費的提高是最后的痛點。在企業(yè)的應用中,最后的一個痛點就在這個地方。

會議比較難做,不像全雙工,只有兩個人在講話,超過三個人的會議就比兩個人會議難很多。如果能做到七八個人開會,都可以轉(zhuǎn)錄和翻譯,可以變成數(shù)字化的形式處理。

問:如何看待目前的人工智能市場?

黃學東:我覺得人工智能造就的“餅”足夠大,傳統(tǒng)公司和新生公司都可以在這個餅上發(fā)揮自己的空間,為用戶提供更優(yōu)質(zhì)的服務。微軟云是提供全球很寬泛的一個平臺,它的覆蓋力不管是全球語言還是數(shù)據(jù)中心的覆蓋力都應該是引導潮流的。在這樣一個平臺上,微軟的從計算機視覺到自然語言處理,再到語音和搜索、知識表達等服務,都是業(yè)界領導潮流的。

所以在這個平臺上和人工智能的深度上微軟有非常大的優(yōu)勢,所以我們希望在提供這個寬度和深度這樣的架構(gòu)下,有更多的開發(fā)商可以在這個平臺上開發(fā)出我們還沒有想到的應用,這個才是平臺做的事情。大家要知道微軟有廣度且有深度,這個情況下開發(fā)商應該加入這個平臺,在上面創(chuàng)造他們新的價值。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 微軟
    +關注

    關注

    4

    文章

    6651

    瀏覽量

    105228
  • 人工智能
    +關注

    關注

    1804

    文章

    48449

    瀏覽量

    244916

原文標題:黃學東:微軟“全武功”解決企業(yè)會議的痛點

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    語音芯片技術賦能:體化方案重塑爬玩具低成本開發(fā)新范式 ——以WT588F02B-C014為核心的超省BOM成本方案解

    、引言:智能化趨勢下的爬玩具開發(fā)挑戰(zhàn)隨著早教理念的普及,爬玩具作為嬰幼兒早期運動能力開發(fā)的重要工具,市場需求持續(xù)增長。然而,傳統(tǒng)爬玩具開發(fā)面臨多重挑戰(zhàn):需集成紅外遙控、
    的頭像 發(fā)表于 04-16 08:43 ?72次閱讀
    <b class='flag-5'>語音</b>芯片技術賦能:<b class='flag-5'>一</b>體化方案重塑<b class='flag-5'>學</b>爬玩具低成本開發(fā)新范式 ——以WT588F02B-C014為核心的超省BOM成本方案解

    雷曼智慧會議交互系統(tǒng)助力企業(yè)打造數(shù)智化會議

    在Deepseek等AI大模型掀起認知智能浪潮的當下,企業(yè)會議場景正迎來新的變革。雷曼智慧會議交互系統(tǒng)(簡稱“雷曼會議體機”)將前沿AI大
    的頭像 發(fā)表于 03-19 15:50 ?269次閱讀

    應急救援的:大核桃單北斗防爆手持終端如何成為破局者?

    在應急救援的緊張與緊迫,每秒都至關重要。然而,傳統(tǒng)的應急通訊設備往往面臨諸多挑戰(zhàn),從定位不準確到通信不穩(wěn)定,再到功能單,這些問題都極大地限制了救援工作的效率與安全性。面對這些
    的頭像 發(fā)表于 01-14 17:24 ?300次閱讀
    應急救援的<b class='flag-5'>痛</b><b class='flag-5'>點</b>:大核桃單北斗防爆手持終端如何成為破局者?

    基于語音識別的智能會議系統(tǒng)具備哪些交互功能

    標貝科技專注智能語音交互領域多年,在語音識別和語音合成領域有著多項大型企業(yè)合作案例,標貝與多個智能會議系統(tǒng)廠商合作,成功將
    的頭像 發(fā)表于 12-20 10:35 ?464次閱讀

    標貝智能語音識別在智能會議場景的落地案例

    標貝科技專注智能語音交互領域多年,在語音識別和語音合成領域有著多項大型企業(yè)合作案例,標貝與多個智能會議系統(tǒng)廠商合作,成功將
    的頭像 發(fā)表于 12-20 10:31 ?578次閱讀
    標貝智能<b class='flag-5'>語音</b>識別在智能<b class='flag-5'>會議</b>場景<b class='flag-5'>中</b>的落地案例

    精準高效,訊維智能語音轉(zhuǎn)寫系統(tǒng)打造智慧會議新體驗!

    在快節(jié)奏的現(xiàn)代工作環(huán)境會議已成為企業(yè)溝通、決策和協(xié)作不可或缺的部分。然而,傳統(tǒng)會議記錄方式往往存在效率低下、信息遺漏、人力成本高等問題
    的頭像 發(fā)表于 11-15 15:27 ?800次閱讀
    精準高效,訊維智能<b class='flag-5'>語音</b>轉(zhuǎn)寫系統(tǒng)打造智慧<b class='flag-5'>會議</b>新體驗!

    828 企業(yè)效率再升級,華為云會議 Flexus 版創(chuàng)新云會議體驗!

    積累和華為云原生的公有云架構(gòu),為中小企業(yè)量身打造了整套高效、安全、智能的云視頻會議解決方案——華為云會議 Flexus 版。 快速部署即開即用 在快節(jié)奏的商業(yè)環(huán)境
    的頭像 發(fā)表于 11-15 15:21 ?434次閱讀
    828 <b class='flag-5'>企業(yè)</b>效率再升級,華為云<b class='flag-5'>會議</b> Flexus 版創(chuàng)新云<b class='flag-5'>會議</b>體驗!

    微軟Copilot Studio將支持企業(yè)創(chuàng)建自主AI代理

    近日,微軟宣布了項重要進展:下個月,企業(yè)將在Copilot Studio擁有創(chuàng)建自主AI代理的能力。這消息標志著
    的頭像 發(fā)表于 10-23 11:44 ?556次閱讀

    神州數(shù)碼郭為:數(shù)字化轉(zhuǎn)型面臨三大,中國科技企業(yè)出海迎來重要機會點

    數(shù)字原生為底層支撐的架構(gòu)是件任重而道遠的事。對此,神州數(shù)碼董事長郭為表示,目前中國政企在數(shù)字化轉(zhuǎn)型的過程主要面臨三
    的頭像 發(fā)表于 07-29 15:03 ?578次閱讀

    四麥語音會議方案

    四麥語音會議方案是種使用四麥克風進行語音捕捉和處理的會議解決方案,旨在提高
    的頭像 發(fā)表于 07-23 22:37 ?504次閱讀
    四麥<b class='flag-5'>語音</b><b class='flag-5'>會議</b>方案

    有效提升智能會議系統(tǒng)語音識別準確性案例分享

    語音識別技術是在智能會議系統(tǒng)至關重要,準確的智能會議語音識別能力,意味著會議參與者可以通過
    的頭像 發(fā)表于 06-21 11:15 ?598次閱讀
    有效提升智能<b class='flag-5'>會議</b>系統(tǒng)<b class='flag-5'>語音</b>識別準確性案例分享

    有效提升智能會議系統(tǒng)語音識別準確性案例分享

    語音識別技術是在智能會議系統(tǒng)至關重要,準確的智能會議語音識別能力,意味著會議參與者可以通過
    的頭像 發(fā)表于 06-21 11:13 ?726次閱讀
    有效提升智能<b class='flag-5'>會議</b>系統(tǒng)<b class='flag-5'>語音</b>識別準確性案例分享

    微軟網(wǎng)頁版PPT新增語音識別及字幕生成功能

    據(jù)報道,微軟計劃于今年六月份推出網(wǎng)頁版PowerPoint全新語音識別功能。此項功能將能夠監(jiān)控PowerPoint視頻的聲音,進而自動生成字幕。
    的頭像 發(fā)表于 05-16 14:36 ?659次閱讀

    會議平板:企業(yè)數(shù)字化轉(zhuǎn)型的重要工具

    會議平板:企業(yè)數(shù)字化轉(zhuǎn)型的重要工具 隨著信息技術的飛速發(fā)展,數(shù)字化轉(zhuǎn)型已經(jīng)成為企業(yè)發(fā)展的重要戰(zhàn)略。在這背景下,會議平板以其高效、便捷的特點
    的頭像 發(fā)表于 05-10 10:20 ?452次閱讀

    鴻蒙的1萬理由,北京中關村現(xiàn)大幅鴻蒙海報

    ,學習鴻蒙已成為高校和企業(yè)的熱門趨勢。隨鴻蒙生態(tài)的飛速發(fā)展,正如張朝陽所說,現(xiàn)在是學習鴻蒙的黃金時期。 最后 如果大家覺得這篇內(nèi)容對學習鴻蒙開發(fā)有幫助,我想邀請大家?guī)臀胰?b class='flag-5'>個小忙:
    發(fā)表于 05-08 20:31
    主站蜘蛛池模板: 中文字幕一区二区三区在线观看 | 久久国产精品免费网站 | 四虎院影永久在线观看 | 欧美一级免费观看 | 2014天堂| 欧美性色xo影院在线观看 | 久久久久久噜噜噜久久久精品 | 欧美一级色视频 | 色爱综合区五月小说 | 午夜伦理片免费观看在线 | 天天躁狠狠躁 | 美女在线看永久免费网址 | 18视频免费网址在线观看 | 手机视频在线播放 | 婷婷在线观看香蕉五月天 | 都市激情亚洲 | 海外毛片 | aa在线视频| 日韩aa| 天堂网在线最新版www | 久久99操 | 成人黄色激情网 | 一级毛片在线 | 啪啪中文字幕 | 天天做天天爱天天爽综合网 | 日本亚洲精品成人 | 拍拍拍拍拍拍拍无挡大全免费 | 黄视频网站在线看 | 久久久久久久国产精品电影 | 国产v69 | 狠狠色狠狠色综合日日不卡 | 又黄又粗暴的120秒免费gif视频 | 天天干天天干天天干天天干天天干 | 午夜在线视频免费观看 | 你懂的在线免费观看 | 免费又爽又黄的禁片1000部 | 日韩爽片| 尻逼久久| 亚在线 | 国产一级特黄生活片 | 日欧毛片 |