語音聽寫,是指將短音頻(≤60秒)精準識別成文字,實時返回結果,達到邊說邊返回的效果。
除了要考慮本身語音聽寫模型或算法的識別準確率之外,一些智能硬件的產(chǎn)品還需要額外考慮降噪、回聲消除、去混響等因素,這些都是保證最后識別效果的重要因素。因為涉及軟硬件,對能力交付方的項目經(jīng)驗提出了較高的要求。
目前,國內提供語音聽寫技術的廠商主要有:
1、科大訊飛
成立于1999年,2008年,公司在深圳證券交易所掛牌上市(股票代碼:002230)。一直深耕在人工智能領域,技術很全也很綜合,多次在語音識別、語音合成、機器翻譯、圖文識別、圖像理解、閱讀理解、機器推理等各項國際評測中取得佳績。
在語音聽寫上,除中文普通話和英文外,支持51個語種、24種方言和1個民族語言,可提供公有云接口及私有化部署方案。采用行業(yè)先進的語音識別技術,識別率可達98% 。目前廣泛應用于語音搜索、聊天輸入、游戲娛樂、人機交互等場景。
2、百度
該技術主要由百度智能云提供,可適用于手機語音輸入、智能語音交互、語音指令、語音搜索等短語音交互場景。近場中文普通話識別準確率達98%,在語言支持上覆蓋主流的普通話、口音普通話、粵語、四川話、英語。
3、云知聲
2012年6月創(chuàng)立于北京,是國內頭部人工智能獨角獸企業(yè)。語音聽寫主要應用于語音搜索、語音輸入、語音控制等場景。準確率可達實用標準,支持普通話、四川話、粵語、英語的識別。
4、思必馳
07年創(chuàng)立于英國劍橋,08年回國落戶蘇州,12年完成A輪融資,是國內專業(yè)的對話式人工智能平臺公司,擁有全鏈路的智能語音語言技術。語音識別提供基于云+端混合引擎的連續(xù)語音識別,覆蓋中文、英文、葡萄牙語等語種,粵、川、滬等方言,以及帶方言的普通話。云端連續(xù)實時語音識別率>97%,可提供公有云接口及私有化部署方案。
審核編輯:符乾江
-
語音識別
+關注
關注
39文章
1770瀏覽量
113784 -
人工智能
+關注
關注
1804文章
48515瀏覽量
245382
發(fā)布評論請先 登錄
車載傳感器主要有哪些傳感器
熱敏電阻主要有哪三種類型
集成電路設計流程主要有哪些步驟
SMT錫膏鋼網(wǎng)的清洗工藝主要有哪些?

助焊劑的作用主要有哪些
邊沿觸發(fā)器主要有哪兩種類型
RFID天線主要有哪些制造工藝
工業(yè)控制設備間主要有哪些有線通信技術?
NFC功能是什么?主要有哪些應用?

工業(yè)網(wǎng)關主要有哪些功能?

評論