在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Google:將AI 應用到語言翻譯上,進而彌平語言不通的問題

yrlT_lianggezhi ? 2018-01-29 14:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Google 的使命是匯集全球資訊,并且讓所有人都能使用這些資訊,不過要能理解各式資訊,最困難的就是語言隔閡,因此在東京舉辦#MadeWithAI 亞太區媒體活動請來了Google 語言研究計畫總經理Linne Ha 來談談怎么將AI 應用到語言翻譯上,進而彌平語言不通的問題。

受惠于智慧型手機的普及,網路人口在最近這幾年高速成長,不過網路上有接近50% 的內容仍是以英文為主,對于非以英文為母語的人來說,想要獲得資料就多了一道門檻,能讓每個人自在的用自己的原生語言在網路上搜集或提供資料是Google 的目標,因此在推動語言翻譯或發展上Google 做了非常多的努力。

▲Google語言研究計畫總經理Linne Ha。

推動各種語言上網,統一碼(Unicode)是重點

不同語言要能在網路上流動,最重要的就是該語言要能被閱讀,若是出現亂碼或空白文字就容易成為閱讀或理解的障礙,因此Google 長期和統一碼(Unicode)聯盟合作,鼓勵更多國家利用統一碼的編碼系統上網,例如Google 大力鼓勵緬甸不要再使用非統一碼的字型。

有了統一碼這項文字系統后,電腦文字編碼就有了一套標準,下一個挑戰就是要確保自行能正確地被轉為網路或手機上的文字,去年Google 推出開放的Noto 字型,可以支援800 種語言、11 億個文字,可呈現各式各樣的文字。

但這樣還不夠,雖然文字能呈現,但卻不是每個人都知道如何輸入文字,因此除了Gboard 提供300 多種鍵盤、 97 種手寫系統、語音輸入等方法讓使用者可以依照自己方便的方式來輸入文字。

在開發手寫系統上,Google 也花了一番心力,由于每個人的字跡都不同,因此Google 導入人工智慧技術,搜集很多自愿者的手寫范本,讓機器學習來辨認文字和書寫風格,進而達到更精確的手寫辨識。語音輸入方面則是透過GOOG-411 的服務來搜集語音資料,類似我們的查號臺,當有人打電話進去問問題查電話,GOOG-411 就會幫忙轉接,在這樣的過程中Google 建立了大量的語音資料庫范本,英文語音搜集還算滿順利的。不過其他語言就沒這么容易了,雖然說Google 有和專門經營文字和語音資料庫的業者合作,但有些語言本身的資料庫就較少,例如廣東話,因此Google 又開啟了下一階段的任務。

語音搜尋實驗,搜集準確的語音資料

既然缺乏語音資料,Google 就開始想方法來搜集各種語言的語音訊息,比方說2010 年Google 推出了荷蘭語的Word of Mouth 計畫,提供參與實驗的使用者手機來搜集他們和親友間的對話樣本,進而得到準確的語音資料。

有了語音資料之后下個問題則是口音和俗語,關于這方面的資料目前Google 仍正在努力發展中,不過經過過去這么長一段時間的努力,到2012 年之后,語音搜尋已可支援到50 種語言,Google 也導入了深度神經網路提升語音辨識的準確性,今年則再新增30 多種的語音輸入,甚至包含了非洲兩種主要語言,斯瓦希里語(Swahili)和阿姆哈拉語(Amharic),對于彌平語言隔閡來說,這是一個重要的里程碑。

怎么將機器學習應用在語音服務上

既然有了機器學習這項技術,也就意味著Google 能透過演算以及建構更有效的模型來解決語音辨識問題。

Google 這回用了一個超級低成本的預算(2000 美金)來增加孟加拉語的文字轉語音服務,首先先準備一套麥克風、USB 轉接器和前置聲音放大器,并建立一組便攜式的錄音工作室「ChitChat」讓實驗者可以錄音。

工具有了,下一步就是找來15 名孟加拉的Googler,錄制了2000 多個從維基百科擷取出來的孟加拉語和英語,實驗者每隔30 分鐘至60 分鐘就錄制250 多個句子,平衡的混音成幾個不同的聲音后,再交給Google 社群投票看看大家最偏好哪一個聲音,最終產出的聲學模型剛好就可以代表平均型的人聲,成功推出了孟加拉語的文字轉語音服務。

除了把更多語言放到網路上,Google 也著手發展方言領域,像是英文就分成美式英文、英式英文、澳洲英文等等,最近Google 正著手處理新加坡式英語,另外,西班牙語、阿拉伯語也是Google 努力的方向。

Google 的中文語音什么時候會有更多突破?

至于***人最常用的中文呢?Google 語言研究計畫總經理Linne Ha 不諱言,中文真的是很有挑戰的語言,比方說中國人說著中文、寫著簡體中文,***人說也說著中文、但寫的是繁體中文,香港人寫的也是繁體中文、不過說的是廣東話,繁體中文、簡體中文、廣東話間各有連結但又不盡相似。

過去Google 是使用「單一語言模式」來處理,比方說***人說的中文就套用繁體中文資料庫,香港人說廣東話則套用另外一個繁體中文資料庫,但這樣的語音辨識效果發展有限,近期Google 嘗試著將相近的語言加進同一個模型中,目前的實驗結果還不錯。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • Google
    +關注

    關注

    5

    文章

    1789

    瀏覽量

    58941
  • AI
    AI
    +關注

    關注

    88

    文章

    35008

    瀏覽量

    278765
  • 語言
    +關注

    關注

    1

    文章

    97

    瀏覽量

    24493

原文標題:【Google 談人工智慧】有了機器學習后,語言還會是隔閡嗎

文章出處:【微信號:lianggezhizi,微信公眾號:兩個質子】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    CC-Link IE 轉 Modbus TCP,閥門通訊的“雙語翻譯官”

    在工業自動化現場,設備間的“語言不通”是工程師們時常遇到的挑戰。例如,一套先進的控制系統可能采用高速的 CC-Link IE 網絡,而現場大量的閥門、儀表卻只支持經典的 Modbus TCP 協議
    的頭像 發表于 07-09 09:46 ?104次閱讀

    【教程】使用NS1串口服務器對接智普清言免費AI語言模型

    AI語言模型可以幫助我們解決各種問題,如翻譯、寫文案、創作詩歌、解決數學問題、情感陪伴等等。今天教大家如何使用NS1串口服務器模塊實現對接智普清言AI
    的頭像 發表于 06-12 19:33 ?194次閱讀
    【教程】使用NS1串口服務器對接智普清言免費<b class='flag-5'>AI</b>大<b class='flag-5'>語言</b>模型

    TDE工業網關:智能制造時代的“數據翻譯官”

    在工業4.0時代,工廠里的傳感器、PLC、機器人等設備每分每秒都在產生海量數據。然而,這些設備往往“語言不通”——不同的通信協議、接口標準讓數據孤島問題突出。如何讓這些數據高效流動,并轉化為生產決策?答案就是天拓四方TDE工業網關。
    的頭像 發表于 03-20 16:12 ?368次閱讀

    語言康復行業首家!陽光語言正式接入DeepSeek

    2025年3月5日,陽光語言上線全國首個部署DeepSeek的語言康復專用AI問答系統,該系統在陽光語言官方微信公眾號和小程序對外免費開放。作為一家發展幾十年的老牌機構,此番引入最新的
    的頭像 發表于 03-06 14:14 ?329次閱讀
    <b class='flag-5'>語言</b>康復行業首家!陽光<b class='flag-5'>語言</b>正式接入DeepSeek

    Meta與UNESCO合作推動多語言AI發展

    在數字環境中常被忽視的少數民族語言。 據Meta介紹,這項計劃積極尋求合作伙伴的加入,共同提供豐富的語言資源。合作伙伴需要貢獻超過10小時的語音錄音及其對應的轉錄內容,同時還需要提供豐富的書面文本以及
    的頭像 發表于 02-08 11:04 ?614次閱讀

    AI助力實時翻譯耳機

    你是否曾經因為語言障礙而無法與外國人順暢交流?或者在旅行中因為語言不通而錯過了一些精彩的經歷?現在,隨著AI技術的發展,實時翻譯耳機可以幫你輕松解決這些問題。 1 什么是實時
    的頭像 發表于 01-24 11:14 ?1622次閱讀
    <b class='flag-5'>AI</b>助力實時<b class='flag-5'>翻譯</b>耳機

    Auracast廣播音頻創新實時語言翻譯解決方案

    世界正朝著互聯化方向發展,但語言障礙仍然為全球溝通和文化交流帶來挑戰。作為藍牙技術聯盟的長期推廣公司,東芝(Toshiba)研發出AI同聲傳譯與Auracast廣播音頻技術相結合的創新解決方案,為打破公共場所和教育環境中的
    的頭像 發表于 01-13 14:39 ?840次閱讀

    語言模型管理的作用

    要充分發揮語言模型的潛力,有效的語言模型管理非常重要。以下,是對語言模型管理作用的分析,由AI部落小編整理。
    的頭像 發表于 01-02 11:06 ?382次閱讀

    AI語言模型開發步驟

    開發一個高效、準確的大語言模型是一個復雜且多階段的過程,涉及數據收集與預處理、模型架構設計、訓練與優化、評估與調試等多個環節。接下來,AI部落小編為大家詳細闡述AI語言模型的開發步驟
    的頭像 發表于 12-19 11:29 ?874次閱讀

    LLMWorld上線代碼翻譯新工具——問丫·碼語翻譯俠,快來體驗!

    01. 工具介紹 aicode.llmworld.net 問丫·碼語翻譯俠 是一款由LLMWorld新推出的代碼翻譯工具,支持各種語言之間的翻譯,包括計算機
    的頭像 發表于 12-09 11:11 ?977次閱讀
    LLMWorld上線代碼<b class='flag-5'>翻譯</b>新工具——問丫·碼語<b class='flag-5'>翻譯</b>俠,快來體驗!

    語言模型開發語言是什么

    在人工智能領域,大語言模型(Large Language Models, LLMs)背后,離不開高效的開發語言和工具的支持。下面,AI部落小編為您介紹大語言模型開發所依賴的主要編程
    的頭像 發表于 12-04 11:44 ?677次閱讀

    一文理解多模態大語言模型——

    /understanding-multimodal-llms 在過去幾個月中, OpenVINO? 架構師 Yury閱讀了眾多有關多模態大語言模型的論文和博客,在此基礎,推薦了一篇解讀多模態大語言模型的最佳文章《Underst
    的頭像 發表于 12-02 18:29 ?1155次閱讀
    一文理解多模態大<b class='flag-5'>語言</b>模型——<b class='flag-5'>上</b>

    IMAX攜手Camb.AI實現影院實時語言翻譯

    近日,據外媒最新報道,國際知名影院品牌IMAX與總部位于迪拜的人工智能初創公司Camb.AI宣布達成戰略合作,旨在為全球影院觀眾帶來前所未有的實時語言翻譯體驗。 此次合作的核心目標是
    的頭像 發表于 11-26 13:55 ?839次閱讀

    在設備利用AI Edge Torch生成式API部署自定義大語言模型

    ,從而無縫地新的設備端生成式 AI 模型部署到邊緣設備。本文是 Google AI Edge 博客連載的第二篇。
    的頭像 發表于 11-14 10:23 ?1095次閱讀
    在設備<b class='flag-5'>上</b>利用<b class='flag-5'>AI</b> Edge Torch生成式API部署自定義大<b class='flag-5'>語言</b>模型

    DeepL推出新一代翻譯編輯大型語言模型

    在人工智能與語言處理領域,DeepL再次以其創新實力引領潮流,宣布成功推出新一代面向翻譯與編輯應用的大型語言模型。這一里程碑式的進展,不僅鞏固了DeepL作為頂尖語言人工智能公司的地位
    的頭像 發表于 07-19 15:56 ?1004次閱讀
    主站蜘蛛池模板: 婷婷色在线 | 日韩电影毛片 | 亚洲欧洲色天使日韩精品 | 经典三级四虎在线观看 | 精品精品国产高清a毛片牛牛 | 亚洲不卡网 | 2014天堂| 日本在线不卡免 | 男女全黄做爰视频 | 色爱区综合五月激情 | 欧美黄色录像视频 | 黄色大成网站 | 在线观看黄网 | 日本免费黄色录像 | 四虎精品免费国产成人 | 欧美一级高清片在线 | 女人又色又爽又黄 | 欧美αv | 免看一级a毛片一片成人不卡 | 午夜小视频在线 | 放荡的俄罗斯美女bd | 九色愉拍自拍 | 日本a级三级三级三级久久 日本a级影院 | 男女一级特黄a大片 | 色多多影视 | 特黄一级视频 | 日本三级hd高清电影 | 国产大片免费观看中文字幕 | 国产亚洲午夜精品a一区二区 | 色多多视频成人影院 | 欧美一级视频免费看 | 亚洲一区二区三区在线网站 | 看黄网站免费 | 四虎影院海外永久 | 国产小视频免费看 | 夜夜天天干 | 国产精品资源在线观看网站 | 看全色黄大色大片免费久久 | 99久久综合 | 欧美在线伊人 | 久久综合九色综合98一99久久99久 |