91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

人工智能如何拯救瀕危語言

NVIDIA英偉達 ? 來源:cc ? 2019-01-29 15:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

據語言學家估計,在全球化、文化同化等多種因素的影響下,到本世紀末,世界上約 7000 種的語言至少有一半將會消失。

記錄及振興瀕危語言的工作充滿挑戰,其中部分原因在于缺乏相應的文本和語音記錄。塞內卡語是北美地區六個易洛魁聯盟所使用的語言之一,目前,僅有約 100 人將塞內卡語作為第一語言,另有數百位非母語人士正在學習塞內卡語。

自動語音識別 (ASR) 技術已被廣泛應用于轉寫英語和漢語等大語種,這些語言的使用人數高達數百萬至數十億。但對于塞內卡語這類使用人數稀少且可用數據極度貧乏的語言來說,自動語言識別技術發揮出的作用只是皮毛而已。

現在,紐約羅切斯特理工學院的一組研究人員以及布法羅大學的同事正在利用深度學習技術來增強自動語音識別的功能。該項目現階段的工作核心是塞內卡語,但研究人員的愿景是將其應用于全球各種瀕危語言的保護,使之成為全人類共同文化歷史的重要組成部分。

“接觸不同的語言可以讓我們更多地了解大腦的運作機制”,波士頓學院計算機科學助理教授兼羅切斯特理工學院研究員 Emily Prud'hommeaux 說道,“在記錄一種語言時,保存下來的不僅是這種語言本身,還有人類使用語言的基本方式”。

Prud’hommeaux 及其同事選擇從塞內卡語開始入手并非偶然。她表示,團隊中有三名成員是塞內卡人,在此類研究中,這種直接的聯系實屬罕見。

項目帶頭人是 Robbie Jimerson,他是羅切斯特理工學院 Golisano 計算與信息科學學院的博士研究生,也是塞內卡印第安人部落中的一員,熱衷于保護塞內卡語免于消亡。

“部落中的長老為塞內卡語的保護和推廣付出了很大的努力” ,Jimerson 說道,“我也在尋找機會貢獻自己的一份力量”。

利用生成對抗網絡創建更多語言樣本

目前,該項目已經進行到了第三個年頭,在積累語言數據時,研究人員遇到了一些挑戰。Jimerson 說,塞內卡群體在與外人分享東西時十分謹慎,所以塞內卡語的錄音資料非常少。而他則迎難而上。

一開始,他把會說塞內卡語的朋友和老人當作錄音對象,并請求這些人錄下他們和各自朋友的談話錄音。每當有人在公共場合說塞內卡語時,他都不會錯過錄音的機會。此外,他還請家人錄下老人講述的古老傳說,同時也搜集了互聯網上一切可以公開獲取的視頻和錄音資料。

研究團隊精心編寫了一款專門用來處理塞內卡語的自動語音識別模型,并通過生成對抗網絡利用有限的錄音創建出更多的語音樣本。該模型將錄音的波形文件轉換為字符流,同時計算出概率并進行校正。

隨后,他們將得出的數據輸入深度學習模型,后者反過來增強了自動語言識別模型的準確度。

研究團隊的網絡采用了兩種計算配置:其一是配備了九臺服務器的機器學習實驗室,實驗室中運行著若干臺 NVIDIA Tesla GPU;另一種是配備了大型服務器的大學集群,每臺服務器上運行著 10 臺NVIDIA Tesla P4 GPU。每個集群都運行著一系列深度學習框架,如 TensorFlow 和 Caffe。

“計算工程集群供計算機工程學院的所有學生使用,所以大家會‘爭搶’資源”,Ray Ptucha 如是說,他是羅切斯特理工學院計算機工程學院的助理教授,也是本項目的另一位成員。

有了這些彌足珍貴的集群,Jimerson 可以在運行著NVIDIA TITAN X的本地機器上測試代碼并檢查模型的穩定性,從而避免運行可能會崩潰的模型,以至于為其他學生帶來不便。

準確度更上一層樓

到目前為止,經過團隊的不懈努力,其自動語音識別模型的文字錯誤率已由 70% 降至 56%。Prud’hommeaux 稱,他們的目標是將錯誤率降低至 25%,這一水平相當于幾年前使用自動語音識別系統處理英語語音的水平。

團隊可以積累的塞內卡語語音和文字樣本越多,識別錯誤率就會越低。(如今,英語自動語音識別模型可以達到低至 5% 的錯誤率。)

該團隊取得的成果有望為全球其他語種的保護工作提供幫助。

據 Prud’hommeaux 稱,團隊已與一家存檔機構達成協議,這是美國國家科學基金會為該項目提供的資助條件。當他們開展記錄瀕危語言的其他工作時,可使用最終形成的語言存檔數據庫作為可用資源。

與此同時,Prud’hommeaux 還表示,團隊的工作將為只能利用有限數據量的深度學習研究提供思路。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1806

    文章

    48996

    瀏覽量

    249192
  • 深度學習
    +關注

    關注

    73

    文章

    5561

    瀏覽量

    122771

原文標題:人工智能幫助瀕危語言 “復活”

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    我國生成式人工智能的發展現狀與趨勢

    作為信息化、數字化、智能化的新型技術基座,生成式人工智能對于提升國家戰略地位與國際競爭力具有重要意義。2022年11月以來,隨著以ChatGPT為代表的大語言模型迅速發展,生成式人工智能
    的頭像 發表于 02-08 11:31 ?1467次閱讀

    人工智能推理及神經處理的未來

    人工智能行業所圍繞的是一個受技術進步、社會需求和監管政策影響的動態環境。機器學習、自然語言處理和計算機視覺方面的技術進步,加速了人工智能的發展和應用。包括醫療保健、金融和制造業在內的各個行業對自動化
    的頭像 發表于 12-23 11:18 ?588次閱讀
    <b class='flag-5'>人工智能</b>推理及神經處理的未來

    編程語言人工智能中的使用

    。編程語言在AI的發展中扮演著至關重要的角色,它們為開發人員提供了構建和實現智能系統的工具和框架。 1. Python Python是人工智能領域最受歡迎的編程語言之一,原因有以下幾點
    的頭像 發表于 11-15 09:34 ?973次閱讀

    嵌入式和人工智能究竟是什么關系?

    、連接主義和深度學習等不同的階段。目前,人工智能已經廣泛應用于各種領域,如自然語言處理、計算機視覺、智能推薦等。 嵌入式系統和人工智能在許多方面都存在密切的關聯性。首先,嵌入式系統可
    發表于 11-14 16:39

    LLM技術對人工智能發展的影響

    隨著人工智能技術的飛速發展,大型語言模型(LLM)技術已經成為推動AI領域進步的關鍵力量。LLM技術通過深度學習和自然語言處理技術,使得機器能夠理解和生成自然語言,極大地擴展了
    的頭像 發表于 11-08 09:28 ?1844次閱讀

    《AI for Science:人工智能驅動科學創新》第6章人AI與能源科學讀后感

    探討了人工智能如何通過技術創新推動能源科學的進步,為未來的可持續發展提供了強大的支持。 首先,書中通過深入淺出的語言,介紹了人工智能在能源領域的基本概念和技術原理。這使得我對人工智能
    發表于 10-14 09:27

    AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感

    很幸運社區給我一個閱讀此書的機會,感謝平臺。 《AI for Science:人工智能驅動科學創新》第4章關于AI與生命科學的部分,為我們揭示了人工智能技術在生命科學領域中的廣泛應用和深遠影響。在
    發表于 10-14 09:21

    《AI for Science:人工智能驅動科學創新》第一章人工智能驅動的科學創新學習心得

    周末收到一本新書,非常高興,也非常感謝平臺提供閱讀機會。 這是一本挺好的書,包裝精美,內容詳實,干活滿滿。 《AI for Science:人工智能驅動科學創新》這本書的第一章,作為整個著作的開篇
    發表于 10-14 09:12

    risc-v在人工智能圖像處理應用前景分析

    RISC-V在人工智能圖像處理領域的應用前景十分廣闊,這主要得益于其開源性、靈活性和低功耗等特點。以下是對RISC-V在人工智能圖像處理應用前景的詳細分析: 一、RISC-V的基本特點 RISC-V
    發表于 09-28 11:00

    人工智能ai 數電 模電 模擬集成電路原理 電路分析

    人工智能ai 數電 模電 模擬集成電路原理 電路分析 想問下哪些比較容易學 不過好像都是要學的
    發表于 09-26 15:24

    人工智能ai4s試讀申請

    目前人工智能在繪畫對話等大模型領域應用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個需要研究的課題,本書對ai4s基本原理和原則,方法進行描訴,有利于總結經驗,擬按照要求準備相關體會材料。看能否有助于入門和提高ss
    發表于 09-09 15:36

    名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅動科學創新

    活的世界? 編輯推薦 《AI for Science:人工智能驅動科學創新》聚焦于人工智能與材料科學、生命科學、電子科學、能源科學、環境科學五大領域的交叉融合,通過深入淺出的語言和諸多實際應用案例,介紹了
    發表于 09-09 13:54

    報名開啟!深圳(國際)通用人工智能大會將啟幕,國內外大咖齊聚話AI

    8月28日至30日,2024深圳(國際)通用人工智能大會暨深圳(國際)通用人工智能產業博覽會將在深圳國際會展中心(寶安)舉辦。大會以“魅力AI·無限未來”為主題,致力于打造全球通用人工智能領域集產品
    發表于 08-22 15:00

    FPGA在人工智能中的應用有哪些?

    FPGA(現場可編程門陣列)在人工智能領域的應用非常廣泛,主要體現在以下幾個方面: 一、深度學習加速 訓練和推理過程加速:FPGA可以用來加速深度學習的訓練和推理過程。由于其高并行性和低延遲特性
    發表于 07-29 17:05

    人工智能自然語言處理

    人工智能教學資料。
    發表于 07-17 17:15 ?0次下載
    主站蜘蛛池模板: 成人国产三级在线播放 | 天堂色网 | 夜夜福利 | 在线免费影视 | 香蕉狠狠再啪线视频 | 欧美激情二区三区 | 欧美性天天影视 | 六月婷婷激情综合 | 伊人久久大香线蕉综合影 | 激情综合网站 | 国产手机在线观看视频 | 四虎国产精品成人永久免费影视 | 国产成年网站v片在线观看 国产成人91青青草原精品 | 五月婷婷激情视频 | 在线色资源 | 毛片不卡一区二区三区 | 色综合久久中文综合网 | 五月情婷婷 | 色一欲一性一乱一区二区三区 | 日本a级免费 | 久久久精品久久久久久久久久久 | 免费国产黄网站在线观看视频 | 在线观看三级视频 | ww久久| 欧美亚洲综合图区在线 | www.四虎.com| 日韩精品一卡二卡三卡四卡2021 | 在线视频黄| 日本三级强在线观看 | 黄色录像三级 | 天天在线天天综合网色 | 高清视频黄色录像免费 | 国产高清美女一级a毛片 | 亚洲福利视频一区二区三区 | 嫩草影院播放地址一二三 | 亚欧免费视频 | 黄乱色伦 | 人人爱天天做夜夜爽 | 午夜黄色大片 | 天天操天天舔天天射 | 欧美性xxxx极品高清 |