在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NLP的兩個部分:NLU和NLG

GKwL_infoqchina ? 來源:InfoQ ? 2019-12-12 14:18 ? 次閱讀

比爾·蓋茨曾說過,「語言理解是人工智能皇冠上的明珠」。自然語言處理的進步將會推動人工智能整體進展。NLP 的歷史幾乎跟計算機和人工智能的歷史一樣長。自計算機誕生,就開始有了對人工智能的研究,而人工智能領域最早的研究就是機器翻譯以及自然語言理解。

隨著大數據和技術設施的完善,人工智能技術在近年來迎來了井噴式的發展。在產業方面,不少專注于計算機視覺的公司也獲得了長足發展。其中比較具有代表性的是估值已經超過 20 億美元的商湯科技,在經歷了數輪大額融資之后,其隱隱有從獨角獸變成巨頭的趨勢。

不過,人工智能另一個相關領域自然語言處理似乎沒有達到這種高度。在技術方面,這一領域的技術準確率遠遠沒有達到計算機視覺和語音識別的水平,技術產品也因為較高的錯誤率,缺少實際價值。那么 NLP 技術到底有哪些難點呢?

什么是 NLP?

在人工智能出現之前,計算機只能處理結構化的數據,就比如我們平時用的表格里的數據,但是網絡中大部分的數據都是非結構化的,比如我們看到的文章、圖片、視頻等等。在這些數據中,文本數據又往往是最多的,為了能夠分析和利用這些文本信息,我們就需要利用 NLP 技術,讓機器理解這些文本信息,并加以利用。

人類可以通過語言來交流,而為了讓計算機之間互相交流,人們讓所有計算機都遵守一些規則,計算機的這些規則就是計算機之間的語言。自然語言處理(NLP)就是在機器語言和人類語言之間溝通的橋梁,以實現人機交流的目的。

NLP 的兩個部分:NLU 和 NLG

自然語言理解(NLU) 則是 NLP 的一部分,這幾年深度學習技術的發展使 NLU 能在一些場景中落地。自然語言理解就是希望機器像人一樣,具備正常人的語言理解能力,由于自然語言在理解上有很多難點 (下面詳細說明),所以 NLU 是至今還遠不如人類的表現。

NLU 目前應用的領域主要集中在機器翻譯、機器客服、智能音箱等領域,但由于需要大量的數據訓練和 NLU 本身存在的一些語言語義上的難點,其實機器還不是非常智能

自然語言生成(NLG)是 NLP 的重要組成部分,NLU 負責理解內容,NLG 負責生成內容。他的主要目的是降低人類和機器之間的溝通鴻溝,將非語言格式的數據轉換成人類可以理解的語言格式。

自然語言生成 – NLG 有 2 種方式:

text – to – text:文本到語言的生成

data – to – text :數據到語言的生成

NLP 的難點

對于機器來說,難點主要分為 5 類問題:

語言的多樣性,我們日常所用的語言是沒有規律的,不同的組合可以表達出很多的含義。

語言的歧義性,如果不聯系上下文,缺少環境的約束,語言有很大的歧義性

語言是一個開放集合,我們可以任意的發明創造一些新的表達方式。

語言需要知識依賴,需要聯系到實踐知識。

語言的上下文

應用場景復雜,很難出現“獨角獸”

總的來說,NLP 技術領域之所以沒有出現如計算機視覺領域那些獨角獸公司,是因為自然語言處理的技術難度太大,和應用場景太復雜。一個公司的成立發展都是由需求驅動的,自然語言應用主要是機器翻譯,雖然機器翻譯的需求長期存在,但機器翻譯的水平一直未取得突破性的進展,即使到今天,機器也很難翻譯有背景的復雜句子。

另外,自然語言處理的應用太依賴于UI了。圖像識別基本不需要 UI,直接在系統內部集成一些技術就行。一些公司做翻譯軟件,如果UI做得不行,用戶體驗不行,人們就不會愿意使用。

技術產業化最重要的是商業模式,也就是怎么讓技術掙錢。圖像識別公司的掙錢模式已經成立了,但翻譯付費就難多了。所以自然語言是從研究到技術到落地到商業化,面臨一系列的挑戰。目前的現狀是,自然語言處理技術更多的是作為公司內部技術,比如內部的商業情報或人機接口功能。

NLP 技術發展,未來可期

從今年的 ACL 大會可以看出 NLP 技術的火爆。會議共收到了 2900 余篇提交的論文,投稿規模相較于 2018 年增長了 75%!自然語言處理領域實在是炙手可熱,學術界和工業界的熱情都創下了歷史新高。

從商業層面來講也涌現出了微軟小冰、小米小愛等比較成熟的機器人產品,相信在未來的不久 NLP 技術一定會給我們帶來更多的驚喜。

大咖現場分享 NLP 技術干貨

王斌博士,是小米人工智能實驗室主任,NLP 首席科學家。中國中文信息學會理事,計算語言學、信息檢索、社會媒體處理、語言與知識計算等專委會委員及《中文信息學報》編委,中國計算機學會中文信息處理專業委員會委員。

加入小米之前,他在中科院計算所、信工所從事自然語言處理和信息檢索相關的科研工作。在AICon 全球人工智能與機器學習大會現場,他將會帶來 NLP 技術方面的相關演講,各位感興趣的小伙伴歡迎來現場聽他分享。

AICon 全球人工智能與機器學習技術大會,將于 11 月 21-22 日在北京國際會議中心舉行。顏水成、賈揚清、崔寶秋等 AI 技術大咖屆時也會來現場,跟大家聊一聊今年在 AI 商業化場景落地的大背景下,又涌現出了哪些新技術。本次大會我們設立了機器學習、計算機視覺、NLP、AI芯片、搜索推薦、產業互聯網、硅谷 AI 技術實踐等 13+ 技術專場,細分到 AI 技術的各個領域,為大家全方位的展示 AI 技術在國內目前發展的現狀。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1805

    文章

    48843

    瀏覽量

    247530
  • 計算機視覺
    +關注

    關注

    9

    文章

    1706

    瀏覽量

    46631
  • nlp
    nlp
    +關注

    關注

    1

    文章

    490

    瀏覽量

    22532

原文標題:為何NLP領域難以出現“獨角獸”?丨AICon

文章出處:【微信號:infoqchina,微信公眾號:InfoQ】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    ADS7230有兩個電源和兩個地,是不是意味著芯片內部模擬部分和數字部分是隔離的?

    ADS7230有兩個電源和兩個地,是不是意味著芯片內部模擬部分和數字部分是隔離的?或者是非隔離,只做電平轉換的?忘各位大俠解答,小弟不甚感激?。?!
    發表于 01-08 08:21

    ads1013有兩個模擬輸入,可以接不同的兩個模擬輸入嗎?

    ads1013有兩個模擬輸入,可以接不同的兩個模擬輸入嗎,驅動程序中怎么分別讀兩個模擬輸入的轉換結果?
    發表于 12-02 08:02

    兩個開關電源可以并聯使用嗎

    兩個開關電源并聯使用是一相對復雜的話題,涉及到電子電路設計、電源管理、安全規范等多個方面。 1. 開關電源的基本原理 開關電源是一種通過電子開關元件(如晶體管、MOSFET等)快速切換來控制電流
    的頭像 發表于 10-09 16:04 ?4358次閱讀

    單相電機兩個繞組都在定子上嗎

    定子和一轉子組成。定子是電機的固定部分,而轉子是旋轉部分。在單相電機中,定子通常包含一主繞組和一輔助繞組,這
    的頭像 發表于 09-03 15:10 ?2007次閱讀

    ad如何設置兩個元器件的距離

    在Altium Designer(簡稱AD)中設置兩個元器件之間的距離,主要是通過設置元器件間的安全間距(Clearance)規則來實現的。這個規則定義了元器件之間、元器件與走線之間以及其他設計元素
    的頭像 發表于 09-02 15:31 ?1.6w次閱讀

    功放機AB兩個聲道輸出怎么接

    功放機AB兩個聲道輸出的接線方式,主要取決于您想要實現的音頻效果以及音箱的配置。以下將詳細介紹幾種常見的接線方式,以及它們各自的特點和適用場景。 一、基礎接線方式 在大多數情況下,功放機的AB兩個
    的頭像 發表于 08-23 10:40 ?8517次閱讀

    二極管的伏安特性分為哪兩個部分?

    二極管是一種半導體器件,具有單向導電性。其伏安特性是描述二極管在不同電壓下電流變化的曲線。二極管的伏安特性可以分為兩個部分:正向特性和反向特性。 正向特性 正向特性是指二極管在正向偏置下,即陽極接
    的頭像 發表于 08-16 11:16 ?1629次閱讀

    觸發器的兩個穩定狀態分別是什么

    觸發器作為數字電路中的基本邏輯單元,具有兩個穩定狀態,這兩個狀態通常用于表示二進制數碼中的0和1。
    的頭像 發表于 08-12 11:01 ?2861次閱讀

    雙穩態電路的兩個穩定狀態是什么

    雙穩態電路是一種具有兩個穩定狀態的電子電路,廣泛應用于數字電路、通信系統、存儲器等領域。 雙穩態電路的基本概念 雙穩態電路是一種具有兩個穩定狀態的電路,即在沒有外部輸入信號的情況下,電路可以保持在
    的頭像 發表于 08-11 15:00 ?2517次閱讀

    雙穩態觸發器的兩個基本性質是什么

    的定義 雙穩態觸發器是一種具有兩個穩定狀態的邏輯電路,通常由兩個交叉耦合的反相器或門電路構成。在沒有外部輸入信號的情況下,雙穩態觸發器可以保持在兩個穩定狀態之一,即“0”狀態或“1”狀態。 1.2 雙穩態觸發器的組成 雙穩態觸發
    的頭像 發表于 08-11 10:08 ?1287次閱讀

    兩個路由器ip地址沖突怎么解決

    兩個路由器的IP地址發生沖突時,會導致網絡連接不穩定或無法連接。以下是解決兩個路由器IP地址沖突的步驟: 確定沖突的IP地址 首先,需要確定兩個路由器的IP地址是否沖突??梢酝ㄟ^以下方法來檢查
    的頭像 發表于 07-09 11:35 ?9522次閱讀

    nlp神經語言和NLP自然語言的區別和聯系

    來改變我們的行為和情感。NLP的目標是幫助人們實現自我改進,提高溝通技巧,增強領導力和解決問題的能力。 NLP的主要組成部分包括: 感知:了解我們如何接收和處理信息。 語言:研究我們如何使用語言來表達我們的思想和情感。 編程:研
    的頭像 發表于 07-09 10:35 ?1138次閱讀

    深度學習與nlp的區別在哪

    深度學習和自然語言處理(NLP)是計算機科學領域中兩個非常重要的研究方向。它們之間既有聯系,也有區別。本文將介紹深度學習與NLP的區別。 深度學習簡介 深度學習是一種基于人工神經網絡的機器學習方法
    的頭像 發表于 07-05 09:47 ?1564次閱讀

    NLP模型中RNN與CNN的選擇

    在自然語言處理(NLP)領域,循環神經網絡(RNN)與卷積神經網絡(CNN)是種極為重要且廣泛應用的網絡結構。它們各自具有獨特的優勢,適用于處理不同類型的NLP任務。本文旨在深入探討RNN與CNN
    的頭像 發表于 07-03 15:59 ?1005次閱讀

    交流二元繼電器有哪兩個線圈

    交流二元繼電器是一種常見的電氣元件,廣泛應用于各種電氣控制系統中。它主要由兩個線圈組成,這兩個線圈分別是線圈1和線圈2。下面我們將詳細介紹這兩個線圈的特點、工作原理以及在實際應用中的注意事項。 一
    的頭像 發表于 06-29 09:43 ?1246次閱讀
    主站蜘蛛池模板: 美女扒开尿口让男人捅 | 日本v片免费一区二区三区 日本www.色 日本wwwwww | 亚洲一级免费视频 | 欧美三级在线免费观看 | 日本免费黄色网址 | 免费四虎永久在线精品 | 国产亚洲精品久久午夜 | 中文字幕一区在线观看 | 久久精品视频免费观看 | 免费精品美女久久久久久久久 | 狠狠去| 九九精品国产 | 成人在线精品 | 成人丁香乱小说 | 亚洲一级毛片免观看 | 亚洲91| 亚洲精品久 | 五月丁五月丁开行停停乱 | 亚洲嫩草影院在线观看 | 又粗又硬又大久久久 | 欧美精品久久久久久久小说 | 李老汉和小花的性生生活 | 性色网址 | 人人天天夜夜 | 鲁老汉精品视频在线观看 | 国产在线观看网址你懂得 | 欧美视频xxxxx| 加勒比一木道|视频在线看 加勒比在线免费视频 | 亚洲国产成人最新精品资源 | 欧美三级一级 | 在线免费影视 | 床上激情四射 | 精品一级毛片 | 91久久青草精品38国产 | 国产区亚洲区 | 全国男人的天堂天堂网 | 天天干影视 | 8000av在线| 日韩精品一卡二卡三卡四卡2021 | 美女免费视频色在线观看 | 国产爱v |