在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

生成式摘要的經典模型

深度學習自然語言處理 ? 來源:AI算法小喵 ? 作者:AI算法小喵 ? 2022-07-08 17:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

寫在前面

在一文詳解生成式文本摘要經典論文Pointer-Generator中我們介紹了生成式摘要的經典模型,今天我們來分享一篇帶風格的標題生成的經典工作。

dc93a2f0-fe9b-11ec-ba43-dac502259ad0.png

以往的標題模型產生的都是平實性標題,即簡單語言描述的事實性標題。但是,實際上我們可能更需要有記憶點的爆款標題來增加點擊量/曝光率。因此,衍生出了一個新任務——帶有風格的標題生成,即Stylistic Headline Generation,簡稱SHG。

本篇文章將介紹TitleStylist模型,該模型是針對SHG任務提出的,它可以生成相關、通順且具有風格的標題,其中風格主要包括三種:幽默、浪漫、標題黨。

論文名稱:《Hooks in the Headline: Learning to Generate Headlines with Controlled Styles》

論文鏈接:https://arxiv.org/abs/2004.01980v1

代碼地址:https://github.com/jind11/TitleStylist

1. 問題定義

首先假設我們有兩類數據和:是由文章-標題對組成的數據;是由具有某種特定風格的句子組成的數據。

我們用來表示數據,其中表示文章,表示標題。此外,我們用來表示數據。需要注意的是,中的句子可以是書本中的句子,不一定是標題。

假設我們有、、。那么,SHG任務目的是從中學習,也就是從分布、中學習出條件分布。

2. 核心思想

TitleStylist模型整體上是一個Transformer結構,分為Encoder(編碼器)和Decoder(解碼器)。TitleStylist利用多任務學習,同時進行兩個任務:

標題生成:有監督任務;在數據S上,根據文章原文生成相應標題。

帶有風格的文本重構:無監督或自監督;在數據上,輸入為擾亂后的句子,生成原句。

標題生成與帶有風格的文本重構兩個任務的數據集和模型都是獨立的。為了生成帶有風格的標題,TitleStylist通過參數共享將二者融合。

3. 模型細節

3.1 序列到序列模型架構(Seq2Seq Model Architecture)

dcaf5414-fe9b-11ec-ba43-dac502259ad0.png

如上圖,TitleStylist采用了Transformer架構的seq2seq模型,它包含編碼器和解碼器。為了提高生成的標題的質量,TitleStylist使用MASS模型來初始化模型參數。

3.2 多任務學習

dce4d4c2-fe9b-11ec-ba43-dac502259ad0.png

為了分離文本的風格和內容,模型引入多任務學習框架。在這里主要包含兩個任務:標題生成及DAE(Denoising Autoencoder)。根據論文描述,我們在這里將DAE稱為帶風格的文本重構。

有監督的標題生成

在標題生成任務中,首先我們輸入文章原文,然后經過編碼器獲得向量表征;接著,再利用解碼器生成標題。

換句話說,在標題生成任務中,我們是利用編碼器和解碼器學習條件分布。我們設是編碼器的待優化參數,是解碼器的待優化參數,那么標題生成任務的損失函數如下:

其中是單向語言模型,即:

這里代表句子的長度。

無監督/自監督的風格文本重構

在文本重構任務中,對于句子,我們通過隨機刪除或者遮蓋某些詞,或者改變文本中詞的順序可以獲得破壞版本的句子。將作為模型輸入,經過編碼器獲得中間表征,再經過解碼器進行還原獲得。這個任務的目的是在還原句子時使模型學到風格化句子的能力。

同樣我們設是編碼器的待優化參數,是解碼器的待優化參數,那么文本重構任務的損失函數如下:

聯合學習

最終,多任務學習會最小化將兩部分的損失函數之和:

3.3 如何生存帶有特定風格的相關標題

到目前為止,大家可能會有所疑問:兩個任務除了損失函數是一同優化外再沒有看到其他任何關聯, 那么TitleStylist怎么可能學到問題部分定義的終極目標,畢竟我們只有來自分布、的數據,并沒有來自分布的數據。

實際上,TitleStylist通過設計參數共享策略,讓兩個任務的編碼器及解碼器存在某種關聯,最終以此來建模。那么如何進行參數共享呢?

最簡單的,可以直接共享所有參數(與共享,與共享)。這樣模型等于同時學了標題生成與帶風格的文本重構兩個任務。其中標題生成的任務讓模型學到了如何生成與文章內容相關的標題;帶風格的文本重構則讓模型學到了如何在還原文本時保留文本具有的風格。在兩個任務的相互加持下,模型就可以生成和文章相關的又具有特定風格的標題。

好了,我們就想到這里。接下來看看TitleStylist究竟是怎么做的。

3.4 參數共享

剛才我們所說的直接共享所有參數的方式存在一個問題,就是模型并沒有真正地顯式地區分開文本內容與文本風格,那么模型就是又學了中的事實性風格,又學了中的特定風格(比如幽默、浪漫或標題黨)。

TitleStylist為了更好地區分開文本內容與文本風格,顯式地學習數據中所包含的風格,選擇讓編碼器共享所有參數,解碼器共享部分參數。個人認為編碼器端之所以完全共享參數,是想在編碼時盡可能保留原文信息。

dcaf5414-fe9b-11ec-ba43-dac502259ad0.png

如上圖所示,解碼器端的參數主要被分成兩部分:黃色部分表示不依賴風格的參數,是共享的;剩余依賴風格的參數,不共享。

具體地,存在于Layer Normalization及Decoder Attention,即層歸一化及解碼器注意力兩部分:

(1) 帶風格的層歸一化(Style Layer Normalization)

帶風格的層歸一化這個部分是借鑒圖像風格遷移的思想。其中分別是的的均值和標準方差,是模型需要學習的與風格相關的參數。

(2) 帶風格的解碼器注意力(Style-Guided Encoder Attention)

TitleStylist認為兩個任務的解碼器端在逐個生成下一個詞時的注意力機制應該有所不同。在這里,TitleStylist主要是設置了不同的,以此生成不同的從而形成不同的注意力模式。

這里代表風格,對標題生成而言其實可以算作事實性風格;對文本重構而言,可能是幽默、浪漫或標題黨風格。

TitleStylist結合完全共享參數的編碼器與部分參數共享的解碼器來實現其目標模型,最終可以生成帶有特定風格的又與原文內容相關的標題。

總結

好了,帶風格的標題生成論文《Hooks in the Headline: Learning to Generate Headlines with Controlled Styles》的內容就到這里了。在本篇文章中,我們就論文思想與論文所提出的模型的結構設計進行了介紹。論文實驗部分小喵沒有細看,大家感興趣的話可以下載原文并結合源碼進行學習。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 解碼器
    +關注

    關注

    9

    文章

    1165

    瀏覽量

    41825
  • 編碼器
    +關注

    關注

    45

    文章

    3786

    瀏覽量

    137576

原文標題:文本生成 | 一篇帶風格的標題生成的經典工作

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    谷歌新一代生成AI媒體模型登陸Vertex AI平臺

    我們在 Vertex AI 上推出新一代生成 AI 媒體模型: Imagen 4、Veo 3 和 Lyria 2。
    的頭像 發表于 06-18 09:56 ?242次閱讀

    ?Diffusion生成動作引擎技術解析

    Diffusion生成動作引擎 Diffusion生成動作引擎是一種基于擴散模型(Diffusion Models)的
    的頭像 發表于 03-17 15:14 ?1677次閱讀

    聚云科技榮獲亞馬遜云科技生成AI能力認證

    Bedrock等技術,從應用范圍、模型選擇、數據處理、模型調優到應用集成與部署等方面,助力企業加速生成AI應用落地。此外,聚云科技還基于亞馬遜云科技打造RAGPro企業知識庫、AI
    的頭像 發表于 02-14 16:07 ?362次閱讀

    聚云科技榮獲亞馬遜云科技生成AI能力認證 助力企業加速生成AI應用落地

    北京 ——2025 年 2 月 14 日 云管理服務提供商聚云科技獲得亞馬遜云科技生成AI能力認證,利用亞馬遜云科技全托管的生成AI服務Amazon Bedrock等技術,從應用范
    發表于 02-14 13:41 ?138次閱讀

    生成人工智能模型的安全可信評測

    近些年來,生成人工智能技術取得了飛躍發展。隨著各式各樣的大模型不斷迭代升級,從一般通用生成能力,到各種專有領域的細分能力,再到更注重與用戶的實際交互,大
    的頭像 發表于 01-22 13:55 ?968次閱讀
    <b class='flag-5'>生成</b><b class='flag-5'>式</b>人工智能<b class='flag-5'>模型</b>的安全可信評測

    AN-715::走近IBIS模型:什么是IBIS模型?它們是如何生成的?

    電子發燒友網站提供《AN-715::走近IBIS模型:什么是IBIS模型?它們是如何生成的?.pdf》資料免費下載
    發表于 01-13 14:21 ?0次下載
    AN-715::走近IBIS<b class='flag-5'>模型</b>:什么是IBIS<b class='flag-5'>模型</b>?它們是如何<b class='flag-5'>生成</b>的?

    NVIDIA推出多個生成AI模型和藍圖

    NVIDIA 宣布推出多個生成 AI 模型和藍圖,將 NVIDIA Omniverse 一體化進一步擴展至物理 AI 應用,如機器人、自動駕駛汽車和視覺 AI 等。全球軟件開發和專業服務領域的領先企業正在使用 Omnivers
    的頭像 發表于 01-08 10:48 ?575次閱讀

    借助谷歌Gemini和Imagen模型生成高質量圖像

    在快速發展的生成 AI 領域,結合不同模型的優勢可以帶來顯著的成果。通過利用谷歌的 Gemini 模型來制作詳細且富有創意的提示,然后使用 Imagen 3
    的頭像 發表于 01-03 10:38 ?854次閱讀
    借助谷歌Gemini和Imagen<b class='flag-5'>模型</b><b class='flag-5'>生成</b>高質量圖像

    Google兩款先進生成AI模型登陸Vertex AI平臺

    新的 AI 模型,包括最先進的視頻生成模型Veo以及最高品質的圖像生成模型Imagen 3。近日,我們在 Google Cloud 上進一步
    的頭像 發表于 12-30 09:56 ?571次閱讀

    NVIDIA推出全新生成AI模型Fugatto

    NVIDIA 開發了一個全新的生成 AI 模型。利用輸入的文本和音頻,該模型可以創作出包含任意的音樂、人聲和聲音組合的作品。
    的頭像 發表于 11-27 11:29 ?797次閱讀

    在設備上利用AI Edge Torch生成API部署自定義大語言模型

    使用 TFLite 運行時的設備上實現高性能的 PyTorch 模型推理。 AI Edge Torch 生成 API 使開發者能夠在設備上引入強大的新功能,例如摘要
    的頭像 發表于 11-14 10:23 ?1021次閱讀
    在設備上利用AI Edge Torch<b class='flag-5'>生成</b><b class='flag-5'>式</b>API部署自定義大語言<b class='flag-5'>模型</b>

    聲智完成多項生成算法和大模型服務備案

    2024年7月20日,北京聲智科技有限公司依據國家《生成人工智能服務管理暫行辦法》,順利完成了壹元大模型生成人工智能(大語言
    的頭像 發表于 07-23 15:25 ?911次閱讀
    聲智完成多項<b class='flag-5'>生成</b><b class='flag-5'>式</b>算法和大<b class='flag-5'>模型</b>服務備案

    經典卷積網絡模型介紹

    經典卷積網絡模型在深度學習領域,尤其是在計算機視覺任務中,扮演著舉足輕重的角色。這些模型通過不斷演進和創新,推動了圖像處理、目標檢測、圖像生成、語義分割等多個領域的發展。以下將詳細探討
    的頭像 發表于 07-11 11:45 ?1178次閱讀

    如何用C++創建簡單的生成AI模型

    生成AI(Generative AI)是一種人工智能技術,它通過機器學習模型和深度學習技術,從大量歷史數據中學習對象的特征和規律,從而能夠生成全新的、完全原創的內容,包括文本、圖像、
    的頭像 發表于 07-05 17:53 ?1670次閱讀

    生成AI與神經網絡模型的區別和聯系

    生成AI與神經網絡模型是現代人工智能領域的兩個核心概念,它們在推動技術進步和應用拓展方面發揮著至關重要的作用。本文將詳細探討生成AI與神
    的頭像 發表于 07-02 15:03 ?1639次閱讀
    主站蜘蛛池模板: 222在线视频免费观看 | 日本不卡视频一区二区三区 | 成年大片免费视频播放手机不卡 | 婷婷色香五月激情综合2020 | 欧美97色| 久久精彩免费视频 | 午夜国产大片免费观看 | 在线观看精品国产入口 | 色偷偷成人 | 色五阁| 天天精品在线 | 国内精品哆啪啪 | 中国特级毛片 | 天天操天天干天天玩 | 最新版天堂中文在线官网 | 亚洲最大色网站 | 乱j伦小说在线阅读 | 丁香五香天堂网 | 在线视频图片小说 | 亚洲人与牲动交xxxxbbbb | 黄色国产 | 国产特黄特色的大片观看免费视频 | 免费一看一级毛片全播放 | 国产精品任我爽爆在线播放6080 | 国产超爽人人爽人人做 | 午夜伦理片免费观看在线 | 美女被免费网站视频在线 | 天天做天天爱夜夜爽毛片毛片 | 亚洲日本在线观看视频 | 狠狠干夜夜骑 | 国产成人精品高清免费 | 欧美一级视频高清片 | 在线视频观看一区 | 自拍偷自拍亚洲精品被多人伦好爽 | 大黄香蕉| 亚洲卡1卡2卡新区网站 | 在线不卡一区 | www在线视频在线播放 | 人人做人人干 | 操夜夜 | 天天好比|