在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

關于深度學習用于多模態語義學習的簡述

獨愛72H ? 來源:網絡整理 ? 作者:佚名 ? 2020-04-15 17:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

(文章來源:網絡整理)

互聯網用戶所創造的“內容”正在迅猛增長,從不同渠道涌現的文本、圖像和視頻等不同類型的媒體數據以及用戶信息更加緊密混合。它們正在以一種新的形式,更為形象綜合地表達語義、主題和事件。針對當前媒體數據呈現出的特點進行深入研究已成為學術熱點,多種類型媒體數據依賴共存,各種平臺和應用的數據來源廣泛,個體和群體參與數據產生的用戶交互史無前例。

谷歌的前任研究主管皮特·諾文(Perter Norvig)博士曾在2010年《自然》雜志上發表文章《2020愿景》,指出今后10年,文本、圖像、視頻等數據以及用戶交互信息和各種傳感器信息將混合在一起,從搜索角度看,搜索引擎對檢索結果進行的是內容綜合而非數據羅列,這也將是谷歌今后面臨的巨大挑戰。我國也同樣重視“跨媒體”研究,國家科技部于2011年11月啟動了973計劃項目“面向公共安全的跨媒體計算理論與方法”,對“跨媒體”的表達建模、語義學習、挖掘推理和搜索排序等核心問題開展了理論研究。目前,媒體計算需要重點解決的兩個難點是消除“異構鴻溝”和“語義鴻溝。

傳統的媒體計算研究方法主要從手工構建的底層特征出發,利用機器學習方法填補異構鴻溝和語義鴻溝。與傳統方法不同深度學習是通過將無監督逐層預訓練與有監督微調(fine-tuning)有機結合,實現端到端方式的特征學習。其基本動機是構建多層網絡來學習隱含在數據內部的關系,從而使學習得到的特征具有更強的表達力和泛化能力。

在大規模數據上進行的實驗表明:通過深度學習得到的特征表示在自然語言處理(詞向量學習)、知識圖譜構建、圖像分類和語音識別等領域表現出良好的性能。例如谷歌研究組在2014年大規模視覺識別挑戰賽中采用改進的卷積神經網絡GoogLeNet,將圖像識別準確率提升到93.3%。

通常,在媒體語義理解過程中可獲取不同類型的媒體數據,如:新聞報道包含了文字和文字對應的圖像,視頻包含了視覺和聽覺信息。不同類型的媒體數據從不同側面反映了高層語義,因此多模態語義學習需要對不同模態的信息進行整合。1976年,麥格克(McGurk)等人驗證了人類對外界信息的認知是基于不同感官信息而形成的整體性理解,任何感官信息的缺乏或不準確,都將導致大腦對外界信息的理解產生偏差,這個現象被稱為“McGurk現象”。McGurk現象揭示了大腦在進行感知時,不同感官會被無意識地自動結合在一起對信息進行處理。

由于深度學習具有通過逐層抽象來形成良好特征的能力,因此可利用該方法來形成不同類型數據的聯合特征表示。具體方法有深度典范相關分析(Deep Caconical Correlation Analysis,Deep CCA)、多模態深度學習以及多模態玻爾茲曼機等。這些方法的基本思路是通過不同的深層模型對不同類型數據進行逐層學習,將學習得到的結果進行合并,以得到多模態聯合特征表示,最后要求多模態聯合特征能有效重建原始不同類型數據或表達相關語義概念。為了得到更好的深層模型,一般在深層模型的最頂端設計反映不同類型數據相互耦合的損失函數來對模型進行優化反饋。

將深度學習應用于語義概念識別和理解時,有兩種方法:(1)將深度學習得到的特征表示直接輸入給判別分類模型(如支持向量機等);(2)通過softmax函數或回歸函數對輸人數據、隱含層和輸出層(語義標簽)之間的概率分布進行建模,然后基于互信息熵最小或間隔距離最大等準則對模型進行優化。

有人的理論研究結果表明:在機器學習中,如果對模型本身的假設產生偏差,則會影響學習結果。因此,如何合理引入數據本身所具有的先驗知識和結構線索,來構造和微調深層模型使之更好地處理多模態數據,是一個亟待解決的問題。因此,一些研究開始在生成式深層模型或區別式深層模型中引入數據本身所具有的先驗結構,以提升特征學習的泛化能力和區別能力。有人在卷積神經網絡輸出端引入層次化概念樹來促進關聯語義所具有的共享特征的學習,有人通過非參貝葉斯假設來提高判別性語義特征學習的靈活度。
(責任編輯:fqj)

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 互聯網
    +關注

    關注

    55

    文章

    11244

    瀏覽量

    106265
  • 深度學習
    +關注

    關注

    73

    文章

    5560

    瀏覽量

    122746
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    ?模態交互技術解析

    模態交互 模態交互( Multimodal Interaction )是指通過多種感官通道(如視覺、聽覺、觸覺等)或多種交互方式(如語音、手勢、觸控、眼動等)與計算機系統進行自然、
    的頭像 發表于 03-17 15:12 ?1996次閱讀

    照明產品質量分級認證規則(學習用燈具)

    電子發燒友網站提供《照明產品質量分級認證規則(學習用燈具).pdf》資料免費下載
    發表于 02-20 13:43 ?1次下載

    軍事應用中深度學習的挑戰與機遇

    人工智能尤其是深度學習技術的最新進展,加速了不同應用領域的創新與發展。深度學習技術的發展深刻影響了軍事發展趨勢,導致戰爭形式和模式發生重大變化。本文將概述
    的頭像 發表于 02-14 11:15 ?515次閱讀

    BP神經網絡與深度學習的關系

    BP神經網絡與深度學習之間存在著密切的關系,以下是對它們之間關系的介紹: 一、BP神經網絡的基本概念 BP神經網絡,即反向傳播神經網絡(Backpropagation Neural Network
    的頭像 發表于 02-12 15:15 ?839次閱讀

    體驗MiniCPM-V 2.6 模態能力

    模態組網
    jf_23871869
    發布于 :2025年01月20日 13:40:48

    NPU在深度學習中的應用

    隨著人工智能技術的飛速發展,深度學習作為其核心驅動力之一,已經在眾多領域展現出了巨大的潛力和價值。NPU(Neural Processing Unit,神經網絡處理單元)是專門為深度學習
    的頭像 發表于 11-14 15:17 ?1875次閱讀

    Pytorch深度學習訓練的方法

    掌握這 17 種方法,用最省力的方式,加速你的 Pytorch 深度學習訓練。
    的頭像 發表于 10-28 14:05 ?642次閱讀
    Pytorch<b class='flag-5'>深度</b><b class='flag-5'>學習</b>訓練的方法

    GPU深度學習應用案例

    能力,可以顯著提高圖像識別模型的訓練速度和準確性。例如,在人臉識別、自動駕駛等領域,GPU被廣泛應用于加速深度學習模型的訓練和推理過程。 二、自然語言處理 自然語言處理(NLP)是深度
    的頭像 發表于 10-27 11:13 ?1320次閱讀

    FPGA加速深度學習模型的案例

    FPGA(現場可編程門陣列)加速深度學習模型是當前硬件加速領域的一個熱門研究方向。以下是一些FPGA加速深度學習模型的案例: 一、基于FPGA的AlexNet卷積運算加速 項目名稱
    的頭像 發表于 10-25 09:22 ?1186次閱讀

    AI大模型與深度學習的關系

    AI大模型與深度學習之間存在著密不可分的關系,它們互為促進,相輔相成。以下是對兩者關系的介紹: 一、深度學習是AI大模型的基礎 技術支撐 :深度
    的頭像 發表于 10-23 15:25 ?2853次閱讀

    利用OpenVINO部署Qwen2模態模型

    模態大模型的核心思想是將不同媒體數據(如文本、圖像、音頻和視頻等)進行融合,通過學習不同模態之間的關聯,實現更加智能化的信息處理。簡單來說,
    的頭像 發表于 10-18 09:39 ?1218次閱讀

    FPGA做深度學習能走多遠?

    。FPGA的優勢就是可編程可配置,邏輯資源,功耗低,而且賽靈思等都在極力推廣。不知道用FPGA做深度學習未來會怎樣發展,能走多遠,你怎么看。 A:FPGA 在深度
    發表于 09-27 20:53

    NVIDIA推出全新深度學習框架fVDB

    在 SIGGRAPH 上推出的全新深度學習框架可用于打造自動駕駛汽車、氣候科學和智慧城市的 AI 就緒型虛擬表示。
    的頭像 發表于 08-01 14:31 ?1108次閱讀

    PyTorch深度學習開發環境搭建指南

    PyTorch作為一種流行的深度學習框架,其開發環境的搭建對于深度學習研究者和開發者來說至關重要。在Windows操作系統上搭建PyTorch環境,需要綜合考慮多個方面,包括軟件安裝、
    的頭像 發表于 07-16 18:29 ?2457次閱讀

    利用Matlab函數實現深度學習算法

    在Matlab中實現深度學習算法是一個復雜但強大的過程,可以應用于各種領域,如圖像識別、自然語言處理、時間序列預測等。這里,我將概述一個基本的流程,包括環境設置、數據準備、模型設計、訓練過程、以及測試和評估,并提供一個基于Mat
    的頭像 發表于 07-14 14:21 ?3604次閱讀
    主站蜘蛛池模板: 国产成人三级视频在线观看播放 | 久久精品免费观看 | 影院午夜 | 成人羞羞视频国产 | xxxxxx日本人免费 | 久久夜色精品 | 性感美女福利视频 | 天天做天天爱天天爽天天综合 | 狠狠操综合 | bt天堂电影 | 1024手机最新手机在线 | 在线精品国产第一页 | 亚洲乱码一二三四区 | 美女扒开腿让男人桶尿口 | 夜夜爽一区二区三区精品 | 亚洲一区免费看 | 黄色的视频网站在线观看 | 色老头性xxxx老头视频 | 久操成人| q2002韩国理论 | 亚洲欧美精品一区二区 | 免费在线黄色网址 | 天天综合网天天做天天受 | 牛牛碰在线 | 天天爽天天操 | 一区二区不卡视频在线观看 | 国产最新网站 | 欧美三级一级 | 国产黄色一级网站 | 国产成在线人视频免费视频 | 亚洲我射 | 四虎免费看黄 | 狠狠色综合网站久久久久久久 | 欧美午夜场 | 老色歌uuu26 老湿成人影院 | 中文字幕一区二区三区永久 | 伊人婷婷色香五月综合缴激情 | 色多多最新地址福利地址 | 国产国产人免费人成成免视频 | 久久瑟 | 女人扒开腿让男人桶到爽 |