導(dǎo)讀
使用深度學(xué)習(xí)融合各種來源的信息。
多模態(tài)數(shù)據(jù)
我們對(duì)世界的體驗(yàn)是多模態(tài)的 —— 我們看到物體,聽到聲音,感覺到質(zhì)地,聞到氣味,嘗到味道。模態(tài)是指某件事發(fā)生或經(jīng)歷的方式,當(dāng)一個(gè)研究問題包含多個(gè)模態(tài)時(shí),它就具有多模態(tài)的特征。為了讓人工智能在理解我們周圍的世界方面取得進(jìn)展,它需要能夠同時(shí)解釋這些多模態(tài)的信號(hào)。
例如,圖像通常與標(biāo)簽和文本解釋相關(guān)聯(lián),文本包含圖像,以更清楚地表達(dá)文章的中心思想。不同的模態(tài)具有非常不同的統(tǒng)計(jì)特性。
多模態(tài)深度學(xué)習(xí)
雖然結(jié)合不同的模態(tài)或信息類型來提高效果從直觀上看是一項(xiàng)很有吸引力的任務(wù),但在實(shí)踐中,如何結(jié)合不同的噪聲水平和模態(tài)之間的沖突是一個(gè)挑戰(zhàn)。此外,模型對(duì)預(yù)測結(jié)果有不同的定量影響。在實(shí)踐中最常見的方法是將不同輸入的高級(jí)嵌入連接起來,然后應(yīng)用softmax。
多模態(tài)深度學(xué)習(xí)的例子,其中使用不同類型的神經(jīng)網(wǎng)絡(luò)提取特征
這種方法的問題是,它將給予所有子網(wǎng)絡(luò)/模式同等的重要性,這在現(xiàn)實(shí)情況中是非常不可能的。
所有的模態(tài)對(duì)預(yù)測都有相同的貢獻(xiàn)
對(duì)網(wǎng)絡(luò)進(jìn)行加權(quán)組合
我們采用子網(wǎng)絡(luò)的加權(quán)組合,以便每個(gè)輸入模態(tài)可以對(duì)輸出預(yù)測有一個(gè)學(xué)習(xí)貢獻(xiàn)(Theta)。 我們的優(yōu)化問題變成-
對(duì)每個(gè)子網(wǎng)絡(luò)給出Theta權(quán)值后的損失函數(shù)。
將權(quán)值附加到子網(wǎng)后預(yù)測輸出。
把所有的都用起來!
準(zhǔn)確性和可解釋性我們?cè)趦蓚€(gè)現(xiàn)實(shí)多模態(tài)數(shù)據(jù)集上得到了SOTA: Multimodal Corpus of Sentiment Intensity(MOSI) 數(shù)據(jù)集 —— 有417個(gè)標(biāo)注過的視頻,每毫秒標(biāo)注的音頻特征。共有2199個(gè)標(biāo)注數(shù)據(jù)點(diǎn),其中情緒強(qiáng)度定義為從strongly negative到strongly positive,線性尺度從- 3到+3。
模態(tài)包括:
1. 文本 2. 音頻
3. 語言
每種模態(tài)對(duì)情緒預(yù)測的貢獻(xiàn)量 Transcription Start Site Prediction(TSS)數(shù)據(jù)集 —— Transcription是基因表達(dá)的第一步,在這一步中,特定的DNA片段被復(fù)制到RNA (mRNA)中。Transcription起始位點(diǎn)是transcription開始的位置。DNA片段的不同部分具有不同的特性,從而影響其存在。
我們將TSS分為三個(gè)部分:
上游DNA
下游DNA
TSS位置
我們?nèi)〉昧饲八从械母纳疲戎暗淖钕冗M(jìn)的結(jié)果3%。使用TATA box的下游DNA區(qū)域?qū)@一過程影響最大。
責(zé)任編輯:lq
-
人工智能
+關(guān)注
關(guān)注
1806文章
48980瀏覽量
248836 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1223瀏覽量
25400 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5560瀏覽量
122745
原文標(biāo)題:多模態(tài)深度學(xué)習(xí):用深度學(xué)習(xí)的方式融合各種信息
文章出處:【微信號(hào):Imgtec,微信公眾號(hào):Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
軍事應(yīng)用中深度學(xué)習(xí)的挑戰(zhàn)與機(jī)遇
BP神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)的關(guān)系
鯤云科技入選工信部2024年實(shí)體經(jīng)濟(jì)和數(shù)字經(jīng)濟(jì)深度融合典型案例
NPU在深度學(xué)習(xí)中的應(yīng)用
AI干貨補(bǔ)給站 | 深度學(xué)習(xí)與機(jī)器視覺的融合探索

評(píng)論