在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NeurIPS23|視覺 「讀腦術」:從大腦活動中重建你眼中的世界

智能感知與物聯網技術研究所 ? 來源:未知 ? 2023-12-24 21:35 ? 次閱讀
在這篇 NeurIPS23 論文中,來自魯汶大學、新加坡國立大學和中科院自動化所的研究者提出了一種視覺 「讀腦術」,能夠從人類的大腦活動中以高分辨率出解析出人眼觀看到的圖像。

人類的感知不僅由客觀刺激塑造,而且深受過往經驗的影響,這些共同促成了大腦中的復雜活動。在認知神經科學領域,解碼大腦活動中的視覺信息成為了一項關鍵任務。功能性磁共振成像(fMRI)作為一種高效的非侵入性技術,在恢復和分析視覺信息,如圖像類別方面發揮著重要作用。

然而,由于 fMRI 信號的噪聲特性和大腦視覺表征的復雜性,這一任務面臨著不小的挑戰。針對這一問題,本文提出了一個雙階段 fMRI 表征學習框架,旨在識別并去除大腦活動中的噪聲,并專注于解析對視覺重建至關重要的神經激活模式,成功從大腦活動中重建出高分辨率且語義上準確的圖像。

wKgZomWINLKALJHdAADF5GvzRlU019.png

論文鏈接:https://arxiv.org/abs/2305.17214

項目鏈接:https://github.com/soinx0629/vis_dec_neurips/

論文中提出的方法基于雙重對比學習、跨模態信息交叉及擴散模型,在相關 fMRI 數據集上取得了相對于以往最好模型接近 40% 的評測指標提升,在生成圖像的質量、可讀性及語義相關性相對于已有方法均有肉眼可感知的提升。該工作有助于理解人腦的視覺感知機制,有益于推動視覺的腦機接口技術的研究。相關代碼均已開源。

功能性磁共振成像(fMRI)雖廣泛用于解析神經反應,但從其數據中準確重建視覺圖像仍具挑戰,主要因為 fMRI 數據包含多種來源的噪聲,這些噪聲可能掩蓋神經激活模式,增加解碼難度。此外,視覺刺激引發的神經反應過程復雜多階段,使得 fMRI 信號呈現非線性的復雜疊加,難以逆轉并解碼。

傳統的神經解碼方式,例如嶺回歸,盡管被用于將 fMRI 信號與相應刺激關聯,卻常常無法有效捕捉刺激和神經反應之間的非線性關系。近期,深度學習技術,如生成對抗網絡(GAN)和潛在擴散模型(LDMs),已被采用以更準確地建模這種復雜關系。然而,將視覺相關的大腦活動從噪聲中分離出來,并準確進行解碼,依然是該領域的主要挑戰之一。

為了應對這些挑戰,該工作提出了一個雙階段 fMRI 表征學習框架,該方法能夠有效識別并去除大腦活動中的噪聲,并專注于解析對視覺重建至關重要的神經激活模式。該方法在生成高分辨率及語義準確的圖像方面,其 50 分類的 Top-1 準確率超過現有最先進技術 39.34%。

方法概述

fMRI 表征學習 (FRL)

wKgZomWINLKAcFDpAAO2RXreIdY129.png

第一階段:預訓練雙對比掩模自動編碼器 (DC-MAE)

為了在不同人群中區分共有的大腦活動模式和個體噪聲,本文引入了 DC-MAE 技術,利用未標記數據對 fMRI 表征進行預訓練。DC-MAE 包含一個編碼器wKgZomWINLOACY85AAATCYkGrj4217.jpg和一個解碼器wKgZomWINLOABwpmAAATHGKaoqQ493.jpg,其中wKgZomWINLOACY85AAATCYkGrj4217.jpg以遮蔽的 fMRI 信號為輸入,wKgZomWINLOABwpmAAATHGKaoqQ493.jpg?則被訓練以預測未遮蔽的 fMRI 信號。所謂的 “雙重對比” 是指模型在 fMRI 表征學習中優化對比損失并參與了兩個不同的對比過程。

在第一階段的對比學習中,每個包含 n 個 fMRI 樣本 v 的批次中的樣本wKgZomWINLOAZytRAAAY_FrfB3k709.jpg被隨機遮蔽兩次,生成兩個不同的遮蔽版本wKgZomWINLOAArgcAAAUaigjVac307.jpgwKgZomWINLOAPQaBAAAUPkzrEOE862.jpg,作為對比的正樣本對。隨后,1D 卷積層將這兩個版本轉換為嵌入式表示,分別輸入至 fMRI 編碼器wKgZomWINLOACY85AAATCYkGrj4217.jpg解碼器wKgZomWINLOABwpmAAATHGKaoqQ493.jpg?接收這些編碼的潛在表示,產生預測值wKgZomWINLOAO6mOAAASQACFk9g996.pngwKgZomWINLOAet-dAAAVNYeXg70733.jpg通過 InfoNCE 損失函數計算的第一次對比損失,即交叉對比損失,來優化模型:

wKgZomWINLSAIiN7AABBN0m1cj8083.jpg

在第二階段對比學習中,每個未遮蔽的原始圖像wKgZomWINLSAHEJRAAAXn-h_7Ng614.jpg及其相應的遮蔽圖像wKgZomWINLSAC2WQAAAT5Kwzsi8234.jpg形成一對天然正樣本。這里的wKgZomWINLSAQovGAAAUiK-KtBw912.jpg代表解碼器wKgZomWINLOABwpmAAATHGKaoqQ493.jpg預測出的圖像。第二次對比損失,也就是自對比損失,根據以下公式進行計算:

wKgZomWINLSAMPzRAABAeYZE5Qc055.jpg

優化自對比損失wKgZomWINLSAF2rFAAARX8jVJfI764.png能夠實現遮蔽重建。無論是wKgZomWINLSAfymTAAAS0IvT2_Q525.jpg還是wKgZomWINLSAF2rFAAARX8jVJfI764.png,負樣本wKgZomWINLSAXwLZAAAN_22lvAA884.png都來自同一批次的實例。wKgZomWINLSAfymTAAAS0IvT2_Q525.jpgwKgZomWINLSAF2rFAAARX8jVJfI764.png共同按如下方式優化:wKgZomWINLWAD1DbAAAch545_CM537.jpg,其中超參數wKgZomWINLWAdlluAAASYyUq0R4990.jpgwKgZomWINLWAMR7FAAASq6Kh68E113.jpg于調節各損失項的權重。

  • 第二階段:使用跨模態指導進行調整

考慮到 fMRI 記錄的信噪比較低且高度卷積的特性,專注于與視覺處理最相關且對重建最有信息價值的大腦激活模式對 fMRI 特征學習器來說至關重要。

在第一階段預訓練后,fMRI 自編碼器通過圖像輔助進行調整,以實現 fMRI 的重建,第二階段同樣遵循此過程。具體而言,從 n 個樣本批次中選擇一個樣本wKgZomWINLWATUnSAAAXnpwIGVw982.jpg及其對應的 fMRI 記錄的神經反應wKgZomWINLWAUdYrAAATFNte410567.jpgwKgZomWINLWAV1W_AAASi0eS_Co553.jpgwKgZomWINLWAUdYrAAATFNte410567.jpg經過分塊和隨機遮蔽處理,分別轉變為wKgZomWINLWARjeiAAAT3H5zAhk833.jpgwKgZomWINLSAC2WQAAAT5Kwzsi8234.jpg,然后分別輸入到圖像編碼器wKgZomWINLaAVwfBAAAS6nvhto0598.jpg和 fMRI 編碼器wKgZomWINLOACY85AAATCYkGrj4217.jpg中,生成wKgZomWINLaAIzbCAAAcAQiZ6Yc949.jpgwKgZomWINLaAe6vgAAAcmXnXrIY053.jpg為重建 fMRIwKgZomWINLWAUdYrAAATFNte410567.jpg,利用交叉注意力模塊將wKgZomWINLaASTQoAAAUKoGGLKU898.jpgwKgZomWINLaAfeUhAAAT-v86Tio504.jpg進行合并:

wKgZomWINLaAajRJAABNntKnTqU552.jpg

W 和 b 分別代表相應線性層的權重和偏置。wKgZomWINLaATBQZAAAVPGeh5Og542.jpg是縮放因子,wKgZomWINLaAeeVsAAATW_AMVgw267.jpg是鍵向量的維度。CA 是交叉注意力(cross-attention)的縮寫。wKgZomWINLeAHF1nAAAfybuIBoI821.jpgwKgZomWINLaAe6vgAAAcmXnXrIY053.jpg后,輸入到 fMRI 解碼器中以重建wKgZomWINLWAUdYrAAATFNte410567.jpg,得到wKgZomWINLeAVvYYAAATnH0DhiA804.jpg

wKgZomWINLeAFXQxAAAxL45-TkQ550.jpg

圖像自編碼器中也進行了類似的計算,圖像編碼器wKgZomWINLaAVwfBAAAS6nvhto0598.jpg的輸出wKgZomWINLeAUm6AAAAcAaDek6k559.jpg通過交叉注意力模塊wKgZomWINLeAQpWXAAATeI5Kmq8032.jpgwKgZomWINLOACY85AAATCYkGrj4217.jpg的輸出合并,然后用于解碼圖像wKgZomWINLWAV1W_AAASi0eS_Co553.jpg,得到wKgZomWINLeAKIigAAATwpBzL4M079.jpg

wKgZomWINLiAb5_6AAAxBx5M7Xg526.jpg

通過優化以下損失函數,fMRI 和圖像自編碼器共同進行訓練:

wKgZomWINLiAZrSMAAArMzBgJiY411.jpg

使用潛在擴散模型 (LDM) 生成圖像

wKgZomWINLiARoeeAAKqfqRTYGQ047.png

在完成 FRL 第一階段和第二階段的訓練后,使用 fMRI 特征學習器的編碼器wKgZomWINLOACY85AAATCYkGrj4217.jpg來驅動一個潛在擴散模型(LDM),從大腦活動生成圖像。如圖所示,擴散模型包括一個向前的擴散過程和一個逆向去噪過程。向前過程逐漸將圖像降解為正態高斯噪聲,通過逐漸引入變方差的高斯噪聲。

該研究通過從預訓練的標簽至圖像潛在擴散模型(LDM)中提取視覺知識,并利用 fMRI 數據作為條件生成圖像。這里采用交叉注意力機制,將 fMRI 信息融入 LDM,遵循穩定擴散研究的建議。為了強化條件信息的作用,這里采用了交叉注意力和時間步條件化的方法。在訓練階段,使用 VQGAN 編碼器wKgZomWINLiALLOQAAATKKDDL5A531.jpg和經 FRL 第一和第二階段訓練的 fMRI 編碼器wKgZomWINLOACY85AAATCYkGrj4217.jpg處理圖像 u 和 fMRI v,并在保持 LDM 不變的情況下微調 fMRI 編碼器,損失函數為:

wKgZomWINLiAURK6AAAxi8Qwnmw428.jpg

其中,wKgZomWINLiAJMGVAAAh0LxI2rw895.jpg是擴散模型的噪聲計劃。在推理階段,過程從時間步長 T 的標準高斯噪聲開始,LDM 依次遵循逆向過程逐步去除隱藏表征的噪聲,條件化在給定的 fMRI 信息上。當到達時間步長零時,使用 VQGAN 解碼器wKgZomWINLiAXoQOAAATapgIzh8041.jpg將隱藏表征轉換為圖像。

實驗

重建結果

wKgZomWINLmADsjhAAWOjRY9Q58396.png

通過與 DC-LDM、IC-GAN 和 SS-AE 等先前研究的對比,并在 GOD 和 BOLD5000 數據集上的評估中顯示,該研究提出的模型在準確率上顯著超過這些模型,其中相對于 DC-LDM 和 IC-GAN 分別提高了 39.34% 和 66.7%

wKgZomWINLmAUZrOAAQs152VB3o042.png

在 GOD 數據集的其他四名受試者上的評估顯示,即使在允許 DC-LDM 在測試集上進行調整的情況下,該研究提出的模型在 50 種方式的 Top-1 分類準確率上也顯著優于 DC-LDM,證明了提出的模型在不同受試者大腦活動重建方面的可靠性和優越性。

實驗結果表明,利用所提出的 fMRI 表示學習框架和預先訓練的 LDM,可以更好的重建大腦的視覺活動,大大優于目前的基線。該工作有助于進一步挖掘神經解碼模型的潛力。


原文標題:NeurIPS23|視覺 「讀腦術」:從大腦活動中重建你眼中的世界

文章出處:【微信公眾號:智能感知與物聯網技術研究所】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 物聯網
    +關注

    關注

    2926

    文章

    45776

    瀏覽量

    386893

原文標題:NeurIPS23|視覺 「讀腦術」:從大腦活動中重建你眼中的世界

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯網技術研究所】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    具身智能×邊緣計算:AI的“大腦”和“身體”如何聯手闖蕩世界

    兩個關鍵詞——具身智能和邊緣計算。它們就像是智能世界的“大腦”和“身體”,通過協同合作,讓機器“能聽話”進化到“懂世界”。那么,這兩者是如何互相成就的呢?今天我
    的頭像 發表于 04-30 18:34 ?105次閱讀
    具身智能×邊緣計算:AI的“<b class='flag-5'>大腦</b>”和“身體”如何聯手闖蕩<b class='flag-5'>世界</b>?

    電基礎系列之電電極的分類與技術對比

    電電極的概述腦電圖(Electroencephalogram,EEG)是通過記錄大腦皮層神經元電活動來反映功能狀態的重要技術手段,廣泛應用于臨床診斷、神經科學研究及
    的頭像 發表于 03-13 10:27 ?826次閱讀
    <b class='flag-5'>腦</b>電基礎系列之<b class='flag-5'>腦</b>電電極的分類與技術對比

    電偽跡系列之電偽跡處理與技術剖析

    在上一篇系列文章中了解到,電信號反映大腦神經元活動,在神經科學研究、臨床診斷、機接口等領域應用廣泛。但電信號幅值微弱極易受偽跡干擾。這
    的頭像 發表于 03-04 20:24 ?606次閱讀
    <b class='flag-5'>腦</b>電偽跡系列之<b class='flag-5'>腦</b>電偽跡處理與技術剖析

    電偽跡全解析:類型、成因與影響

    電信號研究領域,電偽跡是影響數據準確性的關鍵因素。深入了解電偽跡,對獲取可靠電數據、推動腦科學研究意義重大。電偽跡的產生根源
    的頭像 發表于 02-25 22:26 ?1415次閱讀
    <b class='flag-5'>腦</b>電偽跡全解析:類型、成因與影響

    Meta非入侵式機技術:AI讀取大腦信號打字準確率80%

    Meta首席執行官馬克?扎克伯格曾透露,公司正在研發一項革命性的機技術,旨在讓用戶通過大腦直接輸入文字。近日,《麻省理工技術評論》報道稱,Meta已經成功實現了這一技術突破。 據悉,Meta的這項
    的頭像 發表于 02-11 15:45 ?545次閱讀

    如何才ADS1118回命令寄存器的值呢?

    參照ADS1118的說明書,我使用CC2530的串口1的SPI方式向ADS1118連接寫入4個字節的命令,我想問一下我如何才ADS1118回命令寄存器的值呢。意思就是在我寫入
    發表于 02-10 07:19

    使用ADS1299進行電信號采集時采集不到電信號,怎么解決?

    您好!我這邊在使用ADS1299進行電信號采集時采集不到電信號,用信號發生器進行測試,能采集到0.5uV左右的正弦波,文檔是該芯片的原理圖和電極連接方式說明,請問是否有問題?還麻煩指教,謝謝!
    發表于 11-13 06:52

    解鎖機器人視覺與人工智能的潛力,“盲人機器”改造成有視覺能力的機器人(上)

    正如人類依賴眼睛和大腦來解讀世界,機器人也需要自己的視覺系統來有效運作。沒有視覺,機器人就如同蒙上雙眼的人類,僅能執行預編程的命令,容易碰撞障礙物,并犯下代價高昂的錯誤。這正是機器人
    的頭像 發表于 10-12 09:56 ?669次閱讀
    解鎖機器人<b class='flag-5'>視覺</b>與人工智能的潛力,<b class='flag-5'>從</b>“盲人機器”改造成有<b class='flag-5'>視覺</b>能力的機器人(上)

    SynSense時識科技收購瑞士類視覺傳感器公司iniVation 100%股權

    SynSense時識科技今日宣布成功收購瑞士類視覺傳感器公司iniVation 100%股權。隨著交割完成,SynSense時識科技成為全球首個同時擁有類智能領域感知與計算技術,并掌握該領域大量
    的頭像 發表于 07-19 18:09 ?1844次閱讀

    SynSense時識科技成功收購瑞士類視覺傳感器公司iniVation,類智能航母蓄勢待發

    SynSense時識科技今日宣布 成功收購瑞士類視覺傳感器公司iniVation 100%股權 。隨著交割完成,SynSense時識科技成為全球首個同時擁有類智能領域感知與計算技術,并掌握該領域
    發表于 07-19 18:00 ?689次閱讀
    SynSense時識科技成功收購瑞士類<b class='flag-5'>腦</b><b class='flag-5'>視覺</b>傳感器公司iniVation,類<b class='flag-5'>腦</b>智能航母蓄勢待發

    機接囗疲勞預測解決方案

    方案簡介 一款雙通道電采集分析解決方案,基于唯理自研機接口芯片WL122,可以實現雙通道電信號的采集分析和無線傳輸。集成多種電算法API,可以完成對
    的頭像 發表于 07-15 17:37 ?478次閱讀
    <b class='flag-5'>腦</b>機接囗疲勞預測解決方案

    基于FPGA的類計算平臺 —PYNQ 集群的無監督圖像識別類計算系統

    模擬器開源軟件,應用廣泛。NEST 一大優勢是可用于模 擬任何規模的脈沖神經網絡,如可模擬哺乳動物的視覺或聽覺皮層這樣的信息處理模型。也可模擬網絡活動的動力學模型,比如層狀皮質網絡或平衡隨機網絡以及
    發表于 06-25 18:35

    機器視覺應用之檢測 遠景達工業碼器行業知識

    碼器機器視覺
    深圳市遠景達物聯網技術有限公司
    發布于 :2024年06月21日 17:10:44

    世界首款!又是清華:類互補視覺芯片“天眸芯”

    近日,清華大學在類視覺感知芯片領域取得重要突破:清華大學依托精密儀器系的類計算研究中心施路平教授團隊,提出一種基于視覺原語的互補雙通路類
    的頭像 發表于 06-04 08:36 ?644次閱讀
    <b class='flag-5'>世界</b>首款!又是清華:類<b class='flag-5'>腦</b>互補<b class='flag-5'>視覺</b>芯片“天眸芯”

    清華類視覺芯片取得重大突破,“天眸芯”登上Nature封面

    with complementary pathways for open-world sensing”,即面向開放世界感知的具有互補路徑的視覺芯片。 ? 這是世界上首款類互補
    的頭像 發表于 06-01 00:54 ?5407次閱讀
    清華類<b class='flag-5'>腦</b><b class='flag-5'>視覺</b>芯片取得重大突破,“天眸芯”登上Nature封面
    主站蜘蛛池模板: 在线观看视频免费 | 国产黄网站在线观看 | 色噜噜狠狠成人中文小说 | 97一区二区三区 | 国产美女免费观看 | 97综合久久 | 天堂自拍 | 免费不卡毛片 | 国产一级特黄 | 看全色黄大色大片免费久久 | 日本黄页网站 | 色老头综合免费视频 | 久久免费视频网站 | 亚洲影视一区二区 | 久久久久久99 | 他也色在线视频 | 特级黄 | 久久草在线免费 | 成人国产亚洲欧美成人综合网 | 美女露出尿口让男人桶爽网站 | 中文字幕视频二区 | 无人码一区二区三区视频 | 亚洲视频在线网 | 全部免费特黄特色大片视频 | 美女毛片免费 | 男女爱爱免费 | 中文字幕卡二和卡三的视频 | 第一福利在线 | 特级全黄一级毛片视频 | 日韩一级免费视频 | 午夜精品久久久久久久久 | 亚洲男人天堂2021 | 日韩卡1卡2卡三卡四卡二卡免 | 欧美一卡2卡三卡四卡五卡 欧美一卡二卡3卡4卡无卡六卡七卡科普 | 手机看片午夜 | 最好看的最新中文字幕2018免费视频 | 亚洲男人精品 | 亚洲 欧美 自拍 另类 | 又黄又免费的网站 | 国产手机在线 | 日韩三级免费观看 |