管理书籍排行榜,武道至尊帝临小说,盗墓笔记小说全集

本文為新欄目——將門好聲音第5期。

作者是來自將門計算機視覺社群的群友、中科院計算技術研究所VIPL課題組博士生——李勇。本文中，他將為大家介紹中科院計算所VIPL組的CVPR2019新作：一種基于視頻流的自監督特征表達方法，通過利用巧妙的自監督約束信號，得到提純的面部動作特征用于微表情識別。

如果你也想與廣大群友分享自己的研究工作、文章觀點、出坑經驗，隨時與群主小姐姐聯系！只要內容合適，我“門”送你頭條出道！

著名心理學家Paul Ekman和研究伙伴W.V.Friesen，通過對臉部肌肉動作與對應表情關系的研究，于1976年創制了“面部運動編碼系統”，而利用微表情的“讀心術”正是基于這一研究體系。由于該領域有限的數據集和高昂的標注成本，有監督學習的方法往往會導致模型過擬合。本文中，將為大家介紹中科院計算所VIPL組的CVPR2019新作：作者提出了一種基于視頻流的自監督特征表達方法，通過利用巧妙的自監督約束信號，得到提純的面部動作特征用于微表情識別。

李勇，中國科學院計算技術研究所視覺信息處理與課題組博士研究生，導師為常虹副研究員以及山世光研究員，研究方向為開放場景下的人臉表情分析。在攻讀博士學位期間，李勇在 CVPR， TIP 等會議及期刊上發表過多篇學術論文，其已發表的會議文章均被錄取為口頭報告。此外，李勇獲得ACM Multimedia 2017 親屬關系識別國際競賽冠軍。

論文信息：

Yong Li， Jiabei Zeng， Shiguang Shan， Xilin Chen. “Self-Supervised Representation Learning From Videos for Facial Action Unit Detection”， CVPR 2019， pp. 10924-10933， Long Beach， California， USA， June 16-20， 2019.

論文鏈接：

http://openaccess.thecvf.com/content_CVPR_2019/papers/Li_Self-Supervised_Representation_Learning_From_Videos_for_Facial_Action_Unit_Detection_CVPR_2019_paper.pdf

一、研究背景

面部運動編碼系統（FACS，Facial Action Coding System）從人臉解剖學的角度，定義了44個面部動作單元（Action Unit，簡稱AU）用于描述人臉局部區域的肌肉運動。

圖1. 面部動作單元示例

如圖1所示，AU9表示“皺鼻”，AU12表示“嘴角拉伸”。各種動作單元之間可以自由組合，對應不同的表情。如“AU4（降低眉毛）+AU5（上眼瞼上升）+AU24（嘴唇相互按壓）”這一組合對應“憤怒”這一情緒狀態。

面部動作單元能夠客觀、精確、細粒度地描述人臉表情。然而昂貴的標注代價在很大程度上限制了AU識別問題的研究進展，其原因在于不同的AU分布在人臉的不同區域，表現為不同強度、不同尺度的細微變化。具體來說，為一分鐘的人臉視頻標注一個AU，需要耗費一名AU標注專家30分鐘。目前學術界已發布的AU數據集只包含了有限的采集對象，以及有限的人臉圖像（如2017年CMU發布的GFT數據集有96個人，約35，000張人臉圖像）。

當前已有的工作多采用人臉區域分塊、注意力機制等方法學習人臉局部區域的AU特征，這類方法在訓練階段需要利用精確標注的AU標簽，由于目前業界發布的AU數據集人數及圖像總量不足，采用監督學習方法訓練得到的模型往往呈現出在特定數據集上的過擬合現象，這無疑限制了其實際使用效果。

我們提出了一種能夠在不依賴AU標簽的前提下，從人臉視頻數據中自動學習AU表征的方法（Twin-Cycle Autoencoder，簡稱TCAE）。TCAE用于后續的AU識別任務時，只需要利用訓練數據訓練一個分類器即可，顯著減少了所需的訓練數據，并提升了模型的泛化能力。

二、方法概述

如圖2所示，該方法以兩幀人臉圖像（源圖，目標圖）之間的運動信息為監督信號，驅使模型提取出用于解碼運動信息的圖像特征。這個方法的理念在于，模型只有感知并理解了人臉圖像中各個面部動作單元的狀態（AU是否激活），才能夠將源圖的面部動作轉換為目標圖像的面部動作。

圖2. TCAE 設計圖

考慮到兩幀人臉圖像之間的運動信息包含了AU以及頭部姿態的運動分量，TCAE通過利用巧妙的自監督約束信號，使得模型能夠分離出AU變化引起的運動分量，以及頭部姿態變化引起的運動分量，從而得到提純的AU特征。與其他監督方法，TCAE可以利用大量的無標注人臉視頻，這類視頻是海量的。與半監督或者弱監督方法相比， TCAE采用了自監督信號進行模型訓練，避免了對數據或者標簽的分布做出任何假設。

三、算法詳解

如圖3所示，TCAE包含四個階段，分別是特征解耦，圖像重建，AU循環變換，以及姿態（pose）循環變換。

圖3. TCAE的四個階段示意圖，四個階段分別是特征解耦，圖像重建，AU循環變換，以及姿態循環變換。

給定兩張人臉圖像，TCAE在特征解耦階段使用編碼器得到每張圖像的AU特征以及姿態特征，隨后，兩幀圖像的AU特征被送入AU解碼器，用于解碼出AU位移場；兩幀圖像的姿態特征被送入姿態解碼器，用于解碼出姿態位移場。考慮到AU的變化是稀疏的，且AU位移場的數值與姿態位移場相比更小，我們為AU位移場添加了L1約束：

在目標圖重建階段，TCAE通過線性組合AU位移場和pose位移場，得到源圖和目標圖之間的整體位移場，進行圖像重建：

在AU循環變換階段，僅變換了AU的人臉圖像被重新變換到源圖，由此我們獲得一個像素層面的一致性約束：

另外，對于變換了AU的人臉圖像，其AU特征應該接近目標圖像的AU特征，其姿態特征應該和源圖的姿態特征一致，由此我們獲得一個特征層面的一致性約束：

同理，在pose循環變化階段，我們同樣可以獲得類似的像素及特征層面的一致性約束：

四、實驗結果

多個數據集上的實驗證明，TCAE能夠成功提取出人臉圖像的AU及姿態特征。如圖4所示，給定兩張人臉圖像（源圖，目標圖），TCAE能夠僅僅改變源圖的AU或者頭部姿態。可視化的AU位移場呈現出運動方向的多樣性。

圖4. 可視化結果在AU識別任務上，TCAE取得了與監督方法可比的性能。

表1及表2的結果表明，TCAE明顯優于其他自監督方法。在GFT數據集（該數據集存在大范圍的頭部姿態變化）上，TCAE的性能優于其他監督方法。

表1. BP4D及DISFA數據集評測結果

（評測標準：F1 值（%））

表2. GFT及EmotioNet數據集評測結果（評測標準：F1 值（%））

五、總結與展望

TCAE通過自監督的方法學習到了魯棒的AU表征，實驗證明該AU表征是魯棒的，適用于AU分類任務的。可視化結果表明，TCAE具有潛在的人臉表情編輯價值。另外，TCAE在訓練階段使用了大量的無標簽數據（近6000人，約10，000，000張圖像），由此可見使用自監督方法訓練模型時數據利用的效率需要進一步提高，這一點在BERT的實驗分析中也得到了印證：

Good results on pre-training is 》1，000x to 100，000 more expensive than supervised training.

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

計算機視覺

計算機視覺

+關注

關注
8

文章
1701

瀏覽量
46168
視頻數據

視頻數據

+關注

關注
0

文章
18

瀏覽量
10999
數據集

數據集

+關注

關注
4

文章
1210

瀏覽量
24861

原文標題：將門好聲音 | CVPR2019 “識面知心”——基于自監督學習的微表情特征表達

文章出處：【微信號：thejiangmen，微信公眾號：將門創投】歡迎添加關注！文章轉載請注明出處。

一種基于因果路徑的層次圖卷積注意力網絡

機電系統中的故障檢測對其可維護性和安全性至關重要。然而，系統監測變量往往具有復雜的聯系，很難表征它們的關系并提取有效的特征。本文開發了一種基于因果路徑的層次圖卷積注意力網絡（HGCAN），以提高復雜

發表于 11-12 09:52 ?425次閱讀

<b class='flag-5'>一種</b>基于因果路徑的層次圖卷積注意力網絡

一種提升無人機小物體跟蹤精度的方法

這篇文章提出了一種新穎的目標跟蹤方法SFTrack，針對無人機(UAV)視頻中的獨特挑戰，采用了三種簡單有效的策略，尤其是在處理低置信度檢測、小規模物體和無人機運動方面表現出色。通過在

發表于 11-01 10:23 ?385次閱讀

<b class='flag-5'>一種</b>提升無人機小物體跟蹤精度的<b class='flag-5'>方法</b>

一種創新的動態軌跡預測方法

本文提出了一種動態軌跡預測方法，通過結合歷史幀和歷史預測結果來提高預測的穩定性和準確性。它引入了歷史預測注意力模塊，以編碼連續預測之間的動態關系，并通過三重因子注意力模塊實現了最先進的性能。本方法能夠生成準確且穩定的未來軌跡，這

發表于 10-28 14:34 ?529次閱讀

<b class='flag-5'>一種</b>創新的動態軌跡預測<b class='flag-5'>方法</b>

一種簡單高效配置FPGA的方法

本文描述了一種簡單高效配置FPGA的方法，該方法利用微處理器從串行外圍接口（SPI）閃存配置FPGA設備。這種方法減少了硬件組件、板空間和成本。

發表于 10-24 14:57 ?857次閱讀

<b class='flag-5'>一種</b>簡單高效配置FPGA的<b class='flag-5'>方法</b>

特征工程實施步驟

數據中提取數值表示以供無監督模型使用的方法（例如，試圖從之前非結構化的數據集中提取結構）。特征工程包括這兩種情況，以及更多內容。數據從業者通常依賴ML和深度學習算法

發表于 10-23 08:07 ?385次閱讀

一種利用wireshark對遠程服務器/路由器網絡抓包方法

發表于 09-21 08:03 ?3671次閱讀

<b class='flag-5'>一種</b>利用wireshark對遠程服務器/路由器網絡抓包<b class='flag-5'>方法</b>

華芯微電子取得一種過流保護電路專利

創新引領，技術突破！蘇州華芯微電子股份有限公司近日榮獲《一種過流保護電路》發明專利，標志著公司在微電子領域再攀新高峰！

發表于 08-19 15:03 ?515次閱讀

一種無透鏡成像的新方法

使用OAM-HHG EUV光束對高度周期性結構進行成像的EUV聚光顯微鏡為了研究微電子或光子元件中的納米級圖案，一種基于無透鏡成像的新方法可以實現近乎完美的高分辨率顯微鏡。層析成像是一種強大的無

發表于 07-19 06:20 ?456次閱讀

<b class='flag-5'>一種</b>無透鏡成像的新<b class='flag-5'>方法</b>

神經網絡如何用無監督算法訓練

神經網絡作為深度學習的重要組成部分，其訓練方式多樣，其中無監督學習是一種重要的訓練策略。無監督學習旨在從未標記的數據中發現數據內在的結構、模式或規律，從而提取有用的特征表示。這種訓練方

發表于 07-09 18:06 ?931次閱讀

rup是一種什么模型

RUP（Rational Unified Process，統一建模語言）是一種軟件開發過程模型，它是一種迭代和增量的軟件開發方法。RUP是由Rational Software公司（現為

發表于 07-09 10:13 ?1424次閱讀

人臉檢測的五種方法各有什么特征和優缺點

人臉檢測是計算機視覺領域的一個重要研究方向，主要用于識別和定位圖像中的人臉。以下是五種常見的人臉檢測方法及其特征和優缺點的介紹：基于膚色的方法

發表于 07-03 14:47 ?1008次閱讀

接觸器的自鎖接線方法

接觸器是一種用于控制大功率設備或電路的自動開關，廣泛應用于工業自動化、電力系統、家用電器等領域。接觸器的自鎖接線方法是指在接觸器的控制電路中加入自鎖回路，使得接觸器在接通后能夠保持閉合

發表于 06-30 09:15 ?1919次閱讀

介紹一種用于絕對定量的微腔式數字PCR微流控芯片

本文提出一種微腔式數字PCR微流控芯片。作者將兩層微結構背對背堆疊在一起使得在不改變芯片平面面積的情況下使腔室數量和試劑容量增加一倍，極大提升了檢測靈敏度。

發表于 03-04 10:15 ?987次閱讀

mapgis屬性篩選表達式

篇文章中，我們將詳細討論MapGIS的屬性篩選表達式，包括語法、操作符和函數等。屬性篩選表達式是一種在MapGIS中用于指定要素選擇條件的代碼。它由一組操作符、函數和屬性字段組成，用

發表于 02-25 10:58 ?1847次閱讀

Meta發布新型無監督視頻預測模型“V-JEPA”

Meta，這家社交媒體和科技巨頭，近日宣布推出一種新型的無監督視頻預測模型，名為“V-JEPA”。這一模型在視頻處理領域引起了廣泛關注，因為

發表于 02-19 11:19 ?1109次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

CVPR2019新作：一種基于視頻流的自監督特征表達方法

評論