編者按:著名心理學家Paul Ekman和研究伙伴W.V.Friesen,通過對臉部肌肉動作與對應表情關系的研究,于1976年創制了“面部運動編碼系統”,而利用微表情的“讀心術”正是基于這一研究體系。由于該領域有限的數據集和高昂的標注成本,有監督學習的方法往往會導致模型過擬合。本文中,將為大家介紹中科院計算所VIPL組的CVPR2019新作:作者提出了一種基于視頻流的自監督特征表達方法,通過利用巧妙的自監督約束信號, 得到提純的面部動作特征用于微表情識別。
1.研究背景
面部運動編碼系統 (FACS,Facial Action Coding System)從人臉解剖學的角度,定義了44個面部動作單元(Action Unit,簡稱AU)用于描述人臉局部區域的肌肉運動,如圖1所示,AU9表示“皺鼻”,AU12表示“嘴角拉伸”。各種動作單元之間可以自由組合,對應不同的表情。如“AU4(降低眉毛)+AU5(上眼瞼上升)+AU24(嘴唇相互按壓)”這一組合對應“憤怒”這一情緒狀態。
面部動作單元能夠客觀、精確、細粒度地描述人臉表情。然而昂貴的標注代價在很大程度上限制了AU識別問題的研究進展,其原因在于不同的AU分布在人臉的不同區域,表現為不同強度、不同尺度的細微變化。具體來說,為一分鐘的人臉視頻標注一個AU,需要耗費一名AU標注專家30分鐘。目前學術界已發布的AU數據集只包含了有限的采集對象,以及有限的人臉圖像(如2017年CMU發布的GFT數據集有96個人,約35,000張人臉圖像)。
圖1. 面部動作單元示例
當前已有的工作多采用人臉區域分塊、注意力機制等方法學習人臉局部區域的AU特征,這類方法在訓練階段需要利用精確標注的AU標簽,由于目前業界發布的AU數據集人數及圖像總量不足,采用監督學習方法訓練得到的模型往往呈現出在特定數據集上的過擬合現象,這無疑限制了其實際使用效果。
我們提出了一種能夠在不依賴AU標簽的前提下,從人臉視頻數據中自動學習AU表征的方法(Twin-Cycle Autoencoder,簡稱TCAE)。TCAE用于后續的AU識別任務時,只需要利用訓練數據訓練一個分類器即可,顯著減少了所需的訓練數據,并提升了模型的泛化能力。
2.方法概述
如圖2所示,該方法以兩幀人臉圖像(源圖,目標圖)之間的運動信息為監督信號,驅使模型提取出用于解碼運動信息的圖像特征。這個方法的理念在于,模型只有感知并理解了人臉圖像中各個面部動作單元的狀態(AU是否激活),才能夠將源圖的面部動作轉換為目標圖像的面部動作。
圖2. TCAE 設計圖
考慮到兩幀人臉圖像之間的運動信息包含了AU以及頭部姿態的運動分量,TCAE通過利用巧妙的自監督約束信號,使得模型能夠分離出AU變化引起的運動分量,以及頭部姿態變化引起的運動分量,從而得到提純的AU特征。與其他監督方法,TCAE可以利用大量的無標注人臉視頻,這類視頻是海量的。與半監督或者弱監督方法相比, TCAE采用了自監督信號進行模型訓練,避免了對數據或者標簽的分布做出任何假設。
3.算法詳解
如圖3所示,TCAE包含四個階段,分別是特征解耦,圖像重建,AU循環變換,以及姿態(pose)循環變換。
給定兩張人臉圖像,TCAE在特征解耦階段使用編碼器得到每張圖像的AU特征以及姿態特征,隨后,兩幀圖像的AU特征被送入AU解碼器,用于解碼出AU位移場;兩幀圖像的姿態特征被送入姿態解碼器,用于解碼出姿態位移場。考慮到AU的變化是稀疏的,且AU位移場的數值與姿態位移場相比更小,我們為AU位移場添加了L1約束:
在目標圖重建階段,TCAE通過線性組合AU位移場和pose位移場,得到源圖和目標圖之間的整體位移場,進行圖像重建:
在AU循環變換階段,僅變換了AU的人臉圖像被重新變換到源圖,由此我們獲得一個像素層面的一致性約束:
另外,對于變換了AU的人臉圖像,其AU特征應該接近目標圖像的AU特征,其姿態特征應該和源圖的姿態特征一致,由此我們獲得一個特征層面的一致性約束:
同理,在pose循環變化階段,我們同樣可以獲得類似的像素及特征層面的一致性約束:
圖3. TCAE的四個階段示意圖,四個階段分別是特征解耦,圖像重建,AU循環變換,以及pose循環變換。
4.實驗結果
多個數據集上的實驗證明,TCAE能夠成功提取出人臉圖像的AU及姿態特征。如圖4所示,給定兩張人臉圖像(源圖,目標圖),TCAE能夠僅僅改變源圖的AU或者頭部姿態。可視化的AU位移場呈現出運動方向的多樣性。
在AU識別任務上,TCAE取得了與監督方法可比的性能。表1及表2的結果表明,TCAE明顯優于其他自監督方法。在GFT數據集(該數據集存在大范圍的頭部姿態變化)上,TCAE的性能優于其他監督方法。
圖4. 可視化結果
表1. BP4D及DISFA數據集評測結果
(評測標準:F1 值 (%))
表2. GFT及EmotioNet數據集評測結果
(評測標準:F1 值 (%) )
5.總結與展望
TCAE通過自監督的方法學習到了魯棒的AU表征,實驗證明該AU表征是魯棒的,適用于AU分類任務的。可視化結果表明,TCAE具有潛在的人臉表情編輯價值。另外,TCAE在訓練階段使用了大量的無標簽數據(近6000人,約10,000,000張圖像),由此可見使用自監督方法訓練模型時數據利用的效率需要進一步提高,這一點在BERT的實驗分析中也得到了印證:Good results on pre-training is >1,000x to 100,000 more expensive than supervised training。
-
解碼器
+關注
關注
9文章
1153瀏覽量
40979 -
圖像
+關注
關注
2文章
1089瀏覽量
40600 -
數據集
+關注
關注
4文章
1210瀏覽量
24861
原文標題:【CVPR2019】“識面知心”——基于自監督學習的微表情特征表達
文章出處:【微信號:deeplearningclass,微信公眾號:深度學習大講堂】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
一種基于因果路徑的層次圖卷積注意力網絡
![<b class='flag-5'>一種</b>基于因果路徑的層次圖卷積注意力網絡](https://file1.elecfans.com/web1/M00/F4/CD/wKgaoWcytaCAMt21AAAZF3q1mFc472.jpg)
數據準備指南:10種基礎特征工程方法的實戰教程
![數據準備指南:10<b class='flag-5'>種</b>基礎<b class='flag-5'>特征</b>工程<b class='flag-5'>方法</b>的實戰教程](https://file.elecfans.com/web2/M00/4E/DC/poYBAGLCjeiALm_WAAAYmfR7Qec474.png)
一種創新的動態軌跡預測方法
![<b class='flag-5'>一種</b>創新的動態軌跡預測<b class='flag-5'>方法</b>](https://file1.elecfans.com/web2/M00/0B/46/wKgaomcfMJmAXFYrAAEzgGcXUbU308.jpg)
華芯微電子取得一種過流保護電路專利
一種無透鏡成像的新方法
![<b class='flag-5'>一種</b>無透鏡成像的新<b class='flag-5'>方法</b>](https://file1.elecfans.com//web2/M00/FD/50/wKgZomaZlSKAXJd7AAD91lO42tY599.jpg)
神經網絡如何用無監督算法訓練
rup是一種什么模型
人臉檢測的五種方法各有什么特征和優缺點
接觸器的自鎖接線方法
介紹一種用于絕對定量的微腔式數字PCR微流控芯片
![介紹<b class='flag-5'>一種</b>用于絕對定量的微腔式數字PCR微<b class='flag-5'>流</b>控芯片](https://file1.elecfans.com/web2/M00/C3/68/wKgaomXlLxWAYyuLAAA47kR3TMk389.png)
評論