繼神經(jīng)網(wǎng)絡(luò)推理框架ncnn、TNN,動作檢測算法DBG,通用目標檢測算法OSD,人臉檢測算法DSFD、人臉屬性算法FAN等眾多優(yōu)秀的框架、算法開源后,騰訊優(yōu)圖實驗室又有一項人臉識別算法研究項目——TFace正式擁抱開源。
項目背景
TFace是由騰訊優(yōu)圖實驗室研發(fā)的人臉識別算法研究項目,其中TFace中的T意為“trusty”,表達了團隊在可信人臉識別技術(shù)方向上的愿景。
人臉識別算法是指在檢測到人臉并定位面部關(guān)鍵特征點之后,裁剪出主要的人臉區(qū)域,并經(jīng)過預(yù)處理后饋入后端的識別算法。因為有著方便友好、易于接受、不易偽造等一系列優(yōu)點,在過去30多年里,人臉識別一直都是人工智能領(lǐng)域的研究熱點。并被廣泛應(yīng)用在公共安全、身份驗證、門禁考勤、金融支付等領(lǐng)域。隨著人臉識別技術(shù)的大規(guī)模應(yīng)用,進入“看臉時代”的同時,人臉識別也正在一步步向著“可信”發(fā)展。
基于可信人臉識別的理念,TFace重點關(guān)注人臉識別領(lǐng)域的四個研究方向:精準、公平、可解釋以及隱私。經(jīng)過多年的行業(yè)實戰(zhàn)經(jīng)驗,優(yōu)圖在每個方向都積累了大量硬核技術(shù),其中很多提煉后作為學術(shù)成果發(fā)表在相關(guān)頂級CV會議中。為了方便研究人員快速復(fù)現(xiàn)我們的工作,已發(fā)表文章的代碼全部在TFace中開源;
在研究工作開展的過程中,我們開發(fā)了一套成熟的算法訓練和測試框架,框架主要由數(shù)據(jù)增強、骨干網(wǎng)絡(luò)模型庫、模型評估、訓練范式等高度抽象化模塊組成,通過簡單的修改配置文件就可以開展相應(yīng)的實驗,支持多種骨干網(wǎng)絡(luò)結(jié)構(gòu)和heads,復(fù)現(xiàn)了學術(shù)界主流的SOTA方法和效果,同時也利用工業(yè)界主流的推理框架測試了不同模型的推理耗時。
1、在數(shù)據(jù)預(yù)增強模塊中,除了傳統(tǒng)的圖像處理操作外,針對困難場景下識別精度低這一難題,TFace采用從2D和3D兩條路線進行數(shù)據(jù)增強,目前已開放2D數(shù)據(jù)增強代碼,可以擴增成戴口罩、戴眼鏡、戴頭巾等樣本,后續(xù)TFace也會逐漸開放對于光線、表情、姿態(tài)這些細粒度屬性的3D增強代碼;
2、在骨干網(wǎng)絡(luò)模型庫中,TFace實現(xiàn)了十余種學術(shù)界常見的人臉識別提特征網(wǎng)絡(luò)結(jié)構(gòu),可以滿足終端和后臺等常用場景下的耗時需求;
3、模型評估模塊主要包括了推理耗時評估和精度評估,推理耗時評估主要測試了不同模型在X86 CPU,ARM CPU,GPU具體設(shè)備上的推理速度,精度評估主要提供了在常見學術(shù)測試集上的評估工具以及不同模型的結(jié)果,這些可以供開發(fā)者選擇模型結(jié)構(gòu)時參考;
4、在訓練范式上,TFace支持常見的數(shù)據(jù)并行+模型并行以及混合精度訓練,提升大規(guī)模訓練的效率,支持多數(shù)據(jù)分支訓練,采用類似多任務(wù)學習的方式同時訓練多個數(shù)據(jù)集,提升模型的精度,此外TFace后續(xù)將會開放量化感知訓練、模型蒸餾、聯(lián)邦訓練等代碼。
算法介紹(CurricularFace)
一種用于人臉識別基礎(chǔ)模型訓練的損失函數(shù),發(fā)表于CVPR2020,主要的思路是將課程學習的思想結(jié)合到常用的人臉識別損失函數(shù),訓練過程中自動挖掘困難樣本,先易后難漸進學習,提升識別模型訓練魯棒性及難樣本識別性能。
DDL
一種用于提升特定場景下人臉識別性能的方法,發(fā)表于ECCV2020,主要的思路是針對某一特定場景的難樣本,為其尋找一個合適的教師場景,通過拉近兩種場景下的人臉相似度分布,從而提升該場景下困難樣本的識別性能。
CIFP
提升個體識別公平性的方法,發(fā)表于CVPR2021,提出了基于誤報率懲罰的損失函數(shù),即通過增加實例誤報率(FPR)的一致性來減輕人臉識別偏差。
SDD-FIQA
一種基于人臉識別相似度分布的無監(jiān)督人臉質(zhì)量評估方法,發(fā)表于CVPR2021,通過計算同人和非同人相似度分布的韋氏距離作為目標圖像的質(zhì)量分偽標簽,最終通過圖像+質(zhì)量偽標簽訓練得到質(zhì)量分模型。
SCF
一種基于人臉特征置信度的人臉識別方法,發(fā)表于CVPR2021,核心思想包含兩點:a.將人臉樣本特征從確定向量升級為概率分布,從而獲得額外刻畫樣本識別置信度的能力;b.提出適配于超球流形r-radius von Mises Fisher分布建模特征,理論可解釋性與方法收斂性較PFE更佳。
目前,TFace項目中的算法能力已應(yīng)用在內(nèi)外多個業(yè)務(wù)中,對內(nèi)廣泛支撐了騰訊內(nèi)部如微信,QQ中的身份識別需求,對外則通過騰訊云服務(wù)的形式,提供了ToC、ToB的相關(guān)能力,典型應(yīng)用案例如跨年齡尋人、人臉核身、刷臉支付等。現(xiàn)在,TFace已在GitHub(https://github.com/Tencent/TFace)上正式開源。