實驗室研究人臉技術(shù)多年,不僅在技術(shù)方面有很好的積累,而且在公司內(nèi)外的業(yè)務(wù)中有眾多應(yīng)用。在與產(chǎn)品、商務(wù)、工程開發(fā)同事交流過程中發(fā)現(xiàn):不管是“從圖中找到人臉的位置”,或是“識別出這個人臉對應(yīng)的身份”,亦或是其他,大家都會把這些不同的人臉技術(shù)統(tǒng)稱為“
人臉識別技術(shù)”。
因此,整理了一些常見人臉技術(shù)的基本概念,主要用于幫助非基礎(chǔ)研究同事對人臉相關(guān)技術(shù)有一個更深入的了解,方便后續(xù)的交流與合作。
人臉技術(shù)基本概念介紹
1. 人臉檢測
“人臉檢測(Face Detection)”是檢測出圖像中人臉?biāo)谖恢玫囊豁椉夹g(shù)。
人臉檢測算法的輸入是一張圖片,輸出是人臉框坐標(biāo)序列(0個人臉框或1個人臉框或多個人臉框)。一般情況下,輸出的人臉坐標(biāo)框為一個正朝上的正方形,但也有一些人臉檢測技術(shù)輸出的是正朝上的矩形,或者是帶旋轉(zhuǎn)方向的矩形。
常見的人臉檢測算法基本是一個“掃描”加“判別”的過程,即算法在圖像范圍內(nèi)掃描,再逐個判定候選區(qū)域是否是人臉的過程。因此人臉檢測算法的計算速度會跟圖像尺寸、圖像內(nèi)容相關(guān)。開發(fā)過程中,我們可以通過設(shè)置“輸入圖像尺寸”、或“最小臉尺寸限制”、或“人臉數(shù)量上限”的方式來加速算法。
人臉檢測結(jié)果舉例(綠色框為人臉檢測結(jié)果)
2. 人臉配準(zhǔn)
“人臉配準(zhǔn)(Face Alignment)”是定位出人臉上五官關(guān)鍵點坐標(biāo)的一項技術(shù)。
人臉配準(zhǔn)算法的輸入是“一張人臉圖片”加“人臉坐標(biāo)框”,輸出五官關(guān)鍵點的坐標(biāo)序列。五官關(guān)鍵點的數(shù)量是預(yù)先設(shè)定好的一個固定數(shù)值,可以根據(jù)不同的語義來定義(常見的有5點、68點、90點等等)。
當(dāng)前效果的較好的一些人臉配準(zhǔn)技術(shù),基本通過深度學(xué)習(xí)框架實現(xiàn),這些方法都是基于人臉檢測的坐標(biāo)框,按某種事先設(shè)定規(guī)則將人臉區(qū)域扣取出來,縮放的固定尺寸,然后進(jìn)行關(guān)鍵點位置的計算。因此,若不計入圖像縮放過程的耗時,人臉配準(zhǔn)算法是可以計算量固定的過程。另外,相對于人臉檢測,或者是后面將提到的人臉提特征過程,人臉配準(zhǔn)算法的計算耗時都要少很多。
人臉配準(zhǔn)結(jié)果舉例(右圖中的綠色點位人臉配準(zhǔn)結(jié)果)
3. 人臉屬性識別
“人臉屬性識別(Face Attribute)”是識別出人臉的性別、年齡、姿態(tài)、表情等屬性值的一項技術(shù)。
一般的人臉屬性識別算法的輸入是“一張人臉圖”和“人臉五官關(guān)鍵點坐標(biāo)”,輸出是人臉相應(yīng)的屬性值。人臉屬性識別算法一般會根據(jù)人臉五官關(guān)鍵點坐標(biāo)將人臉對齊(旋轉(zhuǎn)、縮放、扣取等操作后,將人臉調(diào)整到預(yù)定的大小和形態(tài)),然后進(jìn)行屬性分析。
常規(guī)的人臉屬性識別算法識別每一個人臉屬性時都是一個獨立的過程,即人臉屬性識別只是對一類算法的統(tǒng)稱,性別識別、年齡估計、姿態(tài)估計、表情識別都是相互獨立的算法。但最新的一些基于深度學(xué)習(xí)的人臉屬性識別也具有一個算法同時輸入性別、年齡、姿態(tài)等屬性值的能力。
人臉屬性識別過程(最右側(cè)文字為屬性識別結(jié)果)
4. 人臉提特征
“人臉提特征(Face Feature Extraction)”是將一張人臉圖像轉(zhuǎn)化為一串固定長度的數(shù)值的過程。這個數(shù)值串被稱為“人臉特征(Face Feature)”,具有表征這個人臉特點的能力。
人臉提特征過程的輸入也是 “一張人臉圖”和“人臉五官關(guān)鍵點坐標(biāo)”,輸出是人臉相應(yīng)的一個數(shù)值串(特征)。人臉提特征算法都會根據(jù)人臉五官關(guān)鍵點坐標(biāo)將人臉對齊預(yù)定模式,然后計算特征。
近幾年來,深度學(xué)習(xí)方法基本統(tǒng)治了人臉提特征算法,這些算法都是固定時長的算法。早前的人臉提特征模型都較大,速度慢,僅使用于后臺服務(wù)。但最新的一些研究,可以在基本保證算法效果的前提下,將模型大小和運算速度優(yōu)化到移動端可用的狀態(tài)。
人臉提特征過程(最右側(cè)數(shù)值串為“人臉特征”)
5. 人臉比對(人臉驗證、
人臉識別、人臉檢索、人臉聚類)
“人臉比對(Face Compare)”是衡量兩個人臉之間相似度的算法
人臉比對算法的輸入是兩個人臉特征(注:人臉特征由前面的人臉提特征算法獲得),輸出是兩個特征之間的相似度。人臉驗證、人臉識別、人臉檢索都是在人臉比對的基礎(chǔ)上加一些策略來實現(xiàn)。相對人臉提特征過程,單次的人臉比對耗時極短,幾乎可以忽略。
基于人臉比對可衍生出人臉驗證(Face Verification)、人臉識別(Face Recognition)、人臉檢索(Face Retrieval)、人臉聚類(Face Cluster)等算法。
人臉對比過程(右側(cè)的相似度為人臉比對輸出的結(jié)果)
6. 人臉驗證
“人臉驗證(Face Verification)”是判定兩個人臉圖是否為同一人的算法。
它的輸入是兩個人臉特征,通過人臉比對獲得兩個人臉特征的相似度,通過與預(yù)設(shè)的閾值比較來驗證這兩個人臉特征是否屬于同一人(即相似度大于閾值,為同一人;小于閾值為不同)。
人臉驗證過程說明(最右側(cè)“是同一人”為人臉驗證的輸出)
7. 人臉識別
“人臉識別(Face Recognition)”是識別出輸入人臉圖對應(yīng)身份的算法。
它的輸入一個人臉特征,通過和注冊在庫中N個身份對應(yīng)的特征進(jìn)行逐個比對,找出“一個”與輸入特征相似度最高的特征。將這個最高相似度值和預(yù)設(shè)的閾值相比較,如果大于閾值,則返回該特征對應(yīng)的身份,否則返回“不在庫中”。
人臉識別過程(右側(cè)身份“jason”為人臉識別結(jié)果)
8. 人臉檢索
“人臉檢索”是查找和輸入人臉相似的人臉序列的算法。
人臉檢索通過將輸入的人臉和一個集合中的說有人臉進(jìn)行比對,根據(jù)比對后的相似度對集合中的人臉進(jìn)行排序。根據(jù)相似度從高到低排序的人臉序列即使人臉檢索的結(jié)果。
人臉檢索過程(右側(cè)綠框內(nèi)排序序列為檢索結(jié)果)
9. 人臉聚類
“人臉聚類(Face Cluster)”是將一個集合內(nèi)的人臉根據(jù)身份進(jìn)行分組的算法。
人臉聚類也通過將集合內(nèi)所有的人臉兩兩之間做人臉比對,再根據(jù)這些相似度值進(jìn)行分析,將屬于同一個身份的人劃分到一個組里。
在沒有進(jìn)行人工身份標(biāo)注前,只知道分到一個組的人臉是屬于同一個身份,但不知道確切身份。另外假設(shè)集合中有N個人臉,那么人臉聚類的算法復(fù)雜度為O(N2)
人臉聚類過程(右側(cè)綠框內(nèi)按身份的分組結(jié)果為聚類結(jié)果)
10. 人臉活體
“人臉活體(FaceLiveness)”是判斷人臉圖像是來自真人還是來自攻擊假體(照片、視頻等)的方法。
和前面所提到的人臉技術(shù)相比,人臉活體不是一個單純算法,而是一個問題的解法。這個解法將用戶交互和算法緊密結(jié)合,不同的交互方式對應(yīng)于完全不同的算法。鑒于方法的種類過于繁多,這里只介紹“人臉活體”的概念,不再展開。