在國(guó)內(nèi),進(jìn)入高鐵站、在機(jī)場(chǎng)過安檢、入住賓館或到單位簽到時(shí)使用人臉識(shí)別系統(tǒng)已是很普遍的事了。但奇怪的是,近來國(guó)外媒體時(shí)有人臉識(shí)別系統(tǒng)患上“臉盲癥”的報(bào)道。近日,英國(guó)大都會(huì)警察局被曝其部署的人臉識(shí)別系統(tǒng)準(zhǔn)確率僅達(dá)到2%。而美國(guó)民權(quán)組織在使用亞馬遜面部識(shí)別系統(tǒng)時(shí),掃描所有535位美國(guó)國(guó)會(huì)議員的面部照片,結(jié)果其中28人竟被識(shí)別成了罪犯。如此誤差引起了人們的質(zhì)疑,以及對(duì)警方使用該系統(tǒng)的擔(dān)憂。
人臉識(shí)別是AI技術(shù)發(fā)展較快、應(yīng)用較多的一個(gè)領(lǐng)域,國(guó)內(nèi)警方的人臉識(shí)別系統(tǒng)屢屢精準(zhǔn)識(shí)別逃犯,國(guó)外警方的人臉識(shí)別準(zhǔn)確率為何如此之低?究竟是評(píng)價(jià)標(biāo)準(zhǔn)不同,還是技術(shù)上真有差別?
對(duì)于中外人臉識(shí)別效果的巨大差異,航天科工智慧產(chǎn)業(yè)發(fā)展有限公司系統(tǒng)總體部專家何東昌在接受科技日?qǐng)?bào)記者采訪時(shí)解釋,首先是國(guó)外的國(guó)情問題。“有些國(guó)家認(rèn)為,人臉識(shí)別存在隱私問題,甚至對(duì)視頻監(jiān)控技術(shù)的應(yīng)用都有一定限制?!崩缭谟?guó),面部識(shí)別和追蹤技術(shù)就曾引發(fā)巨大爭(zhēng)議,英國(guó)各界甚至發(fā)起一項(xiàng)“請(qǐng)警方停止用攝像頭進(jìn)行面部識(shí)別”的抗議活動(dòng)。類似情況在美國(guó)也有發(fā)生,如亞馬遜公司利用云計(jì)算平臺(tái)、人工智能技術(shù)幫助警方使用人臉識(shí)別技術(shù),美國(guó)公民自由聯(lián)盟對(duì)此提出了抗議。
“國(guó)內(nèi)人臉識(shí)別應(yīng)用已相當(dāng)廣泛,并積累了相當(dāng)多的實(shí)戰(zhàn)經(jīng)驗(yàn),在人臉圖像采集、預(yù)處理以及特征選取等方面的工程優(yōu)化也做得很好?!焙螙|昌說,除國(guó)情外,在國(guó)際上我國(guó)的人臉識(shí)別技術(shù)確實(shí)發(fā)展比較快。
美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院組織的人臉識(shí)別算法測(cè)試FRVT 2018結(jié)果顯示,我國(guó)公司再度摘得桂冠。該測(cè)試以評(píng)測(cè)標(biāo)準(zhǔn)的嚴(yán)謹(jǐn)性、一致性和全面性著稱。在測(cè)試中,我國(guó)的人臉識(shí)別算法在千萬分之一的誤報(bào)下達(dá)到識(shí)別準(zhǔn)確率95.5%,成為當(dāng)時(shí)全球業(yè)界在此項(xiàng)指標(biāo)下的最好水平。
清華大學(xué)媒體大數(shù)據(jù)認(rèn)知計(jì)算研究中心主任王生進(jìn)教授說,當(dāng)前人臉識(shí)別有三種應(yīng)用模式:1∶1人臉識(shí)別、1∶N人臉識(shí)別、M∶N動(dòng)態(tài)布控。
1∶1識(shí)別的本質(zhì)是計(jì)算機(jī)對(duì)當(dāng)前人臉與人像數(shù)據(jù)庫進(jìn)行快速人臉比對(duì),并得出是否匹配的過程,“刷臉”登機(jī)、驗(yàn)票、支付都屬此類;1∶N是在海量的人像數(shù)據(jù)庫中找出當(dāng)前用戶的人臉數(shù)據(jù)并進(jìn)行匹配,即從N個(gè)人臉中找出1個(gè)目標(biāo);M∶N是通過計(jì)算機(jī)對(duì)場(chǎng)景內(nèi)所有人進(jìn)行面部識(shí)別,并與人像數(shù)據(jù)庫進(jìn)行動(dòng)態(tài)人臉比對(duì),能應(yīng)用于黑名單監(jiān)控、VIP客戶管理系統(tǒng)、校園人臉識(shí)別系統(tǒng)等多種場(chǎng)景。
“英國(guó)警局出現(xiàn)的情況,也未必是識(shí)別準(zhǔn)確率低??赡苁窃谔囟ōh(huán)境下,采集的圖片不夠理想,或是M∶N的人臉識(shí)別,為達(dá)到更高的檢出率和檢測(cè)速度,在一定程度上犧牲了準(zhǔn)確度?!焙螙|昌說。
在信息即價(jià)值的時(shí)代,個(gè)人隱私信息的商業(yè)價(jià)值日益凸顯。在人臉識(shí)別技術(shù)火爆的同時(shí),社會(huì)上出現(xiàn)了是否會(huì)侵犯隱私,人臉是否能被“假冒”的擔(dān)憂和質(zhì)疑。對(duì)此,何東昌認(rèn)為,目前國(guó)內(nèi),從消費(fèi)電子領(lǐng)域到安保、網(wǎng)絡(luò)支付、金融等領(lǐng)域都在逐步引入人臉識(shí)別,但新技術(shù)有“雙刃劍”屬性,應(yīng)防范其中潛藏的安全隱患。
特別是在“刷臉”過程中,用戶的姓名、性別、年齡、職業(yè),甚至用戶在不同情境狀態(tài)下的情緒等大量信息都被采集并儲(chǔ)存。這些信息如果得不到妥善保管而被泄露,用戶個(gè)人隱私就處在“裸奔”狀態(tài)?!耙虼?面對(duì)刷臉產(chǎn)生的個(gè)人隱私問題,我們必須多角度共同保護(hù)。目前在人臉識(shí)別技術(shù)領(lǐng)域,我國(guó)尚無相應(yīng)的安全監(jiān)管機(jī)制,應(yīng)及早未雨綢繆,預(yù)先防范?!焙螙|昌說。
微軟總裁兼首席法務(wù)官布拉德·史密斯也在其博文中表示:“考慮到這項(xiàng)技術(shù)被濫用的可能性和廣泛的社會(huì)影響,政府在人臉識(shí)別方面的立法似乎顯得尤為重要?!?
“看好我們的臉”,公民應(yīng)多一些戒備與防范意識(shí),企業(yè)多一些技術(shù)層面的保障措施,監(jiān)管也須及時(shí)跟進(jìn)。業(yè)內(nèi)人士也建議,政府應(yīng)從管理者角度,通過立法方式強(qiáng)化面部識(shí)別領(lǐng)域的監(jiān)管力度,保障公民個(gè)人信息安全;相關(guān)行業(yè)、企業(yè)應(yīng)提升應(yīng)用軟件等載體及儲(chǔ)存設(shè)備的安全技術(shù)水平,提升網(wǎng)絡(luò)安全意識(shí),避免公民隱私信息泄露或遭非法轉(zhuǎn)賣;非必要的隱私數(shù)據(jù)不應(yīng)采集。當(dāng)前,人臉識(shí)別技術(shù)的開發(fā)仍有巨大拓展空間,國(guó)家有必要在數(shù)據(jù)共享和開放上加大引導(dǎo)力度,促進(jìn)技術(shù)發(fā)展。另一方面,人臉識(shí)別技術(shù)在逐漸走向成熟,應(yīng)用將越來越多,識(shí)別技術(shù)的各類標(biāo)準(zhǔn),特別是保護(hù)公民隱私的標(biāo)準(zhǔn)應(yīng)盡快出臺(tái);相關(guān)行業(yè)及企業(yè)需擔(dān)負(fù)起社會(huì)責(zé)任,主動(dòng)積極地規(guī)范行業(yè)標(biāo)準(zhǔn),自覺維護(hù)采集、儲(chǔ)存的公民隱私數(shù)據(jù)安全等。
目前,國(guó)內(nèi)外人臉識(shí)別技術(shù)發(fā)展速度加快,技術(shù)路徑也比較多。何東昌介紹說,主流的人臉識(shí)別技術(shù)基本上可歸結(jié)為五類。
其中,基于模板匹配方法是將待處理的人臉圖像直接與數(shù)據(jù)庫中所有模板進(jìn)行匹配,選取匹配最相似的模板圖像作為待處理圖像的分類。不過,由于數(shù)據(jù)庫中每個(gè)人的模板圖片數(shù)量有限,不可能涵蓋現(xiàn)實(shí)中所有的復(fù)雜情況,簡(jiǎn)單的模板匹配只利用了相關(guān)信息,對(duì)背景、光照、表情等非相關(guān)信息非常敏感。因此,該方法只適用于理想條件下的人臉識(shí)別,并不適合應(yīng)用于實(shí)際場(chǎng)景。
基于幾何特征的方法,即人的面部有形狀和大小都不相同的部件,如鼻子和嘴巴等。通過對(duì)這些部件形狀的對(duì)比、部件間位置的檢測(cè),從而實(shí)現(xiàn)人臉識(shí)別。與基于模板匹配方法相似,形狀、距離等信息并不能表達(dá)出圖像中的姿態(tài)、表情等非線性因素,導(dǎo)致該方法的可靠性和有效性較低。
基于人工神經(jīng)網(wǎng)絡(luò)的方法直接使用圖像像素點(diǎn)作為神經(jīng)網(wǎng)絡(luò)的輸入,通過模擬人腦神經(jīng)元工作機(jī)制,可學(xué)習(xí)到其他方法難以實(shí)現(xiàn)的隱性人臉特征表示。而且神經(jīng)網(wǎng)絡(luò)擁有非線性激活函數(shù),使得網(wǎng)絡(luò)對(duì)人臉圖像中的非線性因素和關(guān)系有一定的表達(dá)能力。
基于稀疏表示的人臉識(shí)別方法中,稀疏表示用的“字典”直接由訓(xùn)練所用的全部圖像構(gòu)成,無需經(jīng)字典學(xué)習(xí)。
最后一種是基于深度學(xué)習(xí)的人臉識(shí)別方法。其核心內(nèi)容是逐層訓(xùn)練的網(wǎng)絡(luò)結(jié)構(gòu),每層使用的是自編碼神經(jīng)網(wǎng)絡(luò),自編碼神經(jīng)網(wǎng)絡(luò)主要包括對(duì)數(shù)據(jù)編碼和解碼兩部分內(nèi)容。通過編碼、解碼實(shí)現(xiàn)對(duì)輸入數(shù)據(jù)的無監(jiān)督學(xué)習(xí),辨識(shí)能力隨數(shù)據(jù)增長(zhǎng)逐步提高。