來(lái)源:2018 中國(guó)圖靈大會(huì)
演講人:朱瓏(依圖科技聯(lián)合創(chuàng)始人、CEO)
【新智元導(dǎo)讀】主題為“引領(lǐng)人工智能,創(chuàng)造無(wú)限可能”的2018年中國(guó)圖靈大會(huì)5月19日在上海召開(kāi),于1966年由國(guó)際計(jì)算機(jī)協(xié)會(huì)(ACM)設(shè)立的“圖靈獎(jiǎng)”,當(dāng)之無(wú)愧是計(jì)算機(jī)界最負(fù)盛名、最崇高的獎(jiǎng)項(xiàng),因而有“計(jì)算機(jī)界的諾貝爾獎(jiǎng)”之稱(chēng)。今年的中國(guó)圖靈大會(huì),更是匯聚了學(xué)界、業(yè)界的“最強(qiáng)大腦”,嘉賓陣容可謂豪華。在5月19日的論壇上,依圖CEO朱瓏博士給大家?guī)?lái)了一場(chǎng)深刻而又發(fā)人深省的關(guān)于AI時(shí)代的演講。
在美國(guó)學(xué)習(xí)工作了十年之后,2012年的朱瓏回國(guó)創(chuàng)立依圖,也成為這一代AI創(chuàng)業(yè)的典型代表。他的履歷上來(lái)看有幾段重要的經(jīng)歷,第一段是在UCLA的博士時(shí)期做統(tǒng)計(jì)建模和統(tǒng)計(jì)學(xué)計(jì)算,師從艾倫·尤爾,艾倫的博士導(dǎo)師正是著名的理論物理學(xué)家霍金;然后在MIT的AI Lab做計(jì)算機(jī)視覺(jué)建模相關(guān)領(lǐng)域的博士后研究員;最后一段則是回國(guó)前,在深度學(xué)習(xí)爆發(fā)之前的NYU的Yann Lecun實(shí)驗(yàn)室做研究員。
在2012年之前,很少有人會(huì)說(shuō)自己是做AI的,只會(huì)說(shuō)做統(tǒng)計(jì)建模、統(tǒng)計(jì)學(xué)習(xí)這些具體的方向。但從2016年AlphaGo登上《自然》雜志,到美國(guó)著名的《經(jīng)濟(jì)學(xué)人》雜志多期報(bào)道,AI頻繁登上世界最著名的雜志成為封面主題,如今已經(jīng)進(jìn)入了一個(gè)言必稱(chēng)AI的時(shí)代。與AI相關(guān)的各種言論,關(guān)于機(jī)器學(xué)習(xí)、圖像識(shí)別、無(wú)人車(chē)、健康醫(yī)藥等等都逐步成為熱點(diǎn)。而朱瓏一直關(guān)注的是未來(lái)到底AI能發(fā)生一些什么?
沒(méi)有權(quán)威的時(shí)代讓AI正變得真假難辨
在朱瓏的演講中,他提到目前AI跟過(guò)去比較重大的區(qū)別:因?yàn)锳I發(fā)展太快,現(xiàn)在技術(shù)處于一個(gè)很難辨別真假、好壞的時(shí)代。以深度學(xué)習(xí)為代表新的AI技術(shù),因?yàn)檫^(guò)去參與的人和實(shí)踐不多,全球性研究的大規(guī)模以及長(zhǎng)時(shí)間的積累并不夠。因?yàn)樘盁帷?使得各方都熱衷參與到AI的討論,交流甚至宣傳當(dāng)中,AI的觀點(diǎn)就變得非常多,這客觀上使得很多專(zhuān)家真正有見(jiàn)地的意見(jiàn)和其他的言論很難區(qū)分開(kāi)來(lái),這不僅是中國(guó),在美國(guó)也是同樣。
另外一個(gè)則是:技術(shù)到了一個(gè)沒(méi)有權(quán)威的時(shí)代。過(guò)去不管是從計(jì)算機(jī)視覺(jué),還是整個(gè)人工智能領(lǐng)域,最好的實(shí)驗(yàn)室?guī)缀跄軌驂艛囝A(yù)測(cè)全球百分之七八十的進(jìn)展,但是現(xiàn)在AI無(wú)論是在美國(guó),還是在中國(guó)或歐洲,大家的發(fā)展是比較跳躍性的,在一兩個(gè)實(shí)驗(yàn)室非常難預(yù)測(cè)主流到底在關(guān)注什么。這是整個(gè)時(shí)代的特點(diǎn)。
朱瓏的背景是跨越學(xué)術(shù)界和工業(yè)界的創(chuàng)業(yè)典型,經(jīng)歷了中國(guó)2012年到2018年這五、 六年非常特殊的階段,正如他在演講中提到的,過(guò)去中國(guó)沒(méi)有成熟的科技創(chuàng)業(yè)的情景和市場(chǎng)機(jī)制。過(guò)去,政府、投資者、媒體這三者可以頻繁交流,在2012年之前,學(xué)術(shù)界不像今天這樣經(jīng)常會(huì)被政府或一流基金邀請(qǐng)交流。美國(guó)則因?yàn)槭袌?chǎng)成熟,這些人經(jīng)常會(huì)在一起交流,甚至都是朋友。中國(guó)這幾年開(kāi)始,各種背景的人在一起交流的越來(lái)越多,這是新的形態(tài)。
技術(shù)突破打開(kāi)了工業(yè)界應(yīng)用的突破
技術(shù)上,2015年,機(jī)器識(shí)別人臉的水平正式超過(guò)人類(lèi)。人臉識(shí)別中機(jī)器比人強(qiáng),最簡(jiǎn)單基礎(chǔ)應(yīng)用就是1:1的比對(duì),證明你就是你,大家熟知的是2017年iPhone推出的刷臉開(kāi)機(jī);其次是1:N,是通過(guò)任一設(shè)備里捕捉到的人臉,從一個(gè)省(億級(jí))或一個(gè)國(guó)家的人像庫(kù)(十億級(jí))里來(lái)回答你是誰(shuí),這對(duì)識(shí)別性能的要求提升了一個(gè)量級(jí),是千倍萬(wàn)倍地增長(zhǎng)。這意味著識(shí)別技術(shù)的突破,打開(kāi)了工業(yè)界中的產(chǎn)品的突破。
2012年之前,可以認(rèn)為人臉識(shí)別技術(shù)幾乎沒(méi)有什么發(fā)展,2017年人臉識(shí)別最高水平可識(shí)別規(guī)模在20億人,大概比2016年可識(shí)別千萬(wàn)提高兩百倍,比2015年提高了數(shù)萬(wàn)倍。那未來(lái)的發(fā)展到底是什么樣?會(huì)不會(huì)再10倍、100倍甚至萬(wàn)倍地發(fā)展?
大家現(xiàn)在也有個(gè)討論,技術(shù)是不是發(fā)展到了瓶頸?各項(xiàng)算法之間有沒(méi)有區(qū)別?隨著AI熱潮的涌現(xiàn),各家AI公司都會(huì)頻繁參加一些業(yè)界的比賽以證明自己的算法實(shí)力,以人臉識(shí)別算法為例,可以看到各AI公司在LFW等類(lèi)似的計(jì)算機(jī)視覺(jué)比賽中都取得99.xx%的成績(jī)。于是人們會(huì)問(wèn):AI算法是否已經(jīng)趨同了?如果算法精度差別不大(只有幾個(gè)百分點(diǎn)),是否意味著創(chuàng)業(yè)公司的技術(shù)已經(jīng)同質(zhì)化了,沒(méi)有技術(shù)創(chuàng)業(yè)的核心競(jìng)爭(zhēng)力了呢?
但實(shí)際上,這是典型的認(rèn)知誤區(qū)。我們?cè)谥飙嚨难葜v中看到了一張表,可能更準(zhǔn)確的回答了這個(gè)問(wèn)題,這是中國(guó)某省1億人像庫(kù)的情況下,真實(shí)的刑偵案件的破案環(huán)境的性能測(cè)試對(duì)比的表,參與方是知名的幾大人臉識(shí)別公司:
我們可以這樣理解這張圖:必須對(duì)應(yīng)場(chǎng)景來(lái)談算法精度。不同場(chǎng)景的算法精度不具備任何可比性,甚至不代表有相關(guān)性。換句話(huà)說(shuō)在簡(jiǎn)單場(chǎng)景下算法精度高,不代表在復(fù)雜的高難度場(chǎng)景下有更大的概率可以把算法精度做高,就比如在小學(xué)生的考試中拿滿(mǎn)分,不見(jiàn)得可以在大學(xué)的考試中也拿滿(mǎn)分。因?yàn)楹芏鄬W(xué)術(shù)界的比賽使用的都是公開(kāi)數(shù)據(jù)集,數(shù)據(jù)集內(nèi)多是互聯(lián)網(wǎng)照片,類(lèi)似于難度小的開(kāi)卷考試,大家很容易把測(cè)試成績(jī)刷到比較高。但在實(shí)際的應(yīng)用中則會(huì)遇到各種高難度場(chǎng)景,包括變形、昏暗、逆光、強(qiáng)光、光照不均、低清、運(yùn)動(dòng)模糊、遮擋、跨年齡段比對(duì)等,在這種情況下各家的差距迅速拉開(kāi)了,第二名和第一名的錯(cuò)誤率都會(huì)相差幾倍以上,遠(yuǎn)未到趨同的程度。
第二,這些實(shí)戰(zhàn)中的技術(shù)差距體現(xiàn)在具體產(chǎn)品或應(yīng)用上,不是簡(jiǎn)單的好用和一般好用的差距,而是可用和不可用的差距。實(shí)戰(zhàn)中是要以最高效率解決實(shí)際問(wèn)題為目的的。在一個(gè)1億級(jí)別人像系統(tǒng)中進(jìn)行1:N的靜態(tài)比對(duì)時(shí),錯(cuò)誤率相差幾倍,就導(dǎo)致使用者做事效率下降幾倍,那么自然而然,即使他使用的是一個(gè)多算法平臺(tái),他也只會(huì)傾向于使用第一名的算法。
AI幫助探索人類(lèi)智慧的邊界
AI除了在產(chǎn)業(yè)界的實(shí)際應(yīng)用外,更能夠幫助我們理解人類(lèi)的智慧、人類(lèi)智慧的邊界。
我們以前是沒(méi)辦法了解人類(lèi)自己識(shí)別能力的規(guī)模和精度,到底是什么程度?過(guò)去沒(méi)法做這個(gè)科學(xué)實(shí)驗(yàn),1萬(wàn)人還是10萬(wàn)人你辨別不出來(lái)。而機(jī)器在大規(guī)模的情況下,很輕易地識(shí)別1億人、10億人,甚至更多的時(shí)候,機(jī)器識(shí)別就相當(dāng)于提供了一把尺子,根據(jù)相似度比例篩選出來(lái)給人去測(cè),可以在有效的時(shí)間里面,測(cè)出一個(gè)人自己“看”這個(gè)世界的能力。
這是人類(lèi)第一次有一個(gè)非常穩(wěn)定且強(qiáng)大的機(jī)器,有識(shí)別能力看到人和機(jī)器智能差別到什么程度。依圖曾做過(guò)一個(gè)實(shí)驗(yàn),在幾千萬(wàn)量級(jí)的身份數(shù)據(jù)庫(kù)上,一個(gè)人把他女朋友生活照輸入進(jìn)去,在機(jī)器輸出相似度前十的照片中,他是非常難辨別哪張是他的女朋友。過(guò)去機(jī)器認(rèn)識(shí)生人的能力比人強(qiáng),但是今天機(jī)器識(shí)別熟人臉的能力也超越人了。
今天機(jī)器是有了高性能的,比人類(lèi)大很多倍的這種識(shí)別能力,能夠幫助我們回答這些更有趣的問(wèn)題:在13億中國(guó)人中有多少人跟你長(zhǎng)的一模一樣?一模一樣我們可以先定義為自己的媽媽辨別不出來(lái)誰(shuí)是誰(shuí)。經(jīng)過(guò)依圖的實(shí)驗(yàn),結(jié)果是,每1億人當(dāng)中有一個(gè)人跟你長(zhǎng)的一樣,所以全中國(guó)差不多12個(gè)人跟你長(zhǎng)的一模一樣的。
這個(gè)意味著什么? 1億人當(dāng)中有一個(gè)人跟你長(zhǎng)的像,這又意味著什么?
人類(lèi)進(jìn)化過(guò)程中,視覺(jué)識(shí)別能力在各大感官中的比重越來(lái)越大,也可能是人類(lèi)穿衣服,嗅覺(jué)識(shí)別家庭成員的能力在哺乳動(dòng)物中比較低下,主要是看人臉來(lái)辨別同類(lèi)。選擇壓力驅(qū)使人類(lèi)的臉之間的區(qū)分度需要盡量的大,這樣保證家庭成員的穩(wěn)定性得到保障。
而人作為社群動(dòng)物,需要和大量同類(lèi)打交道,臉部識(shí)別錯(cuò)誤的代價(jià)是失去整個(gè)基因組的遺傳繼承。對(duì)應(yīng)的編碼人臉形狀的基因數(shù)量需要很大,目前知道有一條染色體的一大塊用于編碼臉部特征。一億分之一的識(shí)別度是一個(gè)具有巨大社會(huì)學(xué)意義的統(tǒng)計(jì)數(shù)值,背后更多的生物學(xué)意義需要更近一步探討。與之對(duì)應(yīng)的一個(gè)未經(jīng)實(shí)驗(yàn)證實(shí)的觀察是,動(dòng)物的臉部特征區(qū)分度不像人類(lèi)這么大。比如貓和狗,光看臉,我們很不容易區(qū)分出來(lái)。
臉部信息對(duì)于身份的確認(rèn)是非常重要的,人類(lèi)如果不具備辨別能力,出門(mén)回來(lái)之后你認(rèn)不出你的小孩、老婆,就會(huì)出現(xiàn)社會(huì)的騷亂,所以說(shuō)人臉識(shí)別對(duì)基因的進(jìn)化有非常巨大的影響。
---------------
1950年圖靈發(fā)表《計(jì)算機(jī)器與智能》,提出著名的“圖靈測(cè)試”,成為人工智能的思想起源,而在2018年的圖靈大會(huì)中,依圖朱瓏博士的演講也給我們打開(kāi)了認(rèn)知人工智能現(xiàn)狀和未來(lái)的一扇窗戶(hù),在嘈雜的言論中給我們更多的啟發(fā)和思考。期待聽(tīng)到更多這樣的演講。
來(lái)源:新智元