百度百科對自動化專業(yè)做出了這樣的介紹:
該專業(yè)是以自動控制理論為主要理論基礎(chǔ),以電子技術(shù)、計算機信息技術(shù)、傳感器與檢測技術(shù)等為主要技術(shù)手段,對各種自動化裝置和系統(tǒng)實施控制,是計算機硬件與軟件結(jié)合、機械與電子結(jié)合、元件與系統(tǒng)結(jié)合、運行與制造結(jié)合,集控制科學、計算機技術(shù)、電子技術(shù)、機械工程為一體的綜合性學科專業(yè)。
綜合性學科!是的!
作為自動化專業(yè)出身的我,實際接受的本科教育與研究生教育也恰恰驗證了這一點,這是一個大融合、大雜燴的專業(yè)。
這樣就容易造成什么了解,而又是什么都不太精通的尷尬局面。
從電子角度來看,數(shù)電、模電、電路等基礎(chǔ)的電子技術(shù)不必多說,從最基礎(chǔ)的8位51單片機和16位Freescale單片機的學習開始,到工業(yè)PLC,再到嵌入式系統(tǒng)級別的電子芯片ARM等等,最后還要接觸純硬件設(shè)計的FPGA。為了應(yīng)用這些電子芯片,就需要學習高級算、高等數(shù)學、最優(yōu)控制等等。
總之一系列學習下來,回想到得意之作,自己心里也在犯嘀咕,所有曾經(jīng)做過的東西都是入門級別的實驗,哪兒能稱的上“得意”二字。后來仔細想想,也許“得意”對我來說,就是每次接觸新器件、新技術(shù)的好奇感和新鮮感,以及利用這些器件完成一個電子作品而產(chǎn)生的自豪感。
猶記得第一次接觸Zynq時,對其擁有“ARM+FPGA”硬件結(jié)構(gòu)的那種驚奇,而后用此完成了一些設(shè)計;猶記得第一次使用GPU通過軟件并行的方式完成算法加速。
我的得意之作
本次帶來的“得意”之作就是利用英偉達首款嵌入式GPU加速套件Jetson Tk1做出作品--人臉跟蹤輪式機器人(小車)的設(shè)計。
對于人臉識別,國內(nèi)目前的研究大多數(shù)采用CPU方案。雖然2010年開始,國內(nèi)一些研究者也開始使用GPU進行人臉識別加速,比如有人采用AMD的GPU進行開發(fā),但開發(fā)過程比較復(fù)雜,且受限于顯卡的性能,其相對于CPU的人臉識別速度提升有限,且大部分是在PC端實現(xiàn)的,PC端是存在弊端的。
方案選擇也是艱難的
我們的設(shè)計采用嵌入式系統(tǒng)設(shè)計,而針對嵌入式系統(tǒng)計算性能有限的現(xiàn)狀,故采用NVIDIA公司最新推出的Jetson TK1嵌入式開發(fā)套件,其最大的特點是嵌入一顆NVIDIA Tegra K1的GPU,性能強大直逼桌面端GPU,且其采用NVIDIA CUDA平臺進行開發(fā),充分運用GPU的并行運行的特性,能大大提升算法運算性能。
不僅如此,其還嵌入一顆四核心的ARM Cortex –A15處理器,以及2GB的運行內(nèi)存,能夠很好運行Linux系統(tǒng),這樣能充分發(fā)揮GPU在嵌入式應(yīng)用的威力,大大提升人臉識別速度,并可迅速作出響應(yīng)。
由于此開發(fā)套件只是一個小型的開發(fā)板,攜帶便利,應(yīng)用場合更加靈活,故我們在人臉檢測的基礎(chǔ)上做出一個小車,用以時時刻刻對人臉進行跟蹤。本次開發(fā)在Linux操作系統(tǒng)的層面完成整個臉部識別的控制過程,設(shè)計的主要內(nèi)容如圖1所示。
圖1 課題主要研究內(nèi)容框圖
包括:嵌入式軟硬件平臺和外設(shè)硬件如攝像頭和輪式機器人的搭建,選用并行性高的算法,通過開源函數(shù)庫來完成人臉識別的算法描述,利用CUDA開發(fā)工具對GPU進行開發(fā),實現(xiàn)算法的并行運算以提升人臉識別的速度,最終將人臉識別的結(jié)果信號反饋給輪式機器人,驅(qū)動輪式機器人的移動對人臉進行跟蹤。為了實時查看臉部檢測的結(jié)果,本作品還需將攝像頭返回的圖像利用WIFI無線傳輸?shù)诫娔X上。
人臉識別主要由人臉圖像采集及檢測、人臉圖像特征提取以及匹配與識別這幾部分組成。
首先是人臉檢測,人臉檢測算法的可靠性很大程度上依賴于分類器的設(shè)計,本系統(tǒng)的人臉檢測部分嘗試了三種不同方法:
第一種,在OpenCV 中有直接能拿來用的Haar 分類器,該方法對于被遮擋了部分的人臉是基本檢測不出來的,在TK1 上的運行速度大概每秒8 幀左右;
第二種,在OpenCV 2.X 以上擴充的基于LBP 特征的人臉檢測器,與Haar 特征相比,LBP 是整數(shù)特征,因此訓練和檢測過程都會比Haar 特征快幾倍。在TK1 上的運行速度能達到每秒20 幀左右,但是檢測準確率LBP 比Haar 效果要差;
第三種,Dlib 庫的人臉檢測算法使用的hog 特征與級聯(lián)分類器,Dlib 自帶人臉檢測器準確度非常高,即使受到硬件條件限制,攝像頭拍到比較模糊的畫面,在這種情況下其他一些人臉庫檢測率都非常低,而Dlib的效果卻能出乎意料,美中不足的是,速度比較慢。
人臉特征提取是根據(jù)已知人臉數(shù)據(jù)庫中的人臉表征方法,提取出該人臉圖像的特征值,對人臉特征進行建模,將人臉圖像映射到特征空間的過程。
人臉特征提取的方法很多,可以分為兩大類:一種是基于知識的表征方法,例如:幾何特征、固定特征模板等;另外一種是基于代數(shù)特征或統(tǒng)計學習的表征方法,例如:代數(shù)特征、特征臉等。
在Linux平臺,可以利用Dlib機器學習庫進行人臉特征提取部分。人臉圖像匹配與識別就是將提取的人臉圖像的特征值與數(shù)據(jù)庫中存儲的特征模板進行搜索比較,當兩者相似度超過某一閾值,則認為成功匹配,把匹配得到的結(jié)果輸出。