本文主要是關(guān)于機器視覺的相關(guān)介紹,并著重對機器視覺的應(yīng)用場景進行了詳盡的闡述。
機器視覺是人工智能正在快速發(fā)展的一個分支。簡單說來,機器視覺就是用機器代替人眼來做測量和判斷。機器視覺系統(tǒng)是通過機器視覺產(chǎn)品(即圖像攝取裝置,分CMOS和CCD兩種)將被攝取目標轉(zhuǎn)換成圖像信號,傳送給專用的圖像處理系統(tǒng),得到被攝目標的形態(tài)信息,根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號;圖像系統(tǒng)對這些信號進行各種運算來抽取目標的特征,進而根據(jù)判別的結(jié)果來控制現(xiàn)場的設(shè)備動作。
機器視覺是一項綜合技術(shù),包括圖像處理、機械工程技術(shù)、控制、電光源照明、光學(xué)成像、傳感器、模擬與數(shù)字視頻技術(shù)、計算機軟硬件技術(shù)(圖像增強和分析算法、圖像卡、 I/O卡等)。一個典型的機器視覺應(yīng)用系統(tǒng)包括圖像捕捉、光源系統(tǒng)、圖像數(shù)字化模塊、數(shù)字圖像處理模塊、智能判斷決策模塊和機械控制執(zhí)行模塊。 [2] 機器視覺系統(tǒng)最基本的特點就是提高生產(chǎn)的靈活性和自動化程度。在一些不適于人工作業(yè)的危險工作環(huán)境或者人工視覺難以滿足要求的場合,常用機器視覺來替代人工視覺。同時,在大批量重復(fù)性工業(yè)生產(chǎn)過程中,用機器視覺檢測方法可以大大提高生產(chǎn)的效率和自動化程度。
一個典型的工業(yè)機器視覺系統(tǒng)包括:光源、鏡頭(定焦鏡頭、變倍鏡頭、遠心鏡頭、顯微鏡頭)、 相機(包括CCD相機和COMS相機)、圖像處理單元(或圖像捕獲卡)、圖像處理軟件、監(jiān)視器、通訊 / 輸入輸出單元等。
系統(tǒng)可再分為
一、采集和分析分開的系統(tǒng)。
主端電腦(Host Computer)
影像擷取卡(Frame Grabber)與影像處理器
影像攝影機
定焦鏡頭鏡頭
顯微鏡頭
照明設(shè)備
Halogen光源LED光源
高周波螢光燈源
閃光燈源
其他特殊光源
影像顯示器
LCD
機構(gòu)及控制系統(tǒng)
PLC、PC-Base控制器
精密桌臺
伺服運動機臺
二、采集和分析一體的系統(tǒng)
智能相機(圖像采集和分析一體)
其他配套外圍設(shè)備:光源、顯示、PLC控制系統(tǒng)等等。
工作原理
機器視覺檢測系統(tǒng)采用CCD照相機將被檢測的目標轉(zhuǎn)換成圖像信號,傳送給專用的圖像處理系統(tǒng),根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號,圖像處理系統(tǒng)對這些信號進行各種運算來抽取目標的特征,如面積、數(shù)量、位置、長度,再根據(jù)預(yù)設(shè)的允許度和其他條件輸出結(jié)果,包括尺寸、角度、個數(shù)、合格 / 不合格、有 / 無等,實現(xiàn)自動識別功能。
典型結(jié)構(gòu)
一個典型的機器視覺系統(tǒng)包括以下五大塊:
照明
照明是影響機器視覺系統(tǒng)輸入的重要因素,它直接影響輸入數(shù)據(jù)的質(zhì)量和應(yīng)用效果。由于沒有通用的機器視覺照明設(shè)備,所以針對每個特定的應(yīng)用實例,要選擇相應(yīng)的照明裝置,以達到最佳效果。光源可分為可見光和不可見光。常用的幾種可見光源是白熾燈、日光燈、水銀燈和鈉光燈??梢姽獾娜秉c是光能不能保持穩(wěn)定。如何使光能在一定的程度上保持穩(wěn)定,是實用化過程中急需要解決的問題。另一方面,環(huán)境光有可能影響圖像的質(zhì)量,所以可采用加防護屏的方法來減少環(huán)境光的影響。照明系統(tǒng)按其照射方法可分為:背向照明、前向照明、結(jié)構(gòu)光和頻閃光照明等。其中,背向照明是被測物放在光源和攝像機之間,它的優(yōu)點是能獲得高對比度的圖像。前向照明是光源和攝像機位于被測物的同側(cè),這種方式便于安裝。結(jié)構(gòu)光照明是將光柵或線光源等投射到被測物上,根據(jù)它們產(chǎn)生的畸變,解調(diào)出被測物的三維信息。頻閃光照明是將高頻率的光脈沖照射到物體上,攝像機拍攝要求與光源同步。
鏡頭
FOV(Field of Vision)=所需分辨率*亞象素*相機尺寸/PRTM(零件測量公差比)
鏡頭選擇應(yīng)注意:
1焦距2目標高度 3影像高度 4放大倍數(shù) 5影像至目標的距離 6中心點 /節(jié)點7畸變
視覺檢測中如何確定鏡頭的焦距
為特定的應(yīng)用場合選擇合適的工業(yè)鏡頭時必須考慮以下因素:
· 視野 - 被成像區(qū)域的大小。
· 工作距離 (WD) - 攝像機鏡頭與被觀察物體或區(qū)域之間的距離。
· CCD - 攝像機成像傳感器裝置的尺寸。
· 這些因素必須采取一致的方式對待。如果在測量物體的寬度,則需要使用水平方向的 CCD 規(guī)格,等等。如果以英寸為單位進行測量,則以英尺進行計算,最后再轉(zhuǎn)換為毫米。
參考如下例子:有一臺 1/3” C 型安裝的 CCD 攝像機(水平方向為 4.8 毫米)。物體到鏡頭前部的距離為 12”(305 毫米)。視野或物體的尺寸為2.5”(64 毫米)。換算系數(shù)為 1” = 25.4 毫米(經(jīng)過圓整)。
FL = 4.8 毫米 x 305 毫米 / 64 毫米
FL = 1464 毫米 / 64 毫米
FL = 按 23 毫米鏡頭的要求
FL = 0.19” x 12” / 2.5”
FL = 2.28” / 2.5”
FL = 0.912” x 25.4 毫米/inch
FL = 按 23 毫米鏡頭的要求
注:勿將工作距離與物體到像的距離混淆。工作距離是從工業(yè)鏡頭前部到被觀察物體之間的距離。而物體到像的距離是 CCD 傳感器到物體之間的距離。計算要求的工業(yè)鏡頭焦距時,必須使用工作距離
高速相機
按照不同標準可分為:標準分辨率數(shù)字相機和模擬相機等
。要根據(jù)不同的實際應(yīng)用場合選不同的相機和高分辨率相機:
按成像色彩劃分,可分為彩色相機和黑白相機;
按分辨率劃分,像素數(shù)在38萬以下的為普通型,像素數(shù)在38萬以上的高分辨率型;
按光敏面尺寸大小劃分,可分為1/4、1/3、1/2、1英寸相機;
按掃描方式劃分,可分為行掃描相機(線陣相機)和面掃描相機(面陣相機)兩種方式;(面掃描相機又可分為隔行掃描相機和逐行掃描相機);
按同步方式劃分,可分為普通相機(內(nèi)同步)和具有外同步功能的相機等。
圖像采集卡
圖像采集卡只是完整的機器視覺系統(tǒng)的一個部件,但是
它扮演一個非常重要的角色。圖像采集卡直接決定了攝像頭的接口:黑白、彩色、模擬、數(shù)字等等。
比較典型的是PCI或AGP兼容的捕獲卡,可以將圖像迅速地傳送到計算機存儲器進行處理。有些采集卡有內(nèi)置的多路開關(guān)。例如,可以連接8個不同的攝像機,然后告訴采集卡采用那一個相機抓拍到的信息。有些采集卡有內(nèi)置的數(shù)字輸入以觸發(fā)采集卡進行捕捉,當(dāng)采集卡抓拍圖像時數(shù)字輸出口就觸發(fā)閘門。
視覺處理器
視覺處理器集采集卡與處理器于一體。以往計算機速度較慢時,采用視覺處理器加快視覺處理任務(wù)。采集卡傳輸圖像到存儲器,進而計算分析。當(dāng)前主流配置的PLC,且配置較高,視覺處理器已經(jīng)幾乎退出市場。
TOP 1:人臉識別
人臉識別是人工智能視覺與圖像領(lǐng)域中最熱門的應(yīng)用, 今年 2 月,《麻省理工科技評論》發(fā)布「2017 全球十大突破性技術(shù)」榜單,來自中國的技術(shù)「刷臉支付」位列其中。這是該榜單創(chuàng)建 16 年來首個來自中國的技術(shù)突破。
人臉識別技術(shù)目前已經(jīng)廣泛應(yīng)用于金融、司法、軍隊、公安、邊檢、政府、航天、電力、工廠、教育、醫(yī)療等行業(yè)。據(jù)業(yè)內(nèi)人士分析,我國的人臉識別產(chǎn)業(yè)的需求旺盛,需求推動導(dǎo)致企業(yè)敢于投入資金。目前,該技術(shù)已具備大規(guī)模商用的條件,未來三到五年將高速增長。而今年,這一技術(shù)有望在金融與安防領(lǐng)域迎來大爆發(fā)。
TOP 2:視頻/監(jiān)控分析
視頻/監(jiān)控分析是人工智能視覺與圖像領(lǐng)域中第二大熱門應(yīng)用。
人工智能技術(shù)可以對結(jié)構(gòu)化的人、車、物等視頻內(nèi)容信息進行快速檢索、查詢。這項應(yīng)用使得讓公安系統(tǒng)在繁雜的監(jiān)控視頻中搜尋到罪犯的有了可能。在大量人群流動的交通樞紐,該技術(shù)也被廣泛用于人群分析、防控預(yù)警等。
視頻/監(jiān)控領(lǐng)域盈利空間廣闊,商業(yè)模式多種多樣,既可以提供行業(yè)整體解決方案,也可以銷售集成硬件設(shè)備。將技術(shù)應(yīng)用于視頻及監(jiān)控領(lǐng)域在人工智能公司中正在形成一種趨勢,這項技術(shù)應(yīng)用將率先在安防、交通甚至零售等行業(yè)掀起應(yīng)用熱潮。
TOP 3:圖片識別分析
靜態(tài)圖片識別應(yīng)用熱度在視覺與圖像領(lǐng)域中排名第三。將人工智能技術(shù)單純用于圖片識別分析的應(yīng)用企業(yè)數(shù)量并不如預(yù)想的多,可能有一下幾個方面原因:
1、目前視頻監(jiān)控方向的盈利空間大,眾多企業(yè)的注意力都放在了視頻監(jiān)控領(lǐng)域;
2、人臉識別屬于圖片識別的一個應(yīng)用場景,做人臉識別的大多數(shù)企業(yè)同時也在提供圖片識別服務(wù),但是銷售效果不佳,主要贏利點還在于人臉識別;
3、圖片識別大多商用場景還屬于藍海,潛力有待開發(fā);
4、圖片數(shù)據(jù)大多被大型互聯(lián)網(wǎng)企業(yè)所掌握,創(chuàng)業(yè)公司數(shù)據(jù)資源稀少。
TOP 4:駕駛輔助/智能駕駛
隨著汽車的普及,汽車已經(jīng)成為人工智能技術(shù)非常大的應(yīng)用投放方向,但就目前來說,想要完全實現(xiàn)自動駕駛/無人駕駛,距離技術(shù)成熟還有一段路要走。
不過利用人工智能技術(shù),汽車的駕駛輔助的功能及應(yīng)用越來越多,這些應(yīng)用多半是基于計算機視覺和圖像處理技術(shù)來實現(xiàn)。
TOP 5:三維圖像視覺
三維圖像視覺主要是對于三維物體的識別,應(yīng)用于三維視覺建模,三維測繪等領(lǐng)域。
TOP 6:工業(yè)視覺檢測
機器視覺可以快速獲取大量信息,并進行自動處理。在自動化生產(chǎn)過程中,人們將機器視覺系統(tǒng)廣泛地用于工況監(jiān)視、成品檢驗和質(zhì)量控制等領(lǐng)域。
機器視覺系統(tǒng)的特點是提高生產(chǎn)的柔性和自動化程度。運用在一些危險工作環(huán)境或人工視覺難以滿足要求的場合;此外,在大批量工業(yè)生產(chǎn)過程中,機器視覺檢測可以大大提高生產(chǎn)效率和生產(chǎn)的自動化程度。
TOP 7:醫(yī)療影像診斷
醫(yī)療數(shù)據(jù)中有超過 90% 的數(shù)據(jù)來自醫(yī)療影像。醫(yī)療影像領(lǐng)域擁有孕育深度學(xué)習(xí)的海量數(shù)據(jù),醫(yī)療影像診斷可以輔助醫(yī)生,提升醫(yī)生的診斷的效率。
2015 年 4 月,IBM 成立了 Watson Health 部門,開始進軍醫(yī)療行業(yè)。2015 年 8 月 6 日,IBM 宣布以 10 億美元的價格收購醫(yī)療影像公司 MergeHealthcare,并將其與新成立的 WatsonHealth 合并。2016 年 2 月,IBM 又斥資 26 億美元收購醫(yī)療數(shù)據(jù)公司 TruvenHealthAnalytics。今年 2 月份,在 HIMSS17 大會上 Watson Health 公布了 IBM 的第
TOP 8:文字識別
計算機文字識別,俗稱光學(xué)字符識別,它是利用光學(xué)技術(shù)和計算機技術(shù)把印在或?qū)懺诩埳系奈淖肿x取出來,并轉(zhuǎn)換成一種計算機能夠接受、人又可以理解的格式。這是實現(xiàn)文字高速錄入的一項關(guān)鍵技術(shù)。
TOP 9:圖像及視頻編輯
2016 年,Google 舉行了一場人工智能作家的畫展。通過一個名叫DeepDream的藝術(shù)生成器,谷歌可以將神經(jīng)網(wǎng)絡(luò)由內(nèi)部傳送到外部。不是識別圖像,而是創(chuàng)作圖像。有人稱這些機器做的畫為機器之夢。
目前市場上也出現(xiàn)了很多運用及機器學(xué)習(xí)算法對圖像進行處理,可以實現(xiàn)對圖片的自動修復(fù)、美化、變換效果等操作。并且越來越受到用戶青睞。
機器視覺在應(yīng)用場景上逐漸突破工業(yè)檢測,其應(yīng)用邊界逐步向智能生活領(lǐng)域拓展。由于機器視覺在智能生活、智能制造兩個領(lǐng)域具有不同的技術(shù)特點和應(yīng)用進展,所以機器視覺于這兩個領(lǐng)域的行業(yè)發(fā)展趨勢也不盡相同。
一、機器視覺軟件選型要點
1、定位器的準確性
目標或特征的準確定位是一個檢測體系或由視覺引導(dǎo)的運動體系的重要功用。傳統(tǒng)的物體定位選用的是灰度值有關(guān)來辨認物體。盡管這種技能得到了廣泛的運用,可是,它在圖象質(zhì)量變差的狀況,就缺少穩(wěn)定性。圖象質(zhì)量變差可能是因為雜亂、亮度不一樣和隱瞞等要素的影響。相反,幾何目標定位法是一種最新的辦法,它運用目標的概括來辨認目標及其特征。維視圖像自主研發(fā)的圖像處理軟件多數(shù)采用幾何目標定位法,且效率極高,可以有效的幫助用戶解決定位問題。
2、工具庫還是應(yīng)用軟件
機器視覺軟件主要以兩種典型的方式出售:一種是包含多種處理算法的工具庫,另一種是專門實現(xiàn)某一類特殊工作的應(yīng)用軟件。這兩種各有利弊,需要第一時間確認這一特性后再做選擇。維視圖像提供的圖像處理軟件包含這兩種,既可以提供專業(yè)應(yīng)用又滿足客戶變化多樣的需求。
3、編程和操作方便
簡練、直觀的圖形界面是簡單運用和設(shè)置的要害。當(dāng)今機器視覺商品之間的主要區(qū)別在于他們的圖形接口。接口大概從“設(shè)置”和“操作”這兩方面來評估。對一個工程師來講,它大概十分復(fù)雜,而關(guān)于一個操作者來說應(yīng)十分簡單。
4、亞像素精度
視覺體系的分辯率是體系能分辯的最小特征。例如,1’’的視覺規(guī)模(FOV)運用一個640x480像素的計算機圖象將得到1/640的分辯率或0.00156’’。實際上,機器視覺算法具有亞像素的才能。也就是說,這些算法可以丈量或得出比一個像素更小的單位。
5、易于升級
機器視覺體系可運用在各種場合,他們的運用規(guī)模可從時尚的攝像機到監(jiān)督體系。當(dāng)挑選一個體系時應(yīng)思考體系將來的升級。依據(jù)通用目的的視覺軟件體系十分好晉級。最終用戶大概依據(jù)附加的攝像機、照明的改變、視覺東西的改變等來思考將來對體系的需要。
6、圖象預(yù)處理算法
大部分的圖像處理軟件提供預(yù)處理算法,所以需要比較其提供的豐富程度,效率等。
7、體系集成
假如你對機器視覺技能不是很精通,那么針對你的項目就需要一個體系集成商,理想的視覺商品能被體系集成商廣泛承受。
二、常用機器視覺軟件介紹
1. OpenCV,開源免費的圖像處理庫
OpenCV是近年來推出的開源、免費的計算機視覺庫,利用其所包含的函數(shù)可以很方便地實現(xiàn)數(shù)字圖像和視頻處理。同時利用面向?qū)ο蟮腣C++ 6.0編程工具,用C++語言進行程序編寫 OpenCV算法庫為VC++編程處理數(shù)字圖像提供了很大的方便,其必將成為圖像視頻處理領(lǐng)域的強有力的工具。
缺點:由于是開源軟件,因此其版本繁多,函數(shù)庫復(fù)雜,執(zhí)行效率收到應(yīng)用,比較適用于科研和學(xué)習(xí),不適合工業(yè)應(yīng)用。
2. Halcon,強大的圖像處理庫
HALCON是德國MVtec公司開發(fā)的一套完善的標準的機器視覺算法包,擁有應(yīng)用廣泛的機器視覺集成開發(fā)環(huán)境。它節(jié)約了產(chǎn)品成本,縮短了軟件開發(fā)周期——HALCON靈活的架構(gòu)便于機器視覺,醫(yī)學(xué)圖像和圖像分析應(yīng)用的快速開發(fā)。在歐洲以及日本的工業(yè)界已經(jīng)是公認具有最佳效能的Machine Vision軟件
缺點:價格比較貴,每次分發(fā)需要重新購買授權(quán)。
3. NI Vision,快速驗證的圖像處理庫(含視覺助手、VBAI)
關(guān)于機器視覺的相關(guān)介紹就到這了,如有不足之處歡迎指正。
相關(guān)閱讀推薦:什么是機器視覺,有何實際意義
相關(guān)閱讀推薦:關(guān)于機器視覺的一些事