機(jī)器視覺火了,如何解決三大問題?
機(jī)器視覺是人工智能的一個(gè)分支。簡而言之,它用機(jī)器代替人眼來測試和判斷。機(jī)器視覺的應(yīng)用可以提高生產(chǎn)的靈活性和自動(dòng)化程度。目前,隨著核心技術(shù)的不斷完善,機(jī)器視覺的下游應(yīng)用場景不斷擴(kuò)大,包括消費(fèi)電子、汽車、半導(dǎo)體、虛擬現(xiàn)實(shí)、智能安全、醫(yī)療保健等。
與人類視覺相比,機(jī)器視覺的功能范圍不僅包括接收信息,還包括處理和判斷信息,包括攝像機(jī)、鏡頭、視覺控制器、圖像處理、傳感器、算法平臺(tái)等。典型的機(jī)器視覺應(yīng)用系統(tǒng)包括圖像采集模塊、圖像數(shù)字化模塊、圖像處理模塊、決策模塊、機(jī)械控制執(zhí)行模塊和光源系統(tǒng)。
在機(jī)器視覺的實(shí)際應(yīng)用中,仍然存在很多問題,比如缺陷樣本太少怎么辦,以及面對(duì)未知的缺陷是否有更好的解決方案。在2019年10月10日的機(jī)器視覺研討會(huì)上,機(jī)器視覺領(lǐng)域的專業(yè)人士分享并詳細(xì)解釋了機(jī)器視覺工作流程的細(xì)節(jié)、實(shí)際項(xiàng)目中遇到的問題以及解決方案。
機(jī)器視覺是如何工作的?
機(jī)器視覺的工作過程離不開深度學(xué)習(xí),深度學(xué)習(xí)是機(jī)器學(xué)習(xí)研究的一個(gè)新領(lǐng)域。其動(dòng)機(jī)在于建立和模擬用于分析學(xué)習(xí)的人腦神經(jīng)網(wǎng)絡(luò)。它模仿人腦解釋數(shù)據(jù)的機(jī)制,如圖像、聲音和文本。深度學(xué)習(xí)的概念源于人工智能神經(jīng)網(wǎng)絡(luò)的研究。
深度學(xué)習(xí)的工作流程大致可以概括為標(biāo)記、訓(xùn)練和推理。首先,人工采集圖像,標(biāo)記特征,形成數(shù)據(jù);然后,將這些數(shù)據(jù)輸入計(jì)算機(jī),讓計(jì)算機(jī)進(jìn)行訓(xùn)練,并生成一個(gè)網(wǎng)絡(luò)進(jìn)行評(píng)估。如果該網(wǎng)絡(luò)的性能滿足要求,可以上線并實(shí)現(xiàn)檢測。網(wǎng)絡(luò)上線后,會(huì)產(chǎn)生大量的數(shù)據(jù),這些數(shù)據(jù)可以轉(zhuǎn)化為新的樣本。通過增加數(shù)據(jù)和迭代優(yōu)化,網(wǎng)絡(luò)和檢測系統(tǒng)會(huì)越來越好。
在深度學(xué)習(xí)的過程中,建立高質(zhì)量的訓(xùn)練數(shù)據(jù)集是非常重要的。高質(zhì)量的培訓(xùn)數(shù)據(jù)集對(duì)于深度學(xué)習(xí)解決方案的成功部署非常重要。邊緣條件或不正確標(biāo)記的數(shù)據(jù)集會(huì)使網(wǎng)絡(luò)混亂,而標(biāo)記良好且內(nèi)部一致的數(shù)據(jù)集會(huì)有更好的效果。訓(xùn)練圖像在它們所代表的類別中必須是典型的,并且訓(xùn)練圖像樣式必須盡可能接近系統(tǒng)部署期間遇到的圖像。
深度學(xué)習(xí)在機(jī)器視覺中的應(yīng)用大致可以分為三種類型。一是分類,即產(chǎn)品可以分為合格和不合格,這是深度學(xué)習(xí)的最大應(yīng)用;第二是定位,幫助用戶定位物體的位置和數(shù)量;第三是分割,即可以發(fā)現(xiàn)缺陷的輪廓,并且可以基于缺陷的輪廓和尺寸更精細(xì)地辨別產(chǎn)品。與傳統(tǒng)的機(jī)器學(xué)習(xí)相比,深度學(xué)習(xí)在機(jī)器視覺中發(fā)揮著更加重要的作用。研華(中國)有限公司智能設(shè)備事業(yè)部高級(jí)產(chǎn)品經(jīng)理孫明聰認(rèn)為,在某些方面,深度學(xué)習(xí)視覺解決方案將比傳統(tǒng)的機(jī)器視覺解決方案更具優(yōu)勢。前者可以高精度地分析不規(guī)則圖像,而后者不能低精度地分析不規(guī)則圖像。
在處理不規(guī)則圖像時(shí),深度學(xué)習(xí)機(jī)器視覺解決方案,即使圖像復(fù)雜,軟件也可以通過深度學(xué)習(xí)算法自動(dòng)學(xué)習(xí)缺陷的特征,使得分析不規(guī)則圖像成為可能;然而,在傳統(tǒng)的機(jī)器視覺解決方案中,當(dāng)圖像不規(guī)則和不規(guī)則時(shí),很難手動(dòng)設(shè)置缺陷的特征,并且圖像不能被分析。
在準(zhǔn)確性方面,深度學(xué)習(xí)機(jī)器視覺解決方案可以通過深度學(xué)習(xí)算法和特定于制造的數(shù)據(jù)來提高檢測的準(zhǔn)確性;在傳統(tǒng)的機(jī)器視覺解決方案中,如果缺陷部分和先前設(shè)置的缺陷之間存在微小差異,傳統(tǒng)的視覺無法檢測到這種缺陷,導(dǎo)致檢測精度低。
盡管深度學(xué)習(xí)在許多方面都有優(yōu)勢,但并非所有的任務(wù)都適用。前視紅外系統(tǒng)公司(FLIR? Systems,Inc? .)的現(xiàn)場應(yīng)用工程師王崇普指出,深度學(xué)習(xí)可以為高度主觀或定性的問題提供方便的解決方案,而主觀問題或具有復(fù)雜交互的問題是理想的應(yīng)用。然而,深入學(xué)習(xí)并不是對(duì)所有的任務(wù)都有益。他認(rèn)為許多基本的檢測任務(wù)都適用于傳統(tǒng)的機(jī)器視覺技術(shù),如存在或缺乏明確定義的特征、測量和對(duì)準(zhǔn)。
實(shí)際應(yīng)用中存在哪些問題?
盡管機(jī)器視覺在實(shí)際應(yīng)用中存在很多問題,但仍需要改進(jìn)和優(yōu)化。研討會(huì)上,中國大恒(集團(tuán))有限公司北京圖像視覺技術(shù)分公司高級(jí)解決方案工程師李東平分享了他們在項(xiàng)目中遇到的幾個(gè)問題和解決方案。這些問題是:第一,缺陷樣本太少;二是貼標(biāo)工作量過大;第三,未知的缺陷混雜其中。
第一,缺陷樣本太少的問題,比如iWatch,因?yàn)樘O果的產(chǎn)品質(zhì)量控制很高,產(chǎn)量很高,而且缺陷的數(shù)量很少,它能提供的缺陷樣本很少,所以沒有足夠的缺陷數(shù)據(jù)進(jìn)行訓(xùn)練。
第二,有大量的注釋工作。對(duì)于缺陷檢測和分割,有必要在標(biāo)記時(shí)跟蹤所有缺陷。如果圖像覆蓋范圍大,并且有很多缺陷,那么工作量就比較大。
第三,未知缺陷的混合問題。在生產(chǎn)過程中,我們已經(jīng)知道了幾個(gè)缺陷,但是我們不知道將來會(huì)出現(xiàn)哪些缺陷。例如,在生產(chǎn)過程中,我們突然混入了外來物質(zhì)和其他物質(zhì),而我們事先不知道會(huì)混入什么物質(zhì)。未經(jīng)培訓(xùn),機(jī)器無法檢測,不合格產(chǎn)品將作為合格產(chǎn)品輸出。面對(duì)這些問題,大恒圖像試圖使機(jī)器只學(xué)習(xí)好的樣本,而不是壞的樣本,因?yàn)橹恍枰玫臉颖静恍枰獦?biāo)記,只需要少量的好樣本。如果你輸入一個(gè)壞的圖片到機(jī)器,它會(huì)給出缺陷區(qū)域,因?yàn)橹挥薪?jīng)過訓(xùn)練的樣本可以檢測到任何缺陷,并且運(yùn)行過程會(huì)非???。
廣東豪普特科技有限公司董事何認(rèn)為,將傳統(tǒng)機(jī)器學(xué)習(xí)與深度學(xué)習(xí)相結(jié)合也是一個(gè)可行的方案。在他看來,傳統(tǒng)的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)各有利弊。外觀檢查中有一種情況??梢钥闯?,對(duì)比度非常高,與傳統(tǒng)方法相比非常穩(wěn)定和快速。
然而,深度學(xué)習(xí)在缺陷分類中更具優(yōu)勢。例如,客戶需要整理缺陷類型,在他們用傳統(tǒng)方法調(diào)整了兩個(gè)月之后,如果他們更換了另一種材料,他們必須再次調(diào)整。這種情況適合使用深度學(xué)習(xí)。然而,沒有訓(xùn)練,深度學(xué)習(xí)無法發(fā)現(xiàn)缺陷。
如果在生產(chǎn)過程中發(fā)生這種情況,Haupt會(huì)嘗試使用傳統(tǒng)方法和深度學(xué)習(xí)來解決傳統(tǒng)和快速的問題,甚至分離出合格的產(chǎn)品,然后使用深度工具來對(duì)一些缺陷進(jìn)行分類。
摘要
隨著智能水平的不斷提高,機(jī)器視覺已經(jīng)進(jìn)入了一個(gè)快速發(fā)展的時(shí)期,中國機(jī)器視覺的市場需求也將不斷增長。報(bào)告顯示,2018年中國機(jī)器視覺市場規(guī)模將超過100億元,預(yù)計(jì)2019年市場規(guī)模將接近125億元。面對(duì)不斷擴(kuò)大的市場需求,企業(yè)在實(shí)際應(yīng)用中發(fā)現(xiàn)問題,優(yōu)化產(chǎn)品解決方案是一個(gè)重要的關(guān)鍵點(diǎn)。