機器視覺火了,如何解決三大問題?
機器視覺是人工智能的一個分支。簡而言之,它用機器代替人眼來測試和判斷。機器視覺的應用可以提高生產(chǎn)的靈活性和自動化程度。目前,隨著核心技術的不斷完善,機器視覺的下游應用場景不斷擴大,包括消費電子、汽車、半導體、虛擬現(xiàn)實、智能安全、醫(yī)療保健等。
與人類視覺相比,機器視覺的功能范圍不僅包括接收信息,還包括處理和判斷信息,包括攝像機、鏡頭、視覺控制器、圖像處理、傳感器、算法平臺等。典型的機器視覺應用系統(tǒng)包括圖像采集模塊、圖像數(shù)字化模塊、圖像處理模塊、決策模塊、機械控制執(zhí)行模塊和光源系統(tǒng)。
在機器視覺的實際應用中,仍然存在很多問題,比如缺陷樣本太少怎么辦,以及面對未知的缺陷是否有更好的解決方案。在2019年10月10日的機器視覺研討會上,機器視覺領域的專業(yè)人士分享并詳細解釋了機器視覺工作流程的細節(jié)、實際項目中遇到的問題以及解決方案。
機器視覺是如何工作的?
機器視覺的工作過程離不開深度學習,深度學習是機器學習研究的一個新領域。其動機在于建立和模擬用于分析學習的人腦神經(jīng)網(wǎng)絡。它模仿人腦解釋數(shù)據(jù)的機制,如圖像、聲音和文本。深度學習的概念源于人工智能神經(jīng)網(wǎng)絡的研究。
深度學習的工作流程大致可以概括為標記、訓練和推理。首先,人工采集圖像,標記特征,形成數(shù)據(jù);然后,將這些數(shù)據(jù)輸入計算機,讓計算機進行訓練,并生成一個網(wǎng)絡進行評估。如果該網(wǎng)絡的性能滿足要求,可以上線并實現(xiàn)檢測。網(wǎng)絡上線后,會產(chǎn)生大量的數(shù)據(jù),這些數(shù)據(jù)可以轉化為新的樣本。通過增加數(shù)據(jù)和迭代優(yōu)化,網(wǎng)絡和檢測系統(tǒng)會越來越好。
在深度學習的過程中,建立高質(zhì)量的訓練數(shù)據(jù)集是非常重要的。高質(zhì)量的培訓數(shù)據(jù)集對于深度學習解決方案的成功部署非常重要。邊緣條件或不正確標記的數(shù)據(jù)集會使網(wǎng)絡混亂,而標記良好且內(nèi)部一致的數(shù)據(jù)集會有更好的效果。訓練圖像在它們所代表的類別中必須是典型的,并且訓練圖像樣式必須盡可能接近系統(tǒng)部署期間遇到的圖像。
深度學習在機器視覺中的應用大致可以分為三種類型。一是分類,即產(chǎn)品可以分為合格和不合格,這是深度學習的最大應用;第二是定位,幫助用戶定位物體的位置和數(shù)量;第三是分割,即可以發(fā)現(xiàn)缺陷的輪廓,并且可以基于缺陷的輪廓和尺寸更精細地辨別產(chǎn)品。與傳統(tǒng)的機器學習相比,深度學習在機器視覺中發(fā)揮著更加重要的作用。研華(中國)有限公司智能設備事業(yè)部高級產(chǎn)品經(jīng)理孫明聰認為,在某些方面,深度學習視覺解決方案將比傳統(tǒng)的機器視覺解決方案更具優(yōu)勢。前者可以高精度地分析不規(guī)則圖像,而后者不能低精度地分析不規(guī)則圖像。
在處理不規(guī)則圖像時,深度學習機器視覺解決方案,即使圖像復雜,軟件也可以通過深度學習算法自動學習缺陷的特征,使得分析不規(guī)則圖像成為可能;然而,在傳統(tǒng)的機器視覺解決方案中,當圖像不規(guī)則和不規(guī)則時,很難手動設置缺陷的特征,并且圖像不能被分析。
在準確性方面,深度學習機器視覺解決方案可以通過深度學習算法和特定于制造的數(shù)據(jù)來提高檢測的準確性;在傳統(tǒng)的機器視覺解決方案中,如果缺陷部分和先前設置的缺陷之間存在微小差異,傳統(tǒng)的視覺無法檢測到這種缺陷,導致檢測精度低。
盡管深度學習在許多方面都有優(yōu)勢,但并非所有的任務都適用。前視紅外系統(tǒng)公司(FLIR? Systems,Inc? .)的現(xiàn)場應用工程師王崇普指出,深度學習可以為高度主觀或定性的問題提供方便的解決方案,而主觀問題或具有復雜交互的問題是理想的應用。然而,深入學習并不是對所有的任務都有益。他認為許多基本的檢測任務都適用于傳統(tǒng)的機器視覺技術,如存在或缺乏明確定義的特征、測量和對準。
實際應用中存在哪些問題?
盡管機器視覺在實際應用中存在很多問題,但仍需要改進和優(yōu)化。研討會上,中國大恒(集團)有限公司北京圖像視覺技術分公司高級解決方案工程師李東平分享了他們在項目中遇到的幾個問題和解決方案。這些問題是:第一,缺陷樣本太少;二是貼標工作量過大;第三,未知的缺陷混雜其中。
第一,缺陷樣本太少的問題,比如iWatch,因為蘋果的產(chǎn)品質(zhì)量控制很高,產(chǎn)量很高,而且缺陷的數(shù)量很少,它能提供的缺陷樣本很少,所以沒有足夠的缺陷數(shù)據(jù)進行訓練。
第二,有大量的注釋工作。對于缺陷檢測和分割,有必要在標記時跟蹤所有缺陷。如果圖像覆蓋范圍大,并且有很多缺陷,那么工作量就比較大。
第三,未知缺陷的混合問題。在生產(chǎn)過程中,我們已經(jīng)知道了幾個缺陷,但是我們不知道將來會出現(xiàn)哪些缺陷。例如,在生產(chǎn)過程中,我們突然混入了外來物質(zhì)和其他物質(zhì),而我們事先不知道會混入什么物質(zhì)。未經(jīng)培訓,機器無法檢測,不合格產(chǎn)品將作為合格產(chǎn)品輸出。面對這些問題,大恒圖像試圖使機器只學習好的樣本,而不是壞的樣本,因為只需要好的樣本不需要標記,只需要少量的好樣本。如果你輸入一個壞的圖片到機器,它會給出缺陷區(qū)域,因為只有經(jīng)過訓練的樣本可以檢測到任何缺陷,并且運行過程會非常快。
廣東豪普特科技有限公司董事何認為,將傳統(tǒng)機器學習與深度學習相結合也是一個可行的方案。在他看來,傳統(tǒng)的機器學習和深度學習各有利弊。外觀檢查中有一種情況??梢钥闯?,對比度非常高,與傳統(tǒng)方法相比非常穩(wěn)定和快速。
然而,深度學習在缺陷分類中更具優(yōu)勢。例如,客戶需要整理缺陷類型,在他們用傳統(tǒng)方法調(diào)整了兩個月之后,如果他們更換了另一種材料,他們必須再次調(diào)整。這種情況適合使用深度學習。然而,沒有訓練,深度學習無法發(fā)現(xiàn)缺陷。
如果在生產(chǎn)過程中發(fā)生這種情況,Haupt會嘗試使用傳統(tǒng)方法和深度學習來解決傳統(tǒng)和快速的問題,甚至分離出合格的產(chǎn)品,然后使用深度工具來對一些缺陷進行分類。
摘要
隨著智能水平的不斷提高,機器視覺已經(jīng)進入了一個快速發(fā)展的時期,中國機器視覺的市場需求也將不斷增長。報告顯示,2018年中國機器視覺市場規(guī)模將超過100億元,預計2019年市場規(guī)模將接近125億元。面對不斷擴大的市場需求,企業(yè)在實際應用中發(fā)現(xiàn)問題,優(yōu)化產(chǎn)品解決方案是一個重要的關鍵點。