機器視覺的發(fā)展前景
1.3D重構(gòu) (Stereo image或是Depth map): 目前最吸引眼球的或許是基于深度感應(yīng)器的微軟Kinect fusion。其他還有基于SfM (Structure from Motion) 的應(yīng)用,比如說Google地圖或是一些通過視頻重構(gòu)物體的應(yīng)用。其余相關(guān)的還有虛擬現(xiàn)實技術(shù)(Augmented Reality),很多手機或是掌機(3DS)的游戲都引入了一些作為賣點(據(jù)微軟Youtube官方放出視頻,Xbox720很有可能結(jié)合Kinect對整個房間環(huán)境全局投影獲得最大視覺效果)。
2.識別(圖像類別識別、場景識別、人臉等):個人感覺圖像識別應(yīng)該是計算機視覺一直以來的主流方向,機器視覺學(xué)習(xí)的理論和算法也在此得到最大應(yīng)用。圖像識別系統(tǒng)在生活中也算是屢見不鮮,就先不做闡述了。視頻方面的運動識別近年來也得到挺大的發(fā)展,也歸功于光流或是其他運動檢測算法的提升。無論從導(dǎo)航還是監(jiān)視系統(tǒng)都深受其益,應(yīng)該也是比較有趣的話題。手勢或是姿勢識別最近也有很多應(yīng)用,當然主要來源還是微軟,近期傳言還會推出一種'跨時代'的手勢識別系統(tǒng)(Leap Motion),看起來是個很強大靈敏的手勢感應(yīng)設(shè)備?。
其他能想到的還有追蹤(Tracking),影像糾正和全景圖(Image rectification),圖像分割(Image Segmentation)?。曾經(jīng)更多是屬于圖像處理,但這些技術(shù)近幾年引入機器學(xué)習(xí)算法因此得到了效率和準確率上的大幅提升。
對機器視覺學(xué)習(xí)本身有興趣的人或許可以從簡單的分類器(Nearest Neighbour, Naive Bayes)到現(xiàn)有比較熱的SVM,Random Forest等學(xué)習(xí),了解最優(yōu)化(Optimisation)相關(guān)的理論對理解整個機器視覺學(xué)習(xí)也至關(guān)重要。