︿
Top

電腦視覺進化 用「眼」學習

瀏覽次數:245| 歡迎推文: facebook twitter wechat twitter twitter

林明宜、國家實驗研究院科技政策研究與資訊中心 發表於 2019年12月16日

圖、
電腦視覺進化,用「眼」學習

人類經過百萬年的演化,才發展出複雜精細的視覺系統,時至今日,科學家們仍無法完全了解人類究竟如何看到和理解外界的事物,但是機器學習卻讓我們已經開始教導電腦如何看見,用視覺探索世界。

未來的世界中,家事機器人將能夠看著你的示範,學習如何清潔餐桌,打掃廁所,按照你的想法佈置客廳和修剪花園中的盆栽;通勤時搭乘預約好的自駕車,輕鬆的從家中抵達公司;臉部和步伐辨識,加上非侵入式安全檢查,讓出國機場通關再也不用大排長龍…這種種便利,都基於電腦視覺技術,讓電腦能夠從影片或圖像獲得有用的資訊,從數位影像資料中進行推論。

電腦視覺技術的快速發展,受益於機器學習的門檻越來越低,過去需要大量的計算能力和儲存空間,學習用的影像資料又不易取得,現在除了軟硬體的價格快速下降,能夠使用的資料集也越來越多,近年的電腦視覺技術已逐漸從監督式學習進化到無監督式學習,從需要標記巨量資料(Big Data),到僅需少許無標記的資料即可完成訓練。

世界智慧財產權組織(WIPO)在2019年人工智慧研究報告中,也發現電腦視覺是最常見的AI應用領域,有將近一半的人工智慧相關專利,在其內容中提及電腦視覺。近兩年市調公司CB Insights發布的AI100新創公司所獲證美國專利,也有很大一部份屬於圖形辨識、圖像分析和圖像增強等電腦視覺核心技術。同時根據Market Reports World市場調查報告認為電腦視覺相關市場,在五年內將成長到約五百億美金。

電腦視覺的主要應用領域包括健康醫療、安全監控、機器人和機器視覺、自駕車、消費者、運動和娛樂等,2019年以消費者應用的市場份額最高,超過150億美元,自駕車、機器人和機器視覺次之,約為55億美元,其中消費者應用包含了解消費習性以強化個人化服務、消費者喜愛商品之類似產品的找尋等;機器視覺應用在製造業,例如產品的品質檢驗,機具的預防性維修和物流監控等,更進一步還可以利用x光或其他透視型影像技術,快速檢查橋墩結構或大樓安全,進行預防性維修或拆除。

電腦視覺領域未來主要發展趨勢:

(一) 從圖形辨識到認知:深度學習讓圖形辨識的正確率大幅提升,開啟了電腦視覺的快速成長時代,從早期的辨識影像中是否含有貓或人,近年電腦視覺領域更進一步發展圖像語義分割和實體切割技術,讓電腦對影像的了解達到單一畫素的解析度,能夠分辨影像中有幾個人和幾隻貓,而全景分割則能夠知道特定畫素屬於那個人和那隻貓,讓電腦視覺真正更接近人類視覺。

(二) 雲端和邊緣運算競合:由於自行建立電腦視覺的模型相對困難,商用雲端運算成為許多企業執行電腦視覺計畫的選擇,包括Google、Microsoft、IBM、Amazon等都提供此類服務;邊緣運算能夠在終端即時直接進行資料處理,主要應用在網路品質不佳的地方,或是時間上的延遲是無法被接受的應用(如自駕車),邊緣運算也能夠讓使用者的體驗更加順暢,並透過僅傳送分析後有意義的資訊到雲端,減少網路和雲端負擔;兩者間的競合在近期由於邊緣運算的快速演進而漸趨白熱化。

(三) 合成影像的精進與濫用:生成對抗網絡(GAN)是電腦視覺領域近年最具突破性的技術,能夠產生以假亂真的影像,這個技術原本運用於增加訓練資料以加速機器學習,許多不正當的運用卻使得這個技術可能對社會產生威脅,例如利用修改過的影片誤導民眾對特定事件的看法,或是利用GAN篡改超音波檢查的影像,讓醫師產生誤診。

(四) 隱私權保護:自從人臉辨識和電腦視覺技術開始進入實用性階段,人們就開始擔心個人隱私遭到破壞,或是政府濫用安全監控,舊金山就成為全美第一個立法禁止使用臉部辨識技術的城市。許多電腦視覺或人工智慧公司在進行開發時也開始更重視用戶或資料提供者的隱私保護。

目前的電腦視覺技術雖然已經大幅躍進,能夠有效解決有限制、條件確定的問題,雖然解決開放性的,需要洞察力的問題仍然十分困難,然而技術突破和電腦視覺的商業應用價值無庸置疑,科技的快速演進也同時帶來新的問題,當影像合成越來越容易,越來越多的機器具備視覺功能,如何確認資訊的正確性和確保社會大眾隱私將成為重要課題。
 
(作者是國家實驗研究院科技政策研究與資訊中心研究員)
 

(本文刊登於經濟日報2019/12/15)

 
歡迎來粉絲團按讚!
--------------------------------------------------------------------------------------------------------------------------------------------
【聲明】
1. 科技產業資訊室刊載此文不代表同意其說法或描述,僅為提供更多訊息,也不構成任何投資建議。
2. 著作權所有,非經本網站書面授權同意不得將本文以任何形式修改、複製、儲存、傳播或轉載,本中心保留一切法律追訴權利。