按Enter到主內容區
:::

財團法人海峽交流基金會

:::

靠「臉」吃飯─臉部辨識發展趨勢◆文/楊仲瑜(資策會產業分析師)

  • 更新日期:109-08-16

自1960年起,臉部辨識技術開始發展,如今亞馬遜推出無人商店、iPhone X採用臉部解鎖功能,各式的「刷臉」應用,雨後春筍般推出。有一天,人們出門不用帶手機,也不用帶錢包,你的臉就是錢包,「靠臉吃飯」的時代正式來臨。鏡頭後的人工智慧,透過臉部分析,將超越現在的想像。

人腦中有一個區塊專門用以辨識人臉,它允許我們即使在他人變換髮型、妝容、表情、甚至是隨著年齡老化時,仍可以正確地做出識別,同時不會受到臉部的方向或照明條件等影響判讀。許多研究正試圖建立一套系統,讓機械也可擁有如同人類一般的人臉識別能力,因此所謂的臉部辨識(Facial Recognition)技術,其實就是一種人工智慧(Artificial Intelligence)的應用技術。

臉部辨識的過程包括:透過影像擷取裝置並輸入圖像;進行臉部偵測,識別描繪臉部的圖像區域,以確定人臉是否存在圖像中;確認人臉存在後,則進一步抽取臉部特徵,並與資料庫中已知的人臉進行辨識比對,從而確認或識別所輸入圖像中的個人身分。此外,將抽出的臉部特徵與表情資料庫的資料進行比對,則可用以判讀臉部的各種屬性,如:狀態、表情,乃至情緒辨別,此稱為「屬性」分析。

臉部辨識技術需要處理大量的圖像,運算量相當龐大,成為推廣上的重要課題之一。近年由於電腦運算效能提升,包括雲端運算進展,一定程度改善運算上的課題。同時,網路普及推動大數據運算技術發展,透過處理大量臉部資訊並將之加值而獲得有意義的數據,也成為近期廠商開發重心,特別是在智慧零售、行銷廣告等應用已開始普及。

應用廣泛及領導廠商支持 臉部辨識發展可期

臉部辨識自1990年代後期開始商用化,初期是以數位相機應用為大宗。業者透過臉部辨識技術,追蹤拍攝對象的臉部位置及感測臉部動作,並與數位相機拍攝模式進行連結,開發出如:臉部自動對焦、美顏及微笑快門等功能,藉以實現人機互動。

隨著臉部辨識技術日益成熟,加上「911恐攻事件」後,全球危安議題升溫、經濟活動的轉變(從傳統線下交易到電子商務)、生活型態的演進(對智慧生活的渴望)等,使市場對可提升國土、個人及財產安全,以及可以創造高度人機互動的臉部辨識技術需求增溫。

臉部辨識應用範圍相當廣泛,近年幾個熱門的應用領域,包括智慧車(或自駕車)、金融科技(Fintech)、智慧零售、機器人、無人機等的開發廠商,試圖採用臉部辨識技術提升裝置的性能,或是進行方法、流程的改善及創新。不僅如此,這些應用領域的領導廠商,及平台、晶片業者等,多數也都透過自主開發或合資併購來掌握臉部辨識核心技術,在應用的擴散及大廠帶動下,臉部辨識未來發展值得期待。

非主動認證及導入嵌入式設備為兩大應用發展

臉部辨識應用依使用目的可分成「安全相關」跟「非關安全」。安全相關應用是以保障國土、個人及財產安全為主要目的,如:公部門將臉部辨識認證導入出入境審查系統,用以保障國土及人民安全;金融業採用臉部辨識技術做為金融交易的身分認證使用,以保障客戶財產安全。非關安全的應用則多以提高企業或個人利益為主要目的,如:零售業者透過臉部辨識收集客戶行為數據並加以分析,用客製化的購物體驗吸引消費者,為企業創造收益。

一般而言,與「安全相關」的應用因涉及國土、人身及財產安全保障,一旦在各種應用領域關於安全效益得到驗證,預期發展會相當快速。相對來說,「非關安全」的應用是以企業或個人利益為出發點,若要能順利發展,需視臉部辨識技術的引入,可為企業及個人帶來附加價值。

除依使用目的分類外,臉部辨識技術依使用者的認證模式不同,又可分成「主動認證」跟「非主動認證」。主動認證代表使用者是在自主意識下,依規範而進行認證的行為,如:門禁管理系統的應用,使用者通常會依規定摘除可能遮蔽臉部特徵的物品如:口罩、墨鏡等,以利於認證的進行。非主動認證指的是在使用者沒有意識到攝影機存在的情況下進行認證的動作,如:醫療院所或居家的照護監控系統。

非主動認證因為不需使用者駐足停留,可能應用的情境更為廣泛,且更具便利性。但在非主動認證情境下,被認證的一方很可能是處於不知情或不願意的情況下被動地進行認證,在應用上也易面臨隱私權爭議,例如零售業者採用臉部辨識技術進行消費者或行為分析已行之有年,然而礙於隱私權的問題,多數不會主動談論。

現階段實用化的應用是以與安全相關的主動認證為主,但是隨著如:安全監控、犯罪追蹤、零售應用等需求的展開、以及在使用便利性的考量下,預期應用模式會出現從主動認證朝向非主動認證的趨勢發展。

另一方面,由於資訊隱私及應用時效性等考量,在設備端進行認證的需求也逐漸浮現。臉部辨識運算可能在雲端或設備端處理。如果是採用雲端運算方式,資料先要上傳到雲端經處理後再傳回設備,易有資訊遞延,以及資安疑慮。而設備端處理不僅提升資訊處理速度,資訊保密性亦較高,例如汽車、無人機等注重時效,或家用、醫療等注重隱私應用,則更為合適。

3D辨識及處理深度學習晶片為主要技術動向

非主動認證一般捕捉到的圖像可能不是正面、解析度太低、畫面太小、或易受到各種遮蔽物及環境光的干擾,影響辨識結果,技術難度較主動認證高。採用一般的2D臉部辨識不易得到精準的辨識結果,促使廠商關注3D臉部辨識的開發。

臉部圖像包括2D及 3D兩種態樣。2D圖像主要透過辨識人臉特徵如:眼、鼻、口等進行認證,易受到臉部遮蔽物、臉部角度及表情、光線等影響精準度。3D圖像提供的是幾何、深度資訊,不會受到臉的視角或照明條件影響,且認證距離可拉長至60–130cm(2D技術的認證距離為30–80cm),應用情境相對廣闊,有利於非主動認證的應用。

事實上,3D臉部辨識開發已有十多年,過去因成本高、3D建模速度慢等因素,難以商用普及。2010年後隨著3D感測技術的進步,如 Microsoft Kinect、PrimeSense Carmine等推出,成本降至平均2百美元,使3D臉部辨識具普及發展可能性。在臉部辨識業者多投入3D感測技術發展情況下,預期加速應用擴散。

嵌入式設備發展關鍵在處理深度學習晶片開發

在設備端進行臉部辨識運算發展方面,由於臉部辨識要處理的資料量及運算量相當龐大,當臉部辨識認證從雲端驗證走向設備端驗證時,就面臨到小型嵌入式設備資料處理能力有限的問題。尤其近年業者開始引入深度學習技術,其計算更複雜且耗能,業界需要一種可把深度學習演算法放入低功耗嵌入式設備端進行運算方法。

要能在嵌入式設備處理深度學習運算,需要高性能且低功耗的晶片支援。對此,半導體業者正積極開發低功耗、專用於深度學習計算的神經網絡處理單元(Neural Processing Unit),例如Apple在2017年發表的iPhone X就搭載其自行研發,具神經網路引擎的A11處理器。預期隨著低功耗深度學習處理晶片的開發及商用化,將大舉推動臉部辨識技術於嵌入式設備應用發展,以及整體市場的開拓,此趨勢或將帶動人類發展更高的突破,且拭目以待。

回頁首