靠「脸」吃饭─脸部辨识发展趋势◆文/杨仲瑜(资策会产业分析师)《交流杂志106年12月号第156期(历史资料)》
- 更新日期:112-07-11
自1960年起,脸部辨识技术开始发展,如今亚马逊推出无人商店、iPhone X采用脸部解锁功能,各式的「刷脸」应用,雨后春笋般推出。有一天,人们出门不用带手机,也不用带钱包,你的脸就是钱包,「靠脸吃饭」的时代正式来临。镜头后的人工智慧,透过脸部分析,将超越现在的想像。
人脑中有一个区块专门用以辨识人脸,它允许我们即使在他人变换发型、妆容、表情、甚至是随著年龄老化时,仍可以正确地做出识别,同时不会受到脸部的方向或照明条件等影响判读。许多研究正试图建立一套系统,让机械也可拥有如同人类一般的人脸识别能力,因此所谓的脸部辨识(Facial Recognition)技术,其实就是一种人工智慧(Artificial Intelligence)的应用技术。
脸部辨识的过程包括:透过影像撷取装置并输入图像;进行脸部侦测,识别描绘脸部的图像区域,以确定人脸是否存在图像中;确认人脸存在后,则进一步抽取脸部特征,并与资料库中已知的人脸进行辨识比对,从而确认或识别所输入图像中的个人身分。此外,将抽出的脸部特征与表情资料库的资料进行比对,则可用以判读脸部的各种属性,如:状态、表情,乃至情绪辨别,此称为「属性」分析。
脸部辨识技术需要处理大量的图像,运算量相当庞大,成为推广上的重要课题之一。近年由于电脑运算效能提升,包括云端运算进展,一定程度改善运算上的课题。同时,网路普及推动大数据运算技术发展,透过处理大量脸部资讯并将之加值而获得有意义的数据,也成为近期厂商开发重心,特别是在智慧零售、行销广告等应用已开始普及。
应用广泛及领导厂商支持 脸部辨识发展可期
脸部辨识自1990年代后期开始商用化,初期是以数位相机应用为大宗。业者透过脸部辨识技术,追踪拍摄对象的脸部位置及感测脸部动作,并与数位相机拍摄模式进行连结,开发出如:脸部自动对焦、美颜及微笑快门等功能,借以实现人机互动。
随著脸部辨识技术日益成熟,加上「911恐攻事件」后,全球危安议题升温、经济活动的转变(从传统线下交易到电子商务)、生活型态的演进(对智慧生活的渴望)等,使市场对可提升国土、个人及财产安全,以及可以创造高度人机互动的脸部辨识技术需求增温。
脸部辨识应用范围相当广泛,近年几个热门的应用领域,包括智慧车(或自驾车)、金融科技(Fintech)、智慧零售、机器人、无人机等的开发厂商,试图采用脸部辨识技术提升装置的性能,或是进行方法、流程的改善及创新。不仅如此,这些应用领域的领导厂商,及平台、晶片业者等,多数也都透过自主开发或合资并购来掌握脸部辨识核心技术,在应用的扩散及大厂带动下,脸部辨识未来发展值得期待。
非主动认证及导入嵌入式设备为两大应用发展
脸部辨识应用依使用目的可分成「安全相关」跟「非关安全」。安全相关应用是以保障国土、个人及财产安全为主要目的,如:公部门将脸部辨识认证导入出入境审查系统,用以保障国土及人民安全;金融业采用脸部辨识技术做为金融交易的身分认证使用,以保障客户财产安全。非关安全的应用则多以提高企业或个人利益为主要目的,如:零售业者透过脸部辨识收集客户行为数据并加以分析,用客制化的购物体验吸引消费者,为企业创造收益。
一般而言,与「安全相关」的应用因涉及国土、人身及财产安全保障,一旦在各种应用领域关于安全效益得到验证,预期发展会相当快速。相对来说,「非关安全」的应用是以企业或个人利益为出发点,若要能顺利发展,需视脸部辨识技术的引入,可为企业及个人带来附加价值。
除依使用目的分类外,脸部辨识技术依使用者的认证模式不同,又可分成「主动认证」跟「非主动认证」。主动认证代表使用者是在自主意识下,依规范而进行认证的行为,如:门禁管理系统的应用,使用者通常会依规定摘除可能遮蔽脸部特征的物品如:口罩、墨镜等,以利于认证的进行。非主动认证指的是在使用者没有意识到摄影机存在的情况下进行认证的动作,如:医疗院所或居家的照护监控系统。
非主动认证因为不需使用者驻足停留,可能应用的情境更为广泛,且更具便利性。但在非主动认证情境下,被认证的一方很可能是处于不知情或不愿意的情况下被动地进行认证,在应用上也易面临隐私权争议,例如零售业者采用脸部辨识技术进行消费者或行为分析已行之有年,然而碍于隐私权的问题,多数不会主动谈论。
现阶段实用化的应用是以与安全相关的主动认证为主,但是随著如:安全监控、犯罪追踪、零售应用等需求的展开、以及在使用便利性的考量下,预期应用模式会出现从主动认证朝向非主动认证的趋势发展。
另一方面,由于资讯隐私及应用时效性等考量,在设备端进行认证的需求也逐渐浮现。脸部辨识运算可能在云端或设备端处理。如果是采用云端运算方式,资料先要上传到云端经处理后再传回设备,易有资讯递延,以及资安疑虑。而设备端处理不仅提升资讯处理速度,资讯保密性亦较高,例如汽车、无人机等注重时效,或家用、医疗等注重隐私应用,则更为合适。
3D辨识及处理深度学习晶片为主要技术动向
非主动认证一般捕捉到的图像可能不是正面、解析度太低、画面太小、或易受到各种遮蔽物及环境光的干扰,影响辨识结果,技术难度较主动认证高。采用一般的2D脸部辨识不易得到精准的辨识结果,促使厂商关注3D脸部辨识的开发。
脸部图像包括2D及 3D两种态样。2D图像主要透过辨识人脸特征如:眼、鼻、口等进行认证,易受到脸部遮蔽物、脸部角度及表情、光线等影响精准度。3D图像提供的是几何、深度资讯,不会受到脸的视角或照明条件影响,且认证距离可拉长至60–130cm(2D技术的认证距离为30–80cm),应用情境相对广阔,有利于非主动认证的应用。
事实上,3D脸部辨识开发已有十多年,过去因成本高、3D建模速度慢等因素,难以商用普及。2010年后随著3D感测技术的进步,如 Microsoft Kinect、PrimeSense Carmine等推出,成本降至平均2百美元,使3D脸部辨识具普及发展可能性。在脸部辨识业者多投入3D感测技术发展情况下,预期加速应用扩散。
嵌入式设备发展关键在处理深度学习晶片开发
在设备端进行脸部辨识运算发展方面,由于脸部辨识要处理的资料量及运算量相当庞大,当脸部辨识认证从云端验证走向设备端验证时,就面临到小型嵌入式设备资料处理能力有限的问题。尤其近年业者开始引入深度学习技术,其计算更复杂且耗能,业界需要一种可把深度学习演算法放入低功耗嵌入式设备端进行运算方法。
要能在嵌入式设备处理深度学习运算,需要高性能且低功耗的晶片支援。对此,半导体业者正积极开发低功耗、专用于深度学习计算的神经网络处理单元(Neural Processing Unit),例如Apple在2017年发表的iPhone X就搭载其自行研发,具神经网路引擎的A11处理器。预期随著低功耗深度学习处理晶片的开发及商用化,将大举推动脸部辨识技术于嵌入式设备应用发展,以及整体市场的开拓,此趋势或将带动人类发展更高的突破,且拭目以待。