按Enter到主内容区
:::

财团法人海峡交流基金会

:::

全球大数据发展趋势与台湾的机会◆文/林安妮《交流杂志104年6月号第141期(历史资料)》

近几个月在台湾爆红的关键字不少,大数据(big data)就是其中一个。特别是去年底的「九合一」选举,标榜素人参政的台大医生柯文哲,靠了一支大数据部队风光打赢选战;今(二○一五)年初,毛内阁上台后,也是标榜要以大数据、开放资料与群众外包,翻转政府、创造有感施政。

中研院统计科学研究所研究员银庆刚与高雄大学统计研究所副教授俞淑惠,是国内知名的大数据夫妻档。银庆刚解释,大数据经常也被称为巨量资料或是海量资料,数据之所以大、巨量或者海量,都是因为其涉及的资料量规模,已经大到无法让人工在合理时间内撷取、管理、处理并整理成为人类所能解读的资讯。

举例来说,像是脸书、谷歌每分每秒都在网路上收集资讯,按照时间累积出的资料量相当巨大。对于处理大数据的专家而言,他最重要的任务,就是要找对方法躲开不可能的计算负担,并在有限时间挖掘及分析资料。

大数据妙用多 应用层面广

去(二○一四)年底「九合一」选举时,现任台北市长的柯文哲,就是靠著一批年轻的大数据部队,帮忙分析网路族群关心何项议题并判断那些事情发生时,必须即刻回应。事实上,大数据应用层面广,在国外,有团队算出那些机场最有可能碰到感染伊波拉病毒的旅客,以便官方加强防疫。在国内,还有团队把大数据用在国人健康照护、提升晶圆厂良率、环境监测,甚至还能预测一家公司的破产机率。

财经背景出身的俞淑惠说,她曾以大数据建立一个公司破产模型,靠著找出导致公司破产的关键因素,如营运管理、财务杠杆等,算出一家公司的破产机率。若是把大数据的方法应用在改善良率上,就要看生产线资讯;要预测哪些地方可能发生霾害,就要大量收集各空气监测站的资料;要找出破产公司,则看财务报表。

她笑说,大数据的妙用,就是能以科学方法处理资料、解读资料,并做出预测,有时候感觉像在茫茫的「资料海」中,要找出「凶手」来。银庆刚更传神形容,就是要在大海中捞出那根针。

银庆刚与俞淑惠先前曾透过科技部的研究计划,协助台积电运用大数据,找出问题机台,让不少台积电人惊呼,「不用进到生产线,也能找到问题机台」。

银庆刚说,晶圆的制造过程非常繁复,需要大量机台层层加工涂料,才能诞生一个合格的晶圆成品。对科技厂来说,如何在晶圆成品还很少的制程初期,找到最优良的关键机台协助生产,就能提升良率。

举例而言,一个晶圆成品若要经过三百个机台,正常情况下要找出问题机台的机率是二的三百次方,无疑是一个大数据。银庆钢的做法分三步骤,第一,先透过统计资料将三百个机台做优劣排列;第二,透过机率设定截断点;第三,则是筛检,找出真正的问题机台。

银庆刚的这套方法,是他在二○一一年底与中研院院士、美国史丹福大学统计系教授黎子良一同研究,以大数据协助提升晶圆厂良率所建立。黎子良后来也带领史丹福团队协助英特尔改善良率,说明国际间的晶圆龙头业者,英雄所见略同,早已看见大数据的力量。

运用大数据 提升政策精准度

大数据除了用于产业、协助政治人物提升选民好感度外,也可用在政策制订,协助文官以新方法、新资料,提升政策精准度。

行政院长毛治国最近就指定经济部、国发会与科技部筹组「大数据技术指导小组」,协助各部会提高政策制定精准度。毛院长初步开出要「大数据技术指导小组」研究的「指定题」有三个,包括企业加薪、协助新住民第二代与毒品防制。

国发会官员表示,政府官员每天都在谈论大数据,但是除了拥有技术专长的科技部、经济部,及近年力促各部会释出资料的国发会等少数部会,大多数官员仍对大数据感到陌生,于是毛院长才会要求在政府内部成立指导小组,教各部会如何运用大数据。

以企业家薪资调查来说,过去政府掌握国人薪资情形,主要是仰赖主计总处做薪资调查,或是观察企业投保劳保,但是两者都可能出现人为短报。行政院此次运用大数据,先「捞出」五百多万名纳税人资料,再从每一笔纳税资料人的缴税纪录,与劳保资料库勾稽,分析纳税人所受雇的公司,这三年给薪情形,判定企业有无加薪、加薪水准为何、那些人最容易被加薪等。

行政院的「大数据技术指导小组」指挥官为拥有资通讯专长的副院长张善政,未来各部会可以自行发想出题,由经济部、科技部担任技术指导。当两部会「罩不住」的时候,再请学界、业者提供工具或是好点子帮忙解题。至于国发会则担任行政协调,若A部会想要用B部会资料库,B部会不愿提供,国发会负责协调,并扮演伦理把关者角色,确定各部会的题目不会有道德疑虑或引发社会争议。

国发会官员表示,大数据虽非无所不能,但有了这项新工具,可让政府资源「去到更想去的地方」。除了企业加薪调查外,毛揆相当重视的新住民第二代资源问题,也可靠大数据来「摸底」。官员说,目前台湾的新住民已达五十万人,惟一直欠缺有力的资料库,来掌握新住民与第二代在台湾生活的图像,「毛揆的功课,就是要大家从资料库中,『捞出』新住民与第二代在哪里?需要帮忙吗」﹖

官员解释,一般说来,内政部可掌握新住民的入境、居住资料,但是一旦新住民归化我国籍后,资料很可能就「断链」,倘若能再加入教育部、卫福部等更多部会掌有的资料库,就可大致捕捉到这些新住民与第二代在台湾生活情形,教育、社福资源是否充沛,如果不够,可定向提供资源。更重要的是,此刻正值台湾想要深耕东南亚等海外市场,这些新住民第二代,若能透过政府的重点培育,将可成为助攻海外市场的贸易尖兵。

从点扩及面 全方位运用大数据

在张善政领军下,政府内部除了启动「大数据技术指导小组」,教导各部会如何运用外,包括科技部、经济部也陆续启动扩大政府与产学界应用大数据计划。经济部表示,今年起,经济部将启动四年约十二亿元的大型科专计画,第一步是先鼓励工研院与资策会两大法人,往前端做大数据的技术发展和应用探索,下一步会透过科专计画鼓励业者应用到实际生产面。

科技部在二○一六年的科专计画里,已把大数据列为发展重点,近期教育部还将在硕博士班开设大数据课程,培育人才、缩短产学落差。

科技部次长林一平说,目前科技部已有五十多个学界研发计划,近期会媒合各部会,看是要「政府出题,学界帮忙解决」,还是「学界丢需求,政府帮忙给资源」。他说,大数据真的很夯,很多业者都已看到商机,国内业者,像是运用在物联网的研华,或运用在工具机的上银,纷纷表态,希望能跟政府多合作。

至于业者常碰到的问题为何?科技部与经济部表示,国内大数据人才不足,或是法规面限制,例如健保资料库能否释出或是远距医疗只能做健康管理,不能有诊疗行为等,都是跨部会接下来会检视之处。

资料科学家 薪情夯

大数据夯,让各行各业看见机会与希望,不过,庞大的数据资料,除靠电脑程式挖掘、计算,还是得靠「人」来帮忙设计模型并解读。这些「人」,就是所谓的「资料科学家」。

台湾科技大学管理学院资管系特聘教授卢希鹏表示,数位科技带来各种新的人才需求,这些人才往往也是「跨领域」人才。所谓「跨领域」人才,是指在多个专业领域里拥有知识(domain knowledge),同时兼具分析资讯的逻辑能力,并能与团队一同工作。

他认为,在这样的需求下,不但既有的科系如数学系、资管系等传统学系分法,已显得不管用。既有的公司部门分界,也变得不确定,因为资料科学家、大数据人才似乎不是单一科系能够培育,其任务也不是企业既有的资讯、行销等单一部门能涵括,产官学界应共同思索,如何抓住大数据背后的真正需求,为培育大数据科学人才扎根,带动台湾资料科学环境的发展。

回页首