按Enter到主內容區
:::

財團法人海峽交流基金會

:::

海量資料淘金潮—從兩岸媒體看大數據革新◆文/郭玫君(聯合報記者)

  • 更新日期:109-08-16

大數據(Big Data)浪潮正掀起全面革新,當全世界、各產業都在追趕大數據,搶著從中淘金,兩岸媒體界也從中發展出不同經驗。台灣媒體的大數據應用未成氣候,有待急起直追大;大陸已將大數據當成國家競爭性資源,其傳媒的大數據發展腳步也快得多,但諸多案例用以維持「和諧」社會氣氛,「講好中國故事」,仍具濃厚官方色彩。 海量資料時代,人人都說得一口大數據,大數據究竟為何物?其實大數據不是新東西,其精髓不在「大」而在分析,如何從網路留下的「數據足跡」中挖掘潛在價值,才是大數據的意義。 從一組名為「互聯網上一天」數據可得知,一天當中,互聯網上產生的全部內容可刻滿一‧六八億張DVD;發出的郵件有兩千九百四十億封之多,相當於美國兩年的紙質信件數量;發出的社群貼文達兩百萬則,相當於「時代」雜誌七百七十年的文字量。 驚人的資料量如同金礦,但該如何淘金?大陸媒體數年前開始小範圍應用數據做出數位圖表新聞,從二○一二年網易新聞的「數獨」專欄發布首條新聞「最適合兒童成長的國家」,而後其他入口網站新浪「圖文天下」、搜狐「數位之道」等相繼成立;京華時報、錢江晚報和南方都市報等紙媒也規劃在版面刊載數據新聞的視覺化作品。

從大數據看春運 迷宮中感受全局

但要說真正意義上的大數據新聞應用,就得提央視的案例。二○一四年被視為大陸的大數據新聞元年,因為當年春節開始,央視與大數據公司合作推出一系列電視大數據新聞,「『據』說春運」、「兩會大數據」是經典案例。 被稱為「地表上最大的人口移動」的大陸春運,新聞年年報,該如何創新?央視結合百度大數據,以動態遷徙圖和靜態統計圖等方式,讓讀者及時掌握全大陸春運流動的趨勢。人群從哪裡到哪裡,哪些路線最熱門?透過這張百度遷徙圖,人們首度可「在迷宮中感受全局」,真正看見春運全貌。 大數據中還能挖掘出傳統新聞未能發現的亮點,如父母趕到子女打工城市過年的「逆向過年」現象,或「丈母娘的禮物」成熱搜詞這類有趣角度的報導。因此「『據』說春運」一推出,隨即引起大陸各家媒體,特別是新媒體廣泛轉載和推薦,吸引了五億多網友的目光。 「『據』說春運」讓央視初嘗甜頭,隨後又推出一系列大數據電視新聞節目,而最讓央視津津樂道的,就是他們如何將較為乏味的全國「兩會」新聞透過大數據變有趣。

大陸全國兩會 印尼最關注

大陸每年初春召開的兩會,大陸媒體慣以「全球高度關注」形容;但「全球」指的是誰?到底誰最關注?若有讀者這麼一問,恐怕難倒記者。但二○一四年央視「新聞聯播」卻透過大數據給了解答。 結果出乎意料,原來印尼高居榜首,美國名列第四,大陸民眾相對陌生的祕魯竟排名第七。進一步解讀,大陸每年從祕魯進口鱷梨,這是當地人關注兩會的原因。換言之,大陸發展成敗越攸關哪國的利益,哪國就越關心兩會;當大陸能透過大數據精確讀懂世界怎麼看兩會,就有助於「講好中國故事」。 如何讓兩會題材更貼近普通百姓?當大陸國務院總理李克強的政府工作報告談到互聯網安全時,央視與合作的大數據團隊思索出一個畫像,呈現「什麼人上網最容易上當受騙」。經大數據分析所描繪出的人物畫像特質是:十六歲至廿五歲、九○後、廣東、男性、網路兼職、網路購物、網路遊戲、每天上午十點到十二點最容易上當受騙。 有趣的是,同一天廣東中山大學官方微博發了一個警示:「本校幾位男生因為上網受騙,少的四至五萬,多的四十至五十萬。」此案例正好吻合大數據分析後的人物特質。

陸媒大數據 負責「和諧」輿論

大陸媒體的大數據應用推陳出新,除傳統主流媒體與百度、尼爾森、億贊普、騰訊等合作的模式,有些已發展出新媒體單位,成立自有的大數據中心。但有時大數據用於精準管控輿情發展,維持「和諧」社會氣氛,仍具濃厚大陸特色。 湖北日報新媒體集團近期全力發展大數據中心,該中心主任傅文仁形容,「大數據是麵條不是米飯,米飯是一顆顆、訊息單一,大數據則是從源源不斷的內容中打碎提煉而出。」大數據環境下,資料不是使用了一次效果就遞減,反而越使用越有價值。 在大陸,透過大數據分析讀者每天閱讀的文章,得知其愛好、政治取向,進而推薦文章,已發展出成熟模式。然而湖北日報大數據中心從中提煉出的「麵條」,卻不單單是一般媒體追求的點閱率,而是專攻「形象管理」,不脫官方色彩。 「政治人物在網路上容易被貼標籤,放大錯誤。」傅文仁說,藉由大數據進行網路輿情管理,如發布政治人物講話與文件前,事先預測網友輿論可能導向;若可能偏離原定目標,則在發布前調整、減緩落差,以達成社會和諧的目標。不過他否認這樣的作法,是單純管制或刪除訊息。 有無操作成功的案例?有。他舉了「東方之星」沉船案件為例,指大數據在當中發揮了作用,包括決定哪些內容能報導、哪些能滿足網友的知情權。傅文仁說,若訊息管理得當,可以避免社會過度受到負面情緒影響。 微妙的是,在「東方之星」事件中,由於官媒歌頌救援行動,試圖引導輿論,引發民間強烈反彈。當時湖北日報也因很早就將事因定調為「大風大雨」,將事故淡化為天災所致,遭外界質疑。此被視為「成功」的案例,似乎和網路輿情認知有出入,倒也能一窺大陸特色下的媒體大數據應用。

從大數據找趨勢 從趨勢創造議題

台灣媒體在大數據應用發展尚不夠成熟,比起國外稍顯落後,也較大陸腳步緩慢,但少了官媒包袱,大數據新聞內容更具創意。 台灣最大自媒體「痞客邦」共同創辦人暨技術長朱皇韋表示,網路媒體興起帶動內容多元化,數據變得更加豐富,痞客邦十多年來累積大量的數據資料,每天不重複的拜訪人數達七百七十萬,達台灣一半以上上網人口,累積五億篇文章,讓痞客邦開始思索,如何利用這些資源「從大數據尋找趨勢,從趨勢創造議題」。 以「雷神巧克力」為例,之所以在台灣竄紅,一開始從部落客分享開箱文,進而到社群瘋狂轉載,造成旅日民眾大量採購,最終結果是媒體報導,讓巧克力更難買。 如何從網路社群積累的社會脈動中創造議題?痞客邦成立一個專門觀測大數據的部門PIXinsight,將數據應用於新聞議題、醫療、金融及電信等。以新聞為例,痞客邦曾跟遠見雜誌合作從大數據去分析選校議題,結果打破過去名校、就業考量的迷思,發現興趣、個性跟離家近(生活支出考量)才是三大選校考量。 有別於傳統選校調查報導,它以大數據分析網友們在臉書、PTT、痞客邦等主要網站的創作,如發表文章、分享按讚、瀏覽、搜尋等行為,找出「網路聲量最大」(討論度最高)的校系、該校代表關鍵字(即最常與該校名出現在同一篇文章中的字眼)。結果發現,「成大」奪得網路聲量冠軍,而網路上與成大相關度最高的代表字是「研究所」。 傳統主流媒體「聯合報」近年朝數位化轉型,旗下成立新媒體部,設有大數據研究單位,以科學方法探掘社群正熱議的話題,作為編輯室即時做決定、找新聞亮點的重要依據。 除以大數據輔助決策,聯合報也做出不少創新的數據新聞,讓讀者在尋常人事物中發現數據迷人處。如金曲獎前夕,聯合報新媒體中心特別企畫「數據解讀作詞之王|林夕」,用數據解析林夕的創作人生。有不少膾炙人口經典作品的林夕,原來不只幫大牌歌手寫歌,與他曾合作的歌手多達六百七十位,以楊千嬅一○三首最多,其次是古巨基一○二首、黎明九十二首。

百度大數據 改寫角色命運

除新聞媒體,影視廣電媒體生態也因大數據出現改革,破除傳統收視率迷思。湖南衛視「不一樣的美男子」是大陸首部擁抱大數據、邊拍邊播的電視劇。透過百度大數據,洞察觀眾喜好,為觀眾喜歡的角色增加劇情,甚至決定結局走向,真正做到與觀眾互動。 大陸許多機構結合網路數據預測收視率等,如大陸的尼爾森聯網「電視節目大數據選題研究」,央視索福瑞和新浪微博去年也推出「微博電視指數」。如尼爾森聯網為江蘇衛視的王牌節目「非誠勿擾」提供大數據選題研究服務,挖掘出觀眾對節目的真實態度。 兩岸媒體大數據應用勢不可擋,但都在摸索模式。大陸雖有諸多推陳出新嘗試,但部分粗糙內容也為人詬病。二○一五年底在台北舉行的「大數據時代下的兩岸新聞趨勢及創新應用」座談會中,兩岸媒體人熱議大數據新聞趨勢。 奧美互動行銷公司董事總經理張志浩指出,巴黎爆炸後,一名插畫家畫的圖幾小時內立刻在臉書洗版,若報社內能有一個即時操作的組織,以閱讀者習慣的方式立即回應,力量可能比寫一篇文章更有效。 朱皇韋說,新聞媒體若能結合大數據,更精確掌控事件發生的前因跟後果,進而追蹤報導,可產生更優質的媒體內容。中央廣播電台總台長賴祥蔚則指出,大數據分析日後可以預測未來事件發生,恐衝擊新聞媒體,新聞是否會變為提供讀者喜愛看的新聞,忽略新聞報導倫理,值得關注。

回頁首