數據視覺化在數據策略上的藝術與科學
王任澤

法國 Lascaux 洞窟的石器時代遺蹟被認定為最古老的史前壁畫,是人類最早的繪畫創作。事實上,這些壁畫也是當時人類利用「資訊圖表」(Infographics)記載生活的表現,能用以統計牲畜的種類和數量。

所謂「一圖勝千言」,這是因為大腦處理文字和影像的方式不同:文書處理是「循序線性的」,而影像處理則是「同步進行的」,對人腦來說影像比文字容易理解。科學研究發現影像思考是雙眼生物演化而來的天賦能力,圖畫是最基本而有效的表達工具,這也是在資料量爆炸的時代,數據視覺化、資訊圖表成為顯學的原因。

為何需要數據視覺化

試想如何利用目前的疫情統計,讓社會大眾瞭解保持「社交距離(Social Distancing)」是控制新冠肺炎疫情的最佳解?當代處理數據的裝置和技術,讓數據工程師和數據分析師減少大量作業時間,完成數據清理、整備、建模和分析的工作。然而在分析結果產生之後,透過數字來描述脈絡、述說故事、找到洞察並不容易。龐雜的資訊利用影像來呈現,往往會有出乎意料的效果。

以防疫衛教為例,華盛頓郵報在一篇探討如何對抗疫情的報導當中,先以時間序列圖描述新冠肺炎感染人數呈「指數成長」,再以不同阻絕策略動態模擬病毒的擴散。比對四種模擬之後,驗證「廣泛保持社交距離(Extensive Distancing)」的情況下,感染人數曲線最為平緩,控制效果最佳(見下圖)。此篇報導動態圖表的意涵深入淺出,在網路上被大量轉載和分享。

Simulation of Extensive Distancing
(圖表來源:Why outbreaks like coronavirus spread exponentially, and how to 「flatten the curve」https://www.washingtonpost.com/graphics/2020/world/corona-simulator/)

數據視覺化的興起也產生了新型態的工作,「數據記者」(Data Journalist)即是新興職務之一。顧名思義,數據記者以數據視覺化工具產生資訊圖表,加強寫作和報導內容,讓新聞訊息更容易向社會大眾傳播。早期的數據記者出現于開源社群,利用開放數據和視覺化的技術產出圖表,分享政治、社會、文化和環境等議題內容,間接促進了政府建立更完整的開放數據平臺。隨著資訊圖表加入了更多設計元素,時至今日數據新聞(Data Journalism)已成為新聞媒體的標準配備,走在浪頭上的媒體甚至有專職數據記者的編制。

如同文字資訊的傳播,一組引人入勝的資訊圖表不但可以有效達到溝通的效果,更能快速地在社群中擴散。要製作一組有價值的資訊圖表,建議評估以下幾項要素:

聚焦策略目標與診斷指標

數據視覺化在企業層面的應用,就是能夠即時幫助營運決策的數據儀錶板(Dashboard)。一個企業所擁有的數據,散佈于各個單位部門,要能第一時間掌握營運現況的數據並不容易。依據筆者的經驗,企業對於數據儀錶板的需求,通常隱含了兩個命題:「多來源數據整合」和「商業智慧(Business Intelligence, BI)」。視覺化是資訊呈現的方式,解決營運問題、達成企業目標要透過數據整合和分析找到答案。

管理大師彼得·杜拉克(Peter Drucker)倡導目標管理(Management by Objectives, MBO),其後世人衍生「駕駛艙內」的隱喻:關鍵結果領域(Key Result Areas, KRA)的指標,是引導企業發展方向之必要「儀錶板」。做為商業用途的視覺化資訊圖表,選定要呈現的策略目標和診斷指標(Diagnostic Metrics)甚為重要。策略目標具體的展現是「關鍵績效指標(Key Performance Indicators, KPI)」,必須有代表性並且可用科學方式衡量,診斷指標則是客觀的「度量」。

舉例來說,某個企業設定「三個月內官方網站的流量增長10%以促進銷售機會」,「促進銷售機會」是策略目標,「流量增長10%」是KPI,用來測量流量的「訪客數」則是診斷指標。

列舉數碼行銷常見的KPI與診斷指標

消費旅程接觸點

KPI

診斷指標(列舉)

影片廣告

關注提升

觀看數、觀看率、觀看時間長度

展示型廣告

互動增加

點選數、點選率、點選進站數

關鍵字廣告

需求提升

搜索曝光量、點選數、點選率

網站

流量增長

訪客數、不重複訪客數、造訪次數

電子商務

業績增長

轉換數、轉換率、收益

多來源數據整合與視覺圖表呈現

實務上,筆者經常遇到需要整合多來源數據的情境。例如企業想要了解數碼媒體投放成效,除了檢視媒體端的指標之外,也要同時觀察媒體導流訪客的網站使用行為,甚至要掌握這些訪客是否帶動電商轉換率。有什麼做法可以兼顧營運監測的即時性和互動性?

要滿足這樣的需求,除了在消費者互動的各個環節佈署數據蒐集機制,還可以將不同平臺上的數據呈現在同一組數據儀錶板當中。試想將 Google Ads、Facebook Ads 等媒體廣告數據,並同網站流量數據及電商銷售數據整合在一組儀錶板上,透過篩選器選擇任何時間區間進行觀察和比較,進一步挖掘(Drill-down)不同媒體管道和廣告素材的成效差異,可以大幅提升即時優化和績效管理的效率。

你或許聽過 Google Data Studio,或是 Tableau、Qlikview、微軟 Power BI 等,都是業界常見的數據視覺化解決方案。這些工具皆具備多來源的數據聯結器(Data Connectors)和圖表庫,幫助企業打造兼顧美感和易用性的數據儀錶板。

奧美應用案例

自2019年7月起,我們已陸續利用數據視覺化工具發展數據產品,為客戶開發儀錶板。目前有五種不同型別的模板,如下表所列(因應實際需求客制開發則不限於這五型別):

數據儀錶板型別

儀錶板型別

規格

適用情境

適用行業

Data Source Integration

進階

活動執行要監測好多平臺的數據,如何快速提供整合性的資訊?

各行業適用

Grand Achievement

客戶最關心的是整體活動成效和執行進度

零售業、電商

Performance Marketing

操作成效型活動,客戶不提供網站流量數據的優化作法

金融業、保險業、基金公司

SEM

簡易

如何增減關鍵字廣告鎖定的字組?

各行業適用

Social Posts Promotion

專為社群貼文設計的日常報表

各行業適用

由於客戶營運資訊不宜作為公開案例,我們利用範例資料建置了展示儀錶板供內外部測試,如下圖所示。這組範例儀錶板包含網站數據、電商數據以及 Google Ads 和 Facebook Ads 兩種媒體數據,可體驗「即時數據查詢」和「互動圖表操作」,讓複雜的數據更容易理解和使用。

供內外部測試的範例儀錶板

去年底我們也開始串接政府開放數據做視覺化應用。新冠肺炎抗疫期間,「衛服部健保署」和「疾管署」陸續釋出「健保特約機構口罩剩餘數量明細清單」、「COVID-19 臺灣最新病例、檢驗統計」、「COVID-19 各國家地區累積病例數與死亡數」、「地區年齡性別統計表-嚴重特殊傳染性肺炎」等開放數據,提供社群朋友開發應用界面。

我們將臺灣疫情統計、確診案例分佈、全球疫情統計、國際旅遊警示以及醫事機構口罩剩餘數量彙整於一組儀錶板,並透過數據源即時更新數據,提供關心疫情的民眾一個資訊分流的平臺:「Taiwan COVID-19 Situation Dashboard」 https://bit.ly/2T4gRUD。 (這組儀錶板被臺灣公共數碼創新空間的「口罩供需資訊平臺」 https://mask.pdis.nat.gov.tw/ 所收錄)

如果你對數據視覺化有興趣,不妨找我們聊聊!

返回