文化內容產業
數據儀表板設計研究
本專案針對下列兩組產業類型之常見資料集進行結構分析,並提出建議的視覺化與儀表板規劃。資料集包括:
- 假想之線上影音數據 ( 以流行音樂產業為主 )
- 假想之獨立書店數據 ( 以出版產業為主 )
此外,我們亦針對現已有之 友善書業供給合作社提供之獨立書店相關數據 併 假想之出版產業獨立書店銷售數據 統整進行出版產業獨立書店部份之設計規劃。
研究方法
此設計研究分別針對兩組資料 ( 線上影音、獨立書店 ) 進行三步驟的分析:
- 資料分析
- 儀表板構成
- 參考設計
在 資料分析 部份,將分為 資料標記 → 資料轉換 → 視覺化 三項子步驟做處理,並在視覺化步驟匯整目標讀者可能感興趣的資料觀點。
在 儀表板構成 部份,我們將以資料觀點出發,構思儀表板布局以及對應適合的視覺化手法,並簡單討論可能的儀表板設計改良方向。
在兩組資料討論完後,我們再統一匯整所有提及的儀表板 設計改良 部份做總結,並依使用情境考量額外的功能設計,提出額外的設計規畫,以提升儀表板整體使用體驗及有效性。
資料分析的 資料標記 → 資料轉換 → 視覺化 步驟,我們將以系統性的方式進行,分項描述於後。
1. 資料標記
除了友善書業已提供之資料集外,我們並不確定實際上最終將取得的資料類型,因此我們將分析各領域現有之服務或已釋出之資料集,歸納資料之並做初步分析,做為研究的基礎。
為了簡化資料分析的過程並更容易 ( 甚至自動地 ) 生成視覺化圖表,我們將使用 視覺化資料分類法 標記歸納後的各產業資料。視覺化資料分類法將資料以 欄 ( Column ) 為單位,依據其對應的型態標記其形式。
基本分類標記
我們預計使用的 基本分類標記 包括:
- N 名目式 / Nominal
單純的文字、名稱資料。以 N 標註。任何資料均可視為名目式資料。 - C 分類式 / Categorical
亦為文字資料,但各筆資料間共用少數的幾組文字。以 C 標註。 - O 有序式 / Ordinal
有序、可以建立順序的,如年份、金額。
任何資料均可轉化為有序式。以 O 標註。 - T 時序式 / Temporal
資料的本質是時間。亦為區間式 ( I ) 或有序式資料 ( O )。以 T 標註。 - I 區間式 / Interval
數值資料,但各筆資料間相加不具實質意義,如年齡。以 I 標註。 - R 比例式 / Ratio
可以相加的數值資料 以 R 標註。
例如,以假想的 逐年各類圖書銷售量 來說,我們可能會有如下表的資料:
| 年份 | 類型 | 銷售量(本) |
|---|---|---|
| 2018 | 漫畫 | 120 |
| 2018 | 科普 | 421 |
| 2018 | 商業 | 132 |
| 2018 | 小說 | 220 |
| 2019 | 漫畫 | 123 |
| 2019 | 科普 | 521 |
| 2019 | 商業 | 332 |
| 2019 | 小說 | 122 |
由於視覺化考慮的是各欄位的分類標記,我們需要依視覺化資料分類法將各欄位做標記。例如,
- 年份 為時序資料,標記為 T。
- 類型 為分類式資料,標記為 C。
- 銷售量 則為比例式資料,標記為 R。
標記過後之資料如下:
| 年份 | 類型 | 銷售量(本) |
|---|---|---|
| T | C | R |
為了方便,我們使用 T x C x R 來表示此資料的資料分類標記。
進階性質
除了基本分類標記以外,資料有時會有其它亦值得標注的、適合用於視覺化的概念。舉例來說,地理資料中常有 縣市 → 鄉鎮 這類型的資料,若使用資料標記來描述為 C x C,但這個描述方式並沒有表現到兩者之間上對下的關係;亦或者若我們使用多個欄位表達六都的人口數,資料標記為 R x R x R x R x R x R 但標記並沒有說明這六個欄位表現的為同質性的人口數資料。
為了更完整的表現此類資料的特性,我們額外定義 進階分類標記:
- 同質資料
在不同欄位表現同質性資料時,使用方括號表現。
例如,用 [ R x R ] 表示 台北與新北的人口數。 - 對立資料
同質性但包含對立概念的資料,用角括號表現。
例如,用 < R x R > 表示 男人口數 vs 女人口數。 - 階層資料
欄位間有階層性時,使用箭頭做標記。
例如,用 C → C 表是 縣市與鄉鎮 欄位。 - 階層資料
若我們有不定數量的額外欄位可追加時,使用星號標記。
例如,用 R* 表示一組以上的數值資料。
以人口數資料為例,台灣各縣市、各鄉鎮 之 未成年、壯年、老年男女人口數 之資料分類如下:
| 縣市 | 鄉鎮 | 男人口(未成年) | 女人口(未成年) | 男人口(壯年) | 女人口(壯年) | 男人口(老年) | 女人口(老年) |
|---|---|---|---|---|---|---|---|
| C | C | R | R | R | R | R | R |
其資料標記可以寫成:
C → C x [ < R x R > x < R x R > x < R x R > ]
2. 資料轉換
在資料標記完成後,我們應該就資料的內涵考慮可能的資料轉換。
資料轉換可以想成是透過重新整理資料讓我們可以從另一個面向來觀察資料。以上例 逐年各類圖書銷售量 來說,梳理完的資料類型為 T x C x R ,表示的是在 各個年度、各別分類 的圖書、其 各別銷售數量 為何。然而,我們亦可以銷售數量依年度總計,得到 各個年度、在該年度的書籍總銷售量 為何,分類標記為 T x R。以這個例子來說,我們以 年度相同 為條件,將 不同分類的銷售量 做 總和, 分類 欄位因此消失,留下的只有做為條件的 年度 以及統計過後的 總和。
在此研究中,我們可以使用以下幾種轉換方式:
叢聚轉換 ( Clustering )
將資料依範圍做分組轉換。例如,將年齡欄位 ( R ) 按 未成年 ( 0 ~ 18 )、壯年 ( 18 ~ 65 )、老年 ( 65+ ) 分為三組。資料經轉換後,會變成分類式 ( C ) 資料。若資料集中有其它欄位,則其它欄位需要進一步進行聚合轉換。
叢聚轉換會消滅目標欄位,將其轉換為標記類型為 C 的新欄位。
聚合轉換 ( Aggregation )
依資料分類重新統計各欄位。如上例中,依年齡欄位重新分組後,我們可以將各分組中的身高以 平均值 ( Average ) 表示,亦可將各組中的財產依 總和 ( Sum ) 表示,其中 平均 與 總和 即為 聚合轉換 的一種。
資料表合併 ( Join )
若有多個資料表指涉到同一個實體 ( 例如,兩個資料表都有身份證字號 ),這兩個資料表則可以透過身份證字號合併 ( Join )。
例如,下列兩表分別代表某學生的考試成績:
| 學號 | 國文成績 |
|---|---|
| A001 | 50 |
| A002 | 60 |
| 學號 | 數學成績 |
|---|---|
| A001 | 80 |
| A002 | 72 |
兩者可透過 學號 一欄做合併成:
| 學號 | 國文成績 | 數學成績 |
|---|---|---|
| A001 | 50 | 80 |
| A002 | 60 | 72 |
樞鈕 / 反樞鈕轉換 ( Pivot / Unpivot )
我們可以將分組欄位按分組重新編排成獨立的欄位,例如上例中 年齡分類 欄位中的 未成年、壯年 與 老年,可以搭配 身高 欄位重新分出三個獨立的欄位:
| 年齡分類 | 身高 |
|---|---|
| C | R |
| 身高(未成年) | 身高(壯年) | 身高(老年) |
|---|---|---|
| R | R | R |
如上表所示,原本 C x R 的資料分類經轉換後變成 [ R x R x R ]。
3. 視覺化
在資料標記完成後,再進一步使用各資料集的視覺化分類歸納出適合的視覺化呈現方式。
不同的視覺化方式有各種不同適合的對應分類,而資料亦可以透過各種轉換後再套用到原先不適用的視覺化類型上。
舉例來說,以最常見的 折線圖 ( Line Chart ) 來說,可以對應到 時序式 (T) x 一組以上的 比例式 (R) 的資料組,因此我們只要有 T x [ R x R ... ] 類型的資料,即可使用折線圖來呈現。
就上例「逐年各類圖書銷售量」來說,雖然資料標記為 T x C x R,但我們可以透過樞鈕轉換 ( Pivoting ) 將其中的 C ( 類型 ) 轉成多組的 R ( 銷量 ),變成 T x [ R x R ... ]:
| 年份 | 漫畫銷量 | 科普銷量 | 商業銷量 | 小說銷量 |
|---|---|---|---|---|
| 2018 | 120 | 421 | 132 | 220 |
| 2019 | 123 | 521 | 332 | 122 |
轉換之後,我們得到了一個年份與四個銷量的表格,資料標記變為 T x [ R x R x R x R ],恰好可適用於多重折線圖。
除了資料轉換外,我們亦可透過額外的補助工具加強圖表所能呈現的資料類型。比方說,我們可以透過選單元件,將 圖書分類 ( C ) 單獨呈現供選擇;此時資料集則為依選擇過濾後的結果,例如:
| 年份 | 類型 | 銷售量(本) |
|---|---|---|
| 2018 | 漫畫 | 120 |
| 2019 | 漫畫 | 123 |
考慮資料標記對應到視覺化與強化元件有多種可能,再加上本案為延伸前案之研究案,目的主要為擴充前案之設計,因此談及視覺化時,我們會優先考慮尚未使用過的視覺化類型為主進行討論。其它亦合適但已實用於現有儀表板中之視覺化,基本上我們不另外討論。
線上影音數據
在線上影音數據部份,我們將以 KKBOX 之線上影音數據為例。
資料分析
KKBOX 線上影音服務透過其網站與應用程式對其 註冊會員 以 訂閱 / 單時段消費模式 提供 隨選即播線上目錄中之音樂。從這個基本設定來看,此類線上影音服務一般有以下數據:
- 會員資訊 ( 註冊人數、月活躍人數、訂閱會員數、會員組成分析 等 )
- 營收資訊 ( 月營收、人均月營收、LVT 、營收組成 等 )
- 樂曲資訊 ( 樂曲 / 影片資訊、歌手、出版商資訊 等 )
除此三種資訊外,亦有資訊之間衍生的額外資訊 ( 如「樂曲好評數」)。 接下來我們將對此三種分類與其衍生資訊做逐一分析。
會員資訊
會員以人組成,因此帶有人為基礎的基本資訊;同時會員在平台上的活動亦可納入考量,比方說「收聽音樂的時段」、「日均播放長度」等等資訊。
會員本身可能有的資訊以及其對應的分類如下:
- N - 會員代碼
- C - 性別
- C - 職業
- C - 地區
- C - 使用裝置
- C - 會員等級
- I - 年齡
- I - 會員年資
- T - 註冊日期
其中「年齡」「年資」這類資料常見的使用情境亦為分組分析 ( 如, 18 ~ 30 歲、30 ~ 45 歲做分組 ),我們亦可將這兩類資料視做分組式資料 ( C ) 來處理。因此可以說會員本身的資料大多為分類式 ( C ) 為主。
總地來說,我們可以用 N x C x C x C x C x C x I x I x T 描述會員資料的分類標記。
樂曲資訊
單一樂曲所具有的常見資料欄位有:
- N - 樂曲代碼
- N - 樂曲名稱
- N - 所屬專輯
- N - 歌手 / 演出
- N - 發行人
- N - 製作人
- C - 來源地區
- C - 語系
- C - 類型 ( Genre )
- C - 子類 ( Subgenre )
- C - 年代 ( Decade )
- R - 長度
其中歌手、製作人、發行人等資料均可延伸出額外的資料內容,例如歌手的性別、國籍、發行人的資本額等等。
然而欲使用此類額外資料,往往會需要一個完整的音樂人資料庫,此類服務通常會是商業用途並需要付費使用;考量到此研究案的性質並不一定需要深入到如此細節的資料中,因此我們先不進一步分析此類資料的額外資訊。
樂取資訊的分類標記為: N x N x N x N x N x N x C x C x [ C > C ] x C x R
營收資訊
營收模式會隨企業經營而調整,並且一般不一定會願意釋出相關資料供使用,因此我們僅依現有模式粗略做整理。單就服務的營收來看,至少有以下兩個面向可以考慮:
- 統計時段 ( T )
營收一般均為統計一定時段之內的收益,因此我們可以考慮「天」、「週」、「月」、「季」、「年」等不同週期的營收統計數據,但以儀表板來說我們若能取得越小區間的資料則越能呈現更豐富的數據與讀者。
- 營收類型 ( C )
服務收入往往不會是單一類型,以 KKBOX 來說營收至少還可區分為:
類型 說明 訂閱月租用戶選擇持續訂閱 KKBOX 的付費服務。 單次計時制用戶選擇一次性的付款,以換取在特定時段內的付費功能。 廣告歌單、插播等向其它企業販售版位、插播或任何可供置入內容的廣告。
從上述面向分析,我們可以想像類似下者的營收資訊:
| T - 時段 | C - 類型 | R - 金額 |
|---|---|---|
以下為範例資料,非真實數據 | ||
| 2021/11/01 ~ 2021/11/02 | 訂閱 | 210000 |
| 2021/11/01 ~ 2021/11/02 | 單次 | 150000 |
| 2021/11/01 ~ 2021/11/02 | 廣告 | 350000 |
由於消費牽涉到會員,我們亦可以將各筆營收統計展開至最細節的數據,加入會員對應的內部代碼;此外,雖然 KKBOX 已不提供單曲購買服務,我們亦可想像類似的服務提供此類購買形式,因此我們亦可額外加入樂曲對應的內部代碼用以代表該筆消費與特定樂曲直接相關。
有了會員與樂曲內部代碼,我們即可以連動營收與會員、樂曲資料,進行進一步的資料分析:
| T - 時段 | C - 類型 | N - 會員代碼 | N - 樂曲代碼 | R - 金額 |
|---|---|---|---|---|
以下為範例資料,非真實數據 | ||||
| 2021/11/01 ~ 2021/12/01 | 訂閱 | 8388608 | - | 278 |
| 2021/11/01 ~ 2021/11/04 | 單次 | 1048576 | 12345 | 180 |
| 2021/11/02 ~ 2021/11/05 | 單次 | 3355443 | 24671 | 180 |
| 2021/11/03 ~ 2021/11/06 | 單次 | 3939889 | 62612 | 180 |
總地來說,我們可以使用 T x C x N x N x R 描述營收資訊的分類標記。
衍生資訊
當考慮樂曲在平台使用的狀況,便可以從 樂曲 與 用戶 互動的內容探索更多資料,進而做下列統計:
- N - 會員代碼
- N - 樂曲代碼
- R - 播放次數
- R - 播放分鐘數
- R - 收藏數
小結
就 KKBOX 可能有的資料集來說,我們已列舉了下列四種資料:
會員資訊
| N | 會員代碼 |
| C | 性別 |
| C | 職業 |
| C | 地區 |
| C | 使用裝置 |
| C | 會員等級 |
| I | 年齡 |
| I | 會員年資 |
| T | 註冊日期 |
樂曲資訊
| N | 樂曲代碼 |
| N | 樂曲名稱 |
| N | 所屬專輯 |
| N | 歌手 / 演出 |
| N | 發行人 |
| N | 製作人 |
| C | 來源地區 |
| C | 類型 ( Genre ) |
| C | 子類 ( Subgenre ) |
| C | 年代 ( Decade ) |
| R | 長度 |
衍生資訊
| N | 會員代碼 |
| N | 樂曲代碼 |
| R | 播放次數 |
| R | 播放分鐘數 |
| R | 收藏數 |
營收資訊
| T | 時段 |
| C | 類型 |
| N | 會員代碼 |
| N | 樂曲代碼 |
| R | 金額 |
視覺化
在完成資料分析後,我們還可以進行資料轉換來取得調整過的分類標記。例如:
- 將營收與會員表透過 會員代碼 合併 ( Join )
- 再將相同 地區 ( C ) 的各筆資料做聚合 ( Aggregation )
- 便取得特定地區 ( C ) 會員對 營收 ( R ) 的貢獻,標記為 C x R
或者
- 將營收與會員表透過 會員代碼 合併 ( Join )
- 依會員年齡叢聚 ( Clustering )、分成數個年齡層 ( I 轉 C )
- 依年齡層、銷費類型對 單次購買量 ( R ) 與 訂閱量 ( R ) 做 聚合轉換 ( Aggregation )
- 最後取得各年齡層 ( C ) 單次購買量 ( R ) 與 訂閱量 ( R ) 的比例性資料,標記為 C x < R x R >
取得各別的資料標記後,我們就可以來嘗試調性相合的視覺化方式,例如:
- 標記 R x C ( 特定地區營收 ) 恰好與 圓餅圖 相符
- 標記 C x < R x R > ( 各年齡層消費類型比例 ) 則與 圓餅泡泡圖 相符
然而,要選出什麼樣的資料組合,以及運用哪一個相符的視覺圖表,這是個相當主觀的問題。由於我們可以呈現的資料相當的多樣,在視覺化時我們可以考慮優先提供讀者可能感興趣的資訊。
為了了解這個問題,我們先試著大略列出一些讀者可能感興趣的題目:
- 最近哪首歌最受歡迎?
- 年輕人現在都在聽什麼?
- 音樂產業發展狀況?
這些問題大致上可以透過下面幾種資訊來說明:
- 排行榜
- 營收狀況
- 用戶數
排行榜
排行榜可以告訴我們在 指定的時間範圍 內,哪些樂曲 / 歌手最受歡迎。除此之外,特定分類 的排名也是必要的,這有助於幫助讀者了解特定類型的音樂現況。最後,排名勢必要依照樂曲 / 歌手的表現 - 我們可以使用衍生資料中的 播放次數、 播放時數 做為排序依據,亦或者使用營收資訊中的 金額 做為依據。
上述四點分別包含了時段、樂曲 / 歌手、分類 以及 金額 / 次數 等四組資訊:
| 資料分類 | 欄位 | 說明 |
|---|---|---|
| T | 時段 | 可按週、月、年等 |
| N | 名稱 | 排名對象,樂曲、歌手、專輯或製作人等 |
| C | 分類 | 排名領域,如男性歌手、90 年代等。可以同時使用多組分類 |
| R | 數值 | 排名依據,如播放次數、播放時數等。亦可同時使用多組數值 |
大致上來說,我們的分類標記可以寫成 T x N x C* x R*。
主題河流
若只考慮 T x N x R,我們可以將其中的 N ( 名稱 ) 經樞紐轉換 ( Pivoting ) 變換成 T x [ R* ] 式的資料,適合用於折線圖示的圖表,其中常用於聲量統計的 主題河流 ( Themeriver / Streamgraph ) 圖表便適合呈現此類排行資料;若我們需要使用被忽略的 分類 ( C ) 欄位,可透過額外的選單元件供用戶切換:
因為主題河流在 Y 軸僅以高度為指標,不考慮相對座標軸原點的值,我們亦可將各數值在 Y 軸上排序,得到排序主題河流 ( Sorted Streamgraph ),一種類似於凹凸圖 ( Bump Chart ) 的面積圖版變形:

散布圖與其變種
若希望直接透過圖表呈現分類資料,我們可以使用散布圖 ( Scatter Plot ) 與其變種;散布圖的變種有許多類型,依設計不同有很大的差異,但一般無法呈現時序資料 - 在這個情況下,我們仍可以統計特定時段的資料做排行,分類標記則為 N x C* x R* 。
舉例來說,"Snake Oil Supplements?" ( from Information is Beautiful ) 使用依 Y 軸排序的泡泡圖,再透過顏色 ( C ) 與選單元件 ( C ) 提供額外的變量,支援 N x C x C x R x R 形式的資料,亦適合用來呈現排行榜式的概念。
若以此圖例類推,我們可以做下列維度對應:
- N - 歌手名稱,顯示為泡泡之名稱
- C - 來源地區,以洲別對應到泡泡顏色表現
- C - 曲風,透過選單元件選取
- R - 播放時數,做為 Y 軸排序依據,越上方越長
- R - 貢獻營收,做為泡泡大小依據,越大營收越高
下圖為此類型泡泡圖之示意圖,摘自 Information is Beautiful:

亦或者,若恰好僅有兩組 比例式 ( R ) 、對立性質的資料,則泡泡圓餅圖 C x < R x R > 恰好適合此類型的資料:
舉例來說,性別 ( 男 / 女 ) 為一種對立性質,我們可以依曲風 ( C ) 將個曲風男、女歌手之營收金額做聚合,便可實現以下對應:
- C - 曲風,每個泡泡代表一種曲風
- R - 特定曲風之男歌手貢獻營收
- R - 特定曲風之女歌手貢獻營收
同時間泡泡大小則對應到各曲風之總營收。
若必須要在泡泡圖中表現時序資訊 ( T ),我們可以使用額外的時間軸元件,此種視覺化方式即為相當有名的 "Gapminder" 動畫泡泡圖視覺化:

然而,由於儀表板本身已帶有特定時段資訊,我們不太容易在圖表中再次置入時間軸動畫,因為這樣可能會導致混亂。較有可能的是在用戶所選定的時段中做動畫輪播,這可視實際資料的需求決定是否我們有必要用這種方式呈現資料。
熱度地圖
當我們只考慮當期數據時,不會用到 T ( 時段 ) 資料,資料標記為 N x C x R ;考慮使用多組分類的情況,亦可能是 N x C x C x R 或 N x C x C x C x R 等。此類資料一般適合使用樹狀圖 ( Treemap ) 來呈現,亦可考慮其中分類的進階特性來選擇圖表,例如當分類為地理資料 ( 縣市、鄉鎮 ) 時,我們可以使用台灣熱度地圖 ( C x R ) 視覺化:
由於熱度地圖使用顏色表示各分類 ( C ) 的數值 ( R ) ,因此我們必須將 N x C x R 透過聚合轉換 ( Aggregation ) 變成 C x R 才能適用,並透過使用者介面提供 名稱 ( N ) 的切換機制。這個情況下,無法有效的表現出排名的概念,但可以做為觀察個別名稱 ( 專輯、歌手 ) 的分類分布時使用。
營收狀況
在營收部份,我們重視的通常是 金額 ( R ) 與 交易量 ( R ) 的 走勢或變化 ( T ) 狀況,也會考慮不同分類 ( C ) 的營收來做分組對比。由於消費模式是有週期性的,我們也常會在前後區間做對比 ( 比方說 今年與去年的營業額對比 )。
在這個前提下,營收狀況的分類標記可寫為
這類型的典型圖表即為 折線圖 或 組合圖 ( Combo Chart, 合併折線與長條圖以呈現金額與數量 )。在考慮呈現 變化 的部份,我們可以使用啞鈴圖 ( Dumbbell Chart, < N x R x R > ) 強調變化的數值:
由於啞鈴圖主要僅使用一對比例式欄位 ( < R x R > ),在使用前我們必須針對 時序欄位 ( T ) 做 叢聚轉換,並試情況提供選單元件處理 分類 ( C ) 資料。
用戶數
如同用戶數,我們通常關心的是人數的成長、同時段跨年度的變化比較、使用時間等等,這類型需求透過經典圖表即可以處理。若需進一步分析,用戶還可以透過性別、地理位置、留存率等不同的分類方式來觀察,這些需求通常都需要專用的圖表來處理,但在不考慮資料語意的情況下,我們一般使用 堆積長條圖 或 100% 堆積長條圖 即可初步呈現資料:
儀表板設計
以 排行榜、營收狀況 與 用戶數 三者為主要指標、同時參考先前的討論,我們可以歸納出以下幾個儀表板設計方向:
- 提供主要指標 ( 營收、用戶數 ) 統計數據
- 提供歌手、樂曲的排行資訊
- 依歌手 / 樂曲、用戶組成提供統計資訊
- 基於組成資訊提供進一步的與過濾功能
以下為建議使用的儀表板欄位:
- 總營收 ( 純數字 )
- 活躍用戶人數 ( 純數字 )
- 播放總次數 ( 純數字 )
- 歌手播放次數排行 ( 主題河流 )
- 所有歌手播放次數佔比 ( 互動式比例長條圖 )
- 播放次數分布 ( 直方圖 )
- 播放時數分布 ( 直方圖 )
- 用戶年齡層 ( 或其它分類 ) 分布 ( 直方圖 )
- 播放曲風比例 ( 圓餅圖 )
- 國內外歌手播放次數比 ( 100% 堆積長條圖 )
為降低使用者操作儀表板時的複雜度,我們以電影產業儀表板的版面做為藍本,在排版上將相似機能的面版設置於同樣的位置:
次數
主題河流
獨立書店數據
在獨立書店數據部份,我們將以友善書業提供之獨立書店資料為例。
資料分析
雖然圖書出版、銷售之數據變化性可能遠多於友善書業提供之資料,但由於我們仍需考慮到實際所能取得之資料,因此在目前已有資料的前提下,我們將優先考量現有資料的分析,並以此為依據提供儀表版設計建議。
友善書業提供獨立書店數據包含以下內容:
僅最新資料
各縣市書店量 ( C x R )- ( C ) 縣市別
- ( R ) 書店量
逐年更新 ( T x C x R )
社員資訊: 逐年 / 縣市別入社統計- ( T ) 入社年度
- ( C ) 縣市
- ( R ) 入社數量
逐季更新
出貨書目 ( 亦有年度統計表格 )( [ T x T ] x N x C x < R x R > x R x R x < O x O > x O x O )
- ( T ) 年
- ( T ) 季
- ( N ) 書名
- ( C ) 出版社
- ( R ) 出貨量
- ( R ) 退貨量
- ( R ) 客訂量
- ( R ) 活動量
- ( O ) 出貨排名
- ( O ) 退貨排名
- ( O ) 客訂排名
- ( O ) 活動排名
逐月更新
書訊筆數 ( T x R )- ( T ) 年 / 月
- ( R ) 書訊建立筆數
- ( T ) 年 / 月
- ( R ) 交易供應商數
- ( T ) 年 / 月
- ( R ) 交易出版社數
- ( T ) 年 / 月
- ( R ) 書目出貨種類
- ( T ) 年 / 月
- ( R ) 銷貨收入
- ( R ) 銷貨成本
- ( R ) 銷貨退回收入
- ( R ) ( 銷貨收入 - 銷貨退回收入 )
- ( R ) 銷貨退回成本
- ( R ) 實際銷貨毛利 ( 銷貨收入 - 銷貨成本 - (銷貨退回收入 - 銷貨退回成本) )
- ( R ) 銷貨數量
- ( R ) 銷退數量
- ( R ) 實際銷貨數量
- ( I ) 實際銷貨毛利率(%) ( 毛利 / ( 銷貨收入 - 銷貨退回收入))
資料解析度問題
互動儀表板為了實現過濾機制,需要較細節且詳盡的資料;例如,銷貨數據尚須書目、書店、出版社等欄位,我們才能進一步統計各別書目、書店的銷貨數據。友善書業目前所提供的數據中,銷貨數據與出貨書目是獨立的兩組資料集,因此我們無法同時分析營收與銷貨量,也沒辦法依照書店來統計營業額。
我們仍能夠假想有一組這樣的資料集進而做為設計儀表板的依據,然而在取得更詳細實際數據之前,我們僅能進行概略的設計,在獲得更完整數據之後再依實際狀況做設計調整。以下為我們假想的詳細數據,資料至少以月為單位收集:
- ( T ) 年/月
- ( N ) 書店
- ( C ) 書店所在縣市
- ( C ) 出版社
- ( N ) 書名
- ( R ) 出貨量
- ( R ) 退貨量
- ( R ) 客訂量
- ( R ) 活動量
- ( R ) 銷貨收入
- ( R ) 銷貨成本
- ( R ) 銷貨退回收入
- ( R ) 銷貨退回成本
視覺化
獨立書店數據以時序資料 ( T x R ) 為主,輔以縣市分區社員統計 ( T x C x R ),以及較為細節的出貨數據 ( 出貨書目 / 銷貨數據 ) 等。縣市別入社統計、書訊筆數、交易供應商數量、交易出版社數量、書目出貨種類 等數據互相獨立,無法對應儀表板交互過濾機制 ( Cross Filter ) 實現資料探索,僅適合單獨使用折線圖或長條圖方式呈現。 ( 縣市別入社亦可使用熱度地圖表現 )
出貨書目、銷貨數據有較細節之資訊,其中出貨書目較具有變化性,可單獨對出版社統計、對比出退貨量、亦可對書名做個別統計及排名。出版社統計可以使用樹狀圖呈現 ( 樹狀圖分類標示為 C* x R,不包含時序資料,因此需捨棄時間資訊 ) :
亦可使用主題河流,用以表現 獨立書店青睞的出版社排名:
考慮到獨立書店眾數據間獨立性較高,我們亦可考慮多觀察維度較多的出貨書目資料來構成儀表板,以實現交互過濾機制。
儀表板設計
以下為建議使用的儀表板欄位
- 總毛利 ( 純數字 )
- 出貨書目數 ( 純數字 )
- 獨立書店總數 ( 純數字 )
- 前十大出版商排名 ( 主題河流 )
- 各書目出貨書量佔比 ( 互動式比例長條圖 )
- 出貨量分布 ( 直方圖 )
- 出貨量分布 ( 直方圖 )
- 退貨量分布 ( 直方圖 )
- 各縣市書店量 ( 熱度地圖 )
類似線上影音數據的設計考量,為降低使用者操作儀表板時的複雜度,我們以電影產業儀表板的版面做為藍本,在排版上將相似機能的面版設置於同樣的位置:
書目數
總數
主題河流
考慮現有資料並非統一資料集,以此資料集做設計時無法實作有效的過濾機制,因此我們亦考慮提供非連動式的儀表板,單純做為資料瀏覽之用。為避免用戶在使用時有混淆的情況,我們得依情況將「出貨量分布」、「退貨量分布」、「客訂量分布」圖表改為折線圖呈現近期走勢。
參考設計
基於原先儀表板之設計以及後續討論之調整建議,我們提出以下幾個設計擴充,可供未來增強儀表板功能使用:
- 時段對比
選取特定時段時,同時在儀表板中將該時段與過往同期時段做數值對比
- 進階檢視
透過介面轉換檢視更複雜的細節資料
- 切換資料欄
利用選單、按鈕機制供用戶切換同類型的不同資料欄位
時段對比
對某些資訊來說,我們可能更感興趣的是數值相對於過往同一時段的變化。要表現此類資訊,我們可以透過:
- 調整圖表的呈現方式,以提供「變化」「對比」的機制
- 在各項圖表的標題上,額外提供變化比例的數值
以下表為例,我們除了擴充數字方塊以呈現前期資訊外,亦在標題列額外表現數值的漲跌:
除了圖表外,我們亦需要對時段選擇器做額外的調整,至少提供以下機制:
- 時段對比功能是否開啟
- 想要對比的對應時段
我們可以在時段選擇器中追加額外的控制項來實現這個機制 ( 如右圖 );因為一般都以相同長度的時段做對比,因此我們僅需要提供對比時段起點做選擇以做為對比的基準點,或者亦可以提供快選功能 ( 如「前一年」、「前一季」等選項)。
進階檢視
儀表板受限於空間限制無法呈現細節資料或複雜圖表,這時我們可以採用互動形式透過點選、切換的方式進入「進階檢視」以瀏覽進一步的資料細節。
進階檢視所呈現的依圖表而異,需要個別按設計跟規畫,此處我們以「排行榜」做為範例,點擊方塊後即彈出進階檢視:
切換資料欄
當多組相似數值因空間問題僅能表現一組時,我們可透過額外的控制面板來實現切換,例如使用前文提及之選單元件或時間軸元件。下圖即為使用同一塊面板表現多組數據之方式:
範例
由於我們僅有獨立書店的數據,此處我們提供一組依前文設計規劃之獨立書店數據儀表板範本;線上影音可以此範本做為概念引申。
