什麼是 Superset ?

Superset 是由 Airbnb 開源的數據分析與可視化平台,目前已進入 Apache Incubator(曾用名為Caravel、Panoramix)

通過讓用戶創建並且分享儀錶盤的方式為分析人員提供一個快速建立數據可視化之平台,可以輕鬆導出圖表,用戶 / 角色權限控制,還提供了 SQL Lab 供使用者進行 SQL 查詢等功能。在你用這種豐富的數據可視化方案來分析你的數據的同時,Caravel還可以兼顧數據格式的拓展性、數據模型的高粒度保證、快速的複雜規則查詢、兼容主流鑒權模式(數據庫、OpenID、LDAP、OAuth或者基於Flask AppBuilder的REMOTE_USER)通過一個定義字段、下拉聚合規則的簡單的語法層操作就讓我們可以將數據源在U上豐富地呈現

Superset 特色

指標:
  • 當數據庫連接到 Superset 上後,使用者需要定義要用到的每一張表。表的定義除了字段,還需要定義指標(Metric)
    • BI 工具通常是用來做商業分析的,指標是對字段的某種統計結果,比如字段上值的求和、平均值、最大值、最小值等等
    • ex: 一個電商數據庫,雖然在數據表我們存儲每筆訂單的交易額,但在商業分析時我們不關心單筆交易,我們關心的可能是一個時間段內的總交額,或是平均交易額。每當畫月報表時,每筆交易並部會都畫在圖上,而是把每天的總交易額用一個柱形在圖上表示。這就是為什麼 Superset 要引入「指標」這個概念
  • 對於數據分析人員來說,由於在 Superset 上他們不是直接寫 SQL,而是通過選擇指標(Metric), 分組條件(Group)和過濾條件(Filter)來畫圖表,所以在構建複雜查詢時可能會有些不適應。
    • Superset 里引入自己的表與指標,在統一各種異型的數據源時也是必要的,但實際操作中仍會讓人覺得有些麻煩不夠直接了當

關於 Superset

優點:
  1. 圖表方面十分出色(提供高達 36 種圖表),不但是開源領域中的佼佼者,也領先許多商用 BI 工具
  2. 在選擇圖表類型時,可以先預覽各種圖表類型樣式方便使用者選擇,還提供了 3D 類圖表, Time series 做選擇
  3. 支持的數據源相對來說較豐富點我查看所有支持的數據源列表
  4. Superset 的另一個特色是能在多個時間維度上觀察數據,非常適合在商業分析中處理很多問題(都是與時間密切相關)
  5. 與 Druid 深度結合,可快速的分析大數據
  6. 能詳細記錄下每次使用者查詢的細節, 費時, 結果等,在使用者活動紀錄上非常詳細,適合團隊中使用
  7. 輕量級語義層,允許通過定義維度和指標來控制如何向用戶公開數據源

缺點:
  1. 操作介面上較難上手,增添數據表必須手動填寫表名進行添加,無下拉菜單供使用者做選擇
  2. 同一查詢中無法同時添加多個圖表 僅能 1 對 1 的展示 (一個查詢一個圖)
  3. 圖表內容雖然最多且豐富,但尚未支持混合類型圖表 (常用的 Bar Chart 混 Line Chart)
  4. 查詢不支持 join,如果一個圖表裡的數據要從多個數據表裡取,只能通過建構多張視圖來實現
  5. Superset 分享出去之圖表 / 看板,觀看者都需以 Superset 帳號做登入才能查看即使用,暫無支持訪客身份查看,在分享圖表上有點小麻煩
  6. Dashboard 中無法實現動態輸入更新查詢之效果,對於重複查詢較麻煩些
Superset 也有提供線上 Demo 版本,使用者可以不用下載至本地就能點擊體驗看看

Leave a Reply

Your email address will not be published.