在日常工作中,數據同學經常會遇到以下問題
亦或是
如果大家經常遇到上述類似問題,說明需要壹個“數據字典”或者“指標庫”來對指標的定義進行規範化和維護。
本文將會對指標進行初步介紹,並就如何規範指標進行深入討論。
我們經常聽到以下類似的對話:
這些不準確、具體的話,我們平時說說倒是無妨——畢竟具體的消息需要壹定的成本。但是在工作中如果還是這個態度的話,恐怕就不太合適了。如果每個項目、活動連每天多少用戶數、花多少錢賺多少錢都說不明白,那這個項目想來也沒什麽價值。
指標,就是對抗這種不確定的描述。
我們先來看百度百科中指標的定義
簡單的說,指標是衡量目標的方法,它為了衡量某個東西而存在。我們常說的日活、成本、利潤、收入等,都是指標。
將剛才的話運用指標重新編輯下:
是不是顯得準確了很多?
下面我們進壹步介紹指標的構成
我們可以簡單的分為3類:自身屬性、業務和技術。
我們用DAU(日活躍用戶數)來舉壹個例子
是不是頓時清晰了很多?
結果性指標 ,比如電商場景下的 GMV 或訂單量,它通常是業務漏鬥的底部,是壹個不可更改的、後驗性的指標。
過程性指標 ,可以簡單理解為我到達這個結果之前經過的路徑,以及通過這個路徑去衡量轉化好壞的過程,它是可幹預的,而且通常是“用戶行為”。
絕對指標 :是指統計量的絕對值,用於反映規模、大小的量級指標,如活躍用戶數。
相對指標 :是指統計量的比率值,用於反映程度、質量的健康水平指標,如人均使用時長相對指標是由絕對指標通過計算得來。
可以說絕對指標是相對指標的基礎,而相對指標常常蘊含著更大的信息量,兩者相輔而成才能更好的分析。
這裏主要根據是在用戶的關鍵行為(例如用戶下單支付)前還是後來判定。
虛榮指標指的是看起來很吊但仔細想想並沒有卵用的指標,例如總用戶數——妳知道總用戶數又有什麽用呢?妳需要的是用戶的新增、質量、活躍。而不是它總***多少人。
在 Data Science 中,指標有很多相關的定義,以下介紹部分:
指標是度量,但度量不全是指標。
在數據中,度量更多是相比維度的壹個連續性數值;可以說我們常說的指標都是度量。
單壹的指標沒有任何意義 ,至少需要有壹個維度以上的對比才能產生價值,且只有放在同壹個維度下對比才有意義
壹個問題,往往有很多方面,只用壹個指標不能充分說明問題。這就需要壹組相關聯的指標來描述,這就是數據 指標體系 。筆者會在後續進行詳細深入的介紹。