我們要通過數據分析對業務進行診斷,找到當中的問題所在,就需要我們在使用數據分析之前,對其分析指標和原理有充足的了解,才能夠應對更多復雜的問題 。作者總結了用戶數據分析常見指標和原理,與你分享 。

文章插圖
本著知其然知其所以然的原則,本篇給大家介紹用戶數據分析常見指標以及原理 。
一、原理
1. HTTP協議
超文本傳輸協議(HTTP)是一種通信協議,指計算機通信網絡中兩臺計算機之間進行通信所必須共同遵守的規定或規則,我們平時上網訪問某個網站就是在http協議支持下進行服務器端和客戶端的數據交互 。但它是一種無狀態的協議,一旦數據交換完畢,客戶端與服務器端的連接就會關閉,再次交換數據需要建立新的連接 。
通常情況下會有很多請求同時向服務器發送,那么服務器怎么才能知道這些請求的歸屬吶,所以就需要會話跟蹤技術來實現這個目的,其中cookie&session就是常用的會話跟蹤技術之一 。
2. 會話
定義:會話是用戶在指定的時間段內在網站(APP)上發生的一系列行為,是由多次http請求完成的 。例如,一次會話可以包含多個網頁的瀏覽或者一次社交互動或者一次電子交易 。
重要性:會話是行為數據記錄的必要維度,會話的準確性直接影響對用戶行為的解讀以及部分關鍵統計指標的準確性,例如常用數據統計指標:使用頻次、使用時長、平均使用時長、平均交互深度、跳出率、轉化分析、用戶路徑等都是依據會話統計的 。
例如平均使用時長的定義是在一定統計時間內,瀏覽網站的一個頁面或整個網站時用戶所逗留的總時間與該頁面或整個網站的訪問次數的比 。
平均使用時長=所有用戶產生的所有會話總時長/所有用戶產生的會話總數
平均訪問時長越久,證明 Web/APP 越有吸引力,如果用戶停留的平均時間非常低,那么可能內容不夠有趣,或界面優化較差導致真正有價值的內容無法吸引用戶,影響用戶體驗 。
切割原理:
【一文了解用戶數據分析常見指標與原理 用戶行為數據的主要分析方法】 ①按照時間切割:web 產品建議切割時間為 30 分鐘,所以王小明兩次瀏覽頁面的時間超過了 Web 端的 30 分鐘,被記錄為兩個會話 。APP 產品建議切割時間為 1 分鐘,那么就代表著如果用戶在做了某個行為1 分鐘后沒有任何其他動作,前面的 “會話” 便會被 “切割” 并結束 。
②按照事件切割:在某些情況下,我們也可以設置特定的 “會話” 開始和結束事件,一旦用戶做了某個操作就會自動開始/結束會話 。例如付款成功、或者發表內容成功 。具體的切割規則應該根據業務規則靈活設置,不同的數據分析工具有不同的 Session 切割規則 。例如諸葛的切割規則如下:
- iOS用戶:屏熄、home鍵切到后臺、殺掉進程即判斷為會話結束;
- Android用戶:當應用重新進入活躍狀態與上次活躍狀態相隔30秒以上時,會計為一次新的會話;
- web、小程序:會話的開始是用戶打開產品的某個頁面,如果用戶在30分鐘內沒有任何操作或關閉頁面,則會話結束 。技術上,諸葛io通過cookies(小程序通過storage)追蹤用戶的會話 。
定義:會話(Session)跟蹤是Web程序中常用的技術,用來跟蹤用戶的整個會話 。常用的會話跟蹤技術是Cookie與Session
工作原理:客戶端請求服務器,如果服務器需要記錄該用戶狀態,檢查這個客戶端的請求里面是否包含了sessionId 。
①如果已包含則說明以前已經為此客戶端創建過session,服務器就按照sessionId把這個session檢索出來使用(檢索不到,會新建一個),服務器還可以根據需要修改Cookie的內容,響應給客戶端
②如果客戶端請求不包含sessionId,則為此客戶端創建一個session并且生成一個與此session相關聯的sessionId,把sessionID放在cookie中,使用response返回給客戶端瀏覽器cookie,cookie將被在客戶端保存 。
客戶端攜帶sessionid的常見方式:cookie(服務器生成的,傳給客戶端體積很小的純文本文件)中攜帶sessionID,會附在請求資源的HTTP請求頭上發送給服務器,服務器通過相應方法獲得該cookie 。對于不支持cookie的手機瀏覽器,有另一種解決方案:URL地址重寫 。URL地址重寫的原理是將該用戶session的id信息重寫到URL地址中,服務器能夠解析重寫后的URL獲取session的id 。這樣即使客戶端不支持cookie,也可以使用session來記錄用戶狀態 。
cookie:
①會話cookie:若不設置過期時間,則表示這個cookie的生命期為瀏覽器會話期間,關閉瀏覽器窗口,cookie就消失 。這種生命期為瀏覽器會話期的cookie被稱為會話cookie 。會話cookie一般不存儲在硬盤上而是保存在內存里 。
②持久cookie:若設置了過期時間,瀏覽器就會把cookie保存到硬盤上,關閉后再次打開瀏覽器,這些cookie仍然有效直到超過設定的過期時間 。存儲在硬盤上的cookie可以在不同的瀏覽器進程間共享,這種稱為持久Cookie 。如果cookie沒有失效的前提下,游客身份多次訪問會判斷為同一用戶 。
應用場景舉例:登錄網站時用戶第一天輸入用戶名密碼登錄了,第二天再打開很多情況下就直接打開了 。因為第一次登錄時就把身份認證信息通過加密的方式保存在了cookie中 。
session相當于程序在服務器上建立的一份用戶的檔案,在用戶第一次訪問服務器的時候自動創建,后續來訪時只需要查詢用戶檔案表就可以了 。只要用戶繼續訪問,服務器就會更新Session的最后訪問時間,并維護該session 。為防止內存溢出,服務器會把長時間內沒有活躍的session從內存中刪除 。這個時間就是session的超時時間 。如果超過了超時時間沒訪問過服務器,session就自動失效了 。后續用戶再訪問時會創建一個新的session 。
應用場景舉例:一個未登錄的用戶添加了商品之后客戶端處可以知道添加了哪些商品,而服務器端如何判別呢,所以也需要存儲一些信息就用到了session 。每次用戶添加商品時,都會根據cookie和session的對應關系把該商品添加到session中 。如果用戶手動清除了cookie,那么購物車也會同步清空 。
4. 原理小結
客戶端和服務器端通過http協議進行數據傳遞,按照一定的規則把所有的請求和響應分割成一定數量會話,通過會話能分析出用戶訪問網站的頻次、路徑、時長等關鍵信息 。因為http協議是無狀態的,所以引用會話跟蹤技術進行不同用戶訪問網站完整流程的記錄,其中cookie和seession是常用的會話跟蹤技術之一 。
cookie是通過在客戶端記錄信息確定用戶身份的,而session則通過在服務器端記錄信息確定用戶身份 。
二、用戶數據分析常見指標
不同業務的產品需要關注的數據指標有所差異 。在這里從用戶角度來分析從首次使用產品到最后離開產品的整個流程——新增(首次使用)、活躍(如何使用)、留存(繼續使用)、流失(不再使用) 。
1. 新增(首次使用)
首次使用產品的用戶稱為新增用戶,可以按照不同的屬性進行群體的劃分,例如不同性別、不同年齡段、不同地區的用戶群體 。
常用的新增用戶群體為新增實名用戶和新增匿名用戶 。新增實名用戶指的是新注冊并在數據庫中生成賬號的用戶 。新增匿名用戶指的是對比數據庫沒有出現過的cookie或者設備的游客,一般來說,JS的新增是只要打開網站就會記為新增,而app只有下載打開后才會被記為新增 。
新用戶數量的快速增長,是產品增長的基礎 。通常一個運營活動上線或者進行渠道投放后,會產生比較多的新增用戶,業務會關注后續的日增、周增、月增 。
2. 活躍(如何使用)
活躍用戶的定義取決于業務本身,登錄、消費、瀏覽指定模塊的內容、使用時長達到一定的時間等行為都能成為判斷活躍用戶的標準 。只有活躍用戶才有可能會產品帶來流量或者營收價值,是投資人關注的重要指標 。
活躍用戶的統計需要去重 。例如某款產品把登錄做為活躍用戶的判斷標準,在某段時間內使用過產品的用戶被記錄下來,多次啟用過產品的不會重復計算 。場景舉例:如A公司6月23日~7月4日期間的活躍用戶位1890,那么就是在6月23日~7月4日期間一共有1890人使用過產品,但是其中340名用戶在此期間使用5次以上,但是記在計算活躍用戶時不會重復計算,只會計算為1個 。
使用會話技術跟進用戶的行為路徑,可以統計更多的數據了解用戶對產品使用情況,從而針對性地去優化產品功能設計或者內容本身 。
- PV(訪問量):即Page View, 即頁面瀏覽量,用戶每次刷新即被計算一次 。
- UV(獨立訪客):即Unique Visitor,訪問網站的不同IP地址的訪客數 。在同一天內,uv只記錄第一次進入網站的具有獨立IP的訪問者,在同一天內再次訪問該網站則不計數 。
- 訪問次數:產生會話的次數,會話時長的計算為同一次訪問內觸發的最后一個事件的時間減去會話開始的時間 。
- 平均使用時長:會話的總時長 / 會話次數 。
- 使用時長分布:劃分不同的時間區間,查看對應區間的訪問人數情況 。
- 退出率:該網頁是會話中“最后一頁”的瀏覽次數占該網頁總瀏覽次數的百分比 。退出率=退出次數/總訪問量*100%
- 跳出率:該網頁是會話中“唯一網頁”的會話次數占由該網頁開始的所有會話次數的百分比 。跳出率=會話的開始和結束都是該頁的次數/會話的開始是該頁的次數*100%
留存指的是某種類型的用戶在經過一段時間后仍舊滿足某種條件或者保持某個狀態 。常見的留存為新增用戶留存和活躍用戶留存 。
新增用戶留存指的是某段時間內的新增用戶,經過一段時間后,仍然繼續使用產品被稱為新增留存;這部分用戶占當時新增的比例就是留存率 。場景舉例:某產品,1月份新增用戶10000人;2月時10000人中還有8000人使用產品,則新增留存人數為8000,新增留存率為80%;3月份10000人中還有7000人使用產品,則新增留存人數為7000,新增留存率為70% 。
活躍用戶留存的定義:某段時間內的活躍用戶,經過一段時間后,仍然繼續活躍的用戶被稱為活躍留存;這部分活躍留存用戶占當時活躍用戶的比例就是活躍留存率 。場景舉例:某產品,1月份的活躍用戶數是10萬人,2月時10萬人中還有5萬人活躍,則活躍留存人數為5萬,活躍留存率為50%;3月份,10萬人中還有4萬人活躍,則活躍留存人數為4萬,活躍留存率為40% 。
用戶留存率需要較長的時間去觀察,所以能更多地反應產品體驗、用戶需求滿足程度、市場競爭力等問題 。產品的留存率足夠高,新增用戶投入的成本才有價值,才能促進業務更好地持續發展,是投資人關注的重要指標 。
4. 流失(離開)
理論上只要用戶沒有注銷,就可以認為用戶沒有流失 。但實際上一般會根據業務情況給定一個主觀的判斷標準,用戶多久沒有活躍來判定用戶是否流失 。例如3個月未登錄,6個月沒有消費等 。對于流失的用戶,會定制用戶的召回策略,例如發優惠劵、電話訪問溝通、贈送會員等 。當然有些用戶流失和用戶本來的生命周期相關,這是無法避免的 。例如考研產品的用戶已經考研成功之后便不再使用該產品 。
三、用戶數據分析小結
通過用戶屬性和行為數據分析,可以根據業務需求統計出具有***屬性,新增/活躍于***時間段,做過/沒做過****的用戶群體,針對不同特性的群體進行針對性的營銷策略從而達成業務目標 。
目前常見的第三方數據分析工具,例如諸葛IO、友盟都支持不同終端的數據統計,只需要接入SDK就能自動統計用戶以及行為數據 。不同的平臺統計的數據的標準會稍有差異 。對于精細化運營的需求,可以在借助第三方平臺進行精準化埋點或者在資源的支持下開發自研數據統計平臺 。
指標的是否需要關注以及指標的定義等需要根據業務情況具體分析~好啦,本次此結束,后續有機會給大家詳細漏斗模型、歸因模型等常見的數據分析模型~
推薦閱讀
- 最先了解引起仔豬下痢的原因是什么
- 一文了解坐飛機帶充電寶規則 3萬毫安的充電寶可以帶上飛機嗎
- 帶你全面了解Office和WPS office什么意思
- 小祁歷險記歐布奧特曼是什么游戲 了解一下
- 一文搞清楚實名認證的是什么 微信更改實名認證后果
- 專業電氣自動化的就業方向怎么樣? 進來了解一下
- 一文教你徹底搞清ip的含義 ip有幾個意思
- 一文了解詳細的申請步驟 微信親密付在哪里設置
- 一文教你各種涂抹粉底液方法 沒有美妝蛋怎么上粉底
- 小蘇打牙膏可以治幽門螺桿菌嗎 大家可以了解一下
