咨詢熱線 400-001-5729

常用的數(shù)據(jù)分析方法有哪些

發(fā)布時(shí)間:2023-02-28 09:29:39

數(shù)據(jù)分析師的含金量如何

    一、公式拆解
    數(shù)據(jù)分板師中所謂公式拆解法就是針對(duì)某個(gè)指標(biāo),用公式層層分解該指標(biāo)的影響因素。
    舉例:分析某產(chǎn)品的銷售額較低的原因,用公式法分解
    種常用的數(shù)據(jù)分析方法"
    二、對(duì)比分析
    對(duì)比法就是用兩組或兩組以上的數(shù)據(jù)進(jìn)行比較,是最通用的方法。
    我們知道孤立的數(shù)據(jù)沒有意義,有對(duì)比才有差異。比如在時(shí)間維度上的同比和環(huán)比、增長(zhǎng)率、定基比,與競(jìng)爭(zhēng)對(duì)手的對(duì)比、類別之間的對(duì)比、特征和屬性對(duì)比等。對(duì)比法可以發(fā)現(xiàn)數(shù)據(jù)變化規(guī)律,使用頻繁,經(jīng)常和其他方法搭配使用。
    下圖的AB公司銷售額對(duì)比,雖然A公司銷售額總體上漲且高于B公司,但是B公司的增速迅猛,高于A公司,即使后期增速下降了,最后的銷售額還是趕超。
    種常用的數(shù)據(jù)分析方法"
    三、A/Btest
    A/Btest,是將Web或App界面或流程的兩個(gè)或多個(gè)版本,在同一時(shí)間維度,分別讓類似訪客群組來訪問,收集各群組的用戶體驗(yàn)數(shù)據(jù)和業(yè)務(wù)數(shù)據(jù),最后分析評(píng)估出最好版本正式采用。A/Btest的流程如下:
    (1)現(xiàn)狀分析并建立假設(shè):分析業(yè)務(wù)數(shù)據(jù),確定當(dāng)前最關(guān)鍵的改進(jìn)點(diǎn),作出優(yōu)化改進(jìn)的假設(shè),提出優(yōu)化建議;比如說我們發(fā)現(xiàn)用戶的轉(zhuǎn)化率不高,我們假設(shè)是因?yàn)橥茝V的著陸頁面帶來的轉(zhuǎn)化率太低,下面就要想辦法來進(jìn)行改進(jìn)了
    (2)設(shè)定目標(biāo),制定方案:設(shè)置主要目標(biāo),用來衡量各優(yōu)化版本的優(yōu)劣;設(shè)置輔助目標(biāo),用來評(píng)估優(yōu)化版本對(duì)其他方面的影響。
    (3)設(shè)計(jì)與開發(fā):制作2個(gè)或多個(gè)優(yōu)化版本的設(shè)計(jì)原型并完成技術(shù)實(shí)現(xiàn)。
    (4)分配流量:確定每個(gè)線上測(cè)試版本的分流比例,初始階段,優(yōu)化方案的流量設(shè)置可以較小,根據(jù)情況逐漸增加流量。
    (5)采集并分析數(shù)據(jù):收集實(shí)驗(yàn)數(shù)據(jù),進(jìn)行有效性和效果判斷:統(tǒng)計(jì)顯著性達(dá)到95%或以上并且維持一段時(shí)間,實(shí)驗(yàn)可以結(jié)束;如果在95%以下,則可能需要延長(zhǎng)測(cè)試時(shí)間;如果很長(zhǎng)時(shí)間統(tǒng)計(jì)顯著性不能達(dá)到95%甚至90%,則需要決定是否中止試驗(yàn)。
    (6)最后:根據(jù)試驗(yàn)結(jié)果確定發(fā)布新版本、調(diào)整分流比例繼續(xù)測(cè)試或者在試驗(yàn)效果未達(dá)成的情況下繼續(xù)優(yōu)化迭代方案重新開發(fā)上線試驗(yàn)。
    流程圖如下:
    種常用的數(shù)據(jù)分析方法"
    四、象限分析
    通過對(duì)兩種及以上維度的劃分,運(yùn)用坐標(biāo)的方式表達(dá)出想要的價(jià)值。由價(jià)值直接轉(zhuǎn)變?yōu)椴呗,從而進(jìn)行一些落地的推動(dòng)。象限法是一種策略驅(qū)動(dòng)的思維,常與產(chǎn)品分析、市場(chǎng)分析、客戶管理、商品管理等。比如,下圖是一個(gè)廣告點(diǎn)擊的四象限分布,X軸從左到右表示從低到高,Y軸從下到上表示從低到高。
    種常用的數(shù)據(jù)分析方法"
    高點(diǎn)擊率高轉(zhuǎn)化的廣告,說明人群相對(duì)精準(zhǔn),是一個(gè)高效率的廣告。高點(diǎn)擊率低轉(zhuǎn)化的廣告,說明點(diǎn)擊進(jìn)來的人大多被廣告吸引了,轉(zhuǎn)化低說明廣告內(nèi)容針對(duì)的人群和產(chǎn)品實(shí)際受眾有些不符。高轉(zhuǎn)化低點(diǎn)擊的廣告,說明廣告內(nèi)容針對(duì)的人群和產(chǎn)品實(shí)際受眾符合程度較高,但需要優(yōu)化廣告內(nèi)容,吸引更多人點(diǎn)擊。低點(diǎn)擊率低轉(zhuǎn)化的廣告,可以放棄了。還有經(jīng)典的RFM模型,把客戶按最近一次消費(fèi)(Recency)、消費(fèi)頻率(Frequency)、消費(fèi)金額(Monetary)三個(gè)維度分成八個(gè)象限。
    種常用的數(shù)據(jù)分析方法"
    象限法的優(yōu)勢(shì):
    (1)找到問題的共性原因
    通過象限分析法,將有相同特征的事件進(jìn)行歸因分析,總結(jié)其中的共性原因。例如上面廣告的案例中,第一象限的事件可以提煉出有效的推廣渠道與推廣策略,第三和第四象限可以排除一些無效的推廣渠道;
    (2)建立分組優(yōu)化策略
    針對(duì)投放的象限分析法可以針對(duì)不同象限建立優(yōu)化策略,例如RFM客戶管理模型中按照象限將客戶分為重點(diǎn)發(fā)展客戶、重點(diǎn)保持客戶、一般發(fā)展客戶、一般保持客戶等不同類型。給重點(diǎn)發(fā)展客戶傾斜更多的資源,比如VIP服務(wù)、個(gè)性化服務(wù)、附加銷售等。給潛力客戶銷售價(jià)值更高的產(chǎn)品,或一些優(yōu)惠措施來吸引他們回歸。
    五、帕累托分析
    帕累托法則,源于經(jīng)典的二八法則。比如在個(gè)人財(cái)富上可以說世界上20%的人掌握著80%的財(cái)富。而在數(shù)據(jù)分析中,則可以理解為20%的數(shù)據(jù)產(chǎn)生了80%的效果需要圍繞這20%的數(shù)據(jù)進(jìn)行挖掘。往往在使用二八法則的時(shí)候和排名有關(guān)系,排在前20%的才算是有效數(shù)據(jù)。二八法是抓重點(diǎn)分析,適用于任何行業(yè)。找到重點(diǎn),發(fā)現(xiàn)其特征,然后可以思考如何讓其余的80%向這20%轉(zhuǎn)化,提高效果。
    一般地,會(huì)用在產(chǎn)品分類上,去測(cè)量并構(gòu)建ABC模型。比如某零售企業(yè)有500個(gè)SKU以及這些SKU對(duì)應(yīng)的銷售額,那么哪些SKU是重要的呢,這就是在業(yè)務(wù)運(yùn)營(yíng)中分清主次的問題。
    常見的做法是將產(chǎn)品SKU作為維度,并將對(duì)應(yīng)的銷售額作為基礎(chǔ)度量指標(biāo),將這些銷售額指標(biāo)從大到小排列,并計(jì)算截止當(dāng)前產(chǎn)品SKU的銷售額累計(jì)合計(jì)占總銷售額的百分比。
    百分比在70%(含)以內(nèi),劃分為A類。百分比在70~90%(含)以內(nèi),劃分為B類。百分比在90~100%(含)以內(nèi),劃分為C類。以上百分比也可以根據(jù)自己的實(shí)際情況調(diào)整。
    ABC分析模型,不光可以用來劃分產(chǎn)品和銷售額,還可以劃分客戶及客戶交易額等。比如給企業(yè)貢獻(xiàn)80%利潤(rùn)的客戶是哪些,占比多少。假設(shè)有20%,那么在資源有限的情況下,就知道要重點(diǎn)維護(hù)這20%類客戶。
    種常用的數(shù)據(jù)分析方法"
    六、漏斗分析
    漏斗法即是漏斗圖,有點(diǎn)像倒金字塔,是一個(gè)流程化的思考方式,常用于像新用戶的開發(fā)、購物轉(zhuǎn)化率這些有變化和一定流程的分析中。
    種常用的數(shù)據(jù)分析方法"
    上圖是經(jīng)典的營(yíng)銷漏斗,形象展示了從獲取用戶到最終轉(zhuǎn)化成購買這整個(gè)流程中的一個(gè)個(gè)子環(huán)節(jié)。相鄰環(huán)節(jié)的轉(zhuǎn)化率則就是指用數(shù)據(jù)指標(biāo)來量化每一個(gè)步驟的表現(xiàn)。所以整個(gè)漏斗模型就是先將整個(gè)購買流程拆分成一個(gè)個(gè)步驟,然后用轉(zhuǎn)化率來衡量每一個(gè)步驟的表現(xiàn),最后通過異常的數(shù)據(jù)指標(biāo)找出有問題的環(huán)節(jié),從而解決問題,優(yōu)化該步驟,最終達(dá)到提升整體購買轉(zhuǎn)化率的目的。
    整體漏斗模型的核心思想其實(shí)可以歸為分解和量化。比如分析電商的轉(zhuǎn)化,我們要做的就是監(jiān)控每個(gè)層級(jí)上的用戶轉(zhuǎn)化,尋找每個(gè)層級(jí)的可優(yōu)化點(diǎn)。對(duì)于沒有按照流程操作的用戶,專門繪制他們的轉(zhuǎn)化模型,縮短路徑提升用戶體驗(yàn)。
    還有經(jīng)典的黑客增長(zhǎng)模型,AARRR模型,指Acquisition、Activation、Retention、Revenue、Referral,即用戶獲取、用戶激活、用戶留存、用戶收益以及用戶傳播。這是產(chǎn)品運(yùn)營(yíng)中比較常見的一個(gè)模型,結(jié)合產(chǎn)品本身的特點(diǎn)以及產(chǎn)品的生命周期位置,來關(guān)注不同的數(shù)據(jù)指標(biāo),最終制定不同的運(yùn)營(yíng)策略。
    從下面這幅AARRR模型圖中,能夠比較明顯的看出來整個(gè)用戶的生命周期是呈現(xiàn)逐漸遞減趨勢(shì)的。通過拆解和量化整個(gè)用戶生命周期各環(huán)節(jié),可以進(jìn)行數(shù)據(jù)的橫向和縱向?qū)Ρ龋瑥亩l(fā)現(xiàn)對(duì)應(yīng)的問題,最終進(jìn)行不斷的優(yōu)化迭代。
    種常用的數(shù)據(jù)分析方法"
    七、路徑分析
    用戶路徑分析追蹤用戶從某個(gè)開始事件直到結(jié)束事件的行為路徑,即對(duì)用戶流向進(jìn)行監(jiān)測(cè),可以用來衡量網(wǎng)站優(yōu)化的效果或營(yíng)銷推廣的效果,以及了解用戶行為偏好,其最終目的是達(dá)成業(yè)務(wù)目標(biāo),引導(dǎo)用戶更高效地完成產(chǎn)品的最優(yōu)路徑,最終促使用戶付費(fèi)。如何進(jìn)行用戶行為路徑分析?
    (1)計(jì)算用戶使用網(wǎng)站或APP時(shí)的每個(gè)第一步,然后依次計(jì)算每一步的流向和轉(zhuǎn)化,通過數(shù)據(jù),真實(shí)地再現(xiàn)用戶從打開APP到離開的整個(gè)過程。
    (2)查看用戶在使用產(chǎn)品時(shí)的路徑分布情況。例如:在訪問了某個(gè)電商產(chǎn)品首頁的用戶后,有多大比例的用戶進(jìn)行了搜索,有多大比例的用戶訪問了分類頁,有多大比例的用戶直接訪問的商品詳情頁。
    (3)進(jìn)行路徑優(yōu)化分析。例如:哪條路徑是用戶最多訪問的;走到哪一步時(shí),用戶最容易流失。
    (4)通過路徑識(shí)別用戶行為特征。例如:分析用戶是用完即走的目標(biāo)導(dǎo)向型,還是無目的瀏覽型。
    (5)對(duì)用戶進(jìn)行細(xì)分。通常按照APP的使用目的來對(duì)用戶進(jìn)行分類。如汽車APP的用戶可以細(xì)分為關(guān)注型、意向型、購買型用戶,并對(duì)每類用戶進(jìn)行不同訪問任務(wù)的路徑分析,比如意向型的用戶,他進(jìn)行不同車型的比較都有哪些路徑,存在什么問題。還有一種方法是利用算法,基于用戶所有訪問路徑進(jìn)行聚類分析,依據(jù)訪問路徑的相似性對(duì)用戶進(jìn)行分類,再對(duì)每類用戶進(jìn)行分析。
    以電商為例,買家從登錄網(wǎng)站/APP到支付成功要經(jīng)過首頁瀏覽、搜索商品、加入購物車、提交訂單、支付訂單等過程。而在用戶真實(shí)的選購過程是一個(gè)交纏反復(fù)的過程,例如提交訂單后,用戶可能會(huì)返回首頁繼續(xù)搜索商品,也可能去取消訂單,每一個(gè)路徑背后都有不同的動(dòng)機(jī)。與其他分析模型配合進(jìn)行深入分析后,能為找到快速用戶動(dòng)機(jī),從而引領(lǐng)用戶走向最優(yōu)路徑或者期望中的路徑。
    用戶行為路徑圖示例:
    種常用的數(shù)據(jù)分析方法"
    八、留存分析
    用戶留存指的是新會(huì)員/用戶在經(jīng)過一定時(shí)間之后,仍然具有訪問、登錄、使用或轉(zhuǎn)化等特定屬性和行為,留存用戶占當(dāng)時(shí)新用戶的比例就是留存率。留存率按照不同的周期分為三類,以登錄行為認(rèn)定的留存為例:
    第一種日留存,日留存又可以細(xì)分為以下幾種:
    (1)次日留存率:(當(dāng)天新增的用戶中,第2天還登錄的用戶數(shù))/第一天新增總用戶數(shù)
    (2)第3日留存率:(第一天新增用戶中,第3天還有登錄的用戶數(shù))/第一天新增總用戶數(shù)
    (3)第7日留存率:(第一天新增用戶中,第7天還有登錄的用戶數(shù))/第一天新增總用戶數(shù)
    (4)第14日留存率:(第一天新增用戶中,第14天還有登錄的用戶數(shù))/第一天新增總用戶數(shù)
    (5)第30日留存率:(第一天新增用戶中,第30天還有登錄的用戶數(shù))/第一天新增總用戶數(shù)
    第二種周留存,以周度為單位的留存率,指的是每個(gè)周相對(duì)于第一個(gè)周的新增用戶中,仍然還有登錄的用戶數(shù)。
    第三種月留存,以月度為單位的留存率,指的是每個(gè)月相對(duì)于第一個(gè)周的新增用戶中,仍然還有登錄的用戶數(shù)。留存率是針對(duì)新用戶的,其結(jié)果是一個(gè)矩陣式半面報(bào)告(只有一半有數(shù)據(jù)),每個(gè)數(shù)據(jù)記錄行是日期、列為對(duì)應(yīng)的不同時(shí)間周期下的留存率。正常情況下,留存率會(huì)隨著時(shí)間周期的推移而逐漸降低。下面以月留存為例生成的月用戶留存曲線:
    種常用的數(shù)據(jù)分析方法"
    九、聚類分析
    聚類分析屬于探索性的數(shù)據(jù)分析方法。通常,我們利用聚類分析將看似無序的對(duì)象進(jìn)行分組、歸類,以達(dá)到更好地理解研究對(duì)象的目的。聚類結(jié)果要求組內(nèi)對(duì)象相似性較高,組間對(duì)象相似性較低。在用戶研究中,很多問題可以借助聚類分析來解決,比如,網(wǎng)站的信息分類問題、網(wǎng)頁的點(diǎn)擊行為關(guān)聯(lián)性問題以及用戶分類問題等等。其中,用戶分類是最常見的情況。
    常見的聚類方法有不少,比如K均值(K-Means),譜聚類(SpectralClustering),層次聚類(HierarchicalClustering)。以最為常見的K-means為例,如下圖:
    種常用的數(shù)據(jù)分析方法"
    可以看到,數(shù)據(jù)可以被分到紅藍(lán)綠三個(gè)不同的簇(cluster)中,每個(gè)簇應(yīng)有其特有的性質(zhì)。顯然,聚類分析是一種無監(jiān)督學(xué)習(xí),是在缺乏標(biāo)簽的前提下的一種分類模型。當(dāng)我們對(duì)數(shù)據(jù)進(jìn)行聚類后并得到簇后,一般會(huì)單獨(dú)對(duì)每個(gè)簇進(jìn)行深入分析,從而得到更加細(xì)致的結(jié)果。

以上文章由廣州CDA數(shù)據(jù)分析師培訓(xùn)機(jī)構(gòu)課程顧問整理編輯發(fā)布,部分文章來自網(wǎng)絡(luò)內(nèi)容真實(shí)性請(qǐng)自行核實(shí)或聯(lián)系我們,了解相關(guān)專業(yè)課程信息您可在線咨詢也可免費(fèi)申請(qǐng)?jiān)囌n。關(guān)注官方微信了解更多:150 3333 6050

免 費(fèi) 申 請(qǐng) 試 課