數(shù)據(jù)分析師和數(shù)據(jù)挖掘工程師雖然都是數(shù)據(jù)領(lǐng)域的洞察者,但他們的工作內(nèi)容卻大相徑庭。對(duì)于一個(gè)數(shù)據(jù)分析師來(lái)說(shuō),最重要的不是編程能力,而是邏輯分析能力、業(yè)務(wù)理解能力、報(bào)表呈現(xiàn)能力等。那么,具體數(shù)據(jù)挖掘師和數(shù)據(jù)分析師區(qū)別有哪些?
數(shù)據(jù)挖掘師和數(shù)據(jù)分析師區(qū)別之?dāng)?shù)據(jù)分析師:
數(shù)據(jù)分析師使用的主要工具可以是編程,但不是必須的。
因?yàn)橛写罅繌?qiáng)大易用的數(shù)據(jù)分析工具,如Excel、Tableau、SPSS、SAS等,即使你沒(méi)有編程能力,仍然可以勝任大部分?jǐn)?shù)據(jù)分析工作。
但相比數(shù)據(jù)挖掘工程師,你還需要一些額外的能力,比如數(shù)據(jù)可視化、編寫(xiě)數(shù)據(jù)報(bào)告、在領(lǐng)導(dǎo)甚至很多人面前做報(bào)告、演講等能力。
同時(shí),因?yàn)楝F(xiàn)在互聯(lián)網(wǎng)公司都在講大數(shù)據(jù),而數(shù)據(jù)基本都存儲(chǔ)在各種大數(shù)據(jù)平臺(tái)和數(shù)據(jù)庫(kù)中,所以你需要掌握Hive、HDFS、MySQL等的使用方法,并且熟練掌握SQL是不可避免的。
數(shù)據(jù)分析師一般有兩種,一種是業(yè)務(wù)導(dǎo)向的,主要為各業(yè)務(wù)線、產(chǎn)品經(jīng)理、運(yùn)營(yíng)、各部門(mén)領(lǐng)導(dǎo)的需求提供支持,幫助他們分析理解業(yè)務(wù),發(fā)現(xiàn)業(yè)務(wù)問(wèn)題和提供他們。解決方案; 二是宏觀分析。一般沒(méi)有需求端。主要是自發(fā)探索,積極發(fā)現(xiàn)公司業(yè)務(wù)中存在的問(wèn)題,摸清公司發(fā)展趨勢(shì),指導(dǎo)公司發(fā)展方向。
數(shù)據(jù)挖掘師和數(shù)據(jù)分析師區(qū)別之?dāng)?shù)據(jù)挖掘工程師:
雖然不能做數(shù)據(jù)挖掘工作就不能編程,但好的編程技能會(huì)成為你工作中的得力助手。
很多時(shí)候,數(shù)據(jù)挖掘工程師都會(huì)為數(shù)據(jù)分析師做一些支持性的工作,比如為他們構(gòu)建數(shù)據(jù)庫(kù)、清理數(shù)據(jù)、搭建報(bào)表平臺(tái)等。
有時(shí)數(shù)據(jù)分析師也會(huì)直接向數(shù)據(jù)挖掘工程師提出要求。某些數(shù)據(jù)存儲(chǔ)方法和格式超出了數(shù)據(jù)分析師的技能范圍。這時(shí)候需要數(shù)據(jù)挖掘工程師為他們做一些前期工作。
另外,數(shù)據(jù)挖掘工程師經(jīng)常需要做一些機(jī)器學(xué)習(xí)的工作,所以需要對(duì)各種機(jī)器學(xué)習(xí)算法的理論和代碼實(shí)踐有足夠的了解。
在數(shù)據(jù)挖掘工程師中,也有很多不同的類(lèi)型,如特征工程、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)平臺(tái)支持、算法工程師、數(shù)據(jù)科學(xué)家等,他們的工作職責(zé)不同,專(zhuān)業(yè)技能也不同。
對(duì)于大多數(shù)的數(shù)據(jù)挖掘工程師來(lái)講,編程技能是必須掌握的,但是根據(jù)不同的挖掘工程師的性質(zhì),需要掌握不同的編程技能。一般來(lái)講,Python、Java、Scala是常用的大數(shù)據(jù)挖掘語(yǔ)言,部分?jǐn)?shù)據(jù)科學(xué)家喜歡使用R;最常用的大數(shù)據(jù)平臺(tái)是Hadoop平臺(tái)和Spark平臺(tái),常用的結(jié)構(gòu)化數(shù)據(jù)庫(kù)有MySQL或其他關(guān)系型數(shù)據(jù)庫(kù),MongoDB更常用于非結(jié)構(gòu)化數(shù)據(jù)庫(kù)。
對(duì)于數(shù)據(jù)挖掘工程師來(lái)說(shuō),必要的 Linux 知識(shí)也是必不可少的。由于數(shù)據(jù)挖掘工程師的大部分工作都是在遠(yuǎn)程服務(wù)器上完成的,無(wú)法在命令中去操作各種Linux系統(tǒng)(常用的CentOS、Ubuntu等),工作效率會(huì)大打折扣。另外,Shell在數(shù)據(jù)處理方面也很強(qiáng)大,sed+awk簡(jiǎn)直就是數(shù)據(jù)處理的神器。
其實(shí)數(shù)據(jù)挖掘師和數(shù)據(jù)分析師它們之間并沒(méi)有什么區(qū)別,很多東西都是共通的。
如果你編程基礎(chǔ)不好,可以從數(shù)據(jù)分析師入手,然后考慮轉(zhuǎn)型數(shù)據(jù)挖掘;如果你的編程基礎(chǔ)好,可以考慮數(shù)據(jù)挖掘,但是數(shù)據(jù)挖掘工程師一般不會(huì)接觸太多業(yè)務(wù)。兩個(gè)領(lǐng)域的職業(yè)道路截然不同。數(shù)據(jù)分析師之后可以做業(yè)務(wù)、產(chǎn)品轉(zhuǎn)移和管理;而數(shù)據(jù)挖掘工程師一般可以在技術(shù)領(lǐng)域進(jìn)行縱向深入的探索,后面可能做技術(shù)管理,也有搞一輩子的技術(shù)的。
以上文章由北京AAA教育課程顧問(wèn)整理編輯發(fā)布,部分文章來(lái)自網(wǎng)絡(luò)內(nèi)容真實(shí)性請(qǐng)自行核實(shí)或聯(lián)系我們,了解相關(guān)專(zhuān)業(yè)課程信息您可在線咨詢也可免費(fèi)申請(qǐng)?jiān)囌n。關(guān)注官方微信了解更多:150 3333 6050
免 費(fèi) 申 請(qǐng) 試 課