可以運用PlowerBI或tableau做數(shù)據(jù)可視化;
同時掌握pyth" />
具備數(shù)據(jù)分析、爬蟲的相關(guān)技術(shù)。熟練掌握Python的Numpy、Pandas、matplotlib、Sklearn模塊,可以做數(shù)據(jù)分析、可視化、建模;
可以運用PlowerBI或tableau做數(shù)據(jù)可視化;
同時掌握python多線程爬蟲,熟悉Selenium和xpath、正則表達式。
一、該項目使用python語言;
二、軟件使用的模塊:
a.利用pandas進行數(shù)據(jù)處理;
b.利用matplotlib進行數(shù)據(jù)可視化;
c.利用sklearn進行數(shù)據(jù)挖掘?qū)崿F(xiàn)回歸和分類任務(wù)。
三、項目內(nèi)容:
a.對客戶數(shù)據(jù)進行分類建伯努利貝葉斯模型,預(yù)測客戶續(xù)費情況,為客戶續(xù)存率制定KPI;
b.對公司業(yè)務(wù)數(shù)據(jù)進行相關(guān)性、回歸建模分析,為各部分營收指定KPI;
c.對公司用戶評價,盡情文本分類和情感傾向分析。
1/ 電商評論數(shù)據(jù)文本情感分析,利用SnowNLP和jieba分詞器對文本進行處理,利用wordcloud進行詞云可視化詞; 2/ 電商RFM模型,用戶價值分類;
采集學(xué)生是否主動報班、學(xué)生測試成績、家庭收入狀況數(shù)據(jù),對學(xué)生做續(xù)班分類。 利用貝葉斯分類模型,對客戶續(xù)費結(jié)果做模型預(yù)測。