2.熟練python基礎語法,了解pandas、numpy、matplotlib等數據分析及可視化工具;
3.了解統計學相關知識,以及隨機森林、樸素貝葉斯、KNN" />
1.掌握SQL語言,能在MYSQL環(huán)境下對數據進行增刪改查;
2.熟練python基礎語法,了解pandas、numpy、matplotlib等數據分析及可視化工具;
3.了解統計學相關知識,以及隨機森林、樸素貝葉斯、KNN、KMeans聚類、ARIMA等算法模型;
4.熟悉Tableau可視化工具;
項目介紹:
為了預知用戶潛在的購買需求,對用戶及商品數據進行分析,根據用戶屬性、用戶行為、商品屬
性及時間序列進行拆解分析,得到用戶購買力預測模型并進行有針對性的備貨及商品推薦。
負責內容:
1.使用python連接MYSQL數據庫,并對關鍵數據進行提取和關聯;
2.使用python結合pandas、numpy 等分析庫完成數據的清洗及特征的處理;
3. 使用python結合matplotlib等可視化工具探索并展示各特征和標簽之間的關系;
4.使用sklearn庫拆分訓練集、測試集,并構建隨機森林、樸素貝葉斯、KNN算法預測模型;
5.通過準確率、精確率、召回率分析模型效果,并結合預測結果完成推薦及建議;
6.編寫數據分析報告并完成匯報;