軟件:【用戶導(dǎo)入數(shù)據(jù)集,你的軟件給進(jìn)行數(shù)據(jù)分析】
1、導(dǎo)入數(shù)據(jù):允許用戶導(dǎo)入符合軟件要求的數(shù)據(jù)集
2、展示用戶導(dǎo)入的數(shù)據(jù)信息:例如,有多少行、哪些列、打印前10行等
3、數(shù)據(jù)預(yù)處理:例如,查看數(shù)據(jù)集有沒有缺失值,并進(jìn)行缺失值處理等;再如,文本數(shù)據(jù)需要向量化,即把文本轉(zhuǎn)換成數(shù)值向量
4、數(shù)據(jù)預(yù)處理前后對比展示:
5、探索性數(shù)據(jù)分析:例如,有多少數(shù)據(jù),有多少列、每列數(shù)據(jù)類型等,相關(guān)信息要打印到軟件可視化展示區(qū)域
6、特征選擇:允許用戶選擇哪些列作為特征X,哪個列作為標(biāo)簽y
7、數(shù)據(jù)集劃分:能夠按照用戶的比例要求劃分訓(xùn)練集、測試集
8、提供多個模型:以分類任務(wù)為例,軟件需要提供2種以上模型供用戶選擇
9、模型評價:以分類任務(wù)為例,軟件訓(xùn)練的模型性能要可視化展示出來,如果用戶分別選擇了多個模型,要把所有模型的結(jié)果同時展示給用戶,便于對比
10、模型保存:用戶上傳數(shù)據(jù)集訓(xùn)練的模型,要保存到用戶指定的位置,并能讀取保存的模型
11、新數(shù)據(jù)預(yù)測:讀取保存的模型,對用戶新上傳的數(shù)據(jù)進(jìn)行預(yù)測
12、生成數(shù)據(jù)分析報告:制作word模板,所有可視化結(jié)果、用戶參數(shù)、數(shù)據(jù)信息、模型性能等自動保存到word模板,供用戶查看。