Random forest 的項目. 數(shù)據(jù)要英文的,可以從下面幾個地方來選
Awesome datasets: https://github.com/awesomedata/awesome-public-datasets
NCAA: https://stats.ncaa.org/
Data.gov: https://data.gov/
Kaggle: https://www.kaggle.com/datasets
UCI Repository: https://archive.ics.uci.edu/
這個可以作為大體參考:https://github.com/brichards21/PHP2550-Final-Project
簡介: 項目的背景, 然后這個項目是預測什么? 我們使用隨機森林算法可以幫助我們實現(xiàn)什么?
要用 R markdown 來寫代碼
代碼的邏輯要注釋,寫清楚, 然后任何一些提升算法結果的辦法都要寫一下,讓后前后效果的對比. 可以英文也可以中文. 使用中文的話, 專業(yè)詞要有英文來在后面, 例如 隨機森林(random forest)
理論的來源要說一下, 使用這個: https://arxiv.org/abs/1407.7502
一定要把公式公式列出來
主要就是代碼部分和數(shù)學公式這部分,其他的一些介紹什么的可以稍微來點就好.
分析的數(shù)據(jù)從我提供的里面自選, 最好不要太簡單也不要太復雜, 別太大眾