基本信息
案例ID:132144
技術(shù)顧問:宅男拯救協(xié)會會長 - 3年經(jīng)驗 - 京東數(shù)字科技控股股份有限公司

項目名稱:簡書用戶爬蟲
所屬行業(yè):社交 - 興趣格調(diào)
->查看更多案例案例ID:132144
技術(shù)顧問:宅男拯救協(xié)會會長 - 3年經(jīng)驗 - 京東數(shù)字科技控股股份有限公司
項目名稱:簡書用戶爬蟲
所屬行業(yè):社交 - 興趣格調(diào)
->查看更多案例通過爬蟲實現(xiàn)一個提取簡書網(wǎng)用戶數(shù)據(jù)的程序,實現(xiàn)從簡書網(wǎng)翻頁提取包括關(guān)注用戶數(shù)、粉絲數(shù)、文章數(shù)、字數(shù)、收獲喜歡、簡書鉆、文章內(nèi)容,將獲取的數(shù)據(jù)存儲到數(shù)據(jù)庫中。然后運用NLP分析工具對用戶文章進行分析使得給用戶貼上標簽,進而對簡書用戶進行分類。最后利用關(guān)鍵詞標簽生成詞云,將每個用戶的標簽展示出來