小紅書(shū)采集
一:實(shí)時(shí)監(jiān)控博主id的新增帖子,
有新增的帖子自動(dòng)采集帖子的評(píng)論用戶id
(顯示博主的帖子跟評(píng)論的數(shù)量,
統(tǒng)計(jì)今天,昨天,3天,7天,30天的新增數(shù)量)
(新增博主時(shí)已存在提示)
(設(shè)置一鍵拉黑x天內(nèi)沒(méi)新增評(píng)論的博主)
二:實(shí)時(shí)監(jiān)控帖子新增的評(píng)論
(設(shè)置一鍵拉黑x天內(nèi)沒(méi)新增評(píng)論的帖子)
三:采集內(nèi)容
帖子地址,帖子標(biāo)題,用戶uid,用戶昵稱
評(píng)論內(nèi)容,評(píng)論時(shí)間,用戶地區(qū),小紅書(shū)號(hào)
粉絲數(shù)量,關(guān)注數(shù)量,有無(wú)筆記,性別
四:數(shù)據(jù)分析
過(guò)濾地區(qū),過(guò)濾評(píng)論關(guān)鍵詞,過(guò)濾簽名關(guān)鍵詞,過(guò)濾昵稱,去除粉絲數(shù)大于x,去除有無(wú)筆記用戶,評(píng)論時(shí)間,
五:數(shù)據(jù)上傳
1.篩選后設(shè)置是否自動(dòng)上傳到服務(wù)器
2.設(shè)置去重次數(shù),比如這個(gè)用戶id已經(jīng)被上傳到
數(shù)據(jù)庫(kù)x次,就不再上傳
3.設(shè)置只上傳x天x分鐘內(nèi)評(píng)論的用戶
4.設(shè)置多電腦分組并分別生成api鏈接
5.設(shè)置綁定機(jī)器一機(jī)一碼卡密