【預(yù)算:500,要程序而非數(shù)據(jù),討價(jià)還價(jià)勿擾!】
要求:主語(yǔ)言python , 爬蟲(chóng)盡量使用異步爬蟲(chóng)和節(jié)省性能消耗方案,如果業(yè)務(wù)上只能使用非異步那么使用非異步爬蟲(chóng),保證可以在linux服務(wù)器上使用
功能說(shuō)明:
定義一個(gè)函數(shù),調(diào)用函數(shù),在百度網(wǎng)盤(pán)生成生成基于時(shí)間戳+用戶id的文件夾,并生成訪問(wèn)鏈接和提取碼,返回參數(shù),建立爬取當(dāng)前直播間視頻流后臺(tái)任務(wù),每5分鐘(skip參數(shù))上傳一次百度云對(duì)應(yīng)文件夾,名稱為1.mp4,2.mp4,3.mp4這樣,傳完百度云后刪除本地視頻文件,超過(guò)timeout或直播間關(guān)閉結(jié)束程序,將最后一段上傳百度云并刪除
如果百度云不好弄可以弄成其他云盤(pán),但要保證存儲(chǔ)充足,起碼500g以上
調(diào)用參數(shù) :
{
"url":"抖音直播間鏈接",
"user_id":"用戶id,默認(rèn)0",
"skip":"每段視頻長(zhǎng)度,默認(rèn)5,代表5分鐘",
"timeout":"采集時(shí)長(zhǎng),默認(rèn)60,代表60分鐘",
}
返回參數(shù):
{
"code": 200,
"msg": "success",
"data": "百度網(wǎng)盤(pán)對(duì)應(yīng)文件夾鏈接及提取碼"
|