團(tuán)隊目前自有GPU集群、數(shù)據(jù)集群等豐富的開發(fā)資源,可完成大規(guī)模模型的訓(xùn)練與大樣本集" />
團(tuán)隊成員來自bat在職或離職優(yōu)秀人才。有豐富的人工智能開發(fā)經(jīng)驗,可勝任工作內(nèi)容包括但不限于自然語言處理、圖像理解、視頻理解、數(shù)據(jù)挖掘。
團(tuán)隊目前自有GPU集群、數(shù)據(jù)集群等豐富的開發(fā)資源,可完成大規(guī)模模型的訓(xùn)練與大樣本集的預(yù)測。可以提供人工智能領(lǐng)域一站式服務(wù)。
技能標(biāo)簽:TensorFlow、自然語言處理、圖像理解、視頻理解、深度學(xué)習(xí)
項目一:內(nèi)容推薦
1. 內(nèi)容畫像:topic挖掘、實體標(biāo)注、擴(kuò)散特征(ctr、時長、屬性傾向...)、質(zhì)量預(yù)估
2. 用戶畫像:包括正向興趣、遷移興趣、即時興趣、負(fù)向興趣、興趣預(yù)測
3. Embedding體系:構(gòu)建從細(xì)粒度到粗粒度的embedding體系,包括word、tag、news和user等維度,綜合運用了稀疏編碼,attention機制,side-info等技術(shù)
4. 召回策略
基于準(zhǔn)確性:正向興趣、即時興趣、負(fù)向興趣、用戶向量、協(xié)同召回(item cf)
基于多樣性:基礎(chǔ)屬性召回、熱門召回、遷移興趣
5. 排序策略:基于deepfm+attention
6. 后排策略:基于次模函數(shù)+bandit,兼顧推薦列表的準(zhǔn)確性與多樣性
項目二:應(yīng)用市場搜索
1. app理解:包括三級分類挖掘、關(guān)鍵詞提取、實體識別、名稱切詞權(quán)重自動標(biāo)注
2. 檢索詞理解:包括關(guān)鍵詞提取、實體識別、切詞權(quán)重自動標(biāo)注、點擊基尼、游戲性、匹配占比
3. 召回:基于文本召回和語義召回
4. 排序:基于DeepFM
一方面通過內(nèi)容理解(基于文本、圖片、視頻)完整刻畫內(nèi)容信息。另一方面通過用戶理解(基于行為,屬性)完整刻畫用戶興趣與習(xí)慣。然后通過精準(zhǔn)推薦算法將內(nèi)容信息推薦給用戶,提升用戶的閱讀時長與點擊率。等到右一定用戶規(guī)?;蜻M(jìn)行廣告插播實現(xiàn)流量變現(xiàn)
通過app理解(基于圖片,文本描述,用戶使用信息)完整刻畫app詳細(xì)信息。通過檢索詞理解可以檢索詞隱藏的語義信息與用戶意圖,結(jié)合相關(guān)算法實現(xiàn)兩者的精準(zhǔn)匹配,從而使用戶可以在應(yīng)用市場快速找到所需的app,提高場景的轉(zhuǎn)化率與用戶量。同時通過用戶行為理解發(fā)掘潛在的app需求,推薦高價值