全民 K 歌內容挖掘與召回
分享嘉賓:timmyqiu 騰訊音樂 應用研究
編輯整理:郭真繼
出品平臺:DataFunTalk
導讀:推薦系統一般分爲兩部分,召回階段和排序階段。召回階段是從全量數據中挑選出用戶可能感興趣的一部分數據,供後面的排序階段使用。全民 K 歌作爲一個擁有大量用戶上傳作品的平臺,如何挖掘用戶上傳的內容作爲推薦的候選集,也需要精心設計。
今天的介紹會圍繞下面四點展開:
-
內容挖掘
-
召回模型
-
召回模型實踐
-
總結和展望
01
內容挖掘
首先和大家分享下全民 K 歌進行內容挖掘在業務上的必要性。
1. 內容挖掘 -- 重要性
2. 內容挖掘—目標
-
內容准入機制:從內容創造者上傳的內容中篩選出優質作品,進入到推薦系統鏈路
-
分發通路:內容創作者上傳內容中篩選出優質作品之後,需要一個穩定的分發通路,保證這些優質資源能夠讓用戶看到。
這兩個模塊也是經歷了一系列的迭代和優化過程,下面將詳細介紹迭代過程。
3. 內容挖掘—迭代
在內容分發方面,一開始完全是基於推薦系統的自然分發,然後在此基礎上,爲了更好的激勵內容創作者,增加了冷啓動內容保量機制。現在採用的是多級分發,針對不同的反饋效果去給一個作品做多流量的分發機制。
4. 內容挖掘—方案
① 內容准入:內容准入部分是由 TME 創新團隊提供的深度神經網絡模型,將一些普通內容和優質內容進行人工標註之後訓練模型。對於新發的音頻和視頻資源,模型會根據他的唱功、視頻質量等一系列特徵來判斷內容好壞。對於音頻資源通過模型打分之後直接進入到推薦候選池中,對於音頻資源還需要通過人工審覈才能入庫。通過這樣的流程就可以很高效的從每日發佈的 500w 資源中挖掘出可以推薦的資源。
② 分級分發:從用戶創作的內容挖掘出優質資源之後,跟着的就是冷啓動階段。根據用戶的賬號等級,給資源初始曝光量,在曝光量打到設定的值之後根據反饋的數據與資源的平均數據進行對比,如果反饋效果更好的話就增加曝光量,在擴大曝光幾次之後,如果資源的反饋仍然比較好,就用雙塔模型對資源進行一個保量。
③ 召回:召回模型採用的是雙塔模型,不過和傳統的雙塔模型相比,這裏只用到了作品的源信息,沒有用到後續的信息。
在完成保量過程之後優秀的作品會轉入到流量流轉階段,這個階段和分級分發類似,每個推薦週期結束後根據一些指標對內容進行評估。比如看點擊率、完播率這些,根據這些表現來確定是不是要把它放到更大一級的流量池裏面去分發。
02
召回模型
完成了內容創作者資源的挖掘之後,從每日上傳的內容裏面可以獲取到比較優秀的內容,構建內容池,然後對這個內容池來做個性化召回。
1. 召回模型—總覽
-
屬性召回:用戶在看什麼內容,說明用戶對於這類屬性的物品有一個偏好,然後可以根據這些偏好去做點對點的召回,召回一些帶有用戶偏好屬性的內容;
-
模型召回:從用戶和 item 的建模角度,把用戶和 item 建模到同一個向量空間,之後可以按照相關檢索去爲用戶做一個召回;
-
其他召回:除了上述兩種召回以外,基於實時熱門內容、LBS(基於位置服務)、關係鏈召回也可以召回少量數據作爲補充。
2. 召回模型—畫像屬性召回
3. 召回模型—屬性向量化
03
召回模型實踐
在介紹完召回模型的理論部分之後,下面介紹一下召回模型的實踐以及實踐中的探索優化
1. 召回模型實踐—模型化召回
模型化召回典型結構有三種:
-
只有 Embedding 層:矩陣分解
-
用戶單塔 + softmax:Youtube-DNN
-
雙塔 + cosine:DSSM
全民 K 歌線上採用的是第三種結構,和排序模型相比有幾個需要注意的問題:
-
相比排序,召回面臨的搜索空間更大。排序只是把少量內容進行打分然後按照分數從高到低排序,但是召回要面臨的數據更多,而且數據分佈也不相同,所以選擇負樣本非常重要。
-
線上檢索速度有要求,時間太長會影響用戶體驗,所以無法引入用戶的 item 的交叉特徵,導致模型的表達能力比起排序模型偏弱。
-
作爲個性化分發的起點,需要引入 debias 機制,緩解 bias 循環
2. 召回模型實踐—負樣本選取
3. 召回模型實踐—增強單塔的表達能力
用於召回的雙塔模型存在一個問題:不能用到用戶和 item 之間的交互特徵,前面說過這樣導致的結果就是導致表達能力偏弱。所以需要做一些優化來增強單塔的表達能力。具體的做法是利用用戶比較穩定的一些行爲序列,再加上用戶的用戶畫像的的一些基礎信息,根據這些來構建用戶的隱藏的表徵。然後基於這個表徵,去篩選用戶的動態,比如播放、點擊這種比較穩定的行爲動態,這樣就能得到一些和當前預測目標更相關的信息。
4. 召回模型—最終模型
5. 召回模型實踐—Debias
-
(user,item,rating)從推薦場景擴充到全平臺主動性爲
-
Rating 的置信度與 Propensity Score 關聯起來,降低高曝光正樣本的權重,增加低曝光正樣本的權重
-
IPS 變換和截斷
這個方案上線以後也取得了一定的收益,說明 bias 的循環是存在的。採取上述方案 Debias 是成功的。
04
總結和展望
文章作者:
timmyqiu
騰訊音樂 | 應用研究
2016 年南京大學計算機系碩士畢業,同年加入騰訊 SNG 數字音樂部,先後負責過 QQ 音樂的畫像和每日 30 首推薦的算法相關工作。2018 年底至今在全民 K 歌負責 UGC 作品的推薦算法開發與相關的工程實現。
本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源:https://mp.weixin.qq.com/s/scAbqhaozy5HQyNuQYW2_A