嗶哩嗶哩推薦策略分析與思考

(一)B 站推薦策略概述

作爲 UGC 視頻平臺和年輕文化社區,B 站經過 10 年多的成長,已經積累了龐大而豐富的內容資源,也成功吸引了上億用戶。2019 年第四季度財報顯示,B 站平均月活用戶數量達 1.3 億,移動端月均活躍用戶達 1.16 億,日均活躍用戶達 3800 萬。同時,2019 年日均視頻播放量高達 7.1 億,其中專業用戶的自制內容(PUGV)佔整體平臺播放量的 91%。

B 站是國內視頻平臺中比較有代表性的長尾市場案例之一,在長尾市場中,儘管內容資源越來越豐富,但是用戶的注意力和時間仍然有限。爲保證用戶留存和良好的口碑,提升競爭地位,幫助用戶在紛繁的內容中找到個人感興趣的那些就變得尤爲重要。從用戶角度來看,主要有兩種方式可以達到目的,主動的 “搜索” 和被動的 “推薦” 。從用戶體驗來看 “推薦” 更能降低用戶的選擇成本,對於平臺來說也可以成爲一種更爲高效的營銷方式。

(二)本文分析內容說明

目前,B 站 “推薦” 策略的主要應用有兩塊:1、移動端首頁推薦;2、視頻播放相關推薦。因爲兩者對應的場景不同,用戶的需求也不同,因此需要分別進行分析。本文僅針對移動端首頁。

本次分析的目的和目標:

1、通過階段性抽樣調研的方式,根據推薦內容的展現和排序,分析 B 站推薦策略的影響因素和衡量標準,根據分析推測推薦策略的評分計算規則;

2、評估當前的推薦策略效果,擬定優化方向;

(三)移動端首頁推薦分析

目標一:推測推薦策略的影響因素和排序展現規則

(1)推薦理想態:用戶花費最短的時間找到自己感興趣的內容;

(2)可能影響推薦結果的因素擬定:主要可以從三個大的方面考慮,基於用戶基本信息、用戶歷史行爲分析和其他的客觀影響因素,詳見下圖。

(3)分析方法:通過隨機的十次刷新首頁推薦,截屏記錄推薦的內容,從以上影響因素的維度進行分析,得出具體的結果如下表。根據相關因素的出現次數,統計得到一個總分數,理論上,分數越高代表在推薦內容中佔的比重越高,說明在推薦規則中佔的權重越大。(但是由於個人做調研分析,樣本量過小,也不能排除個人主觀影響,所以可能會與實際情況存在偏差)

(4)影響因素和計算邏輯推測

從以上的分析中根據個人經驗推測的可能影響因素和計算規則如下圖所示:

(5)實現邏輯說明

爲用戶推薦感興趣的內容的基本原理是:找到用戶的興趣點,提取爲可以描述的關鍵標籤,分析候選內容,識別提取內容的標籤,實現標籤的匹配,即實現按照用戶的興趣推薦的目的。

目標二:推薦策略效果及優化方向分析

(1)用戶行爲與滿意度之間的關係分析

用戶的行爲可分爲四類:跳出行爲、查看行爲、互動行爲和跳轉行爲。跳出行爲說明內容並沒有非常吸引用戶;查看行爲說明推薦的內容比較讓用戶滿意,而且有進一步探索的慾望;互動行爲說明用戶對於推薦結果很滿意,但是有一個 “不喜歡” 的互動是反向情況,說明用戶對該內容感興趣但是不同意推薦內容的觀點或者引起不適;跳轉或者下載也是比較滿意的行爲表現。

(2)核心指標量化

通過準確率和召回率對推薦效果進行評估,準確率是指:策略覆蓋的案例中真正希望被覆蓋的佔策略覆蓋的所有案例的比例;召回率是指:希望被覆蓋的案例中實際覆蓋到的案例佔理想狀態下希望策略覆蓋的案例的比例;

在本案例中轉化爲以下指標:

準確率 = 用戶點擊的推薦內容的數量 / 推薦給用戶的內容總數量;

例如:平臺給用戶推薦了 10 條內容,用戶點擊了其中一條,準確率爲:0.1

召回率 = 用戶點擊的推薦內容的數量 / 用戶在平臺中總共的點擊量;

例如:平臺推薦給用戶 20 條內容,用戶在系統推薦的內容中一共點擊了 10 條,但是用戶在平臺中一共點擊了 200 條內容,召回率爲:0.05

滿意度爲(點擊內容後用戶對應行爲的數量 / 進入內容頁的總用戶數量)的累加之和;

例如:進入某視頻內容詳情頁的用戶爲 10000 人次,產生互動行爲的有 3000 人次,跳轉或者下載行爲的是 200 人次,則非常滿意的佔比爲:(3000+200)/10000=0.32

(3)抽樣調研說明

實際情況下的抽樣分析方案:一天之內隨機篩選一定數量用戶的首頁推薦的 session,針對用戶的推薦內容數量和用戶推薦中點擊的數量等數據,計算準確率和召回率。根據上述分析的各類用戶行爲計算用戶的滿足情況。(因爲資源和條件的限制,本文以自己十分鐘內的推薦相關的操作數據爲準進行分析,不代表真實情況,僅用做分析參考。準確率 = 3/39=0.077;召回率 = 3/8=0.375;)

隨機抽取 200 個不滿意和一般滿意的用戶行爲 session,分析不同行爲所佔的比例,確定改進方案的影響面。(同樣因爲條件限制,本文爲虛擬的數據,只爲分析思路提供支持,不代表真實情況)

(4)可能存在的問題分析

1、熱點內容或者熱門內容權重比針對性的用戶興趣標籤比重大;

2、商業推廣和活動運營權重比針對性的用戶興趣標籤比重大;

3、用戶畫像分析和基本信息提取不夠準確;

4、用戶不感興趣的相同類型內容重複推薦;

5、標籤過於寬泛,推薦內容與用戶匹配精準性欠缺;

(5)改進方案及優先級判斷

(以上數據爲自行實驗測定,僅供思路參考,不代表實際情況)

因此,進一步的優化計劃如下,優先級依次下降:

1、將推薦計算規則中熱門內容和熱點內容的權重係數適當調低;

2、將推薦計算規則中商業推廣和活動運營的權重係數適當調低;

3、進一步優化用戶畫像分析算法,提高用戶畫像的精準性;

4、添加負向權重,關注推薦內容的重複度,減少重複內容比例;

5、細化標籤體系;

本文分析均爲個人觀點,建立在不考慮其他因素僅追求極致用戶體驗的基礎上,但是整體的優化方向和具體計劃還要參考平臺整體的戰略規劃。目前,B 站需要吸引和培養更多的優秀 up 主,保護良好的社區環境和內容質量,同時,不斷提高營收也是 B 站需要努力的方向,商業推廣和活動運營也必不可少。因此在 “推薦” 策略中需要權衡 up 主、廣告主和用戶等各方的利益。

本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/7dfNLy29nqyNOg3x-2xWgQ