推薦系統概述#
什麼是推薦系統#
推薦系統的本質是在用戶和物品之間建立連接。這個連接可以是:
- 用戶點擊了某個商品
- 用戶收藏了某篇文章
- 用戶購買了某個產品
- 用戶關注了某個人
推薦系統的核心目標:利用已有的用戶-物品連接,預測未來可能產生的連接。
是否需要推薦系統#
評估推薦系統價值的公式:
價值 = ΔConnection / (ΔUser × ΔItem)| 條件 | 說明 |
|---|---|
| ΔConnection | 新增的用戶-物品連接數 |
| ΔUser | 新增用戶數 |
| ΔItem | 新增物品數 |
當這個比值足夠大時,推薦系統才能創造價值。如果平台規模較小,可能人工推薦更有效。
推薦系統的經典問題#
1. 冷啟動問題#
新用戶或新物品缺乏歷史資料,難以進行個性化推薦。
| 類型 | 解決方案 |
|---|---|
| 用戶冷啟動 | 利用人口統計學特徵、引導用戶選擇興趣標籤 |
| 物品冷啟動 | 基於內容的推薦、利用物品元資料 |
2. 探索與利用 (Exploration vs Exploitation)#
只推薦用戶已知喜歡的內容會導致「資訊繭房」,需要平衡已知興趣(利用)和發現新興趣(探索)。
推薦策略 = α × 利用(已知興趣)+ (1-α) × 探索(潛在興趣)3. 推薦解釋性#
用戶需要知道「為什麼推薦這個給我」,增強信任感和接受度。
推薦系統的思維模式#
不確定性思維#
推薦系統處理的是概率問題,需要接受:
- 推薦結果不可能 100% 準確
- 同樣的輸入可能產生不同的輸出
- 需要通過資料來驗證假設
資料驅動#
核心原則:不要相信直覺,要相信資料。
- 用戶說喜歡什麼不重要,用戶做了什麼才重要
- A/B 測試是驗證改進效果的金標準
系統工程思維#
推薦系統不只是演算法,還包括:
推薦系統 = 資料採集 + 特徵工程 + 模型訓練 + 線上服務 + 效果評估三種資訊取得方式#
| 方式 | 特點 | 代表產品 |
|---|---|---|
| 搜尋 | 用戶主動,目標明確 | Google、Bing |
| 推薦 | 系統主動,發現興趣 | 今日頭條、抖音 |
| 廣告 | 為資訊找人,商業目標 | Facebook Ads |
三者都在解決資訊過載問題,技術上有很多共通之處,但目標和約束不同。
推薦系統的產品形式#
猜你喜歡#
- 首頁個性化推薦
- 根據用戶歷史行為推薦相關內容
相關推薦#
- 物品詳情頁的「看了又看」「買了又買」
- 基於當前物品推薦相關物品
資訊流 (Feed)#
- 社交動態流
- 資訊閱讀流
- 短影片流
排行榜#
- 熱門排行
- 新品推薦
- 編輯精選
推薦系統的核心流程#
用戶請求 → 召回 → 粗排 → 精排 → 重排 → 展示
↓
多路召回策略
↓
候選集融合
↓
CTR/CVR 預估
↓
業務規則調整召回層#
- 目標:從海量物品中快速篩選出候選集
- 方法:協同過濾、內容匹配、向量召回
- 規模:從百萬級 → 數千
排序層#
- 目標:對候選集進行精細排序
- 方法:機器學習模型(LR、GBDT、DNN)
- 規模:數千 → 數十
重排層#
- 目標:滿足業務規則和多樣性要求
- 方法:規則過濾、打散去重、多樣性控制
推薦系統的商業價值#
推薦系統是注意力存儲器:
注意力 = 內容消耗加速度 × 內容複雜度在注意力稀缺的時代,推薦系統通過「投其所好」的方式存儲用戶注意力,再通過廣告等方式變現。
總結#
| 要點 | 說明 |
|---|---|
| 本質 | 在用戶和物品之間建立連接 |
| 核心問題 | 冷啟動、探索利用、解釋性 |
| 思維模式 | 不確定性、資料驅動、系統工程 |
| 核心流程 | 召回 → 排序 → 重排 |
| 商業價值 | 存儲並變現用戶注意力 |