推薦系統概述#

什麼是推薦系統#

推薦系統的本質是在用戶物品之間建立連接。這個連接可以是:

  • 用戶點擊了某個商品
  • 用戶收藏了某篇文章
  • 用戶購買了某個產品
  • 用戶關注了某個人

推薦系統的核心目標:利用已有的用戶-物品連接,預測未來可能產生的連接。

是否需要推薦系統#

評估推薦系統價值的公式:

價值 = ΔConnection / (ΔUser × ΔItem)
條件說明
ΔConnection新增的用戶-物品連接數
ΔUser新增用戶數
ΔItem新增物品數

當這個比值足夠大時,推薦系統才能創造價值。如果平台規模較小,可能人工推薦更有效。

推薦系統的經典問題#

1. 冷啟動問題#

新用戶或新物品缺乏歷史資料,難以進行個性化推薦。

類型解決方案
用戶冷啟動利用人口統計學特徵、引導用戶選擇興趣標籤
物品冷啟動基於內容的推薦、利用物品元資料

2. 探索與利用 (Exploration vs Exploitation)#

只推薦用戶已知喜歡的內容會導致「資訊繭房」,需要平衡已知興趣(利用)和發現新興趣(探索)。

推薦策略 = α × 利用(已知興趣)+ (1-α) × 探索(潛在興趣)

3. 推薦解釋性#

用戶需要知道「為什麼推薦這個給我」,增強信任感和接受度。

推薦系統的思維模式#

不確定性思維#

推薦系統處理的是概率問題,需要接受:

  • 推薦結果不可能 100% 準確
  • 同樣的輸入可能產生不同的輸出
  • 需要通過資料來驗證假設

資料驅動#

核心原則:不要相信直覺,要相信資料。

  • 用戶說喜歡什麼不重要,用戶做了什麼才重要
  • A/B 測試是驗證改進效果的金標準

系統工程思維#

推薦系統不只是演算法,還包括:

推薦系統 = 資料採集 + 特徵工程 + 模型訓練 + 線上服務 + 效果評估

三種資訊取得方式#

方式特點代表產品
搜尋用戶主動,目標明確Google、Bing
推薦系統主動,發現興趣今日頭條、抖音
廣告為資訊找人,商業目標Facebook Ads

三者都在解決資訊過載問題,技術上有很多共通之處,但目標和約束不同。

推薦系統的產品形式#

猜你喜歡#

  • 首頁個性化推薦
  • 根據用戶歷史行為推薦相關內容

相關推薦#

  • 物品詳情頁的「看了又看」「買了又買」
  • 基於當前物品推薦相關物品

資訊流 (Feed)#

  • 社交動態流
  • 資訊閱讀流
  • 短影片流

排行榜#

  • 熱門排行
  • 新品推薦
  • 編輯精選

推薦系統的核心流程#

用戶請求 → 召回 → 粗排 → 精排 → 重排 → 展示
            ↓
        多路召回策略
            ↓
        候選集融合
            ↓
        CTR/CVR 預估
            ↓
        業務規則調整

召回層#

  • 目標:從海量物品中快速篩選出候選集
  • 方法:協同過濾、內容匹配、向量召回
  • 規模:從百萬級 → 數千

排序層#

  • 目標:對候選集進行精細排序
  • 方法:機器學習模型(LR、GBDT、DNN)
  • 規模:數千 → 數十

重排層#

  • 目標:滿足業務規則和多樣性要求
  • 方法:規則過濾、打散去重、多樣性控制

推薦系統的商業價值#

推薦系統是注意力存儲器

注意力 = 內容消耗加速度 × 內容複雜度

在注意力稀缺的時代,推薦系統通過「投其所好」的方式存儲用戶注意力,再通過廣告等方式變現。

總結#

要點說明
本質在用戶和物品之間建立連接
核心問題冷啟動、探索利用、解釋性
思維模式不確定性、資料驅動、系統工程
核心流程召回 → 排序 → 重排
商業價值存儲並變現用戶注意力