搜广推 / 04

冷启动、探索与多样性

推荐系统如果只利用历史点击，很容易陷入马太效应：热门内容越来越热门，新内容没有机会，新用户只能看泛化内容。冷启动、探索和多样性就是为了解决这个问题。

新用户冷启动

新用户缺少历史行为，模型很难判断兴趣。

常用方法：

新用户冷启动的目标不是一开始就极致个性化，而是快速建立可靠兴趣画像。

新物料没有点击和转化历史，容易被排序系统低估。

解决方式：

关键是给新物料足够曝光，同时控制低质量内容伤害用户体验。

利用是展示模型认为最好的内容，探索是给不确定但可能有价值的内容机会。

只利用会导致系统越来越保守；探索太多会伤害体验。

常见方法：

业务上通常会限制探索比例，并设置质量门槛。

多样性不是为了“看起来丰富”，而是为了避免重复、提升长期体验和发现潜在兴趣。

多样性维度：

多样性通常在重排阶段做，因为它需要看整个列表，而不是单个 item 分数。

多样性可能降低短期点击，但提升长期留存。面试里要说清楚取舍。

常见策略：

理想回答：

我会先用内容特征和作者特征做质量预估，再通过相似内容召回和新内容探索池获得初始曝光。排序时对新内容设置合理的先验和探索预算，线上监控有效消费、负反馈和后续留存。探索不是无脑保量，要有质量门槛和退出机制。

回答要点：

可以看：

不要只看“类别数量”，要结合用户体验和长期指标。

冷启动、探索、多样性都是在解决同一个问题：系统不能只复刻历史。一个成熟推荐系统需要在短期收益、长期体验、内容生态和探索成本之间做平衡。

下一篇建议继续看：

本文有帮助吗？