内容风控 / 03

文本、图像与多模态审核

内容风险经常不是单一模态。文字、图片、视频、语音、标题、评论和上下文组合起来，才构成完整语义。

文本审核

文本风险包括辱骂、广告、诈骗、敏感内容、引流等。

方法：

图像风险包括色情、暴力、二维码、广告图、侵权等。

方法：

视频比图像更难，因为风险可能出现在某几帧或音频里。

常用策略：

多模态审核要融合文本、图像、音频和上下文。

例如一张图本身无风险，但配文引导诈骗；一段视频画面正常，但语音违规；商品图和标题组合才构成虚假宣传。

风控评估要分风险类型看：

高危风险更重召回，普通风险更要控制误伤。

理想回答：

我会先分别处理文本、图像、OCR、ASR 和用户上下文，再做多模态融合。高危规则直接拦截，中低风险由模型打分并进入人审或放行。评估时按风险类型分层，看召回、误伤和审核成本，并通过申诉和人审结果回流优化。

下一篇建议继续看：

本文有帮助吗？