NLP / AIGC / 02

经典 NLP 任务与工业场景

经典 NLP 任务仍然是很多业务系统的基础。即使使用大模型，分类、抽取、匹配、排序和评测也不会消失。

文本分类

文本分类用于判断文本属于什么类别。

业务场景：

面试重点是标签定义、类别不均衡、误伤成本和阈值选择。

序列标注用于识别文本中的实体或片段。

业务场景：

常见模型包括 CRF、BiLSTM-CRF、BERT + CRF、大模型抽取。

信息抽取把非结构化文本变成结构化字段。

例如从商品标题中抽取品牌、型号、规格，从物流文本中抽取地址、时间、联系人，从合同中抽取金额和条款。

大模型适合少样本抽取，但线上系统还要考虑稳定性、格式约束和错误校验。

文本匹配判断两段文本是否相关或等价。

业务场景：

常见方法：

生成任务包括摘要、改写、问答、营销文案、客服回复。

生成任务最关键不是“能生成”，而是：

经典 NLP 评估包括准确率、召回率、F1、BLEU、ROUGE、NDCG。大模型时代还要加人工评估、LLM-as-judge、事实一致性和安全评测。

可以回答：

可以回答：

经典 NLP 任务是大模型应用的底座。面试里不要只讲模型，要讲任务定义、数据标注、评估指标、业务风险和上线闭环。

下一篇建议继续看：

本文有帮助吗？