数据标签常见分类

数据标签常见分类（2026 年主流视角）

“数据标签”这个词在不同语境下含义略有差异，主要分为两大场景：

下面按这两个维度分别整理最常见的分类方式（基于行业实践 + 最新趋势）。

这是目前 CV、NLP、语音、多模态等领域最主流的划分方式。

序号	标签类型	英文常见叫法	典型任务示例	适用数据类型	难度/成本排序
1	分类标签	Classification Label	图像分类、文本情感（正/负/中）、垃圾邮件	图像、文本、音频	★☆☆☆☆
2	边界框 / 检测框	Bounding Box	对象检测（YOLO、Faster R-CNN）	图像、视频	★★☆☆☆
3	语义分割	Semantic Segmentation	像素级分割（人、车、路、背景）	图像、视频	★★★☆☆
4	实例分割	Instance Segmentation	Mask R-CNN，每个物体独立 mask	图像、视频	★★★★☆
5	关键点 / 姿态	Keypoint / Landmark / Pose	人体关键点、面部 68/106 点、手部关键点	图像、视频	★★★★☆
6	序列标注	Sequence Labeling	NER（人名、地名）、分词、词性标注	文本	★★☆☆☆
7	关系抽取 / 事件	Relation / Event Annotation	SPO 三元组、事件触发词+论元	文本	★★★★☆
8	多模态 / 复合标注	Multi-modal Annotation	图像+文本 caption、视频帧+语音转写+说话人	图像+文本+音频+视频	★★★★★

2025–2026 年新增/热门趋势：

这是增长、推荐、风控、营销最常用的标签分类框架。市面上基本逃不出以下三种主流切分方式（常混用）。

类型	含义	计算成本	更新频率	典型标签举例
事实标签	直接统计或原始字段加工	低	中～高	年龄、性别、注册天数、累计消费金额、最近登录时间
规则标签	人工/业务定义的规则判定	中	中	高价值用户（近30天消费>5000）、沉默用户（90天未登录）、黑产用户（设备多开）
模型/预测标签	机器学习/算法挖掘	高	低～中	流失概率、复购概率、LTV预测、兴趣偏好（服装/数码/母婴）、信用分

你现在做的具体是哪个方向的标签体系？

告诉我场景，我可以给你更针对性的分类示例 + 常见字段设计。

相关文章