提交4-1数据标注概述(Label Studio版)
This commit is contained in:
501
README.md
501
README.md
@@ -1,2 +1,501 @@
|
|||||||
# 4-1
|
# 4-1 数据标注概述
|
||||||
|
|
||||||
|
## 学习目标
|
||||||
|
|
||||||
|
1. 理解什么是数据标注及其在AI项目中的重要性
|
||||||
|
2. 掌握数据标注的完整流程
|
||||||
|
3. 了解常见的数据标注类型
|
||||||
|
4. 认识主流标注工具
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## 1. 什么是数据标注
|
||||||
|
|
||||||
|
### 1.1 一句话定义
|
||||||
|
|
||||||
|
**数据标注**:让人工为原始数据添加"标签",让计算机能够理解数据的含义。
|
||||||
|
|
||||||
|
### 1.2 生活类比
|
||||||
|
|
||||||
|
想象一个不会说话的婴儿:
|
||||||
|
- 婴儿看到一只猫,大人指着它说"猫"
|
||||||
|
- 婴儿看到一只狗,大人指着它说"狗"
|
||||||
|
- 反复多次后,婴儿学会了区分猫和狗
|
||||||
|
|
||||||
|
**数据标注的作用就类似于"教婴儿认识世界"——给数据打上标签,让AI学会认识数据。**
|
||||||
|
|
||||||
|
```
|
||||||
|
原始数据 标注后 AI能理解
|
||||||
|
┌──────────┐ ┌──────────┐ ┌──────────┐
|
||||||
|
│ 一张图片 │ → │ 标签:猫 │ → │ 这是猫! │
|
||||||
|
│ │ │ │ │ │
|
||||||
|
└──────────┘ └──────────┘ └──────────┘
|
||||||
|
|
||||||
|
┌──────────┐ ┌──────────┐ ┌──────────┐
|
||||||
|
│ 一段文字 │ → │ 情感:正面 │ → │ 积极评价! │
|
||||||
|
│ │ │ │ │ │
|
||||||
|
└──────────┘ └──────────┘ └──────────┘
|
||||||
|
|
||||||
|
┌──────────┐ ┌──────────┐ ┌──────────┐
|
||||||
|
│ 一段语音 │ → │ 文字:你好 │ → │ "你好"! │
|
||||||
|
│ │ │ │ │ │
|
||||||
|
└──────────┘ └──────────┘ └──────────┘
|
||||||
|
```
|
||||||
|
|
||||||
|
### 1.3 为什么AI需要标注数据
|
||||||
|
|
||||||
|
**AI模型的本质**:从标注数据中学习"输入"和"输出"之间的规律
|
||||||
|
|
||||||
|
```
|
||||||
|
训练过程:
|
||||||
|
┌─────────────┐ ┌─────────────┐ ┌─────────────┐
|
||||||
|
│ 输入数据 │ + │ 标注标签 │ → │ AI模型学会 │
|
||||||
|
│ (图片) │ │ (这是猫) │ │ 识别猫狗 │
|
||||||
|
└─────────────┘ └─────────────┘ └─────────────┘
|
||||||
|
|
||||||
|
预测过程:
|
||||||
|
┌─────────────┐ ┌─────────────┐
|
||||||
|
│ 新图片 │ ──────────────────→ │ 识别结果 │
|
||||||
|
│ (没标注过) │ │ 这是猫! │
|
||||||
|
└─────────────┘ └─────────────┘
|
||||||
|
```
|
||||||
|
|
||||||
|
**没有标注数据,就没有AI模型** —— 这是深度学习时代的基本规则。
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## 2. 数据标注的应用场景
|
||||||
|
|
||||||
|
### 2.1 图像领域
|
||||||
|
|
||||||
|
| 标注类型 | 说明 | 应用场景 |
|
||||||
|
|---------|------|---------|
|
||||||
|
| **图像分类** | 给整张图片打一个标签 | 猫狗分类、商品识别、病变检测 |
|
||||||
|
| **目标检测** | 在图片中框出目标物体并标注类别 | 自动驾驶、安防监控 |
|
||||||
|
| **语义分割** | 逐像素标注每个像素属于哪个类别 | 医学影像、自动驾驶道路识别 |
|
||||||
|
| **关键点标注** | 标注人体/物体的关键点位置 | 姿态识别、表情分析 |
|
||||||
|
|
||||||
|
```
|
||||||
|
图像分类:整张图片 → 1个标签
|
||||||
|
┌─────────────────┐
|
||||||
|
│ 🐱 │ → 猫
|
||||||
|
│ │
|
||||||
|
└─────────────────┘
|
||||||
|
|
||||||
|
目标检测:图片中 → 多个目标框
|
||||||
|
┌─────────────────┐
|
||||||
|
│ [🐱] [🐕] │ → 猫、狗
|
||||||
|
│ [🏠] │ → 房子
|
||||||
|
└─────────────────┘
|
||||||
|
|
||||||
|
语义分割:每个像素 → 类别
|
||||||
|
┌─────────────────┐
|
||||||
|
│ ▓▓▓▓▓▓▓▓▓▓▓▓▓▓ │
|
||||||
|
│ ▓▓地面▓▓天空▓▓▓ │ → 不同颜色代表不同类别
|
||||||
|
│ ▓▓▓▓▓▓▓▓▓▓▓▓▓▓ │
|
||||||
|
└─────────────────┘
|
||||||
|
```
|
||||||
|
|
||||||
|
### 2.2 文本领域
|
||||||
|
|
||||||
|
| 标注类型 | 说明 | 应用场景 |
|
||||||
|
|---------|------|---------|
|
||||||
|
| **文本分类** | 给整段文本打一个类别标签 | 垃圾邮件识别、新闻分类、情感分析 |
|
||||||
|
| **命名实体识别(NER)** | 标注文本中的具体实体 | 信息抽取、知识图谱构建 |
|
||||||
|
| **意图识别** | 标注用户query的意图 | 智能客服、对话系统 |
|
||||||
|
| **关系标注** | 标注两个实体之间的关系 | 知识图谱、关系抽取 |
|
||||||
|
|
||||||
|
```
|
||||||
|
文本分类:
|
||||||
|
"这部电影太精彩了!" → 正面情感
|
||||||
|
|
||||||
|
命名实体识别(NER):
|
||||||
|
"张伟毕业于清华大学" → 人名:张伟,机构:清华大学
|
||||||
|
|
||||||
|
意图识别:
|
||||||
|
"帮我查一下明天北京的天气" → 意图:查询天气,地点:北京,时间:明天
|
||||||
|
```
|
||||||
|
|
||||||
|
### 2.3 语音领域
|
||||||
|
|
||||||
|
| 标注类型 | 说明 | 应用场景 |
|
||||||
|
|---------|------|---------|
|
||||||
|
| **语音转写(ASR)** | 把语音转成文字 | 字幕生成、会议记录、智能音箱 |
|
||||||
|
| **说话人分离** | 标注每段话是谁说的 | 会议纪要、对话分析 |
|
||||||
|
| **音频分类** | 给音频打标签 | 音乐分类、声音事件检测 |
|
||||||
|
| **情感标注** | 标注语音中的情感 | 语音客服质检、情绪分析 |
|
||||||
|
|
||||||
|
```
|
||||||
|
语音转写:
|
||||||
|
🔊 "今天天气怎么样" → 文字:今天天气怎么样,时间戳:0s-2s
|
||||||
|
|
||||||
|
说话人分离:
|
||||||
|
🔊 [Speaker A]: 明天要开会吗?
|
||||||
|
🔊 [Speaker B]: 是的,下午三点。
|
||||||
|
→ 每段话标注说话人身份
|
||||||
|
|
||||||
|
音频分类:
|
||||||
|
🔊 🔇 🔊 → 环境声:关门声,人声:说话声,音乐:背景音乐
|
||||||
|
```
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## 3. 数据标注的完整流程
|
||||||
|
|
||||||
|
### 3.1 六步流程图
|
||||||
|
|
||||||
|
```
|
||||||
|
┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐
|
||||||
|
│ 数据 │ → │ 数据 │ → │ 任务 │ → │ 人工 │ → │ 质量 │ → │ 标注 │
|
||||||
|
│ 采集 │ │ 清洗 │ │ 定义 │ │ 标注 │ │ 质检 │ │ 入库 │
|
||||||
|
└──────────┘ └──────────┘ └──────────┘ └──────────┘ └──────────┘ └──────────┘
|
||||||
|
```
|
||||||
|
|
||||||
|
### 3.2 各步骤详解
|
||||||
|
|
||||||
|
#### 步骤1:数据采集
|
||||||
|
|
||||||
|
**目标**:收集用于标注的原始数据
|
||||||
|
|
||||||
|
**采集方式**:
|
||||||
|
- 网络爬虫(公开数据集)
|
||||||
|
- 业务系统日志
|
||||||
|
- 传感器采集
|
||||||
|
- 购买或合作获取
|
||||||
|
- 现场拍摄/录制
|
||||||
|
|
||||||
|
**注意事项**:
|
||||||
|
- 版权问题(尤其是图像、文本)
|
||||||
|
- 隐私合规(人脸、语音、地理位置等)
|
||||||
|
- 数据质量初步筛选(去掉模糊/损坏的)
|
||||||
|
|
||||||
|
#### 步骤2:数据清洗
|
||||||
|
|
||||||
|
**目标**:把原始数据处理成"可标注"的状态
|
||||||
|
|
||||||
|
**常见操作**:
|
||||||
|
- 图像:调整分辨率、去重、去除敏感内容
|
||||||
|
- 文本:去除乱码、统一编码、分句分段
|
||||||
|
- 语音:降噪处理、切除静音片段、格式转换
|
||||||
|
|
||||||
|
```
|
||||||
|
原始数据 清洗后
|
||||||
|
┌────────────┐ ┌────────────┐
|
||||||
|
│ 图片损坏 │ → │ 去除 │
|
||||||
|
│ 图片重复 │ → │ 去重 │
|
||||||
|
│ 图片模糊 │ → │ 过滤 │
|
||||||
|
└────────────┘ └────────────┘
|
||||||
|
```
|
||||||
|
|
||||||
|
#### 步骤3:任务定义
|
||||||
|
|
||||||
|
**目标**:明确"要标什么"和"怎么标"
|
||||||
|
|
||||||
|
**关键文档**:
|
||||||
|
1. **标注规范文档**:详细说明每个标签的定义、边界、示例
|
||||||
|
2. **标注界面设计**:设计标注工具的交互方式
|
||||||
|
3. **质量标准**:明确"什么算合格"
|
||||||
|
|
||||||
|
**这一步至关重要**——任务定义不清,后续标注全部白做!
|
||||||
|
|
||||||
|
#### 步骤4:人工标注
|
||||||
|
|
||||||
|
**核心环节**:由标注员按照规范完成标注工作
|
||||||
|
|
||||||
|
**标注方式**:
|
||||||
|
| 方式 | 说明 | 适用场景 |
|
||||||
|
|------|------|---------|
|
||||||
|
| **全职标注员** | 公司内部专业团队 | 大型项目、敏感数据 |
|
||||||
|
| **外包团队** | 委托专业标注公司 | 大量数据、长期合作 |
|
||||||
|
| **众包平台** | 众多个体接单标注 | 海量数据、成本敏感 |
|
||||||
|
| **内部协作** | 学生/同事参与标注 | 学术研究、小规模数据 |
|
||||||
|
| **AI辅助** | 用已有模型预标注,人工校正 | 数据量大、规则明确 |
|
||||||
|
|
||||||
|
#### 步骤5:质量质检
|
||||||
|
|
||||||
|
**目标**:确保标注质量达标
|
||||||
|
|
||||||
|
**质检方法**:
|
||||||
|
|
||||||
|
```
|
||||||
|
┌─────────────────────────────────────────────────┐
|
||||||
|
│ 质量检查机制 │
|
||||||
|
├─────────────────────────────────────────────────┤
|
||||||
|
│ │
|
||||||
|
│ 📊 抽样检查 │
|
||||||
|
│ 随机抽取10-20%的数据,由质检员复核 │
|
||||||
|
│ │
|
||||||
|
│ 🔄 双盲标注 │
|
||||||
|
│ 同一数据由两个标注员分别标注,一致性<80%则复核 │
|
||||||
|
│ │
|
||||||
|
│ 👨🏫 专家仲裁 │
|
||||||
|
│ 疑难数据由专家决定最终标签 │
|
||||||
|
│ │
|
||||||
|
│ 📈 标注员绩效 │
|
||||||
|
│ 统计每个标注员准确率,作为考核依据 │
|
||||||
|
│ │
|
||||||
|
└─────────────────────────────────────────────────┘
|
||||||
|
```
|
||||||
|
|
||||||
|
**常见质量指标**:
|
||||||
|
- **标注一致性**:两人标同一样本结果一致的比例
|
||||||
|
- **标注准确率**:标注结果与正确答案的符合程度
|
||||||
|
- **标注速度**:每人每小时标注的数量
|
||||||
|
|
||||||
|
#### 步骤6:标注入库
|
||||||
|
|
||||||
|
**目标**:将合格标注数据存入数据库,供训练使用
|
||||||
|
|
||||||
|
**入库前检查**:
|
||||||
|
- ✅ 格式统一(JSON/XML/数据库)
|
||||||
|
- ✅ 标注完整(无遗漏)
|
||||||
|
- ✅ 质量合格(通过质检)
|
||||||
|
- ✅ 元数据完整(来源、标注时间、标注员)
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## 4. 常见的标注类型详解
|
||||||
|
|
||||||
|
### 4.1 分类标注(Classification)
|
||||||
|
|
||||||
|
**定义**:给整个数据打一个类别标签
|
||||||
|
|
||||||
|
**特点**:一个输入 → 一个标签
|
||||||
|
|
||||||
|
```
|
||||||
|
图像分类:
|
||||||
|
📷 图片 → [猫] / [狗] / [鸟]
|
||||||
|
📄 文本 → [正面] / [负面] / [中性]
|
||||||
|
🔊 音频 → [音乐] / [语音] / [噪声]
|
||||||
|
```
|
||||||
|
|
||||||
|
**应用场景**:
|
||||||
|
- 垃圾邮件识别(spam/not spam)
|
||||||
|
- 情感分析(正面/负面/中性)
|
||||||
|
- 内容审核(合规/违规)
|
||||||
|
|
||||||
|
### 4.2 检测标注(Detection)
|
||||||
|
|
||||||
|
**定义**:在数据中找出并标注目标的位置
|
||||||
|
|
||||||
|
**特点**:一个输入 → 多个目标(位置+类别)
|
||||||
|
|
||||||
|
```
|
||||||
|
目标检测:
|
||||||
|
📷 图片中 → [人: x1,y1,x2,y2], [车: x1,y1,x2,y2], ...
|
||||||
|
📄 文本中 → [人名:张伟], [地名:北京], ...
|
||||||
|
```
|
||||||
|
|
||||||
|
**应用场景**:
|
||||||
|
- 人脸检测(标出人脸位置)
|
||||||
|
- 车辆检测(标出车辆位置)
|
||||||
|
- 物体检测(标出商品位置)
|
||||||
|
|
||||||
|
### 4.3 分割标注(Segmentation)
|
||||||
|
|
||||||
|
**定义**:逐像素标注每个像素的类别
|
||||||
|
|
||||||
|
**特点**:精细到像素级别
|
||||||
|
|
||||||
|
```
|
||||||
|
语义分割:
|
||||||
|
📷 图片 → 每个像素都标注类别
|
||||||
|
草地(绿) + 树木(深绿) + 天空(蓝) + 人(红)
|
||||||
|
|
||||||
|
实例分割:
|
||||||
|
📷 图片 → 不仅标类别,还区分不同个体
|
||||||
|
人1(红) + 人2(橙) + 车1(蓝) + 车2(青)
|
||||||
|
```
|
||||||
|
|
||||||
|
**应用场景**:
|
||||||
|
- 自动驾驶道路感知
|
||||||
|
- 医学影像分析
|
||||||
|
- 卫星图像分析
|
||||||
|
|
||||||
|
### 4.4 序列标注(Sequence Labeling)
|
||||||
|
|
||||||
|
**定义**:给序列中的每个元素打标签
|
||||||
|
|
||||||
|
**特点**:文本/语音的每个token都有标签
|
||||||
|
|
||||||
|
```
|
||||||
|
命名实体识别(NER):
|
||||||
|
张伟 [B-PER] 毕业 [O] 于 [O] 清华大学 [B-ORG]
|
||||||
|
|
||||||
|
词性标注:
|
||||||
|
我 [代词] 爱 [动词] 北京 [名词]
|
||||||
|
|
||||||
|
时间轴标注:
|
||||||
|
0s-2s [说话人A] 2s-5s [说话人B] 5s-8s [静音]
|
||||||
|
```
|
||||||
|
|
||||||
|
**应用场景**:
|
||||||
|
- 实体抽取(人名、地名、机构名)
|
||||||
|
- 词性标注
|
||||||
|
- 语音时间戳标注
|
||||||
|
|
||||||
|
### 4.5 关系标注(Relation Extraction)
|
||||||
|
|
||||||
|
**定义**:标注两个实体之间的关系
|
||||||
|
|
||||||
|
**特点**:标出"谁和谁是什么关系"
|
||||||
|
|
||||||
|
```
|
||||||
|
文本关系:
|
||||||
|
"张伟和李娜是夫妻"
|
||||||
|
→ 实体1: 张伟,实体2: 李娜,关系: 夫妻
|
||||||
|
|
||||||
|
"马化腾创办了腾讯"
|
||||||
|
→ 实体1: 马化腾,实体2: 腾讯,关系: 创办
|
||||||
|
```
|
||||||
|
|
||||||
|
**应用场景**:
|
||||||
|
- 知识图谱构建
|
||||||
|
- 关系抽取
|
||||||
|
- 知识库填充
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## 5. 主流标注工具简介
|
||||||
|
|
||||||
|
### 5.1 图像标注工具
|
||||||
|
|
||||||
|
| 工具 | 特点 | 适用场景 |
|
||||||
|
|------|------|---------|
|
||||||
|
| **Label Studio ⭐** | 开源、多模态、可视化配置界面 | 分类、检测、分割、关键点(本章主选) |
|
||||||
|
| **LabelImg** | 轻量、目标检测专用 | 极简的VOC/YOLO标框 |
|
||||||
|
| **CVAT** | 专业图像/视频标注 | 大型分割、视频跟踪 |
|
||||||
|
| **Supervisely** | 商用平台,UI友好 | 企业级团队协作 |
|
||||||
|
|
||||||
|
### 5.2 文本标注工具
|
||||||
|
|
||||||
|
| 工具 | 特点 | 适用场景 |
|
||||||
|
|------|------|---------|
|
||||||
|
| **Label Studio ⭐** | NER、分类、关系、问答全覆盖 | 几乎所有文本任务(本章主选) |
|
||||||
|
| **Doccano** | 轻量开源,中文友好 | 入门级文本分类与NER |
|
||||||
|
| **Prodigy** | 商业、AI辅助 | 高质量小样本标注 |
|
||||||
|
|
||||||
|
### 5.3 音频标注工具
|
||||||
|
|
||||||
|
| 工具 | 特点 | 适用场景 |
|
||||||
|
|------|------|---------|
|
||||||
|
| **Label Studio ⭐** | 音频转写、时间戳、说话人分离 | ASR、音频分类(本章主选) |
|
||||||
|
| **Audacity** | 音频编辑+简单标注 | 音频切分预处理 |
|
||||||
|
| **ELAN** | 专业多层级标注 | 学术研究级语料 |
|
||||||
|
|
||||||
|
### 5.4 为什么本章统一用 Label Studio
|
||||||
|
|
||||||
|
> **统一工具,降低学习成本**
|
||||||
|
|
||||||
|
```
|
||||||
|
传统方案(多工具切换):
|
||||||
|
图像 → LabelImg
|
||||||
|
文本 → Doccano
|
||||||
|
语音 → Audacity / ELAN
|
||||||
|
项目管理 → Excel
|
||||||
|
|
||||||
|
Label Studio 一站式方案:
|
||||||
|
图像 → ✅
|
||||||
|
文本 → ✅
|
||||||
|
语音 → ✅
|
||||||
|
项目管理 → ✅(内置成员、角色、质检)
|
||||||
|
```
|
||||||
|
|
||||||
|
**Label Studio 的核心优势**:
|
||||||
|
1. **多模态**:图像、文本、语音、视频、时序一站式
|
||||||
|
2. **可视化配置**:不用写代码,勾选即可配置标注界面
|
||||||
|
3. **协作管理**:内置角色(管理员/标注员/审核员)、项目分配
|
||||||
|
4. **格式灵活**:支持 YOLO、COCO、VOC、JSON、CSV 等多种导出
|
||||||
|
5. **本地部署**:开源免费,数据不出本地
|
||||||
|
|
||||||
|
> 💡 本章后续 4-2、4-3、4-4、4-5 都将围绕 **Label Studio** 展开实战。
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## 6. 标注质量控制基础概念
|
||||||
|
|
||||||
|
### 6.1 为什么要质量控制
|
||||||
|
|
||||||
|
**问题场景**:
|
||||||
|
- 标注员A把"苹果"标成了水果
|
||||||
|
- 标注员B把"苹果"标成了手机品牌
|
||||||
|
- 两个标注员标注不一致,AI学到了矛盾的信息
|
||||||
|
|
||||||
|
```
|
||||||
|
错误的标注 = 错误的知识 → AI学到错误规律
|
||||||
|
```
|
||||||
|
|
||||||
|
### 6.2 一致性指标
|
||||||
|
|
||||||
|
**标注一致性**:衡量标注结果稳定性的指标
|
||||||
|
|
||||||
|
```
|
||||||
|
Kappa系数:
|
||||||
|
κ = (P₀ - Pₑ) / (1 - Pₑ)
|
||||||
|
|
||||||
|
P₀ = 实际一致率(两人标一样的比例)
|
||||||
|
Pₑ = 期望一致率(随机情况下的一致率)
|
||||||
|
κ > 0.8 → 良好
|
||||||
|
κ > 0.6 → 可接受
|
||||||
|
κ < 0.6 → 需改进
|
||||||
|
```
|
||||||
|
|
||||||
|
### 6.3 质检流程
|
||||||
|
|
||||||
|
```
|
||||||
|
┌─────────────┐ ┌─────────────┐ ┌─────────────┐
|
||||||
|
│ 标注员标注 │ → │ 随机抽检 │ → │ 统计准确率 │
|
||||||
|
│ │ │ (10-20%) │ │ │
|
||||||
|
└─────────────┘ └─────────────┘ └─────────────┘
|
||||||
|
↓
|
||||||
|
┌─────────────┐
|
||||||
|
│ 准确率 < 95% │ → 打回重新标注
|
||||||
|
│ 准确率 ≥ 95% │ → 通过验收
|
||||||
|
└─────────────┘
|
||||||
|
```
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## 7. 本章知识小结
|
||||||
|
|
||||||
|
```
|
||||||
|
┌─────────────────────────────────────────────────────────────┐
|
||||||
|
│ 数据标注概述 │
|
||||||
|
├─────────────────────────────────────────────────────────────┤
|
||||||
|
│ │
|
||||||
|
│ 📌 定义:给数据打标签,让AI能够学习 │
|
||||||
|
│ │
|
||||||
|
│ 📌 应用场景: │
|
||||||
|
│ 图像:分类、检测、分割 │
|
||||||
|
│ 文本:分类、NER、意图识别 │
|
||||||
|
│ 语音:转写、说话人分离、情感 │
|
||||||
|
│ │
|
||||||
|
│ 📌 完整流程: │
|
||||||
|
│ 采集 → 清洗 → 任务定义 → 标注 → 质检 → 入库 │
|
||||||
|
│ │
|
||||||
|
│ 📌 标注类型:分类、检测、分割、序列标注、关系标注 │
|
||||||
|
│ │
|
||||||
|
│ 📌 质量控制:抽样检查、双盲标注、专家仲裁 │
|
||||||
|
│ │
|
||||||
|
└─────────────────────────────────────────────────────────────┘
|
||||||
|
```
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## 思考题
|
||||||
|
|
||||||
|
1. **如果让你标注一批图片中的人脸,你会选择哪种标注类型?为什么?**
|
||||||
|
|
||||||
|
2. **在标注员培训中,最重要的是什么?你觉得一个好的标注员需要具备哪些素质?**
|
||||||
|
|
||||||
|
3. **假设你负责一个文本情感标注项目,如何设计标注规范来保证标注一致性?**
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## 下节预告
|
||||||
|
|
||||||
|
下一节我们将学习 **Label Studio 图像标注实战**,包括:
|
||||||
|
- Label Studio 安装与启动
|
||||||
|
- 图像分类、目标检测、语义分割三种标注配置
|
||||||
|
- 边界框、多边形、关键点实操
|
||||||
|
- VOC / YOLO / COCO 格式导出
|
||||||
Reference in New Issue
Block a user