任务详情
保持原平台任务详情结构,在当前页面承载任务进度、配置信息、团队信息和数据管理。
任务编号:task-ai-demo-001
热线语料自动化演示任务
自动标注自动化处理中面向客服场景的自动化标注任务,用于演示原平台任务体系中的 AI 自动化能力重构。
项目归属
联通客服自动标注全流程 Demo
数据集
10010热线对话样本-四月
数据类型
对话
任务数据量
18,240
创建人
周航
04/18 09:00
最近更新
04/21 08:45
任务数据情况
任务数据总量
18,240
当前任务纳入管理的数据总量
有效数据量
2,000
进入本次处理范围的数据量
无效数据量
16,240
未进入本次处理范围或被过滤的数据量
任务执行情况
自动化处理
- 处理样本量
- 790
- 完成进度
- 39.5%
- 失败样本量
- 0
人工验收
- 待验收样本量
- 0
- 已确认样本量
- 0
- 已修正样本量
- 0
最终结果
- 总完成率
- 31.6%
- 可导出数据量
- 1,700
- 风险样本量
- 210
自动标注结果看板
按量级、质检和质量评估分组展示自动标注结果,用于后续评估自动标注质量。
量级组
自动标注量与置信度分布自动标注量
2,000
当前自动标注阶段产出的结果总量
高置信度数据量
1,280
可直接进入自动通过或抽检的样本量
中置信度数据量
420
需要结合质检规则进一步判断的样本量
低置信度数据量
300
优先进入质检和人工复核的样本量
置信度分布
输出结果按置信度分层质检组
展示自动质检后的样本去向待复核数据量
0
优先流转到人工验收的样本量
风险样本量
210
命中风险规则,需要重点关注
阻断样本量
90
必须人工确认后才能继续流转
自动通过量
1,700
自动质检直接通过的样本量
质量评估组
用于评估自动标注质量表现低置信度占比
15.0%
低置信度结果占自动标注总量的比例
人工修正量
0
人工验收阶段已修正的样本量
人工修正率
0.0%
人工修正量占自动标注总量的比例
自动标注通过率
85.0%
无需人工介入即可直接通过的占比
分段进度
按自动化执行、结果分布、人工验收和最终完成四个区块查看当前任务状态。
自动化处理进度
展示自动化执行进度、当前处理阶段与异常样本量。
- 当前阶段
- 数据预处理
- 已处理样本
- 790
- 失败样本量
- 0
自动标注结果分布
Step 3 工具阶段输出结构决定 Step 4 质检逻辑,低置信度结果优先进入质检和复核。
- 高置信度
- 1,280
- 中置信度
- 420
- 低置信度
- 300
人工验收进度
人工验收重点承接待复核结果,并对最终样本进行确认与修正。
- 待验收
- 0
- 已确认
- 0
- 已修正
- 0
最终完成情况
综合自动化处理与人工验收结果,展示最终交付状态。
- 当前状态
- 自动化处理中
- 可导出数据量
- 1,700
- 风险样本量
- 210
当前说明
当前任务正在执行自动化处理,完成后将进入人工验收。
本任务基于自动化流水线执行,按“数据输入 → 工具承载 → 自动化能力处理 → AI 自动质检 → 人工验收”完成结果生成与确认。
基本信息
任务名称
热线语料自动化演示任务
项目名称
联通客服自动标注全流程 Demo
任务类型
自动标注
数据类型
对话
创建人
周航
创建时间
04/18 09:00
任务说明
面向客服场景的自动化标注任务,用于演示原平台任务体系中的 AI 自动化能力重构。
数据配置
数据集名称
10010热线对话样本-四月
批次信息
3个批次
最大样本量
18,240
本次标注数量
2,000
数据来源
省分热线平台
当前处理范围
10010热线对话样本-四月 / 2000条
数据说明
优先处理套餐升级、账单查询和宽带报障相关样本。
工具配置
模板类型
意图分类模板
工具名称
热线意图识别模板
标签数量
3
标注方式摘要
工具模板承载自动标注结果并回写标签体系
输出格式
意图标签 + 置信度 + 原始样本引用
输出去向
预标结果
自动化能力配置
能力选择模式
调用大模型能力
能力摘要
Qwen3-32B-Instruct v1.3
版本信息
v1.3
模型类型
文本模型
任务目标
自动识别热线会话中的套餐升级、账单查询、宽带报障和投诉升级等核心意图,并为人工验收输出结构化结果。
参数摘要
能力版本 v1.3 / 优先提取用户主诉意图,回写工具模板,并保留人工复核建议。
标签映射摘要
按3个工具标签回写 意图分类模板,输出 意图标签 + 置信度 + 原始样本引用
输入对象
已选对话样本
输出目标
候选意图 + 置信度
规则说明
优先提取用户主诉意图,回写工具模板,并保留人工复核建议。
Agent 语义摘要
任务编排来源
由 Agent 基于平台上下文自动生成配置,任务编排来源:智能体流水线;编排链路:数据输入 → 工具承载 → 自动化能力处理 → AI自动质检 → 人工验收
数据与结构上下文
已读取数据与结构上下文:数据=10010热线对话样本-四月;结构=意图标签 + 置信度 + 原始样本引用;业务=套餐升级、账单查询、宽带报障场景优先
能力来源策略
平台已有能力优先,模型能力兜底。当前使用模型能力兜底:Qwen3-32B-Instruct v1.0。
AI自动质检配置
质检模式
大模型质检
质检摘要
Qwen3-32B-Judge v1.1
质检目标
一致性校验
输入格式
意图标签 + 置信度 + 原始样本引用
逻辑依据
基于标签完整性、规则一致性、风险词命中和阈值判断。
阈值摘要
高置信度阈值 0.92 / 待复核阈值 0.83 / 风险阈值 0.72 / 阻断阈值 0.60
模式摘要
一致性校验 / 基于标签完整性、规则一致性、风险词命中和阈值判断。
版本信息
v1.1
输入 / 输出摘要
通过字段回显任务的工具承载、自动化能力处理和 AI 自动质检输入输出。
工具阶段输入
已选对话样本
工具阶段输出
候选意图 + 置信度
工具输出格式
意图标签 + 置信度 + 原始样本引用
质检阶段输入
预标结果 + 原始对话样本 + 业务规则
质检阶段输出
通过 / 待复核 / 风险样本 / 阻断样本
输出去向
预标结果
逻辑说明
Step 3 的输出格式决定 Step 4 的质检逻辑,当前按“意图标签 + 置信度 + 原始样本引用”组织质检输入。
自动化链路说明
数据输入 → 工具承载 → 自动化能力处理 → AI自动质检 → 人工验收
团队概览
验收团队
客服自动标注验收组
负责人
周宇
团队成员量
5
验收方式
抽检
团队分工
验收成员
- 林夏验收组长
- 陈熙验收专员
- 王萌验收专员
复核成员
- 周宇复核专员
- 李辰复核专员
数据概览
数据集名称
10010热线对话样本-四月
数据数量
18,240
有效数据量
2,000
无效数据量
16,240
最近更新时间
04/21 08:45
处理范围
当前处理范围
10010热线对话样本-四月 / 2000条
数据说明
优先处理套餐升级、账单查询和宽带报障相关样本。