任务详情

保持原平台任务详情结构，在当前页面承载任务进度、配置信息、团队信息和数据管理。

任务编号：task-ai-demo-001

热线语料自动化演示任务

自动标注自动化处理中

面向客服场景的自动化标注任务，用于演示原平台任务体系中的 AI 自动化能力重构。

返回列表自动化处理完成后开放人工验收入口

项目归属

联通客服自动标注全流程 Demo

数据集

10010热线对话样本-四月

数据类型

对话

任务数据量

18,240

创建人

周航

04/18 09:00

任务数据情况

任务数据总量

18,240

当前任务纳入管理的数据总量

有效数据量

2,000

进入本次处理范围的数据量

无效数据量

16,240

未进入本次处理范围或被过滤的数据量

任务执行情况

自动化处理

处理样本量: 790
完成进度: 39.5%
失败样本量: 0

人工验收

待验收样本量: 0
已确认样本量: 0
已修正样本量: 0

最终结果

总完成率: 31.6%
可导出数据量: 1,700
风险样本量: 210

自动标注结果看板

按量级、质检和质量评估分组展示自动标注结果，用于后续评估自动标注质量。

量级组

自动标注量与置信度分布

自动标注量

2,000

当前自动标注阶段产出的结果总量

高置信度数据量

1,280

可直接进入自动通过或抽检的样本量

中置信度数据量

420

需要结合质检规则进一步判断的样本量

低置信度数据量

300

优先进入质检和人工复核的样本量

置信度分布

输出结果按置信度分层

高置信度1,280 / 64.0%

中置信度420 / 21.0%

低置信度300 / 15.0%

质检组

展示自动质检后的样本去向

待复核数据量

优先流转到人工验收的样本量

风险样本量

210

命中风险规则，需要重点关注

阻断样本量

必须人工确认后才能继续流转

自动通过量

1,700

自动质检直接通过的样本量

自动质检会优先识别待复核、风险与阻断样本，并把结果汇总到人工验收队列。输出结构仍然遵循工具阶段产出的格式，用于后续质量评估与最终确认。

质量评估组

用于评估自动标注质量表现

低置信度占比

15.0%

低置信度结果占自动标注总量的比例

人工修正量

人工验收阶段已修正的样本量

人工修正率

0.0%

人工修正量占自动标注总量的比例

自动标注通过率

85.0%

无需人工介入即可直接通过的占比

自动通过率85.0%

低置信度占比15.0%

分段进度

按自动化执行、结果分布、人工验收和最终完成四个区块查看当前任务状态。

自动化处理进度

展示自动化执行进度、当前处理阶段与异常样本量。

39.5%

当前阶段: 数据预处理
已处理样本: 790
失败样本量: 0

自动标注结果分布

Step 3 工具阶段输出结构决定 Step 4 质检逻辑，低置信度结果优先进入质检和复核。

2,000 条

高置信度: 1,280
中置信度: 420
低置信度: 300

人工验收进度

人工验收重点承接待复核结果，并对最终样本进行确认与修正。

待验收: 0
已确认: 0
已修正: 0

最终完成情况

综合自动化处理与人工验收结果，展示最终交付状态。

31.6%

当前状态: 自动化处理中
可导出数据量: 1,700
风险样本量: 210

当前说明

当前任务正在执行自动化处理，完成后将进入人工验收。

本任务基于自动化流水线执行，按“数据输入 → 工具承载 → 自动化能力处理 → AI 自动质检 → 人工验收”完成结果生成与确认。

基本信息

任务名称

热线语料自动化演示任务

项目名称

联通客服自动标注全流程 Demo

任务类型

自动标注

数据类型

对话

创建人

周航

创建时间

04/18 09:00

任务说明

面向客服场景的自动化标注任务，用于演示原平台任务体系中的 AI 自动化能力重构。

数据配置

数据集名称

10010热线对话样本-四月

批次信息

3个批次

最大样本量

18,240

本次标注数量

2,000

数据来源

省分热线平台

当前处理范围

10010热线对话样本-四月 / 2000条

数据说明

优先处理套餐升级、账单查询和宽带报障相关样本。

工具配置

模板类型

意图分类模板

工具名称

热线意图识别模板

标签数量

标注方式摘要

工具模板承载自动标注结果并回写标签体系

输出格式

意图标签 + 置信度 + 原始样本引用

输出去向

预标结果

自动化能力配置

能力选择模式

调用大模型能力

能力摘要

Qwen3-32B-Instruct v1.3

版本信息

v1.3

模型类型

文本模型

任务目标

自动识别热线会话中的套餐升级、账单查询、宽带报障和投诉升级等核心意图，并为人工验收输出结构化结果。

参数摘要

能力版本 v1.3 / 优先提取用户主诉意图，回写工具模板，并保留人工复核建议。

标签映射摘要

按3个工具标签回写意图分类模板，输出意图标签 + 置信度 + 原始样本引用

输入对象

已选对话样本

输出目标

候选意图 + 置信度

规则说明

优先提取用户主诉意图，回写工具模板，并保留人工复核建议。

Agent 语义摘要

任务编排来源

由 Agent 基于平台上下文自动生成配置，任务编排来源：智能体流水线；编排链路：数据输入 → 工具承载 → 自动化能力处理 → AI自动质检 → 人工验收

数据与结构上下文

已读取数据与结构上下文：数据=10010热线对话样本-四月；结构=意图标签 + 置信度 + 原始样本引用；业务=套餐升级、账单查询、宽带报障场景优先

能力来源策略

平台已有能力优先，模型能力兜底。当前使用模型能力兜底：Qwen3-32B-Instruct v1.0。

AI自动质检配置

质检模式

大模型质检

质检摘要

Qwen3-32B-Judge v1.1

质检目标

一致性校验

输入格式

意图标签 + 置信度 + 原始样本引用

逻辑依据

基于标签完整性、规则一致性、风险词命中和阈值判断。

阈值摘要

高置信度阈值 0.92 / 待复核阈值 0.83 / 风险阈值 0.72 / 阻断阈值 0.60

模式摘要

一致性校验 / 基于标签完整性、规则一致性、风险词命中和阈值判断。

版本信息

v1.1

输入 / 输出摘要

通过字段回显任务的工具承载、自动化能力处理和 AI 自动质检输入输出。

工具阶段输入

已选对话样本

工具阶段输出

候选意图 + 置信度

工具输出格式

意图标签 + 置信度 + 原始样本引用

质检阶段输入

预标结果 + 原始对话样本 + 业务规则

质检阶段输出

通过 / 待复核 / 风险样本 / 阻断样本

输出去向

预标结果

逻辑说明

Step 3 的输出格式决定 Step 4 的质检逻辑，当前按“意图标签 + 置信度 + 原始样本引用”组织质检输入。

自动化链路说明

数据输入 → 工具承载 → 自动化能力处理 → AI自动质检 → 人工验收

任务详情

热线语料自动化演示任务

任务数据情况

任务执行情况

自动标注结果看板

量级组

置信度分布

质检组

质量评估组

分段进度

自动化处理进度

自动标注结果分布

人工验收进度

最终完成情况

当前说明

基本信息

数据配置

工具配置

自动化能力配置

Agent 语义摘要

AI自动质检配置

输入 / 输出摘要

团队概览

团队分工

数据概览

处理范围