E2E Testing Agent
├── Perception Layer (感知层)
│ ├── PageStateExtractor - 页面状态提取
│ ├── SetOfMarkTagger - SoM 视觉标记
│ └── DOMCleaner - DOM 精简
├── Planner Layer (规划层)
│ ├── TestActionPlanner - 动作规划
│ ├── ActionSpace - 动作空间 (click, type, scroll, wait, assert)
│ └── TestMemory - 短期记忆
├── Executor Layer (执行层)
│ ├── BrowserActionExecutor - 浏览器动作执行
│ └── SelfHealingLocator - 自愈定位器
└── Supervisor Layer (监督层)
└── TestSupervisor - 执行验证
mpp-core/src/commonMain/kotlin/cc/unitmesh/agent/e2etest/
├── E2ETestAgent.kt
├── E2ETestContext.kt
├── perception/
├── planner/
├── executor/
└── model/
E2E Testing Agent 实现计划
Issue: AI-Driven E2E Testing Agent
概述
实现一个基于 AI 的端到端测试 Agent,能够通过自然语言指令自动执行 Web UI 测试,具备多模态感知、智能规划和自愈能力。
背景
当前项目已具备关键基础设施:
mpp-viewer-web/webedit/- KCEF 浏览器控制、DOM 提取、Vision Helpermpp-core/agent/- Agent 架构、Tool 系统、SubAgent 机制WebElementSourceMapperTool- DOM 元素到源码映射目标
技术方案
架构
模块位置
平台适配
实现阶段
Phase 1: 核心接口和数据模型
TestAction动作空间E2ETestContext上下文PageStateExtractorexpect 接口E2ETestResult结果模型Phase 2: JVM 平台实现
JvmPageStateExtractor(复用 KCEF)BrowserActionExecutorSelfHealingLocator(L1 算法级)TestActionPlannerPhase 3: Agent 集成
E2ETestAgent作为 SubAgentPhase 4: 高级功能
关键技术点
参考资料
验收标准
相关文档
docs/test-agent/AI E2E 测试 Agent 实现方案.md- 详细研究报告docs/features/webedit-agent-completed.md- WebEdit 功能文档