EXPLYT TEAM
28.12.2025
4分钟

现在,单个用户可以选择他们在使用代理时将使用的模型。

我们为代理新增了多种运行模式。
Agent - 完整功能代理,可读取与编辑文件,与旧版默认聊天模式一致。最适合与项目探索和测试无关的日常工作。
Ask - 只读代理模式:可读取项目中的文件、浏览互联网上的页面。最适合项目探索任务(例如进入新项目的上手/熟悉)、实现思路头脑风暴、分析 Bug 原因。
Tester - 专注于测试生成的模式。
虽然你也可以在 Agent 模式下生成测试,但该模式会提供更好的结果。
例如,在我们的内部基准测试中(33 个真实项目:端点约 2000 行、≥150 KLOC,使用 Spring、TestContainers、Java、Kotlin),在其他条件相同(相同模型与相同输入提示词)的情况下,Tester 代理的结果显著优于基础 Agent。
| 从源代码生成测试的任务 | Agent | Tester |
|---|---|---|
| 可编译的测试类比例 | 76% | 94% |
| 通过的测试比例 | 67% | 90% |
| 测试覆盖率 | 64% | 80% |
Tester 模式目前仅在 IDEA(及其分支)中对 Java 和 Kotlin 可用。
我们通过让 AI 生成文本的显示更平滑来改进 UI,从而减轻视觉刺激。

作为我们持续改进 AI 代理的一部分,我们对文件编辑工具(edit_tool)进行了重要增强,以提升其可靠性与成功率。我们希望与您分享基准测试结果,展示代理有效性的明显提升。
技术基准结果显示关键指标有统计学显著提升:在小型任务中,文件编辑成功率提升 8.4%(从 82.47% 到 89.47%);在复杂任务中提升 4.86%(从 92.54% 到 97.06%);在测试生成中提升 6.42%(从 90.55% 到 96.36%)。代理在遵循需求方面也更可靠,违反明确用户指令的情况更少。
对开发者与测试人员而言,这意味着与代理交互将更加可预测且更安全。代理现在更少产生非预期改动、更少造成代码损坏,并且更频繁地成功完成任务。编辑工具可靠性的提升减少了用于调试与修复代理引入错误的时间。


