OpenAI 发布开源数据可视化工具 Euphony，专注 Harmony 数据呈现

为什么调试AI代理这么难？Euphony 给了我们一个答案

写一个普通函数，出错了看一眼堆栈就能定位问题。但当你在调试一个AI代理——它读文件、调API、生成代码、反复迭代——你面对的不是一行报错，而是一连串模糊的响应、临时的中间输出、甚至自己都记不清的试探性提问。传统调试工具在这里完全失灵：没有明确的调用链，没有清晰的执行路径，更没有“第42行出错”这种直白的提示。

OpenAI团队推出的Euphony，不是另一个“AI助手”，而是一个专为AI代理开发打造的“时间线回放器”。它把那些散乱的聊天日志、Codex会话记录，变成你能一眼看懂的对话流程图。不是抽象的JSON，不是命令行输出，是像微信聊天记录一样，一条一条、清清楚楚地展示AI在做什么、为什么这么想、又在哪一步拐了弯。

拖进去，就能看懂AI在想什么

Euphony 没有复杂的安装流程。你只需要打开浏览器，就能用：

直接粘贴一段JSON日志
拖一个本地的.jsonl文件
或者输入一个公开的URL，加载远程会话数据

它自动识别格式，不用你管是Harmony还是Codex的输出。点一下，对话就按时间顺序展开：AI说了什么，你回复了什么，它又生成了哪段代码，哪里卡住了——全都一目了然。

你不再需要在终端里翻几十页日志，也不用靠记忆还原“那天它为什么突然改了变量名”。Euphony 把整个思考过程，变成可浏览、可回溯的对话流。

不只是看，还能动手改

它不只是个播放器。你可以在界面上：

用JMESPath写过滤条件，只看包含“数据库连接失败”的对话片段
点击某条消息，查看完整的元数据：模型版本、温度参数、调用耗时、token用量
启用“焦点模式”，把注意力锁定在某一段关键交互上
甚至直接在浏览器里编辑某条消息，模拟“如果当时我这么问，结果会不会不一样？”

这些功能不是炫技。它们是你复现问题、验证假设、优化提示词的实战工具。很多团队现在用它做“失败案例复盘会”——把一次失败的代理会话投到大屏上，全组一起看：“它为什么在这里误解了需求？”

能嵌入你的工作流，也能跑在本地

你不想把敏感数据传到云端？没问题。Euphony 完全可以在浏览器里独立运行，所有数据都留在你电脑里，不上传、不外传。

如果你的会话日志有几GB大，浏览器扛不住？它还支持轻量级的FastAPI后端服务，帮你预处理、分页加载，让大文件也能流畅打开。你甚至可以把它部署在内网，和你的CI/CD系统对接，自动生成每次测试的AI行为报告。

团队用它，不是因为它是AI工具，而是因为它省时间

一个前端团队在集成AI代码生成器时，曾因为一个变量命名不一致，连续三天卡在“生成的代码跑不起来”。他们用Euphony回放了50次会话，发现AI在第37次时突然把`userId`改成了`user_id`，而他们的测试框架只认前者——问题立刻定位。

另一个数据团队用它来校准模型输出风格。他们把不同提示词的输出并排对比，发现“请用中文解释”和“请用通俗语言说明”带来的差异，比他们预想的大得多。

它没有“智能推荐”“自动修复”这种虚头巴脑的功能。它只是让你看得清、查得准、改得快。

开源，免费，开箱即用

Euphony 是开源项目，GitHub上可以直接下载。它由一组可复用的Web组件构成，你可以把它嵌入到React、Vue、Svelte等任何前端框架里，做成你自己的调试面板。

样式也能改。用几行CSS，就能让它匹配你团队的深色主题、字体习惯，甚至加个公司Logo。它不强迫你适应工具，而是让你的工具适应你。

如果你每天都要和AI代理打交道——无论是写代码、做分析、还是构建自动化流程——Euphony 不是“下一个AI工具”，它就是你该用的那个调试器。

项目地址：https://github.com/openai/euphony

Euphony AI代理调试对话可视化浏览器工具

CB科技站