分解、评估、可视化超长 Agent 轨迹。 专为跨越数百轮次、百万级 Token 的轨迹而生 — 人工审阅已不再可能。
原始轨迹依次经过分解、评估和可视化三个阶段 — 将不透明的百万 Token 日志转化为结构化、可解释的 DAG。
逐 turn 读取 400+ 轮次的原始轨迹,调用 LLM 判断每个 turn 是"新步骤"还是"续写", 最终构建一棵带有父子依赖关系的有向无环图(DAG)。每个步骤包含类型分类、标题摘要和因果叙述。
先对任务本身的难度进行客观评分,再对 Agent 的执行轨迹进行质量评估。 内置 8 种反模式检测器,精准定位轨迹中的"玻璃碴" — 那些会污染训练数据的坏模式。
将步骤分析 JSON 渲染为单文件交互式 HTML 页面。所有数据内联,无需后端, 可直接通过浏览器打开分享。支持 100+ 节点的大型 DAG 流畅渲染。
安装、配置、运行完整分析流水线。
# 安装 git clone https://github.com/YuyaoGe/Long_Insight.git cd Long_Insight && pip install -e . # 配置 API 密钥 export OPENAI_API_KEY="your-key" # 运行完整流水线 long-insight pipeline trajectory.jsonl --output-dir output/
# 将轨迹分解为步骤 DAG long-insight analyze trajectory.jsonl -o steps.json --max-turns 500 # 评估轨迹质量 long-insight evaluate trajectory.jsonl --chart --sample 50 # 生成交互式 DAG 可视化 long-insight visualize steps.json -o visualization.html