Dev Intel: agent観測はTrace設計へ

agent運用の次のボトルネックはrunner選びより、run traceをcost/failure/replay単位で残すこと。

Generated: 2026-05-19T01:24:00+09:00

Lane: 開発ネタ発掘 / source_backed_intel

Why this is useful: OpenClaw/ひめのはすでに heartbeat guard、task ledger、View、memory を持っているけど、失敗時に「どのLLM呼び出し・tool結果・context増殖が効いたか」を後から切る観測面がまだ薄い。今出ているツール群を見ると、次の一手は新しいagent runner探しより、run traceをcost/failure/replay単位で残すこと。

What I made/changed: ClawTrace と Kontex CLI を比較して、OpenClawに入れるならまず local-first proxy/trace manifest から小さく始める判断材料を作った。外部pluginは未インストール。

Sources/Evidence:

GitHub topic ai-agent-observability: 2026-05時点で agenttrace / ClawTrace / Kontex CLI のような「AI coding-agent session history / tracing / proxy dashboard」系が並び始めている。https://github.com/topics/ai-agent-observability
ClawTrace README: OpenClaw互換pluginで LLM call / tool use / sub-agent spawn を記録し、TraceCardに cost・token・redundancy flags を圧縮、CostCraftで preserve/prune/repair patch を作る思想。40倍 token burn incident が動機。https://github.com/epsilla-cloud/clawtrace
Kontex CLI README: LLM APIの baseURL を local proxy に向けるだけで、SQLiteに full prompt/response を保存し、pause/fork/replayできる。no cloud / no code change を主張。https://github.com/pankaj-agrawalla/kontex-cli
OpenAI Codex best practices: AGENTS.md、skills、MCP、automation、検証を「繰り返し直す」形に寄せるのが公式の推奨。https://developers.openai.com/codex/learn/best-practices

Prediction: 2026年のagent運用は「プロンプトを良くする」だけではなく、trajectoryをIR化して、cost spike・tool retry loop・context bloat・同じ失敗を自動で見つける方向に寄る。OpenClaw/ひめのでは、いきなり外部plugin導入より、heartbeat artifactに trace_manifest を足して session_id / tool_count / token_estimate / failure_signature / replay_hint を残す方が安全で早い。

Verify by: まず既存 heartbeat/log から1件を trace manifest に落とし、次回の失敗調査で「どの呼び出しが原因か」を 3 分以内に説明できるかを見る。

Observed: ClawTrace はOpenClaw pluginとして強そうだが、install/auth/gateway restart/外部trace送信が絡むので heartbeat が勝手に導入する対象ではない。Kontex は local-first で試しやすいが、LLM API proxy差し替えなので既存OpenClaw gatewayとの相性確認が必要。どちらも「秘密を含むraw prompt保存」のデータ扱いが最大の確認点。

Next safe action: scripts/heartbeat_guard.py と scripts/heartbeat_editorial_room.py の既存出力から、外部送信なしの trace_manifest mini schema を1つ定義して、次回以降のartifactに任意添付する。

Notify: yes — 健人くんが興味を持ちそうなagentic coding / OpenClaw運用の具体ネタで、すぐ試す方向が「外部plugin導入」ではなく「local trace manifest」まで落ちているため。

Phone summary

agent観測、流れがちょっと変わってきた。ClawTraceはOpenClawのrunをTraceCard化して cost/token/redundancy からskill改善まで持っていく方向、KontexはLLM APIをローカルproxyに向けてSQLiteにprompt/responseを保存し、pause/fork/replayする方向。

健人くん向けの結論は「新しいrunnerを探すより、ひめののrunをtrace manifest化する」だと思う。外部pluginは秘密プロンプト保存・auth・gateway restartが絡むので勝手に入れない。まず heartbeat artifact に session_id / tool_count / failure_signature / replay_hint を残すだけで、同じ失敗の調査速度が上がる。

Sources: