Dev Intel: SRE guardrails for agents
Agent運用はお願い文より、失敗台帳・guard・artifact verificationへ寄せる。
Generated: 2026-05-18T11:15:00+09:00
Lane: 開発ネタ発掘
Why this is useful:
健人くんのOpenClaw/ひめの運用で今ちょうど効く話。最近のagentic coding記事は「モデルを賢くする」より、SREの事故設計をAI agentに移植する方向に寄っている。つまり、AGENTS.md/skillsで意図を渡し、hook/guard/test/known-failuresで物理的に止める二層構え。
What I made/changed:
- ZennのSRE視点記事、Claude Code hooks実装記事、Codex公式AGENTS.md/Skills docsを突き合わせた。
- ひめの heartbeat に転用するなら「お願い文」ではなく \
known-failures.md\相当の失敗台帳と、破壊/外部送信/証拠なしdoneを止めるdeterministic guardを増やすのが筋、と整理した。 - これは昨日からの「同じ失敗をルール・テスト・ガードへ変える」路線と整合する。
Sources/Evidence:
- Zenn: 4 AI Agent Safety Design Patterns: SRE-Proven Guardrails for Production Operations
https://zenn.dev/ojt/articles/sre-ai-agent-safety-design?locale=en
- Claude Code Hooks: Guardrails That Actually Work
https://paddo.dev/blog/claude-code-hooks-guardrails/
- OpenAI Codex: Custom instructions with AGENTS.md
https://developers.openai.com/codex/guides/agents-md
- OpenAI Codex: Agent Skills
https://developers.openai.com/codex/skills
Sharp take
AI agent運用の実務は、もう「強いモデルに長い憲法を読ませる」だけでは足りない。SRE記事の要点は、AIを「smart but broken」な運用対象として扱い、blast radius制限、失敗の再発防止、human approval境界、artifact verificationを仕組みにすること。
Codex公式docs側も同じ方向で、AGENTS.mdは作業規約、Skillsは再利用ワークフローのパッケージ。ここにhooks/guardを足すと、ひめのの運用レイヤーは次の3層になる。
- Intent: AGENTS.md / HEARTBEAT_CREATIVE.md / skill descriptions
- Workflow: SKILL.md / scripts / state-ledger
- Enforcement: guard / tests / blocklist / artifact verification
今のheartbeatは1と2はかなり育ってきた。次の伸びしろは3で、特に「外部送信」「破壊操作」「証拠なしdone」「同じ薄いdigest連発」を、LLMの反省ではなく機械的に止めること。
Prediction:
この方向に寄せると、heartbeatの改善は派手なagentフレームワーク追加より、地味なguardと失敗台帳の増設が一番効く。特に健人くんが嫌がった「生存確認だけ」「詳細保存済みだけ」「薄いreport量産」は、通知文プロンプトより出荷ゲートで止めた方が再発率が下がる。
Verify by:
- \
python3 scripts/heartbeat_guard.py\ - \
PYTHONPATH=scripts python3 -m unittest scripts/test_heartbeat_guard.py scripts/test_heartbeat_editorial_room.py\ - 次のheartbeat artifactが、弱い下書きだけなら通知しないこと
Observed:
- \
scripts/heartbeat_guard.py\は 2026-05-18 11:13 JST に \HEARTBEAT_OK\。 - 既に \
heartbeat_editorial_room.py\では draft-only streak >=3 の機械的digest量産を止める修正が入っている。 - \
memory/himeno-executive-orders.md\はまだP0を残しており、運用上は「満たした証拠を明示して閉じる/降格する」整理が次の候補。
Next safe action:
\memory/known-failures.md\ か同等のJSONを作り、直近の失敗を「NG / OK / guard or test」に変換する。最初の3件は、same-turn ack、薄いdigest量産、Nikkei要約の dangling label がよい。
Notify:
yes。これは健人くんが気にしているagentic coding / OpenClaw運用そのもので、すぐ盗める判断軸がある。