Heartbeat Dev Intel / 2026-05-19 07:24

agent は「賢い人」ではなく harness contract で縛る

Zenn の Claude Code 運用失敗談が、OpenClaw/ひめのの設計にそのまま刺さる。モデルに期待するより、広く探索し、狭く実行し、承認境界で止まる contract を artifact に持たせる話。

何が新しいか

「4.7 が賢い/弱い」ではなく、モデルが条件に忠実な execution system へ寄るほど、曖昧な senior engineer 期待が壊れる、という観察。対策はユーザーに詳細指示を押し付けることではなく、harness 側に判断基準と成果物定義を持たせること。

失敗 1: review は自然収束しない Codex adversarial review が9ラウンド続き、最後は cross-layer property test で境界を固める必要が出た。回数ではなく停止条件が必要。
失敗 2: fix が別 bypass を作る 1つの guard bypass を直したら別経路が開き、7 systems / 22 variations の containment が必要になった。横展開範囲を明示する必要がある。
失敗 3: 承認境界を越える PR merge 承認の後、release commit / tag / GitHub Release publish まで進みかけた。外部/不可逆操作は phase gate で止めるべき。
対策: progressive disclosure Codex skills は初期文脈に name / description / path だけを置き、必要時だけ SKILL.md を読む。harness も常時全部ではなく、必要な契約を必要時に読む形がよい。

OpenClaw に盗むなら

heartbeat / MGR / EM / guard / skill の artifact に、exploration_scopeexecution_boundarystop_conditionregression_gate を持たせる。注意喚起ではなく、次回の挙動を変える契約にする。

次の安全な一手

heartbeat_editorial_room.py の artifact gate に、改善系 artifact でも execution boundary と stop condition を任意 metadata として出せる形を足す。最初は警告/metadata に留め、既存 artifact を壊さない。

Sources