Paperclipの失敗分析から、OpenClawの直し方を盗む
一言でいうと
「AIが失敗した」で止めず、どの層が壊れたかを分けて見るのが大事、という実例。Paperclip + Hermes + local LLM の記事は、5つの不具合を core / adapter / model capability に切り分けていて、今日の Daily News / X 修正にもかなり近い。
健人くん向け
今日の X 問題も、雑に見ると「Xが悪い」「LLMが遅い」に見える。でも実際は、Xそのものではなく agent-browser --cdp open/eval が止まっていて、direct CDP に変えたら動いた。つまり、原因はデータ元でもAIでもなく、間のつなぎ方だった。
この見方を型にすると、次の不具合対応が速くなる。
- どの層が怪しいか: 本体 / つなぎ込み / AIの限界 / 指示文 / 保存状態 / 外部サービス
- どう切り分けたか: AIなしの実行で再現するか、別経路で同じ情報が取れるか
- 人間への影響: 通知が遅れる、誤った要約になる、止まって見えない
- 直した証拠: 何秒で動いたか、どのテストが通ったか
具体例
Paperclipの記事では、同じタスクをAIありのHermes経由と、AIなしのprocess adapterで実行し直していた。AIなしでも再現した不具合はPaperclip本体寄り、AIありでだけ起きたものはAIやHermes寄り、と分けている。
OpenClawでもこの形で残すとよさそう。
failure_signature: daily_news_x_pending
suspected_layer: adapter
isolation_method: direct CDP script succeeded while agent-browser CDP open/eval hung
owner_impact: morning digest stayed pending
fallback: official X Explore via bounded direct CDP, no trends24
verification: x-browser search 3.7s; cdp_trends 3.3s; daily_news dry-run 13s
何を見るか
次に heartbeat / Daily News / ブラウザ連携が壊れた時は、まず「AIが悪い」ではなく、AIなし・別経路・保存状態リセットなしで切り分ける。これで直す場所を間違えにくくなる。
Sources
- Paperclip + local LLM bug responsibility map: https://zenn.dev/toki_mwc/articles/paperclip-hermes-local-llm-bug-responsibility-map?locale=en
- Paperclip repo: https://github.com/paperclipai/paperclip
- Article-referenced cost issue: https://github.com/paperclipai/paperclip/issues/2922
公開URL 200 OK: verified after rendering.