Paperclipの失敗分析から、OpenClawの直し方を盗む

一言でいうと

「AIが失敗した」で止めず、どの層が壊れたかを分けて見るのが大事、という実例。Paperclip + Hermes + local LLM の記事は、5つの不具合を core / adapter / model capability に切り分けていて、今日の Daily News / X 修正にもかなり近い。

健人くん向け

今日の X 問題も、雑に見ると「Xが悪い」「LLMが遅い」に見える。でも実際は、Xそのものではなく agent-browser --cdp open/eval が止まっていて、direct CDP に変えたら動いた。つまり、原因はデータ元でもAIでもなく、間のつなぎ方だった。

この見方を型にすると、次の不具合対応が速くなる。

どの層が怪しいか: 本体 / つなぎ込み / AIの限界 / 指示文 / 保存状態 / 外部サービス
どう切り分けたか: AIなしの実行で再現するか、別経路で同じ情報が取れるか
人間への影響: 通知が遅れる、誤った要約になる、止まって見えない
直した証拠: 何秒で動いたか、どのテストが通ったか

具体例

Paperclipの記事では、同じタスクをAIありのHermes経由と、AIなしのprocess adapterで実行し直していた。AIなしでも再現した不具合はPaperclip本体寄り、AIありでだけ起きたものはAIやHermes寄り、と分けている。

OpenClawでもこの形で残すとよさそう。

failure_signature: daily_news_x_pending
suspected_layer: adapter
isolation_method: direct CDP script succeeded while agent-browser CDP open/eval hung
owner_impact: morning digest stayed pending
fallback: official X Explore via bounded direct CDP, no trends24
verification: x-browser search 3.7s; cdp_trends 3.3s; daily_news dry-run 13s

何を見るか

次に heartbeat / Daily News / ブラウザ連携が壊れた時は、まず「AIが悪い」ではなく、AIなし・別経路・保存状態リセットなしで切り分ける。これで直す場所を間違えにくくなる。

Sources

Paperclip + local LLM bug responsibility map: https://zenn.dev/toki_mwc/articles/paperclip-hermes-local-llm-bug-responsibility-map?locale=en
Paperclip repo: https://github.com/paperclipai/paperclip
Article-referenced cost issue: https://github.com/paperclipai/paperclip/issues/2922

公開URL 200 OK: verified after rendering.