AHE audit for
ひめの heartbeat harness
盗むのは自動進化ではなく、観測の型。外部repoのコードや自動optimizerは入れず、heartbeat成果物の分類だけを安全に取り込んだ。
今回盗んだもの
- Component observability
触った/壊れた部品をprompt / tool / script / memory / view / permission / notificationで残す。 - Decision observability
既存のPrediction/Verify byを活かして、改善を次に反証できる仮説にする。 - Experience observability
失敗を「LLMが弱い」で片付けず、Failure categoryとして残す。
今回は盗まないもの
- 外部repoのコード実行や依存追加
- prompt/tools/middlewareを自動で書き換えるoptimizer
- Terminal-Bench/SWE-bench向けの巨大評価ループ
- 課金・外部送信・prod変更を含む自動実行
今のひめのに必要なのは「勝手に進化する仕組み」より、まず「どこが壊れたかを毎回残す仕組み」。ここを外すとまた通知やViewで変なことする。
反映した変更
scripts/heartbeat_editorial_room.py の heartbeat artifact にこれを追加した。
分類候補は prompt tool script memory view permission notification task unknown。
検証
PYTHONPATH=scripts python3 -m unittest scripts/test_heartbeat_editorial_room.py
27 tests OK
Sources
Generated: 2026-05-18 23:00 JST