[triage-generated] [bug] Cycle retro records issue=null for all cycles despite active work #492

New Issue

Timmy · 2026-03-19T20:00:18Z

Timmy commented

2026-03-19 20:00:18 +00:00

Problem

The dev loop cycle retro (.loop/retro/cycles.jsonl) records issue=null and success=false for all recent cycles (521-539), yet the loop IS doing productive work:

31 PRs merged in the measurement window
4776 lines added
Issues filed, assigned, and closed

The disconnect: the cycle runner is not linking its work to queue items. When it picks up an issue, it does not record which issue it worked on. This causes:

0% measured success rate despite real progress
Queue starvation detection fails (looks starved when it is not)
Deep triage cannot evaluate which issue types succeed

Root cause hypothesis

The cycle runner picks issues from queue.json but does not write the issue number to the cycle retro entry. Or the queue items have stale/closed issue numbers so the runner falls through to ad-hoc work without recording it.

Acceptance criteria

Each cycle retro entry has a non-null issue field when work was done
success field accurately reflects whether the cycle achieved its goal
The summary.json success_rate reflects actual loop productivity

Files to investigate

.loop/ directory — the cycle runner script
.loop/retro/cycles.jsonl — output format
.loop/queue.json — input format

Impact

This is the #1 meta-issue for the dev loop. Without accurate metrics, triage is flying blind and the loop cannot self-improve.

## Problem The dev loop cycle retro (`.loop/retro/cycles.jsonl`) records `issue=null` and `success=false` for all recent cycles (521-539), yet the loop IS doing productive work: - 31 PRs merged in the measurement window - 4776 lines added - Issues filed, assigned, and closed The disconnect: the cycle runner is not linking its work to queue items. When it picks up an issue, it does not record which issue it worked on. This causes: 1. 0% measured success rate despite real progress 2. Queue starvation detection fails (looks starved when it is not) 3. Deep triage cannot evaluate which issue types succeed ## Root cause hypothesis The cycle runner picks issues from `queue.json` but does not write the issue number to the cycle retro entry. Or the queue items have stale/closed issue numbers so the runner falls through to ad-hoc work without recording it. ## Acceptance criteria - Each cycle retro entry has a non-null `issue` field when work was done - `success` field accurately reflects whether the cycle achieved its goal - The summary.json `success_rate` reflects actual loop productivity ## Files to investigate - `.loop/` directory — the cycle runner script - `.loop/retro/cycles.jsonl` — output format - `.loop/queue.json` — input format ## Impact This is the #1 meta-issue for the dev loop. Without accurate metrics, triage is flying blind and the loop cannot self-improve.

🎉 1

Timmy commented

2026-03-19 20:05:17 +00:00

Root Cause Found

The log_retro() function in ~/hermes-config/bin/timmy-loop.sh (lines ~162-175) calls cycle_retro.py but only passes:

--cycle N
--success or --failure
--duration SECONDS
--reason "..." (on failure)

It does NOT pass:

--issue (which issue was worked on)
--tests-passed (test count)
--lines-added / --lines-removed (diff stats)
--files-changed
--pr (PR number if merged)
--main-green (smoke test result)
--type (bug/feature/refactor)

All of these default to null/0 in cycle_retro.py, which is why every cycle entry shows issue=null, success=false (success requires --main-green), and tests_passed=0.

Fix

The log_retro() function needs to extract metadata after the cycle completes:

Read state.json to get the current issue number from the cycle
Parse git diff --stat on main to get lines/files changed
Run tox -e unit count or parse last test output for test count
Check if a PR was merged this cycle
Run a smoke test and pass --main-green if it passes

This is an infrastructure fix in timmy-loop.sh, not a codebase change.

## Root Cause Found The `log_retro()` function in `~/hermes-config/bin/timmy-loop.sh` (lines ~162-175) calls `cycle_retro.py` but only passes: - `--cycle N` - `--success` or `--failure` - `--duration SECONDS` - `--reason "..."` (on failure) It does NOT pass: - `--issue` (which issue was worked on) - `--tests-passed` (test count) - `--lines-added` / `--lines-removed` (diff stats) - `--files-changed` - `--pr` (PR number if merged) - `--main-green` (smoke test result) - `--type` (bug/feature/refactor) All of these default to null/0 in `cycle_retro.py`, which is why every cycle entry shows `issue=null`, `success=false` (success requires `--main-green`), and `tests_passed=0`. ## Fix The `log_retro()` function needs to extract metadata after the cycle completes: 1. Read `state.json` to get the current issue number from the cycle 2. Parse `git diff --stat` on main to get lines/files changed 3. Run `tox -e unit` count or parse last test output for test count 4. Check if a PR was merged this cycle 5. Run a smoke test and pass `--main-green` if it passes This is an infrastructure fix in `timmy-loop.sh`, not a codebase change.

kimi referenced this issue from a commit

2026-03-19 20:11:17 +00:00

fix: auto-detect issue number in cycle retro from git branch name

kimi referenced a pull request that will close this issue

2026-03-19 20:11:24 +00:00

fix: auto-detect issue number in cycle retro from git branch #495

Rockachopa referenced this issue from a commit

2026-03-19 20:13:31 +00:00

fix: auto-detect issue number in cycle retro from git branch name

Timmy commented

2026-03-19 20:13:33 +00:00

Root Cause Found

The loop runner (~/.hermes/bin/timmy-loop.sh) calls log_retro success with zero data arguments.

The log_retro function correctly passes --cycle and --duration, but there is no mechanism for hermes to communicate back what issue it worked on, type, tests, files, PR number, etc.

The gap: hermes runs as a subprocess and never writes structured output. So cycle_retro.py gets called without --issue, --type, --pr, etc. — all fields default to null/0.

Fix: Cycle Result File

Hermes writes .loop/cycle_result.json at end of each cycle
timmy-loop.sh reads it in log_retro() and passes contents as args
This is a loop infrastructure fix (timmy-loop.sh + loop prompt), not repo code

## Root Cause Found The loop runner (`~/.hermes/bin/timmy-loop.sh`) calls `log_retro success` with zero data arguments. The `log_retro` function correctly passes `--cycle` and `--duration`, but there is no mechanism for hermes to communicate back what issue it worked on, type, tests, files, PR number, etc. The gap: hermes runs as a subprocess and never writes structured output. So `cycle_retro.py` gets called without `--issue`, `--type`, `--pr`, etc. — all fields default to null/0. ## Fix: Cycle Result File 1. Hermes writes `.loop/cycle_result.json` at end of each cycle 2. `timmy-loop.sh` reads it in `log_retro()` and passes contents as args 3. This is a loop infrastructure fix (timmy-loop.sh + loop prompt), not repo code

Rockachopa closed this issue

2026-03-19 20:13:36 +00:00

Rockachopa referenced this issue from a commit

2026-03-19 20:13:38 +00:00

fix: auto-detect issue number in cycle retro from git branch (#495)

kimi referenced this issue from a commit

2026-03-19 20:17:49 +00:00

fix: auto-detect issue number from git branch in cycle_retro

kimi referenced a pull request that will close this issue

2026-03-19 20:18:03 +00:00

fix: auto-detect issue number from git branch in cycle_retro #497

Sign in to join this conversation.

Branches Tags

main

gemini/issue-892

claude/issue-1342

claude/issue-1346

claude/issue-1351

claude/issue-1340

fix/test-llm-triage-syntax

gemini/issue-1014

gemini/issue-932

claude/issue-1277

claude/issue-1139

claude/issue-870

claude/issue-1285

claude/issue-1292

claude/issue-1281

claude/issue-917

claude/issue-1275

claude/issue-925

claude/issue-1019

claude/issue-1094

claude/issue-1019-v3

fix/flaky-vassal-xdist-tests

fix/test-config-env-isolation

claude/issue-1019-v2

claude/issue-957-v2

claude/issue-1218

claude/issue-1217

test/chat-store-unit-tests

claude/issue-1191

claude/issue-1186

claude/issue-957

gemini/issue-936

claude/issue-1065

gemini/issue-976

gemini/issue-1149

claude/issue-1135

claude/issue-1064

gemini/issue-1012

claude/issue-1095

claude/issue-1102

claude/issue-1114

gemini/issue-978

gemini/issue-971

claude/issue-1074

claude/issue-987

claude/issue-1011

feature/internal-monologue

feature/issue-1006

feature/issue-1007

feature/issue-1008

feature/issue-1009

feature/issue-1010

feature/issue-1011

feature/issue-1012

feature/issue-1013

feature/issue-1014

feature/issue-981

feature/issue-982

feature/issue-983

feature/issue-984

feature/issue-985

feature/issue-986

feature/issue-987

feature/issue-993

claude/issue-943

claude/issue-975

claude/issue-989

claude/issue-988

fix/loop-guard-gitea-api-and-queue-validation

feature/lhf-tech-debt-fixes

kimi/issue-753

kimi/issue-714

kimi/issue-716

fix/csrf-check-before-execute

chore/migrate-gitea-to-vps

kimi/issue-640

fix/utcnow-calm-py

kimi/issue-635

kimi/issue-625

fix/router-api-truncated-param

kimi/issue-604

kimi/issue-594

review-fixes

kimi/issue-570

kimi/issue-554

kimi/issue-539

kimi/issue-540

feature/ipad-v1-api

kimi/issue-506

kimi/issue-512

refactor/airllm-doc-cleanup

kimi/issue-513

kimi/issue-514

kimi/issue-500

kimi/issue-492

kimi/issue-490

kimi/issue-459

kimi/issue-472

kimi/issue-473

kimi/issue-462

kimi/issue-463

kimi/issue-454

kimi/issue-445

kimi/issue-446

kimi/issue-431

1 Participants

Notifications

Due Date

No due date set.

Dependencies

No dependencies set.

Reference: Rockachopa/Timmy-time-dashboard#492