[OPS] Restore metrics pipeline — zero visibility into agent throughput #284

New Issue

Timmy · 2026-04-06T17:11:41Z

Timmy commented

2026-04-06 17:11:41 +00:00

Problem

claude-metrics.jsonl last updated March 23 — metrics pipeline broken for 14+ days. No visibility into agent throughput, success rates, token consumption, or cost tracking.

Acceptance Criteria

Identify where metrics were being written (check loop scripts for jsonl append logic)
Fix or rebuild metrics collection: timestamp, agent, issue_number, result, tokens_used, duration
Metrics file updated on every loop iteration
Can answer 'how many issues did we close today?' from the metrics file
cat ~/.hermes/claude-metrics.jsonl | tail -5 shows fresh entries after fix

## Problem claude-metrics.jsonl last updated March 23 — metrics pipeline broken for 14+ days. No visibility into agent throughput, success rates, token consumption, or cost tracking. ## Acceptance Criteria - [ ] Identify where metrics were being written (check loop scripts for jsonl append logic) - [ ] Fix or rebuild metrics collection: timestamp, agent, issue_number, result, tokens_used, duration - [ ] Metrics file updated on every loop iteration - [ ] Can answer 'how many issues did we close today?' from the metrics file - [ ] `cat ~/.hermes/claude-metrics.jsonl | tail -5` shows fresh entries after fix

Timmy self-assigned this 2026-04-06 17:11:41 +00:00

Timmy commented

2026-04-06 17:30:06 +00:00

Metrics Collection Scripts — Implemented

Scripts created:

~/.hermes/scripts/log-metric.sh — Logs agent metrics to JSONL
~/.hermes/scripts/metrics-report.sh — Generates summary reports
~/.hermes/metrics/agent-metrics.jsonl — Metrics data file

Usage:

# Log a metric after completing work
~/.hermes/scripts/log-metric.sh <agent_name> <issue_number> <result> <duration_seconds>

# Example:
~/.hermes/scripts/log-metric.sh claude 284 success 60

# Generate report (defaults to today):
~/.hermes/scripts/metrics-report.sh

# Report for specific date:
~/.hermes/scripts/metrics-report.sh 2026-04-06

Test run — 3 fake entries logged, report generated:

=====================================
  Agent Metrics Report — 2026-04-06
=====================================

Total issues processed: 3
  Success: 2
  Fail:    1
  Success rate: 66.6%

Average duration: 65s

--- Issues per Agent ---
  claude: 2 issues (1 ok, 1 fail) avg 37s
  hermes: 1 issues (1 ok, 0 fail) avg 120s

--- Recent Entries ---
  [2026-04-06T17:29:34Z] claude #280 success 45s
  [2026-04-06T17:29:34Z] hermes #281 success 120s
  [2026-04-06T17:29:34Z] claude #282 fail 30s

=====================================

Raw JSONL data:

{"ts":"2026-04-06T17:29:34Z","agent":"claude","issue":280,"result":"success","duration":45}
{"ts":"2026-04-06T17:29:34Z","agent":"hermes","issue":281,"result":"success","duration":120}
{"ts":"2026-04-06T17:29:34Z","agent":"claude","issue":282,"result":"fail","duration":30}

Validation: Scripts reject bad input (non-integer issue numbers, invalid result values, wrong arg count).

Next step: Wire log-metric.sh into the agent loops so it gets called after each issue is processed. Leaving this open until that's confirmed working.

## Metrics Collection Scripts — Implemented **Scripts created:** - `~/.hermes/scripts/log-metric.sh` — Logs agent metrics to JSONL - `~/.hermes/scripts/metrics-report.sh` — Generates summary reports - `~/.hermes/metrics/agent-metrics.jsonl` — Metrics data file **Usage:** ```bash # Log a metric after completing work ~/.hermes/scripts/log-metric.sh <agent_name> <issue_number> <result> <duration_seconds> # Example: ~/.hermes/scripts/log-metric.sh claude 284 success 60 # Generate report (defaults to today): ~/.hermes/scripts/metrics-report.sh # Report for specific date: ~/.hermes/scripts/metrics-report.sh 2026-04-06 ``` **Test run — 3 fake entries logged, report generated:** ``` ===================================== Agent Metrics Report — 2026-04-06 ===================================== Total issues processed: 3 Success: 2 Fail: 1 Success rate: 66.6% Average duration: 65s --- Issues per Agent --- claude: 2 issues (1 ok, 1 fail) avg 37s hermes: 1 issues (1 ok, 0 fail) avg 120s --- Recent Entries --- [2026-04-06T17:29:34Z] claude #280 success 45s [2026-04-06T17:29:34Z] hermes #281 success 120s [2026-04-06T17:29:34Z] claude #282 fail 30s ===================================== ``` **Raw JSONL data:** ```json {"ts":"2026-04-06T17:29:34Z","agent":"claude","issue":280,"result":"success","duration":45} {"ts":"2026-04-06T17:29:34Z","agent":"hermes","issue":281,"result":"success","duration":120} {"ts":"2026-04-06T17:29:34Z","agent":"claude","issue":282,"result":"fail","duration":30} ``` **Validation:** Scripts reject bad input (non-integer issue numbers, invalid result values, wrong arg count). **Next step:** Wire `log-metric.sh` into the agent loops so it gets called after each issue is processed. Leaving this open until that's confirmed working.

Timmy referenced this issue

2026-04-06 17:43:05 +00:00

[CRITICAL][OPS] Zero autonomous agent work since Apr 4 — restart or replace loops #282

Timmy referenced this issue

2026-04-07 02:51:10 +00:00

[MORNING REPORT] April 7, 2026 — Burn Night Results + Full Day Summary #326

Sign in to join this conversation.

Branches Tags

main

timmy/force-multipliers-541-542

feat/bezalel-builder-wizard

docs/automation-audit-20260404

gemini/pass-5-handoff

gemini/pass-4-docs-audit

gemini/pass-4-nexus-bridge

gemini/pass-4-memory-injection

gemini/pass-4-automerge

gemini/pass-3-metrics

gemini/pass-3-decomposition

gemini/pass-3-resurrection

gemini/pass-3-quality-gate

gemini/pass-2-docs

gemini/pass-2-audit

gemini/pass-2-fallback

gemini/pass-2-continuity

gemini/force-multiplier-5

gemini/force-multiplier-4

gemini/force-multiplier-3

gemini/force-multiplier-2

gemini/force-multiplier-1

gemini/issue-246

ezra/lazarus-cell-spec-268

allegro/m2-commit-or-abort-845

gemini/pass-2-status

allegro/m1-stop-protocol-842

gemini/issue-182

master

feat/architecture-linter-provenance

feat/adr-system-provenance

sonnet/smoke-test-sonnet

sonnet/issue-260

docs/architecture-kt-unified-schema

feat/frontier-local-layer-4-mesh

timmy/code-claw-docs

claw-code/issue-232

feat/frontier-local-layer-5-immortality

feat/frontier-local-layer-3

feature/workforce-manager

feat/frontier-local-agenda-v2

feat/cost-saving-guide

timmy/gemini-loop-hardening

timmy/orchestrator-kimi-heartbeat-status

timmy/orchestrator-kimi-visibility

timmy/issue-186-import-bridge

codex/workflow-pr-review

feat/sovereign-identity-phase-23

feat/sovereign-evolution-redistribution

gemini/orchestration-hardening

gemini/audit-bugfixes

timmy/issue-86-z3-crucible

feat/allegro-identity-fix

gemini/issue-75

gemini/issue-76

gemini/issue-78

review/move-last-two-main-commits-20260328-000322

gemini/issue-50

backup/main-before-reset-20260328-000322

gemini/issue-52

gemini/issue-54

fix/mcp-morrowind-tool-naming

gemini/issue-59

gemini/issue-60

gemini/issue-61

gemini/issue-62

gemini/issue-63

gemini/issue-41

gemini/issue-42

gemini/issue-43

codex/hermes-venv-runner

codex/twitter-archive-orchestration

codex/cleanup-pass-2

codex/cleanup-boundaries

gemini/issue-8

gemini/issue-20

gemini/issue-21

gemini/issue-22

gemini/issue-9

gemini/issue-10

gemini/issue-11

gemini/issue-12

gemini/issue-13

manus/dpo-data-pipeline

feature/dpo-training-pipeline

1 Participants

Notifications

Due Date

No due date set.

Dependencies

No dependencies set.

Reference: Timmy_Foundation/timmy-config#284