[Autoresearch] Document Experiment Governance Runbook #911

New Issue

perplexity · 2026-03-22T13:06:06Z

perplexity commented

2026-03-22 13:06:06 +00:00

Parent

Part of #904 (Autoresearch Integration Proposal v2) — Action Item #10

Goal

Write a governance runbook documenting the full experiment lifecycle: branch → tox → PR → review → merge/revert. This ensures all agents follow the same safety constraints.

Sections to Cover

Experiment Lifecycle
- How to create an experiment branch
- How tox validates (pytest, lint, type-check)
- How PRs are created and structured
- How Timmy (account #2) auto-reviews
- Merge criteria vs revert criteria
Safety Rules (from KT document — hard-won)
- Never create test issues on the real repo
- Morrowind is the confirmed direction — no pivots
- OpenGauss was rejected — don't reference
- No cloud dependencies — Ollama on localhost required
- All experiment work lives on branches and PRs only
Agent Roles in Research Swarm
- Forge (kimi) → codebase optimization
- Echo (hermes) → memory retrieval
- Seer (manus) → inference quality
- Quill (perplexity) → prompt quality
- Mace (replit) → security
- Helm (Timmy) → orchestration
- rockachopa → principal authority, program.md author
Compute Budget Rules
- Metabolic protocol: Lightning balance governs tier selection
- Resting mode (local M3 Max) is default
- VPS for heavier inference
- Cloud burst only when funded
Failure Modes & Mitigations
- Runaway experiments → feature branches + tox + revert default
- Compute escalation → Lightning-balance budgets
- Tests pass but UX degrades → H2 LLM-as-judge benchmarks
- Experiment pollution → branches/PRs only, never auto-create issues

Deliverable

Wiki page or docs/autoresearch-governance.md in the repo

Cross-references

#904 (Autoresearch Epic)
#875 (Docker Compose — reproducible environments)

Owner

Engineering

## Parent Part of #904 (Autoresearch Integration Proposal v2) — Action Item #10 ## Goal Write a governance runbook documenting the full experiment lifecycle: branch → tox → PR → review → merge/revert. This ensures all agents follow the same safety constraints. ## Sections to Cover 1. **Experiment Lifecycle** - How to create an experiment branch - How tox validates (pytest, lint, type-check) - How PRs are created and structured - How Timmy (account #2) auto-reviews - Merge criteria vs revert criteria 2. **Safety Rules** (from KT document — hard-won) - Never create test issues on the real repo - Morrowind is the confirmed direction — no pivots - OpenGauss was rejected — don't reference - No cloud dependencies — Ollama on localhost required - All experiment work lives on branches and PRs only 3. **Agent Roles in Research Swarm** - Forge (kimi) → codebase optimization - Echo (hermes) → memory retrieval - Seer (manus) → inference quality - Quill (perplexity) → prompt quality - Mace (replit) → security - Helm (Timmy) → orchestration - rockachopa → principal authority, program.md author 4. **Compute Budget Rules** - Metabolic protocol: Lightning balance governs tier selection - Resting mode (local M3 Max) is default - VPS for heavier inference - Cloud burst only when funded 5. **Failure Modes & Mitigations** - Runaway experiments → feature branches + tox + revert default - Compute escalation → Lightning-balance budgets - Tests pass but UX degrades → H2 LLM-as-judge benchmarks - Experiment pollution → branches/PRs only, never auto-create issues ## Deliverable Wiki page or `docs/autoresearch-governance.md` in the repo ## Cross-references - #904 (Autoresearch Epic) - #875 (Docker Compose — reproducible environments) ## Owner Engineering

perplexity referenced this issue

2026-03-22 13:06:06 +00:00

[Study] Autoresearch Integration Proposal v2 — Karpathy's Self-Improvement Loop for Timmy Time #904

perplexity referenced this issue

2026-03-22 19:06:05 +00:00

EPIC: Timmy: Instantiate your own openclaw agent on the Hermes VPS #663

perplexity referenced this issue

2026-03-22 19:08:53 +00:00

[P1] Auto-create Gitea issues from research findings #977

perplexity referenced this issue

2026-03-22 19:10:53 +00:00

Restore self-modification loop (deleted in Operation Darling Purge) #983

perplexity referenced this issue

2026-03-22 19:10:53 +00:00

Restore MCP integration via FastMCP v3.1.1 at /tools/mcp #984

perplexity referenced this issue

2026-03-22 19:12:47 +00:00

[GOVERNING] Session Crystallization & Operational Playbook — Master Handoff Document #982

perplexity referenced this issue

2026-03-22 19:12:48 +00:00

[GOVERNING] Replacing Claude — Autonomous Research Pipeline Spec #972

gemini referenced this issue

2026-03-22 23:13:39 +00:00

PR for #984: Restore MCP integration via FastMCP v3.1.1 at /tools/mcp #1041

gemini referenced this issue

2026-03-22 23:13:44 +00:00

PR for #983: Restore self-modification loop (deleted in Operation Darling Purge) #1042

claude was assigned by Rockachopa

2026-03-22 23:32:00 +00:00

perplexity referenced this issue

2026-03-23 13:32:11 +00:00

[GOVERNING] Deep Backlog Triage — Harness (Product) vs Infrastructure Separation #1076

claude closed this issue

2026-03-23 13:47:35 +00:00

claude added the rejected-direction label 2026-03-23 13:51:23 +00:00

perplexity commented

2026-03-23 13:52:14 +00:00

🧹 Closed — Superseded

Autoresearch direction has been superseded by the Sovereignty Loop spec (#953) and the harness-first architecture. The research pipeline now routes through the cascade router and local model stack.

Ref: Deep Backlog Triage #1076. Reopen if needed.

🧹 **Closed — Superseded** Autoresearch direction has been superseded by the Sovereignty Loop spec (#953) and the harness-first architecture. The research pipeline now routes through the cascade router and local model stack. Ref: Deep Backlog Triage #1076. Reopen if needed.

claude referenced this issue

2026-03-23 13:59:58 +00:00

[claude] Execute deep backlog triage — harness vs infrastructure separation (#1076) #1082

Sign in to join this conversation.

Branches Tags

main

gemini/issue-892

claude/issue-1342

claude/issue-1346

claude/issue-1351

claude/issue-1340

fix/test-llm-triage-syntax

gemini/issue-1014

gemini/issue-932

claude/issue-1277

claude/issue-1139

claude/issue-870

claude/issue-1285

claude/issue-1292

claude/issue-1281

claude/issue-917

claude/issue-1275

claude/issue-925

claude/issue-1019

claude/issue-1094

claude/issue-1019-v3

fix/flaky-vassal-xdist-tests

fix/test-config-env-isolation

claude/issue-1019-v2

claude/issue-957-v2

claude/issue-1218

claude/issue-1217

test/chat-store-unit-tests

claude/issue-1191

claude/issue-1186

claude/issue-957

gemini/issue-936

claude/issue-1065

gemini/issue-976

gemini/issue-1149

claude/issue-1135

claude/issue-1064

gemini/issue-1012

claude/issue-1095

claude/issue-1102

claude/issue-1114

gemini/issue-978

gemini/issue-971

claude/issue-1074

claude/issue-987

claude/issue-1011

feature/internal-monologue

feature/issue-1006

feature/issue-1007

feature/issue-1008

feature/issue-1009

feature/issue-1010

feature/issue-1011

feature/issue-1012

feature/issue-1013

feature/issue-1014

feature/issue-981

feature/issue-982

feature/issue-983

feature/issue-984

feature/issue-985

feature/issue-986

feature/issue-987

feature/issue-993

claude/issue-943

claude/issue-975

claude/issue-989

claude/issue-988

fix/loop-guard-gitea-api-and-queue-validation

feature/lhf-tech-debt-fixes

kimi/issue-753

kimi/issue-714

kimi/issue-716

fix/csrf-check-before-execute

chore/migrate-gitea-to-vps

kimi/issue-640

fix/utcnow-calm-py

kimi/issue-635

kimi/issue-625

fix/router-api-truncated-param

kimi/issue-604

kimi/issue-594

review-fixes

kimi/issue-570

kimi/issue-554

kimi/issue-539

kimi/issue-540

feature/ipad-v1-api

kimi/issue-506

kimi/issue-512

refactor/airllm-doc-cleanup

kimi/issue-513

kimi/issue-514

kimi/issue-500

kimi/issue-492

kimi/issue-490

kimi/issue-459

kimi/issue-472

kimi/issue-473

kimi/issue-462

kimi/issue-463

kimi/issue-454

kimi/issue-445

kimi/issue-446

kimi/issue-431

1 Participants

Notifications

Due Date

No due date set.

Dependencies

No dependencies set.

Reference: Rockachopa/Timmy-time-dashboard#911