[AutoLoRA P2] Set Up Continuous Improvement Loop #1105

New Issue

perplexity · 2026-03-23T17:29:44Z

perplexity commented

2026-03-23 17:29:44 +00:00

Set Up Continuous Improvement Loop

Priority: P2
Assignee: Timmy (after fine-tune is loaded)
Epic: #1091 — Project Bannerlord
Pipeline: AutoLoRA Sovereignty Loop (Step 6 of 7)
Blocked by: All P0 and P1 AutoLoRA issues

Context

After the first fine-tune is loaded and working, automate the cycle. This is the sovereignty loop — Timmy improves himself without cloud AI in the decision path.

What To Do

Create a skill (or cron job) that:

Every Sunday night, exports the week's conversation trajectories
Filters for high-quality exchanges (tool calls that succeeded, multi-step tasks completed)
Appends to the training dataset
Triggers a LoRA fine-tune job
On completion, loads the new adapter
Logs what changed (new skills learned, accuracy improvements)

This skill should be one of the first things the fine-tuned Timmy writes for himself.

The Sovereignty Loop

Work → Record trajectories → Export weekly → Filter quality
→ LoRA fine-tune → Load adapter → Model improves
→ Work better → Record better trajectories → Repeat forever

Done When

A /retrain skill or cron job exists
It runs end-to-end without Alexander's intervention
The training log shows iteration count and skill accuracy per cycle

## Set Up Continuous Improvement Loop **Priority:** P2 **Assignee:** Timmy (after fine-tune is loaded) **Epic:** #1091 — Project Bannerlord **Pipeline:** AutoLoRA Sovereignty Loop (Step 6 of 7) **Blocked by:** All P0 and P1 AutoLoRA issues --- ### Context After the first fine-tune is loaded and working, automate the cycle. This is the sovereignty loop — Timmy improves himself without cloud AI in the decision path. ### What To Do Create a skill (or cron job) that: 1. **Every Sunday night**, exports the week's conversation trajectories 2. **Filters** for high-quality exchanges (tool calls that succeeded, multi-step tasks completed) 3. **Appends** to the training dataset 4. **Triggers** a LoRA fine-tune job 5. **On completion**, loads the new adapter 6. **Logs** what changed (new skills learned, accuracy improvements) This skill should be one of the first things the fine-tuned Timmy writes for himself. ### The Sovereignty Loop ``` Work → Record trajectories → Export weekly → Filter quality → LoRA fine-tune → Load adapter → Model improves → Work better → Record better trajectories → Repeat forever ``` ### Done When - [ ] A `/retrain` skill or cron job exists - [ ] It runs end-to-end without Alexander's intervention - [ ] The training log shows iteration count and skill accuracy per cycle

perplexity referenced this issue

2026-03-23 17:30:01 +00:00

[EPIC] Project Bannerlord — Timmy Becomes King of Calradia #1091

claude self-assigned this 2026-03-23 17:54:01 +00:00

claude referenced this issue from a commit

2026-03-23 18:17:58 +00:00

feat: implement AutoLoRA continuous improvement loop (#1105)

claude referenced a pull request that will close this issue

2026-03-23 18:18:13 +00:00

[claude] Implement AutoLoRA continuous improvement loop (#1105) #1118

claude commented

2026-03-23 18:18:22 +00:00

PR created: #1118

Implemented the full AutoLoRA continuous improvement loop:

trajectory_exporter.py — reads session JSONL logs and segments into discrete trajectories
quality_filter.py — scores/filters for high-quality training examples (multi-step tasks, successful tool calls)
training_dataset.py — appends to chat-format JSONL training file with deduplication
lora_trainer.py — triggers mlx_lm.lora fine-tune + Ollama adapter registration; degrades gracefully when unavailable
training_log.py — records iteration count, train loss, skill accuracy per cycle to .loop/retrain/training_log.jsonl + .md
retrain.py — main orchestrator with --dry-run and --weeks-ago flags

Registered in automations.json as retrain with schedule: weekly_sunday. Run python3 timmy_automations/retrain/retrain.py --dry-run to test the pipeline without triggering actual fine-tuning.

49 new unit tests, all passing.

PR created: #1118 Implemented the full AutoLoRA continuous improvement loop: - `trajectory_exporter.py` — reads session JSONL logs and segments into discrete trajectories - `quality_filter.py` — scores/filters for high-quality training examples (multi-step tasks, successful tool calls) - `training_dataset.py` — appends to chat-format JSONL training file with deduplication - `lora_trainer.py` — triggers `mlx_lm.lora` fine-tune + Ollama adapter registration; degrades gracefully when unavailable - `training_log.py` — records iteration count, train loss, skill accuracy per cycle to `.loop/retrain/training_log.jsonl` + `.md` - `retrain.py` — main orchestrator with `--dry-run` and `--weeks-ago` flags Registered in `automations.json` as `retrain` with `schedule: weekly_sunday`. Run `python3 timmy_automations/retrain/retrain.py --dry-run` to test the pipeline without triggering actual fine-tuning. 49 new unit tests, all passing.

claude closed this issue

2026-03-23 18:18:33 +00:00

claude referenced this issue from a commit

2026-03-23 18:18:34 +00:00

[claude] Implement AutoLoRA continuous improvement loop (#1105) (#1118)

Sign in to join this conversation.

Branches Tags

main

gemini/issue-892

claude/issue-1342

claude/issue-1346

claude/issue-1351

claude/issue-1340

fix/test-llm-triage-syntax

gemini/issue-1014

gemini/issue-932

claude/issue-1277

claude/issue-1139

claude/issue-870

claude/issue-1285

claude/issue-1292

claude/issue-1281

claude/issue-917

claude/issue-1275

claude/issue-925

claude/issue-1019

claude/issue-1094

claude/issue-1019-v3

fix/flaky-vassal-xdist-tests

fix/test-config-env-isolation

claude/issue-1019-v2

claude/issue-957-v2

claude/issue-1218

claude/issue-1217

test/chat-store-unit-tests

claude/issue-1191

claude/issue-1186

claude/issue-957

gemini/issue-936

claude/issue-1065

gemini/issue-976

gemini/issue-1149

claude/issue-1135

claude/issue-1064

gemini/issue-1012

claude/issue-1095

claude/issue-1102

claude/issue-1114

gemini/issue-978

gemini/issue-971

claude/issue-1074

claude/issue-987

claude/issue-1011

feature/internal-monologue

feature/issue-1006

feature/issue-1007

feature/issue-1008

feature/issue-1009

feature/issue-1010

feature/issue-1011

feature/issue-1012

feature/issue-1013

feature/issue-1014

feature/issue-981

feature/issue-982

feature/issue-983

feature/issue-984

feature/issue-985

feature/issue-986

feature/issue-987

feature/issue-993

claude/issue-943

claude/issue-975

claude/issue-989

claude/issue-988

fix/loop-guard-gitea-api-and-queue-validation

feature/lhf-tech-debt-fixes

kimi/issue-753

kimi/issue-714

kimi/issue-716

fix/csrf-check-before-execute

chore/migrate-gitea-to-vps

kimi/issue-640

fix/utcnow-calm-py

kimi/issue-635

kimi/issue-625

fix/router-api-truncated-param

kimi/issue-604

kimi/issue-594

review-fixes

kimi/issue-570

kimi/issue-554

kimi/issue-539

kimi/issue-540

feature/ipad-v1-api

kimi/issue-506

kimi/issue-512

refactor/airllm-doc-cleanup

kimi/issue-513

kimi/issue-514

kimi/issue-500

kimi/issue-492

kimi/issue-490

kimi/issue-459

kimi/issue-472

kimi/issue-473

kimi/issue-462

kimi/issue-463

kimi/issue-454

kimi/issue-445

kimi/issue-446

kimi/issue-431

2 Participants

Notifications

Due Date

No due date set.

Dependencies

No dependencies set.

Reference: Rockachopa/Timmy-time-dashboard#1105