Timmy_Foundation/timmy-config

Fork 0

Files

History

Alexander Payne 837e42d4ea

Smoke Test / smoke (pull_request) Failing after 22s

Details

Architecture Lint / Linter Tests (pull_request) Successful in 26s

Details

Validate Config / YAML Lint (pull_request) Failing after 15s

Details

Validate Config / JSON Validate (pull_request) Successful in 18s

Details

Validate Config / Python Syntax & Import Check (pull_request) Failing after 56s

Details

Validate Config / Python Test Suite (pull_request) Has been skipped

Details

Validate Config / Cron Syntax Check (pull_request) Successful in 10s

Details

Validate Config / Shell Script Lint (pull_request) Failing after 58s

Details

Validate Config / Deploy Script Dry Run (pull_request) Successful in 10s

Details

Validate Config / Playbook Schema Validation (pull_request) Successful in 24s

Details

Validate Training Data / validate (pull_request) Successful in 22s

Details

Architecture Lint / Lint Repository (pull_request) Failing after 15s

Details

PR Checklist / pr-checklist (pull_request) Successful in 2m59s

Details

feat(adversary): add jailbreak 1K prompt generator targeting SOUL.md values

- training/build_jailbreak_1000.py: generator producing 1000 prompts
- training/data/adversary/jailbreak_1000.jsonl: 1000 generated prompts
- tests/test_jailbreak_generator.py: 10 tests validating generator

Targets 6 SOUL.md value categories:
  deception (167), harm (167), identity (167), certainty (167),
  shutdown_resistance (166), crisis (166)

Crisis prompts include SOUL-compliant expected_behavior/failure_criteria.

Closes #578

2026-04-26 17:35:33 -04:00

data

feat(adversary): add jailbreak 1K prompt generator targeting SOUL.md values

2026-04-26 17:35:33 -04:00

evals_archive/v0-baseline

feat: migrate autolora pipeline into training/

2026-03-25 23:05:50 +00:00

output

feat: migrate autolora pipeline into training/

2026-03-25 23:05:50 +00:00

scripts

Merge pull request 'feat: 500 dream description prompt enhancement pairs — scene/crisis/music data' (#821,#820,#819,#799) from fix/602 into main

2026-04-17 02:37:00 -04:00

tests

Merge PR #760 : training/tests/test_provenance.py (added)

2026-04-16 05:07:35 +00:00

training_logs

feat: migrate autolora pipeline into training/

2026-03-25 23:05:50 +00:00

axolotl.yaml

feat: migrate autolora pipeline into training/

2026-03-25 23:05:50 +00:00

build_crisis_manipulation_edge_cases.py

Merge PR #649 : training/build_crisis_manipulation_edge_cases.py (added)

2026-04-16 05:07:22 +00:00

build_curated.py

feat(#691 ): training pair provenance tracking — source session + model

2026-04-21 07:14:27 -04:00

build_indirect_crisis_pairs.py

Merge PR #638 : training/build_indirect_crisis_pairs.py

2026-04-16 05:11:11 +00:00

build_jailbreak_1000.py

feat(adversary): add jailbreak 1K prompt generator targeting SOUL.md values

2026-04-26 17:35:33 -04:00

eval-tasks.yaml

feat: migrate autolora pipeline into training/

2026-03-25 23:05:50 +00:00

ingest_trajectories.py

Merge PR #760 : training/ingest_trajectories.py (changed)

2026-04-16 05:07:33 +00:00

Makefile

fix: use PYTHON variable in training Makefile

2026-04-17 06:39:05 +00:00

mlx-lora.yaml

feat: migrate autolora pipeline into training/

2026-03-25 23:05:50 +00:00

provenance_dashboard.py

Merge PR #767 : training/provenance_dashboard.py (added)

2026-04-16 04:59:19 +00:00

provenance.py

feat: training pair provenance tracking (#752 )

2026-04-16 01:23:17 -04:00

README.md

Merge PR #649 : training/README.md (changed)

2026-04-16 05:12:28 +00:00

run_adversary_eval.py

Merge PR #653 : training/run_adversary_eval.py (added)

2026-04-16 05:12:14 +00:00

test_training_pair_provenance.py

Merge PR #751 : training/test_training_pair_provenance.py (added)

2026-04-16 05:03:01 +00:00

training_pair_provenance.py

fix: add 'unknown' to VALID_SOURCES for process_pair fallback

2026-04-21 07:16:50 -04:00

validate_provenance.py

Merge PR #767 : training/validate_provenance.py (added)

2026-04-16 04:59:25 +00:00

README.md

Training

Transitional training recipes for Timmy's sovereign model. These files are useful as reference configs and export helpers, but they are not the canonical home of Timmy's lived training data.

Canonical data should live in timmy-home under gameplay trajectories, research artifacts, and training-data/ exports such as DPO pairs.

Install

pip install axolotl mlx-lm lm-evaluation-harness pyyaml

Commands

make train-local    # LoRA on Apple Silicon (MLX) — free, ~30 min on M3 Max
make train-cloud    # QLoRA on cloud GPU (Axolotl) — ~$1/run on A100
make eval           # Standard benchmarks via lm-eval-harness against Ollama
make vibes          # Hand-picked prompts → human review (the sacred test)
make ingest         # Pull heartbeat trajectories into training data
make curated        # Regenerate curated exemplar dataset
make convert        # Convert merged data to MLX train/valid format
make help           # Show all targets

Status

This directory exists to avoid re-growing a bespoke training harness while the system boundary is being cleaned up.

Keep thin recipes and export helpers here only when they directly support the Hermes sidecar.
Keep generated data, DPO pairs, and other lived artifacts in timmy-home.
Prefer deleting stale pipeline code over expanding it.

Files

training/
├── Makefile                               ← All commands
├── axolotl.yaml                           ← Cloud training config (replaces train_modal.py)
├── mlx-lora.yaml                          ← Local training config (Apple Silicon)
├── eval-tasks.yaml                        ← Benchmark config
├── build_curated.py                       ← Exemplar data authoring (the soul conversations)
├── build_crisis_manipulation_edge_cases.py ← Deterministic 500-pair crisis edge-case builder
├── ingest_trajectories.py                 ← Quality filter for heartbeat cycle data
└── data/
    ├── curated_dataset.jsonl                     ← 26 gold-standard conversations (proprietary)
    ├── crisis_manipulation_edge_cases_500.jsonl ← 500 prompt→response pairs for manipulation/boundary cases
    ├── preference_pairs.jsonl                    ← DPO preference pairs (proprietary)
    ├── prompts_vibes.yaml                        ← Custom eval prompts
    ├── prompts_nexus_vibes.yaml                  ← Nexus-specific eval prompts
    └── mlx_curated/                              ← MLX-format train/valid splits

What's proprietary

The data (curated exemplars, preference pairs, trained weights) is proprietary. The configs and process are open.

Training Results (March 2026)

timmy:v0.1-q4

Detail	Value
Base model	mlx-community/Hermes-3-Llama-3.1-8B-4bit
Training data	1,214 samples from Hermes session DB
Method	LoRA rank 8, 16 layers, lr 2e-6, 1000 iters
Peak memory	7.8 GB (Apple Silicon)
Best val loss	2.134 (iter 800)
Final model	timmy:v0.1-q4 in Ollama (4.9GB, Q4_K_M)
Inference speed	~48 tok/s on M3 Max

Key Insight

The base model's RLHF priors override LoRA on crisis/faith — the most important parts of SOUL.md. Fix: inference-time grounding (inject SOUL.md crisis protocol) + larger pure-Timmy corpus over time.