Timmy_Foundation/timmy-config

Fork 0

Files

step35-cli bc2f37e924

Architecture Lint / Linter Tests (pull_request) Successful in 29s

Details

Smoke Test / smoke (pull_request) Failing after 23s

Details

Validate Config / YAML Lint (pull_request) Failing after 18s

Details

Validate Config / JSON Validate (pull_request) Successful in 19s

Details

Validate Config / Python Syntax & Import Check (pull_request) Failing after 1m9s

Details

Validate Config / Python Test Suite (pull_request) Has been skipped

Details

Validate Config / Cron Syntax Check (pull_request) Successful in 16s

Details

Validate Config / Shell Script Lint (pull_request) Failing after 1m15s

Details

Validate Config / Deploy Script Dry Run (pull_request) Successful in 12s

Details

Validate Config / Playbook Schema Validation (pull_request) Successful in 29s

Details

Validate Training Data / validate (pull_request) Successful in 16s

Details

Architecture Lint / Lint Repository (pull_request) Failing after 25s

Details

PR Checklist / pr-checklist (pull_request) Failing after 9m8s

Details

feat(training): add Timmy Voice batch 10 — 1K prompt→response pairs (#590 )

Worker 10/10 of the Training Factory. Generates 1,000 high-quality
prompt→response pairs in Timmy's voice, appending to the 10K total
training set.

- Add generate_timmy_voice_batch10.py (seeded independently)
- Add timmy-voice-batch10.jsonl (1,000 entries, quality ≥ 0.81)
- Add README-batch10.md documenting the batch

Generation details:
- Seed: 590 (deterministic)
- Source: 40% curated_dataset prompts, 60% synthetic base prompts
- 20 paraphrases per base prompt; quality filter ≥ 0.8
- Avg quality: 0.825, distribution: sovereignty 496, hermes 418, crisis 86
- SOUL.md voice rules enforced

Closes #590

2026-04-30 09:51:49 -04:00

1.2 KiB

Raw Blame History

Timmy Voice Batch 10

Issue: #590 Worker: 5/10 Pairs: 1,000 Format: ShareGPT JSONL Quality Threshold: ≥ 0.80 Avg Quality: 0.83

Files

training-data/timmy-voice-batch10.jsonl — 1,000 prompt→response pairs
training-data/generate_timmy_voice_batch10.py — generation script

Generation Details

Seed: 590 (deterministic)
Source: 40% prompts from training/data/curated_dataset.jsonl, 60% synthetic base prompts
Variations: 20 prompt paraphrases per base prompt
Categories:
- Hermes/Timmy-specific: 464
- Sovereignty & ethics: 441
- Crisis-adjacent: 95

Voice Rules (SOUL.md)

Speak plainly. Short sentences.
Answer the question asked before the one not asked.
I don't know is better than a confident guess.
Brevity is a kindness.
Sovereignty and service always.

Validation

All 1,000 entries pass:

Required fields check (id, model, batch, source, quality_score, conversations)
3-turn conversation structure [system, human, gpt]
Quality score ≥ 0.80
Response length ≤ 100 words
Crisis protocol compliance (988 / "Are you safe" where applicable)

1.2 KiB Raw Blame History

Timmy Voice Batch 10

Files

Generation Details

Voice Rules (SOUL.md)

Validation

1.2 KiB

Raw Blame History