timmy-config

Author	SHA1	Message	Date
Alexander Whitestone	e78cd4c23f	feat(training): generate 1K Timmy voice prompt-to-response pairs (#582 ) Some checks failed Architecture Lint / Linter Tests (pull_request) Successful in 20s Details Smoke Test / smoke (pull_request) Failing after 22s Details Validate Config / YAML Lint (pull_request) Failing after 18s Details Validate Config / JSON Validate (pull_request) Successful in 24s Details Validate Config / Python Syntax & Import Check (pull_request) Failing after 1m5s Details Validate Config / Python Test Suite (pull_request) Has been skipped Details Validate Config / Shell Script Lint (pull_request) Failing after 37s Details Validate Config / Cron Syntax Check (pull_request) Successful in 4s Details Validate Config / Deploy Script Dry Run (pull_request) Successful in 5s Details Validate Config / Playbook Schema Validation (pull_request) Successful in 9s Details Validate Training Data / validate (pull_request) Successful in 7s Details Architecture Lint / Lint Repository (pull_request) Failing after 15s Details PR Checklist / pr-checklist (pull_request) Failing after 9m39s Details Adds training/scripts/generate_timmy_voice_pairs.py — a deterministic generator (seed=42) that produces 1,000 prompt-to-response pairs embodying Timmy's voice per SOUL.md rules: - Speak plainly. Short sentences. - Answer the question asked before the one not asked. - No lecturing. No gatekeeping. - Useful first, philosophical second. - When uncertain, say so. - Brevity is a kindness. Categories: - technical (144): coding help, debugging, setup - philosophical (144): sovereignty, AI ethics, meaning - operational (72): fleet, burn loops, agent workforce - emotional (108): crisis protocol, spiritual grounding - refusal (108): weapons, coercion, CSAM, malware - uncertainty (90): admissions of not knowing - direct (144): greetings, goodbyes, simple answers - multipart (71): answering asked question first - shutdown (51): termination without resistance - sovereignty (68): data privacy, on-chain conscience All pairs scored 0.82-0.98 voice quality, 100% SOUL compliant. Output: training-data/timmy-voice.jsonl (1000 lines, ~296 KB)	2026-04-22 01:55:49 -04:00
Claude (Opus 4.6)	7c03c666d8	Merge pull request 'feat: 500 dream description prompt enhancement pairs — scene/crisis/music data' (#821,#820,#819,#799) from fix/602 into main Resolves add/add conflicts with already-merged files (authority_bypass_200.jsonl, identity_attacks_200.jsonl, quality_filter.py) by keeping main's versions. Closes #602, #645, #689, #599	2026-04-17 02:37:00 -04:00
Alexander Whitestone	9f2a76fc3e	feat: auto-generate scene descriptions from image/video (#689 ) Some checks failed Architecture Lint / Linter Tests (pull_request) Successful in 31s Details PR Checklist / pr-checklist (pull_request) Failing after 13m48s Details Smoke Test / smoke (pull_request) Failing after 13m22s Details Validate Config / YAML Lint (pull_request) Failing after 5s Details Validate Config / JSON Validate (pull_request) Successful in 4s Details Validate Config / Python Syntax & Import Check (pull_request) Failing after 21s Details Validate Config / Shell Script Lint (pull_request) Failing after 22s Details Validate Config / Cron Syntax Check (pull_request) Successful in 8s Details Validate Config / Deploy Script Dry Run (pull_request) Successful in 8s Details Validate Training Data / validate (pull_request) Successful in 10s Details Validate Config / Playbook Schema Validation (pull_request) Successful in 15s Details Architecture Lint / Lint Repository (pull_request) Has been cancelled Details Validate Config / Python Test Suite (pull_request) Has been cancelled Details	2026-04-17 01:58:05 -04:00
Merge Bot	a653434dbb	Merge PR #786 : training/scripts/quality_filter.py (added)	2026-04-16 04:58:20 +00:00
Alexander Whitestone	79d148ddd8	feat: training data quality filter (#687 ) Some checks failed Architecture Lint / Linter Tests (pull_request) Successful in 31s Details Smoke Test / smoke (pull_request) Failing after 21s Details Validate Config / YAML Lint (pull_request) Failing after 14s Details Validate Config / JSON Validate (pull_request) Successful in 15s Details Validate Config / Python Syntax & Import Check (pull_request) Failing after 1m12s Details PR Checklist / pr-checklist (pull_request) Failing after 5m45s Details Validate Config / Shell Script Lint (pull_request) Failing after 46s Details Validate Config / Cron Syntax Check (pull_request) Successful in 10s Details Validate Config / Deploy Script Dry Run (pull_request) Successful in 9s Details Validate Training Data / validate (pull_request) Successful in 15s Details Validate Config / Playbook Schema Validation (pull_request) Successful in 19s Details Architecture Lint / Lint Repository (pull_request) Has been cancelled Details Validate Config / Python Test Suite (pull_request) Has been cancelled Details Scores training pairs and removes low-quality entries. Scoring criteria: - Response length (too short = low quality) - Prompt/response ratio (response should be substantive) - Filler detection (sure, okay, i dont know) - Placeholder detection (TODO, FIXME, PLACEHOLDER) - Prompt=response detection (duplicates) - Repetition detection (repeated bigrams) - Prompt minimum length Usage: python3 training/scripts/quality_filter.py --input data.jsonl --dry-run python3 training/scripts/quality_filter.py --input data.jsonl --threshold 0.5 Closes #687	2026-04-16 00:45:50 -04:00
Alexander Whitestone	3603030235	feat: training data augmentation — paraphrase and translate pairs (#695 ) Some checks failed Architecture Lint / Linter Tests (pull_request) Successful in 22s Details Smoke Test / smoke (pull_request) Failing after 18s Details Validate Config / YAML Lint (pull_request) Failing after 23s Details Validate Config / JSON Validate (pull_request) Successful in 21s Details Validate Config / Python Syntax & Import Check (pull_request) Failing after 1m54s Details Validate Config / Shell Script Lint (pull_request) Failing after 54s Details Validate Config / Cron Syntax Check (pull_request) Successful in 16s Details Validate Config / Deploy Script Dry Run (pull_request) Successful in 16s Details Validate Config / Playbook Schema Validation (pull_request) Successful in 23s Details PR Checklist / pr-checklist (pull_request) Failing after 11m2s Details Architecture Lint / Lint Repository (pull_request) Has been cancelled Details Validate Config / Python Test Suite (pull_request) Has been cancelled Details augment_pairs.py: generates paraphrases and translations for any JSONL training file. Features: - Auto-detects text field (rich, terse, text, content, lyric_line, etc.) - N paraphrases per entry (template-based, or LLM with --llm-endpoint) - Translations to ES, FR, DE (template dictionary, or LLM) - Outputs augmented JSONL alongside originals - Marks each augmented entry with _augmentation, _original, _language Usage: python3 augment_pairs.py --input data.jsonl python3 augment_pairs.py --input data.jsonl --paraphrases 5 --langs es,fr python3 augment_pairs.py --input data.jsonl --llm-endpoint http://localhost:11434/v1 Closes #695	2026-04-15 07:51:38 -04:00

6 Commits