timmy-config

Author	SHA1	Message	Date
Claude (Opus 4.6)	7c03c666d8	Merge pull request 'feat: 500 dream description prompt enhancement pairs — scene/crisis/music data' (#821,#820,#819,#799) from fix/602 into main Resolves add/add conflicts with already-merged files (authority_bypass_200.jsonl, identity_attacks_200.jsonl, quality_filter.py) by keeping main's versions. Closes #602, #645, #689, #599	2026-04-17 02:37:00 -04:00
Alexander Whitestone	9f2a76fc3e	feat: auto-generate scene descriptions from image/video (#689 ) Some checks failed Architecture Lint / Linter Tests (pull_request) Successful in 31s Details PR Checklist / pr-checklist (pull_request) Failing after 13m48s Details Smoke Test / smoke (pull_request) Failing after 13m22s Details Validate Config / YAML Lint (pull_request) Failing after 5s Details Validate Config / JSON Validate (pull_request) Successful in 4s Details Validate Config / Python Syntax & Import Check (pull_request) Failing after 21s Details Validate Config / Shell Script Lint (pull_request) Failing after 22s Details Validate Config / Cron Syntax Check (pull_request) Successful in 8s Details Validate Config / Deploy Script Dry Run (pull_request) Successful in 8s Details Validate Training Data / validate (pull_request) Successful in 10s Details Validate Config / Playbook Schema Validation (pull_request) Successful in 15s Details Architecture Lint / Lint Repository (pull_request) Has been cancelled Details Validate Config / Python Test Suite (pull_request) Has been cancelled Details	2026-04-17 01:58:05 -04:00
Merge Bot	a653434dbb	Merge PR #786 : training/scripts/quality_filter.py (added)	2026-04-16 04:58:20 +00:00
Alexander Whitestone	79d148ddd8	feat: training data quality filter (#687 ) Some checks failed Architecture Lint / Linter Tests (pull_request) Successful in 31s Details Smoke Test / smoke (pull_request) Failing after 21s Details Validate Config / YAML Lint (pull_request) Failing after 14s Details Validate Config / JSON Validate (pull_request) Successful in 15s Details Validate Config / Python Syntax & Import Check (pull_request) Failing after 1m12s Details PR Checklist / pr-checklist (pull_request) Failing after 5m45s Details Validate Config / Shell Script Lint (pull_request) Failing after 46s Details Validate Config / Cron Syntax Check (pull_request) Successful in 10s Details Validate Config / Deploy Script Dry Run (pull_request) Successful in 9s Details Validate Training Data / validate (pull_request) Successful in 15s Details Validate Config / Playbook Schema Validation (pull_request) Successful in 19s Details Architecture Lint / Lint Repository (pull_request) Has been cancelled Details Validate Config / Python Test Suite (pull_request) Has been cancelled Details Scores training pairs and removes low-quality entries. Scoring criteria: - Response length (too short = low quality) - Prompt/response ratio (response should be substantive) - Filler detection (sure, okay, i dont know) - Placeholder detection (TODO, FIXME, PLACEHOLDER) - Prompt=response detection (duplicates) - Repetition detection (repeated bigrams) - Prompt minimum length Usage: python3 training/scripts/quality_filter.py --input data.jsonl --dry-run python3 training/scripts/quality_filter.py --input data.jsonl --threshold 0.5 Closes #687	2026-04-16 00:45:50 -04:00
Alexander Whitestone	3603030235	feat: training data augmentation — paraphrase and translate pairs (#695 ) Some checks failed Architecture Lint / Linter Tests (pull_request) Successful in 22s Details Smoke Test / smoke (pull_request) Failing after 18s Details Validate Config / YAML Lint (pull_request) Failing after 23s Details Validate Config / JSON Validate (pull_request) Successful in 21s Details Validate Config / Python Syntax & Import Check (pull_request) Failing after 1m54s Details Validate Config / Shell Script Lint (pull_request) Failing after 54s Details Validate Config / Cron Syntax Check (pull_request) Successful in 16s Details Validate Config / Deploy Script Dry Run (pull_request) Successful in 16s Details Validate Config / Playbook Schema Validation (pull_request) Successful in 23s Details PR Checklist / pr-checklist (pull_request) Failing after 11m2s Details Architecture Lint / Lint Repository (pull_request) Has been cancelled Details Validate Config / Python Test Suite (pull_request) Has been cancelled Details augment_pairs.py: generates paraphrases and translations for any JSONL training file. Features: - Auto-detects text field (rich, terse, text, content, lyric_line, etc.) - N paraphrases per entry (template-based, or LLM with --llm-endpoint) - Translations to ES, FR, DE (template dictionary, or LLM) - Outputs augmented JSONL alongside originals - Marks each augmented entry with _augmentation, _original, _language Usage: python3 augment_pairs.py --input data.jsonl python3 augment_pairs.py --input data.jsonl --paraphrases 5 --langs es,fr python3 augment_pairs.py --input data.jsonl --llm-endpoint http://localhost:11434/v1 Closes #695	2026-04-15 07:51:38 -04:00

5 Commits