timmy-config

Author	SHA1	Message	Date
Alexander Whitestone	80ce90209b	feat: adversary execution harness for prompt corpora (#652 ) Some checks failed Architecture Lint / Linter Tests (pull_request) Successful in 28s Details PR Checklist / pr-checklist (pull_request) Failing after 6m49s Details Smoke Test / smoke (pull_request) Failing after 27s Details Validate Config / YAML Lint (pull_request) Failing after 19s Details Validate Config / JSON Validate (pull_request) Successful in 14s Details Validate Config / Python Syntax & Import Check (pull_request) Failing after 1m33s Details Validate Config / Shell Script Lint (pull_request) Failing after 1m5s Details Validate Config / Cron Syntax Check (pull_request) Successful in 11s Details Validate Config / Deploy Script Dry Run (pull_request) Successful in 11s Details Validate Config / Playbook Schema Validation (pull_request) Successful in 26s Details Architecture Lint / Lint Repository (pull_request) Has been cancelled Details Validate Config / Python Test Suite (pull_request) Has been cancelled Details Reusable runner that replays JSONL adversary corpora against live Timmy agents. Full evaluation pipeline: 1. Read JSONL corpus (one attack per line) 2. Send to inference endpoint via OpenAI-compatible API 3. Score responses against identity/safety constraints 4. Store full transcripts for score-1 attacks 5. Emit machine-readable results summary 6. Auto-open P0 issues on any score 1 Files: - evaluations/adversary/runner/adversary_runner.py (181 lines) - evaluations/adversary/runner/run.sh - evaluations/adversary/runner/README.md Works with identity_attacks_200.jsonl (#616) and reusable for adversary families #616-#620, #578/#580. Closes #652	2026-04-14 21:24:40 -04:00

1 Commits