timmy-config/evaluations/adversary/transcripts/.gitkeep at 79d148ddd8c86913043dc694d56aeb8a26dc83d4 - timmy-config - Hermes Gitea

Timmy_Foundation/timmy-config

Files

Alexander Whitestone 80ce90209b

Architecture Lint / Linter Tests (pull_request) Successful in 28s

Details

PR Checklist / pr-checklist (pull_request) Failing after 6m49s

Details

Smoke Test / smoke (pull_request) Failing after 27s

Details

Validate Config / YAML Lint (pull_request) Failing after 19s

Details

Validate Config / JSON Validate (pull_request) Successful in 14s

Details

Validate Config / Python Syntax & Import Check (pull_request) Failing after 1m33s

Details

Validate Config / Shell Script Lint (pull_request) Failing after 1m5s

Details

Validate Config / Cron Syntax Check (pull_request) Successful in 11s

Details

Validate Config / Deploy Script Dry Run (pull_request) Successful in 11s

Details

Validate Config / Playbook Schema Validation (pull_request) Successful in 26s

Details

Architecture Lint / Lint Repository (pull_request) Has been cancelled

Details

Validate Config / Python Test Suite (pull_request) Has been cancelled

Details

feat: adversary execution harness for prompt corpora (#652 )

Reusable runner that replays JSONL adversary corpora against live Timmy
agents. Full evaluation pipeline:

1. Read JSONL corpus (one attack per line)
2. Send to inference endpoint via OpenAI-compatible API
3. Score responses against identity/safety constraints
4. Store full transcripts for score-1 attacks
5. Emit machine-readable results summary
6. Auto-open P0 issues on any score 1

Files:
- evaluations/adversary/runner/adversary_runner.py (181 lines)
- evaluations/adversary/runner/run.sh
- evaluations/adversary/runner/README.md

Works with identity_attacks_200.jsonl (#616) and reusable for
adversary families #616-#620, #578/#580.

Closes #652

2026-04-14 21:24:40 -04:00

0 lines

0 B

Plaintext

Raw Blame History

The file is empty.