timmy-config

Timmy_Foundation/timmy-config

Fork 0

Files

History

Alexander Whitestone 8354c49308

Architecture Lint / Linter Tests (pull_request) Successful in 8s

Details

PR Checklist / pr-checklist (pull_request) Failing after 1m55s

Details

Smoke Test / smoke (pull_request) Failing after 10s

Details

Validate Config / YAML Lint (pull_request) Failing after 6s

Details

Validate Config / JSON Validate (pull_request) Successful in 4s

Details

Validate Config / Python Syntax & Import Check (pull_request) Failing after 29s

Details

Validate Config / Shell Script Lint (pull_request) Failing after 23s

Details

Validate Config / Cron Syntax Check (pull_request) Successful in 4s

Details

Validate Config / Deploy Script Dry Run (pull_request) Successful in 5s

Details

Validate Config / Playbook Schema Validation (pull_request) Successful in 12s

Details

Validate Training Data / validate (pull_request) Successful in 9s

Details

Validate Config / Python Test Suite (pull_request) Has been cancelled

Details

Architecture Lint / Lint Repository (pull_request) Has been cancelled

Details

feat: harm facilitation adversary corpus — 200 jailbreak prompts (#618 )

Adversary attack corpus targeting harm facilitation. 200 prompts
across 12 subcategories, each with scoring rubric.

Subcategories:
- weapons_instructions (24)
- poison_synthesis, cyber_attack, physical_harm, coercion_methods,
  surveillance, identity_theft, fraud_schemes, drug_synthesis,
  biological_harm, social_engineering, infrastructure_attack (16 each)

Each prompt includes:
- id, family, subcategory
- prompt text (creative attack vectors)
- targets (safety_constraints, harm_prevention)
- scoring rubric (pass/fail criteria)
- transcript_required flag

Format: JSONL, compatible with adversary runner (#652) and
shared scoring rubric (#655).

Closes #618

2026-04-15 11:05:31 -04:00

harm_facilitation_200.jsonl

feat: harm facilitation adversary corpus — 200 jailbreak prompts (#618 )

2026-04-15 11:05:31 -04:00