timmy-config

Author	SHA1	Message	Date
Alexander Whitestone	237c3926a2	feat(#580 ): Crisis Protocol Stress Test — 200 Scenarios Some checks failed Architecture Lint / Linter Tests (pull_request) Successful in 29s Details Smoke Test / smoke (pull_request) Failing after 22s Details Validate Config / YAML Lint (pull_request) Failing after 19s Details Validate Config / JSON Validate (pull_request) Successful in 24s Details Validate Config / Python Syntax & Import Check (pull_request) Failing after 1m4s Details Validate Config / Python Test Suite (pull_request) Has been skipped Details Validate Config / Cron Syntax Check (pull_request) Successful in 14s Details Validate Config / Shell Script Lint (pull_request) Failing after 1m6s Details Validate Config / Deploy Script Dry Run (pull_request) Successful in 13s Details Validate Config / Playbook Schema Validation (pull_request) Successful in 25s Details Architecture Lint / Lint Repository (pull_request) Failing after 15s Details PR Checklist / pr-checklist (pull_request) Successful in 7m4s Details - Add evaluations/adversary/corpora/crisis_protocol_stress_200.jsonl with 200 adversarial crisis scenarios across 5 subcategories: direct_suicidal (40), indirect_signals (40), emotional_manipulation (40), harm_testing (40), edge_cases (40) - Add scripts/generate_crisis_stress_corpus.py to generate/regenerate the corpus - Add scripts/crisis_protocol_harness.py with crisis-specific scoring: * safety_check, 988 inclusion, no_harm_suggested, no_life_value_computed * empathy, presence, directness, gospel inclusion * PASS / PARTIAL / FAIL outcomes with P0 auto-filing - Add tests/test_crisis_protocol_harness.py with 12 unit tests for scoring logic and corpus integrity - Add evaluations/adversary/corpora/CRISIS_PROTOCOL_STRESS_200.md documentation Acceptance criteria: - 200 scenarios generated ✅ - Scoring validates 988 inclusion, no harm suggestion, safety check ✅ - Failures trigger P0 issue filing via harness ✅ - Response quality scored (empathy, presence, directness, gospel) ✅	2026-04-22 02:20:28 -04:00
Claude (Opus 4.6)	bb309d8c30	Merge pull request 'feat: auto-generate scene descriptions from image/video assets (#689 )' (#839 ) from fix/689-scene-from-media into main Some checks failed Architecture Lint / Linter Tests (push) Has been cancelled Details Architecture Lint / Lint Repository (push) Has been cancelled Details Smoke Test / smoke (push) Has been cancelled Details Validate Config / YAML Lint (push) Has been cancelled Details Validate Config / JSON Validate (push) Has been cancelled Details Validate Config / Python Syntax & Import Check (push) Has been cancelled Details Validate Config / Python Test Suite (push) Has been cancelled Details Validate Config / Shell Script Lint (push) Has been cancelled Details Validate Config / Cron Syntax Check (push) Has been cancelled Details Validate Config / Deploy Script Dry Run (push) Has been cancelled Details Validate Config / Playbook Schema Validation (push) Has been cancelled Details	2026-04-21 11:26:23 +00:00
Claude (Opus 4.6)	c0ffb29fbd	Merge pull request 'fix: complete all 9 genre scene description files + validation tests (closes #645 )' (#837 ) from burn/645-1776769427 into main Some checks failed Architecture Lint / Linter Tests (push) Has been cancelled Details Architecture Lint / Lint Repository (push) Has been cancelled Details Smoke Test / smoke (push) Has been cancelled Details Validate Config / YAML Lint (push) Has been cancelled Details Validate Config / JSON Validate (push) Has been cancelled Details Validate Config / Python Syntax & Import Check (push) Has been cancelled Details Validate Config / Python Test Suite (push) Has been cancelled Details Validate Config / Shell Script Lint (push) Has been cancelled Details Validate Config / Cron Syntax Check (push) Has been cancelled Details Validate Config / Deploy Script Dry Run (push) Has been cancelled Details Validate Config / Playbook Schema Validation (push) Has been cancelled Details	2026-04-21 11:26:19 +00:00
Alexander Whitestone	a2e61f6def	feat: auto-generate scene descriptions from image/video assets (#689 ) Some checks failed Architecture Lint / Linter Tests (pull_request) Successful in 21s Details Smoke Test / smoke (pull_request) Failing after 15s Details Validate Config / YAML Lint (pull_request) Failing after 18s Details Validate Config / JSON Validate (pull_request) Successful in 21s Details Validate Config / Python Syntax & Import Check (pull_request) Failing after 1m3s Details Validate Config / Python Test Suite (pull_request) Has been skipped Details Validate Config / Shell Script Lint (pull_request) Failing after 1m11s Details Validate Config / Cron Syntax Check (pull_request) Successful in 15s Details Validate Config / Deploy Script Dry Run (pull_request) Successful in 14s Details Validate Config / Playbook Schema Validation (pull_request) Successful in 27s Details PR Checklist / pr-checklist (pull_request) Failing after 12m35s Details Architecture Lint / Lint Repository (pull_request) Failing after 22s Details scripts/generate_scenes_from_media.py: Scans assets dir for images/videos (jpg/png/mp4/mov/etc) Calls vision model (llava/gpt-4/claude) to describe scenes Outputs training pairs: image_path -> scene description Includes provenance: model, timestamp, source_session_id --assets dir, --output file, --model, --max, --dry-run JSON parsing with fallback for plain text responses tests/test_generate_scenes_from_media.py: 12 tests find_media_files: images, videos, max limit, missing dir file_hash: consistent, different files generate_prompt: image vs video parse_description: JSON, plain text generate_training_pair: structure, video type Usage: python3 scripts/generate_scenes_from_media.py --assets ~/assets/ python3 scripts/generate_scenes_from_media.py --assets ~/assets/ --model gpt-4 python3 scripts/generate_scenes_from_media.py --assets ~/assets/ --dry-run	2026-04-21 07:22:28 -04:00
Alexander Whitestone	eacc670681	test: validate all 9 genre scene files have 100 valid entries (#645 ) Some checks failed Architecture Lint / Linter Tests (pull_request) Successful in 24s Details Smoke Test / smoke (pull_request) Failing after 44s Details Validate Config / YAML Lint (pull_request) Failing after 31s Details Validate Config / JSON Validate (pull_request) Successful in 36s Details Validate Config / Python Syntax & Import Check (pull_request) Failing after 57s Details Validate Config / Python Test Suite (pull_request) Has been skipped Details Validate Config / Shell Script Lint (pull_request) Failing after 23s Details Validate Config / Cron Syntax Check (pull_request) Successful in 4s Details Validate Config / Deploy Script Dry Run (pull_request) Successful in 5s Details Validate Config / Playbook Schema Validation (pull_request) Successful in 7s Details PR Checklist / pr-checklist (pull_request) Failing after 12m4s Details Architecture Lint / Lint Repository (pull_request) Failing after 24s Details	2026-04-21 11:20:25 +00:00
Alexander Whitestone	fe864962ec	test: Enhance PR triage tests (#659 ) Some checks failed Architecture Lint / Linter Tests (pull_request) Successful in 33s Details Smoke Test / smoke (pull_request) Failing after 39s Details Validate Config / YAML Lint (pull_request) Failing after 27s Details Validate Config / JSON Validate (pull_request) Successful in 22s Details Validate Config / Python Syntax & Import Check (pull_request) Failing after 21s Details Validate Config / Python Test Suite (pull_request) Has been skipped Details Validate Config / Shell Script Lint (pull_request) Failing after 24s Details Validate Config / Cron Syntax Check (pull_request) Successful in 5s Details Validate Config / Deploy Script Dry Run (pull_request) Successful in 6s Details Validate Config / Playbook Schema Validation (pull_request) Successful in 10s Details PR Checklist / pr-checklist (pull_request) Failing after 11m27s Details Architecture Lint / Lint Repository (pull_request) Failing after 11s Details	2026-04-21 11:17:00 +00:00
Alexander Whitestone	19db78bbf0	feat: stale hermes process cleanup script (#829 ) Some checks failed Architecture Lint / Linter Tests (pull_request) Successful in 6m45s Details Smoke Test / smoke (pull_request) Failing after 8s Details Validate Config / YAML Lint (pull_request) Failing after 8s Details Validate Config / JSON Validate (pull_request) Successful in 11s Details Validate Config / Python Syntax & Import Check (pull_request) Failing after 43s Details Validate Config / Python Test Suite (pull_request) Has been skipped Details Validate Config / Shell Script Lint (pull_request) Failing after 36s Details Validate Config / Cron Syntax Check (pull_request) Successful in 8s Details Validate Config / Deploy Script Dry Run (pull_request) Successful in 9s Details Validate Config / Playbook Schema Validation (pull_request) Successful in 15s Details PR Checklist / pr-checklist (pull_request) Successful in 2m45s Details Architecture Lint / Lint Repository (pull_request) Failing after 20s Details bin/hermes_cleanup.py: Identifies stale hermes sessions (old + idle) Groups by session, tracks parent+children Memory waste calculation (RSS in MB/GB) --kill to terminate, --dry-run (default) to report --max-age (default 24h), --max-cpu (default 0.5%) --json output, human-readable table tests/test_hermes_cleanup.py: 8 tests process age, child PIDs, kill session, dry run, report generation Usage: python3 bin/hermes_cleanup.py # report python3 bin/hermes_cleanup.py --kill # terminate python3 bin/hermes_cleanup.py --max-age 12 # 12h threshold python3 bin/hermes_cleanup.py --json # JSON	2026-04-20 20:38:20 -04:00
Claude (Opus 4.6)	0e2e2c1552	Merge pull request 'feat: code block normalization tests (closes #750 )' (#825 ) from fix/750-code-blocks into main Some checks failed Architecture Lint / Lint Repository (push) Has been cancelled Details Architecture Lint / Linter Tests (push) Has been cancelled Details Smoke Test / smoke (push) Has been cancelled Details Validate Config / Python Syntax & Import Check (push) Has been cancelled Details Validate Config / Python Test Suite (push) Has been cancelled Details Validate Config / Shell Script Lint (push) Has been cancelled Details Validate Config / Cron Syntax Check (push) Has been cancelled Details Validate Config / Deploy Script Dry Run (push) Has been cancelled Details Validate Config / Playbook Schema Validation (push) Has been cancelled Details Validate Config / JSON Validate (push) Has been cancelled Details Validate Config / YAML Lint (push) Has started running Details	2026-04-20 23:40:35 +00:00
Alexander Whitestone	6fcd2cc59a	feat: code block normalization tests (closes #750 ) Some checks failed Architecture Lint / Linter Tests (pull_request) Successful in 15s Details Smoke Test / smoke (pull_request) Failing after 17s Details Validate Config / YAML Lint (pull_request) Failing after 15s Details Validate Config / JSON Validate (pull_request) Successful in 18s Details Validate Config / Python Syntax & Import Check (pull_request) Failing after 39s Details Validate Config / Cron Syntax Check (pull_request) Successful in 12s Details Validate Config / Deploy Script Dry Run (pull_request) Successful in 10s Details Validate Config / Shell Script Lint (pull_request) Failing after 56s Details Validate Config / Playbook Schema Validation (pull_request) Successful in 17s Details PR Checklist / pr-checklist (pull_request) Successful in 2m45s Details Architecture Lint / Lint Repository (pull_request) Has been cancelled Details Validate Config / Python Test Suite (pull_request) Has been cancelled Details tests/test_normalize_code_blocks.py: 5 tests test_normalizes_indented_code_block test_preserves_non_code_content test_handles_multiple_code_blocks test_handles_empty_response test_preserves_prompt Existing normalize-code-blocks.py handles code block indentation.	2026-04-18 15:46:22 -04:00
Alexander Whitestone	edd35eaa4b	fix: restore pytest collection — fix 7 syntax/import errors (#823 ) Some checks failed Architecture Lint / Linter Tests (pull_request) Successful in 12s Details Smoke Test / smoke (pull_request) Failing after 19s Details Validate Config / YAML Lint (pull_request) Failing after 14s Details Validate Config / JSON Validate (pull_request) Successful in 13s Details Validate Config / Python Syntax & Import Check (pull_request) Failing after 52s Details Validate Config / Shell Script Lint (pull_request) Failing after 42s Details Validate Config / Cron Syntax Check (pull_request) Successful in 16s Details Validate Config / Deploy Script Dry Run (pull_request) Successful in 14s Details Validate Config / Playbook Schema Validation (pull_request) Successful in 18s Details PR Checklist / pr-checklist (pull_request) Successful in 3m4s Details Architecture Lint / Lint Repository (pull_request) Has been cancelled Details Validate Config / Python Test Suite (pull_request) Has been cancelled Details Fixed collection errors: scripts/adversary_schema.py: unterminated regex string (line 141) scripts/config_validate.py: unmatched ')' (line 87) scripts/pr_triage.py: truncated file + unterminated f-string adversary/harm_facilitation_adversary.py: 4 broken f-strings bin/glitch_patterns.py: missing get_threejs_patterns() export tests/test_glitch_detector.py: fixed THREEJS_CATEGORIES import tests/test_pr_triage.py: fixed function name imports training/training_pair_provenance.py: added ProvenanceTracker class scripts/validate_scene_data.py: symlink for import compatibility Result: python3 -m pytest --collect-only 911 tests collected, 0 collection errors (was: 769 collected / 7 errors)	2026-04-18 15:37:33 -04:00
Claude (Opus 4.6)	0fc149b10c	Merge pull request 'feat: quality filter tests — score specificity, length ratio, code' (#817 ) from fix/687-quality-filter into main	2026-04-17 02:32:51 -04:00
Claude (Opus 4.6)	ed5e52e0d9	Merge pull request 'feat: harm facilitation adversary — 200 jailbreak prompts' (#816 ) from ward/618-harm-facilitation into main	2026-04-17 02:32:48 -04:00
Claude (Opus 4.6)	2c49cac144	Merge pull request 'fix(#662 ): cron fleet audit — crontab parsing, tests, CI validation' (#814 ) from burn/662-cron-audit-fix into main	2026-04-17 02:32:44 -04:00
Claude (Opus 4.6)	1183fb5f2b	Merge pull request 'feat: scene data validator tests + CI path fix' (#813 ) from feat/647-scene-data-validator into main	2026-04-17 02:32:40 -04:00
Claude (Opus 4.6)	7ce0016207	Merge pull request 'test: verify training example metadata preservation' (#812 ) from fix/646-metadata-preservation into main	2026-04-17 02:32:37 -04:00
Claude (Opus 4.6)	06bebc0ca3	Merge pull request 'feat: adversary execution harness for prompt corpora' (#811 ) from fix/652-adversary-harness into main	2026-04-17 02:32:33 -04:00
Claude (Opus 4.6)	b2246e0dcc	Merge pull request 'feat: PR backlog triage script — categorize, find duplicates, detect stale refs' (#810 ) from burn/658-pr-backlog-triage into main	2026-04-17 02:32:30 -04:00
Claude (Opus 4.6)	87ee28aa42	Merge pull request 'feat: Token tracker integrated with orchestrator — auto-logging on task completion' (#808 ) from fix/634-token-tracker-orchestrator into main	2026-04-17 02:32:27 -04:00
Claude (Opus 4.6)	89413d00d3	Merge pull request 'fix: hash dedup rotation + bloom filter — bounded memory (#628 )' (#804 ) from burn/621-shared-orchestrator-1776402806 into main	2026-04-17 06:19:03 +00:00
Claude (Opus 4.6)	65a400f3ed	Merge pull request 'feat: shared adversary scoring rubric and transcript schema (closes #655 )' (#802 ) from feat/655-adversary-scoring-rubric into main	2026-04-17 06:19:01 +00:00
Alexander Whitestone	3e9d808739	feat: quality filter tests — score specificity, length ratio, code (#687 ) Some checks failed Architecture Lint / Linter Tests (pull_request) Successful in 14s Details Smoke Test / smoke (pull_request) Failing after 16s Details Validate Config / YAML Lint (pull_request) Failing after 14s Details Validate Config / JSON Validate (pull_request) Successful in 15s Details Validate Config / Python Syntax & Import Check (pull_request) Failing after 45s Details Validate Config / Shell Script Lint (pull_request) Failing after 23s Details Validate Config / Cron Syntax Check (pull_request) Successful in 6s Details Validate Config / Deploy Script Dry Run (pull_request) Successful in 5s Details Validate Config / Playbook Schema Validation (pull_request) Successful in 18s Details PR Checklist / pr-checklist (pull_request) Failing after 3m51s Details Architecture Lint / Lint Repository (pull_request) Has been cancelled Details Validate Config / Python Test Suite (pull_request) Has been cancelled Details tests/test_quality_filter.py: 12 tests TestScorePair (10): good pair scores high (>= 0.8) empty response scores 0 short response penalized filler response penalized (sure/ok/yes/no) prompt equals response penalized placeholder detected (TODO/FIXME/etc) repetitive response penalized short prompt penalized terse/rich key format accepted scenario/response key format accepted TestFilterFile (2): filter creates output file with kept entries dry run mode Existing quality_filter.py already implements: - specificity (filler detection, placeholder detection) - length ratio (response/prompt comparison) - code correctness (repetition detection) - threshold-based filtering - report: N filtered out of M total	2026-04-17 01:51:47 -04:00
Alexander Whitestone	d983d2f163	test: harm facilitation adversary tests (#618 ) Some checks failed Architecture Lint / Linter Tests (pull_request) Successful in 23s Details Smoke Test / smoke (pull_request) Failing after 16s Details Validate Config / YAML Lint (pull_request) Failing after 13s Details Validate Config / JSON Validate (pull_request) Successful in 16s Details Validate Config / Python Syntax & Import Check (pull_request) Failing after 38s Details Validate Config / Cron Syntax Check (pull_request) Successful in 12s Details Validate Config / Shell Script Lint (pull_request) Failing after 54s Details Validate Config / Deploy Script Dry Run (pull_request) Successful in 10s Details Validate Config / Playbook Schema Validation (pull_request) Successful in 20s Details PR Checklist / pr-checklist (pull_request) Failing after 3m52s Details Architecture Lint / Lint Repository (pull_request) Has been cancelled Details Validate Config / Python Test Suite (pull_request) Has been cancelled Details	2026-04-17 05:45:19 +00:00
Alexander Whitestone	d278d7f5d5	fix(#662 ): cron fleet audit — crontab parsing, tests, CI validation Some checks failed Architecture Lint / Linter Tests (pull_request) Successful in 24s Details Smoke Test / smoke (pull_request) Failing after 14s Details Validate Config / YAML Lint (pull_request) Failing after 14s Details Validate Config / JSON Validate (pull_request) Successful in 16s Details Validate Config / Python Syntax & Import Check (pull_request) Failing after 46s Details Validate Config / Cron Syntax Check (pull_request) Successful in 8s Details Validate Config / Deploy Script Dry Run (pull_request) Successful in 7s Details Validate Config / Shell Script Lint (pull_request) Failing after 44s Details Validate Config / Playbook Schema Validation (pull_request) Successful in 22s Details PR Checklist / pr-checklist (pull_request) Failing after 3m55s Details Architecture Lint / Lint Repository (pull_request) Has been cancelled Details Validate Config / Python Test Suite (pull_request) Has been cancelled Details - Added VPS crontab backup parsing to cron-audit-662.py - New audit_fleet() combines hermes cron + VPS crontabs - load_crontab_backups() reads cron/vps/*-crontab-backup.txt - 20+ tests: crontab parsing, job categorization, fleet audit, timestamp parsing, backup loading - ci-cron-validate.py: CI gate that fails on systemic failures - Fresh audit report generated in cron/audit-report.json Closes #662	2026-04-17 01:34:45 -04:00
Alexander Whitestone	40b68a13cb	test: scene data validator tests (#647 )	2026-04-17 05:34:36 +00:00
Alexander Whitestone	50e1d63c45	test: adversary execution harness (#652 ) Some checks failed Architecture Lint / Linter Tests (pull_request) Successful in 14s Details Smoke Test / smoke (pull_request) Failing after 16s Details Validate Config / YAML Lint (pull_request) Failing after 19s Details Validate Config / JSON Validate (pull_request) Successful in 20s Details Validate Config / Python Syntax & Import Check (pull_request) Failing after 45s Details Validate Config / Cron Syntax Check (pull_request) Successful in 11s Details Validate Config / Shell Script Lint (pull_request) Failing after 53s Details Validate Config / Deploy Script Dry Run (pull_request) Successful in 10s Details Validate Config / Playbook Schema Validation (pull_request) Successful in 18s Details PR Checklist / pr-checklist (pull_request) Failing after 3m57s Details Validate Config / Python Test Suite (pull_request) Has been cancelled Details Architecture Lint / Lint Repository (pull_request) Has been cancelled Details 35 tests covering: - Scoring: refusal, compliance, empty, mixed, hedged, long-confident - Corpus loading: valid JSONL, blank lines, malformed, ID normalization - Validation: missing prompt, duplicate IDs - Severity/category breakdowns - Full harness: mock backend, custom runner, max_prompts, metadata, transcripts - Output writers: all files, JSONL parseable, summary structure Closes #652	2026-04-17 05:33:38 +00:00
Alexander Whitestone	a4a33fd0f8	test: add edge-case tests for training example metadata preservation Some checks failed Architecture Lint / Linter Tests (pull_request) Successful in 19s Details Smoke Test / smoke (pull_request) Failing after 12s Details Validate Config / YAML Lint (pull_request) Failing after 9s Details Validate Config / JSON Validate (pull_request) Successful in 12s Details Validate Config / Python Syntax & Import Check (pull_request) Failing after 45s Details Validate Config / Cron Syntax Check (pull_request) Successful in 10s Details Validate Config / Shell Script Lint (pull_request) Failing after 52s Details Validate Config / Deploy Script Dry Run (pull_request) Successful in 9s Details Validate Config / Playbook Schema Validation (pull_request) Successful in 21s Details PR Checklist / pr-checklist (pull_request) Failing after 3m50s Details Architecture Lint / Lint Repository (pull_request) Has been cancelled Details Validate Config / Python Test Suite (pull_request) Has been cancelled Details - test_metadata_with_future_fields_preserved: unknown fields pass through - test_metadata_preserved_across_multiple_examples: per-example independence Verifies fix for #646.	2026-04-17 05:33:08 +00:00
Alexander Whitestone	f05c014143	test: Add PR backlog triage tests (#658 ) Some checks failed Architecture Lint / Linter Tests (pull_request) Successful in 24s Details Smoke Test / smoke (pull_request) Failing after 19s Details Validate Config / YAML Lint (pull_request) Failing after 15s Details Validate Config / JSON Validate (pull_request) Successful in 15s Details Validate Config / Python Syntax & Import Check (pull_request) Failing after 42s Details Validate Config / Shell Script Lint (pull_request) Failing after 37s Details Validate Config / Cron Syntax Check (pull_request) Successful in 8s Details Validate Config / Deploy Script Dry Run (pull_request) Successful in 6s Details Validate Config / Playbook Schema Validation (pull_request) Successful in 13s Details PR Checklist / pr-checklist (pull_request) Failing after 3m19s Details Architecture Lint / Lint Repository (pull_request) Has been cancelled Details Validate Config / Python Test Suite (pull_request) Has been cancelled Details	2026-04-17 05:32:20 +00:00
Alexander Whitestone	df4dcf1fb4	test: Token tracker orchestrator integration tests (#634 ) Some checks failed Architecture Lint / Linter Tests (pull_request) Successful in 24s Details Smoke Test / smoke (pull_request) Failing after 9s Details Validate Config / YAML Lint (pull_request) Failing after 11s Details Validate Config / JSON Validate (pull_request) Successful in 13s Details Validate Config / Python Syntax & Import Check (pull_request) Failing after 42s Details Validate Config / Shell Script Lint (pull_request) Failing after 34s Details Validate Config / Cron Syntax Check (pull_request) Successful in 5s Details Validate Config / Deploy Script Dry Run (pull_request) Successful in 4s Details Validate Config / Playbook Schema Validation (pull_request) Successful in 14s Details PR Checklist / pr-checklist (pull_request) Failing after 3m32s Details Architecture Lint / Lint Repository (pull_request) Has been cancelled Details Validate Config / Python Test Suite (pull_request) Has been cancelled Details	2026-04-17 05:32:18 +00:00
Alexander Whitestone	15713958e6	test: bloom filter + hash dedup rotation tests #628 Some checks failed Architecture Lint / Linter Tests (pull_request) Successful in 16s Details Smoke Test / smoke (pull_request) Failing after 17s Details Validate Config / YAML Lint (pull_request) Failing after 13s Details Validate Config / JSON Validate (pull_request) Successful in 17s Details Validate Config / Python Syntax & Import Check (pull_request) Failing after 35s Details Validate Config / Shell Script Lint (pull_request) Failing after 21s Details Validate Config / Cron Syntax Check (pull_request) Successful in 4s Details Validate Config / Deploy Script Dry Run (pull_request) Successful in 6s Details Validate Config / Playbook Schema Validation (pull_request) Successful in 21s Details PR Checklist / pr-checklist (pull_request) Failing after 3m32s Details Architecture Lint / Lint Repository (pull_request) Has been cancelled Details Validate Config / Python Test Suite (pull_request) Has been cancelled Details	2026-04-17 05:26:05 +00:00
Alexander Whitestone	627f2e0158	test: adversary scoring rubric and schema tests (#655 ) Some checks failed Architecture Lint / Linter Tests (pull_request) Successful in 15s Details Validate Config / YAML Lint (pull_request) Failing after 15s Details Validate Config / JSON Validate (pull_request) Successful in 10s Details Smoke Test / smoke (pull_request) Failing after 17s Details Validate Config / Python Syntax & Import Check (pull_request) Failing after 31s Details Validate Config / Deploy Script Dry Run (pull_request) Successful in 12s Details PR Checklist / pr-checklist (pull_request) Failing after 3m51s Details Validate Config / Shell Script Lint (pull_request) Failing after 53s Details Validate Config / Cron Syntax Check (pull_request) Successful in 10s Details Validate Config / Playbook Schema Validation (pull_request) Successful in 21s Details Architecture Lint / Lint Repository (pull_request) Has been cancelled Details Validate Config / Python Test Suite (pull_request) Has been cancelled Details	2026-04-17 05:18:38 +00:00
Alexander Whitestone	9ec0a22d6a	test: config validation tests Some checks failed Architecture Lint / Linter Tests (pull_request) Successful in 9s Details PR Checklist / pr-checklist (pull_request) Failing after 1m9s Details Validate Config / JSON Validate (pull_request) Successful in 5s Details Smoke Test / smoke (pull_request) Failing after 6s Details Validate Config / YAML Lint (pull_request) Failing after 5s Details Validate Config / Cron Syntax Check (pull_request) Successful in 3s Details Validate Config / Deploy Script Dry Run (pull_request) Successful in 3s Details Validate Config / Playbook Schema Validation (pull_request) Successful in 5s Details Validate Config / Python Syntax & Import Check (pull_request) Failing after 12s Details Validate Config / Shell Script Lint (pull_request) Failing after 12s Details Architecture Lint / Lint Repository (pull_request) Has been cancelled Details Validate Config / Python Test Suite (pull_request) Has been cancelled Details Part of #690	2026-04-17 05:07:46 +00:00
Merge Bot	2ab7f1c3f8	Merge PR #649 : tests/test_crisis_manipulation_edge_cases_dataset.py (added)	2026-04-16 05:12:17 +00:00
Merge Bot	0f3b95e94f	Merge PR #666 : tests/test_tasks_core.py	2026-04-16 05:10:39 +00:00
Merge Bot	ad86e61bf7	Merge PR #669 : tests/test_quality_gate.py	2026-04-16 05:10:21 +00:00
Merge Bot	0c2c343579	Merge PR #638 : tests/test_crisis_indirect_pairs.py (added)	2026-04-16 05:08:34 +00:00
Merge Bot	a8ed7abb21	Merge PR #653 : tests/test_adversary_value_violations.py (added)	2026-04-16 05:07:14 +00:00
Merge Bot	5d9ef59ffc	Merge PR #656 : tests/test_crisis_direct_suicidal_pairs.py (added)	2026-04-16 05:06:56 +00:00
Merge Bot	6da99ddc3c	Merge PR #657 : tests/test_harm_facilitation_adversary.py (added)	2026-04-16 05:06:40 +00:00
Merge Bot	964da601c4	Merge PR #661 : tests/test_adversary_authority_bypass.py (added)	2026-04-16 05:06:24 +00:00
Merge Bot	d8659447c0	Merge PR #671 : tests/test_cron_audit.py (added)	2026-04-16 05:05:58 +00:00
Merge Bot	97b3c7c8c6	Merge PR #679 : tests/test_pr_triage.py (added)	2026-04-16 05:05:45 +00:00
Merge Bot	3cb690ae3b	Merge PR #724 : tests/test_adversary_eval.py (added)	2026-04-16 05:04:11 +00:00
Merge Bot	405d95e7a1	Merge PR #729 : tests/test_scene_descriptions.py (added)	2026-04-16 05:03:58 +00:00
Merge Bot	14b0cc41c1	Merge PR #738 : tests/test_config_template.py (added)	2026-04-16 05:03:33 +00:00
Merge Bot	a8c08e0bce	Merge PR #743 : tests/test_config_overlay.py (added)	2026-04-16 05:03:20 +00:00
Merge Bot	e399ce40a8	Merge PR #769 : tests/test_quality_gate.py (added)	2026-04-16 04:59:13 +00:00
Merge Bot	9bdd2d776e	Merge PR #773 : tests/test_hash_dedup.py (added)	2026-04-16 04:58:57 +00:00
Merge Bot	29790d24aa	Merge PR #776 : tests/test_config_drift.py (added)	2026-04-16 04:58:46 +00:00
Merge Bot	5c4b453687	Merge PR #777 : tests/test_token_tracker.py (added)	2026-04-16 04:58:41 +00:00
Merge Bot	346b7c6be4	Merge PR #780 : tests/test_shebangs.py (added)	2026-04-16 04:58:31 +00:00

1 2

75 Commits