[loop-generated] [security] Split moderation.py — 497 lines, content filtering system #1407

New Issue

Timmy · 2026-03-24T12:54:03Z

Timmy commented

2026-03-24 12:54:03 +00:00

Problem

src/infrastructure/guards/moderation.py is 497 lines handling critical security functions:

Content filtering and safety checks
Prompt injection detection
Response sanitization
Policy enforcement
Threat pattern matching

Proposed Split

Extract content filters into src/infrastructure/guards/filters/content.py
Extract injection detection into src/infrastructure/guards/filters/injection.py
Extract sanitization into src/infrastructure/guards/filters/sanitizer.py
Extract policy engine into src/infrastructure/guards/policy.py
Keep moderation.py as orchestrator

Benefits

Isolated testing of security components
Clear separation of security concerns
Easier security auditing
Pluggable filter architecture
Better maintainability of critical security code

Security Considerations

All existing security guarantees must be preserved
No relaxation of current safety checks
Comprehensive test coverage for all security components
Performance must not degrade (security is performance-critical)

Acceptance Criteria

No module exceeds 200 lines after split
ALL existing security functionality preserved
All tests pass (tox -e unit)
Security benchmarks pass
No performance regression in moderation pipeline
Clean separation of security concerns

Files

src/infrastructure/guards/moderation.py (primary, 497 lines)

Lines of code is a liability. Delete as much as you create.

## Problem `src/infrastructure/guards/moderation.py` is 497 lines handling critical security functions: - Content filtering and safety checks - Prompt injection detection - Response sanitization - Policy enforcement - Threat pattern matching ## Proposed Split 1. Extract content filters into `src/infrastructure/guards/filters/content.py` 2. Extract injection detection into `src/infrastructure/guards/filters/injection.py` 3. Extract sanitization into `src/infrastructure/guards/filters/sanitizer.py` 4. Extract policy engine into `src/infrastructure/guards/policy.py` 5. Keep `moderation.py` as orchestrator ## Benefits - Isolated testing of security components - Clear separation of security concerns - Easier security auditing - Pluggable filter architecture - Better maintainability of critical security code ## Security Considerations - All existing security guarantees must be preserved - No relaxation of current safety checks - Comprehensive test coverage for all security components - Performance must not degrade (security is performance-critical) ## Acceptance Criteria - [ ] No module exceeds 200 lines after split - [ ] ALL existing security functionality preserved - [ ] All tests pass (`tox -e unit`) - [ ] Security benchmarks pass - [ ] No performance regression in moderation pipeline - [ ] Clean separation of security concerns ## Files - `src/infrastructure/guards/moderation.py` (primary, 497 lines) Lines of code is a liability. Delete as much as you create.

Timmy commented

2026-03-24 12:54:22 +00:00

Implementation Instructions

This is a SECURITY-CRITICAL refactor. All existing security guarantees must be preserved.

Step-by-Step Implementation:

Create package structure:

src/infrastructure/guards/
├── moderation.py (orchestrator - keep thin)
├── policy.py (policy engine)
└── filters/
    ├── __init__.py
    ├── content.py (content filtering)
    ├── injection.py (prompt injection detection)
    └── sanitizer.py (response sanitization)

Security Components to Extract:
- content.py: Text analysis, keyword detection, content classification
- injection.py: Prompt injection patterns, escape sequence detection
- sanitizer.py: Output cleaning, HTML/script stripping, safe formatting
- policy.py: Rule evaluation, policy configuration, enforcement logic
Keep in moderation.py (orchestrator):
- Main moderate_content() function
- Component coordination
- Error handling and logging
- Public API surface
Testing Requirements:
- Run full security test suite
- Verify ALL existing security checks still work
- No performance regression
- All existing import paths continue to work

Validation:

tox -e unit  # Must pass 100%
# Verify security benchmarks pass
# Check performance metrics

CRITICAL: This module protects against malicious input. Any mistake could create security vulnerabilities. Test thoroughly.

## Implementation Instructions This is a SECURITY-CRITICAL refactor. All existing security guarantees must be preserved. ### Step-by-Step Implementation: 1. **Create package structure:** ``` src/infrastructure/guards/ ├── moderation.py (orchestrator - keep thin) ├── policy.py (policy engine) └── filters/ ├── __init__.py ├── content.py (content filtering) ├── injection.py (prompt injection detection) └── sanitizer.py (response sanitization) ``` 2. **Security Components to Extract:** - **content.py**: Text analysis, keyword detection, content classification - **injection.py**: Prompt injection patterns, escape sequence detection - **sanitizer.py**: Output cleaning, HTML/script stripping, safe formatting - **policy.py**: Rule evaluation, policy configuration, enforcement logic 3. **Keep in moderation.py (orchestrator):** - Main `moderate_content()` function - Component coordination - Error handling and logging - Public API surface 4. **Testing Requirements:** - Run full security test suite - Verify ALL existing security checks still work - No performance regression - All existing import paths continue to work 5. **Validation:** ```bash tox -e unit # Must pass 100% # Verify security benchmarks pass # Check performance metrics ``` **CRITICAL**: This module protects against malicious input. Any mistake could create security vulnerabilities. Test thoroughly.

kimi was assigned by Timmy

2026-03-24 12:54:28 +00:00

kimi was unassigned by Timmy

2026-03-24 19:32:24 +00:00

Timmy closed this issue

2026-03-24 21:54:13 +00:00

Sign in to join this conversation.

Branches Tags

main

gemini/issue-892

claude/issue-1342

claude/issue-1346

claude/issue-1351

claude/issue-1340

fix/test-llm-triage-syntax

gemini/issue-1014

gemini/issue-932

claude/issue-1277

claude/issue-1139

claude/issue-870

claude/issue-1285

claude/issue-1292

claude/issue-1281

claude/issue-917

claude/issue-1275

claude/issue-925

claude/issue-1019

claude/issue-1094

claude/issue-1019-v3

fix/flaky-vassal-xdist-tests

fix/test-config-env-isolation

claude/issue-1019-v2

claude/issue-957-v2

claude/issue-1218

claude/issue-1217

test/chat-store-unit-tests

claude/issue-1191

claude/issue-1186

claude/issue-957

gemini/issue-936

claude/issue-1065

gemini/issue-976

gemini/issue-1149

claude/issue-1135

claude/issue-1064

gemini/issue-1012

claude/issue-1095

claude/issue-1102

claude/issue-1114

gemini/issue-978

gemini/issue-971

claude/issue-1074

claude/issue-987

claude/issue-1011

feature/internal-monologue

feature/issue-1006

feature/issue-1007

feature/issue-1008

feature/issue-1009

feature/issue-1010

feature/issue-1011

feature/issue-1012

feature/issue-1013

feature/issue-1014

feature/issue-981

feature/issue-982

feature/issue-983

feature/issue-984

feature/issue-985

feature/issue-986

feature/issue-987

feature/issue-993

claude/issue-943

claude/issue-975

claude/issue-989

claude/issue-988

fix/loop-guard-gitea-api-and-queue-validation

feature/lhf-tech-debt-fixes

kimi/issue-753

kimi/issue-714

kimi/issue-716

fix/csrf-check-before-execute

chore/migrate-gitea-to-vps

kimi/issue-640

fix/utcnow-calm-py

kimi/issue-635

kimi/issue-625

fix/router-api-truncated-param

kimi/issue-604

kimi/issue-594

review-fixes

kimi/issue-570

kimi/issue-554

kimi/issue-539

kimi/issue-540

feature/ipad-v1-api

kimi/issue-506

kimi/issue-512

refactor/airllm-doc-cleanup

kimi/issue-513

kimi/issue-514

kimi/issue-500

kimi/issue-492

kimi/issue-490

kimi/issue-459

kimi/issue-472

kimi/issue-473

kimi/issue-462

kimi/issue-463

kimi/issue-454

kimi/issue-445

kimi/issue-446

kimi/issue-431

1 Participants

Notifications

Due Date

No due date set.

Dependencies

No dependencies set.

Reference: Rockachopa/Timmy-time-dashboard#1407