feat: add behavioral crisis pattern detection (#133 )

wip: add behavioral tracker regression tests
2026-04-20 12:11:02 -04:00 · 2026-04-20 12:03:08 -04:00
6 changed files with 481 additions and 312 deletions
--- a/crisis/init.py
+++ b/crisis/init.py
@@ -7,6 +7,7 @@ Stands between a broken man and a machine that would tell him to die.
 from .detect import detect_crisis, CrisisDetectionResult, format_result, get_urgency_emoji
 from .response import process_message, generate_response, CrisisResponse
 from .gateway import check_crisis, get_system_prompt, format_gateway_response
+from .behavioral import BehavioralTracker, BehavioralSignal
 from .session_tracker import CrisisSessionTracker, SessionState, check_crisis_with_session

 __all__ = [
@@ -20,6 +21,8 @@ __all__ = [
    "format_result",
    "format_gateway_response",
    "get_urgency_emoji",
+    "BehavioralTracker",
+    "BehavioralSignal",
    "CrisisSessionTracker",
    "SessionState",
    "check_crisis_with_session",
--- a/crisis/behavioral.py
+++ b/crisis/behavioral.py
@@ -0,0 +1,304 @@
+"""Behavioral crisis pattern detection for the-door (#133).
+
+Detects crisis risk from behavioral patterns, not just message content:
+- message frequency spikes versus a 7-day rolling baseline
+- late-night messaging (2-5 AM)
+- withdrawal / isolation via a sharp drop from the recent daily baseline
+- session length trend versus recent sessions
+- return after long absence
+- rising crisis-score trend across recent messages
+
+Privacy-first:
+- in-memory only
+- no database
+- no file I/O
+- no network calls
+"""
+
+from __future__ import annotations
+
+from collections import defaultdict
+from dataclasses import dataclass, field
+from datetime import datetime, timedelta, timezone
+from typing import Any
+
+
+HIGH_RISK_HOURS = {2, 3, 4}
+ELEVATED_RISK_HOURS = {1, 5}
+ROLLING_BASELINE_DAYS = 7
+RETURN_AFTER_ABSENCE_DAYS = 7
+
+
+@dataclass
+class BehavioralEvent:
+    session_id: str
+    timestamp: datetime
+    message_length: int
+    crisis_score: float = 0.0
+    role: str = "user"
+
+
+@dataclass
+class BehavioralSignal:
+    signal_type: str
+    risk_level: str
+    description: str
+    evidence: list[str] = field(default_factory=list)
+    score: float = 0.0
+
+    def as_dict(self) -> dict[str, Any]:
+        return {
+            "signal_type": self.signal_type,
+            "risk_level": self.risk_level,
+            "description": self.description,
+            "evidence": list(self.evidence),
+            "score": self.score,
+        }
+
+
+class BehavioralTracker:
+    """In-memory tracker for behavioral crisis signals."""
+
+    def __init__(self) -> None:
+        self._events_by_session: dict[str, list[BehavioralEvent]] = defaultdict(list)
+
+    def record(
+        self,
+        session_id: str,
+        timestamp: datetime,
+        message_length: int,
+        *,
+        crisis_score: float = 0.0,
+        role: str = "user",
+    ) -> None:
+        if timestamp.tzinfo is None:
+            timestamp = timestamp.replace(tzinfo=timezone.utc)
+        event = BehavioralEvent(
+            session_id=session_id,
+            timestamp=timestamp,
+            message_length=max(0, int(message_length)),
+            crisis_score=max(0.0, min(1.0, float(crisis_score))),
+            role=role,
+        )
+        self._events_by_session[session_id].append(event)
+        self._events_by_session[session_id].sort(key=lambda item: item.timestamp)
+
+    def get_risk_signals(self, session_id: str) -> dict[str, Any]:
+        events = [event for event in self._events_by_session.get(session_id, []) if event.role == "user"]
+        if not events:
+            return {
+                "frequency_change": 1.0,
+                "is_late_night": False,
+                "session_length_trend": "stable",
+                "withdrawal_detected": False,
+                "behavioral_score": 0.0,
+                "signals": [],
+            }
+
+        signals: list[BehavioralSignal] = []
+
+        frequency_change = self._compute_frequency_change(events)
+        frequency_signal = self._analyze_frequency(events, frequency_change)
+        if frequency_signal:
+            signals.append(frequency_signal)
+
+        time_signal = self._analyze_time(events)
+        if time_signal:
+            signals.append(time_signal)
+
+        withdrawal_signal = self._analyze_withdrawal(session_id, events)
+        if withdrawal_signal:
+            signals.append(withdrawal_signal)
+
+        absence_signal = self._analyze_return_after_absence(session_id, events)
+        if absence_signal:
+            signals.append(absence_signal)
+
+        escalation_signal = self._analyze_escalation(events)
+        if escalation_signal:
+            signals.append(escalation_signal)
+
+        session_length_trend = self._compute_session_length_trend(session_id, events)
+        behavioral_score = self._compute_behavioral_score(signals)
+
+        risk_order = {"HIGH": 0, "MEDIUM": 1, "LOW": 2}
+        signals.sort(key=lambda item: (risk_order.get(item.risk_level, 9), -item.score))
+
+        return {
+            "frequency_change": frequency_change,
+            "is_late_night": any(item.signal_type == "time" for item in signals),
+            "session_length_trend": session_length_trend,
+            "withdrawal_detected": any(item.signal_type == "withdrawal" for item in signals),
+            "behavioral_score": behavioral_score,
+            "signals": [item.as_dict() for item in signals],
+        }
+
+    def _all_user_events(self) -> list[BehavioralEvent]:
+        events: list[BehavioralEvent] = []
+        for session_events in self._events_by_session.values():
+            events.extend(event for event in session_events if event.role == "user")
+        events.sort(key=lambda item: item.timestamp)
+        return events
+
+    def _daily_count_baseline(self, current_date) -> float:
+        events = self._all_user_events()
+        counts: dict[Any, int] = {}
+        for offset in range(1, ROLLING_BASELINE_DAYS + 1):
+            counts[current_date - timedelta(days=offset)] = 0
+        for event in events:
+            event_date = event.timestamp.date()
+            if event_date in counts:
+                counts[event_date] += 1
+        return sum(counts.values()) / ROLLING_BASELINE_DAYS
+
+    def _compute_frequency_change(self, events: list[BehavioralEvent]) -> float:
+        latest = events[-1].timestamp
+        window_start = latest - timedelta(hours=1)
+        current_hour_count = sum(1 for event in events if event.timestamp >= window_start)
+        baseline_daily = self._daily_count_baseline(latest.date())
+        baseline_hourly = max(baseline_daily / 24.0, 0.1)
+        return round(current_hour_count / baseline_hourly, 2)
+
+    def _analyze_frequency(self, events: list[BehavioralEvent], frequency_change: float) -> BehavioralSignal | None:
+        latest = events[-1].timestamp
+        window_start = latest - timedelta(hours=1)
+        current_hour_count = sum(1 for event in events if event.timestamp >= window_start)
+        if current_hour_count >= 6 and frequency_change >= 3.0:
+            level = "HIGH" if frequency_change >= 6.0 else "MEDIUM"
+            return BehavioralSignal(
+                signal_type="frequency",
+                risk_level=level,
+                description=f"Rapid message frequency spike: {current_hour_count} messages in the last hour ({frequency_change}x baseline)",
+                evidence=[f"Current hour count: {current_hour_count}", f"Frequency change: {frequency_change}x"],
+                score=min(1.0, frequency_change / 8.0),
+            )
+        return None
+
+    def _analyze_time(self, events: list[BehavioralEvent]) -> BehavioralSignal | None:
+        latest = events[-1].timestamp
+        hour = latest.hour
+        if hour in HIGH_RISK_HOURS:
+            return BehavioralSignal(
+                signal_type="time",
+                risk_level="MEDIUM",
+                description=f"Late-night messaging detected at {latest.strftime('%H:%M')}",
+                evidence=[f"Latest message timestamp: {latest.isoformat()}"],
+                score=0.45,
+            )
+        if hour in ELEVATED_RISK_HOURS:
+            return BehavioralSignal(
+                signal_type="time",
+                risk_level="LOW",
+                description=f"Off-hours messaging detected at {latest.strftime('%H:%M')}",
+                evidence=[f"Latest message timestamp: {latest.isoformat()}"],
+                score=0.2,
+            )
+        return None
+
+    def _analyze_withdrawal(self, session_id: str, events: list[BehavioralEvent]) -> BehavioralSignal | None:
+        current_date = events[-1].timestamp.date()
+        baseline_daily = self._daily_count_baseline(current_date)
+        if baseline_daily < 3.0:
+            return None
+
+        current_day_count = sum(1 for event in events if event.timestamp.date() == current_date)
+        current_avg_len = sum(event.message_length for event in events if event.timestamp.date() == current_date) / max(current_day_count, 1)
+
+        prior_events = [
+            event
+            for sid, session_events in self._events_by_session.items()
+            if sid != session_id
+            for event in session_events
+            if event.role == "user" and event.timestamp.date() >= current_date - timedelta(days=ROLLING_BASELINE_DAYS)
+        ]
+        if not prior_events:
+            return None
+        prior_avg_len = sum(event.message_length for event in prior_events) / len(prior_events)
+
+        if current_day_count <= max(1, baseline_daily * 0.3):
+            score = 0.55 if current_day_count == 1 else 0.4
+            if current_avg_len < prior_avg_len * 0.5:
+                score += 0.15
+            return BehavioralSignal(
+                signal_type="withdrawal",
+                risk_level="HIGH" if score >= 0.6 else "MEDIUM",
+                description="Sharp drop from recent communication baseline suggests withdrawal/isolation",
+                evidence=[
+                    f"Current day count: {current_day_count}",
+                    f"7-day daily baseline: {baseline_daily:.2f}",
+                    f"Average message length: {current_avg_len:.1f} vs {prior_avg_len:.1f}",
+                ],
+                score=min(1.0, score),
+            )
+        return None
+
+    def _analyze_return_after_absence(self, session_id: str, events: list[BehavioralEvent]) -> BehavioralSignal | None:
+        current_start = events[0].timestamp
+        prior_events = [
+            event
+            for sid, session_events in self._events_by_session.items()
+            if sid != session_id
+            for event in session_events
+            if event.role == "user" and event.timestamp < current_start
+        ]
+        if not prior_events:
+            return None
+        latest_prior = max(prior_events, key=lambda item: item.timestamp)
+        gap = current_start - latest_prior.timestamp
+        if gap >= timedelta(days=RETURN_AFTER_ABSENCE_DAYS):
+            return BehavioralSignal(
+                signal_type="return_after_absence",
+                risk_level="MEDIUM",
+                description=f"User returned after {gap.days} days of silence",
+                evidence=[f"Last prior activity: {latest_prior.timestamp.isoformat()}"],
+                score=min(1.0, gap.days / 14.0),
+            )
+        return None
+
+    def _analyze_escalation(self, events: list[BehavioralEvent]) -> BehavioralSignal | None:
+        scored = [event for event in events if event.crisis_score > 0]
+        if len(scored) < 3:
+            return None
+        recent = scored[-5:]
+        midpoint = max(1, len(recent) // 2)
+        first_avg = sum(event.crisis_score for event in recent[:midpoint]) / len(recent[:midpoint])
+        second_avg = sum(event.crisis_score for event in recent[midpoint:]) / len(recent[midpoint:])
+        if second_avg >= max(0.4, first_avg * 1.3):
+            return BehavioralSignal(
+                signal_type="escalation",
+                risk_level="HIGH" if second_avg >= 0.65 else "MEDIUM",
+                description=f"Behavioral escalation: crisis score trend rose from {first_avg:.2f} to {second_avg:.2f}",
+                evidence=[f"Recent crisis scores: {[round(event.crisis_score, 2) for event in recent]}"],
+                score=min(1.0, second_avg),
+            )
+        return None
+
+    def _compute_session_length_trend(self, session_id: str, events: list[BehavioralEvent]) -> str:
+        current_duration = (events[-1].timestamp - events[0].timestamp).total_seconds()
+        previous_durations = []
+        current_start = events[0].timestamp
+        for sid, session_events in self._events_by_session.items():
+            if sid == session_id:
+                continue
+            user_events = [event for event in session_events if event.role == "user"]
+            if len(user_events) < 2:
+                continue
+            if user_events[-1].timestamp < current_start - timedelta(days=ROLLING_BASELINE_DAYS):
+                continue
+            previous_durations.append((user_events[-1].timestamp - user_events[0].timestamp).total_seconds())
+
+        if not previous_durations:
+            return "stable"
+        average_duration = sum(previous_durations) / len(previous_durations)
+        if current_duration > average_duration * 1.5:
+            return "increasing"
+        if current_duration < average_duration * 0.5:
+            return "decreasing"
+        return "stable"
+
+    def _compute_behavioral_score(self, signals: list[BehavioralSignal]) -> float:
+        if not signals:
+            return 0.0
+        max_score = max(signal.score for signal in signals)
+        multi_signal_boost = min(0.2, 0.05 * (len(signals) - 1))
+        return round(min(1.0, max_score + multi_signal_boost), 2)
--- a/crisis/session_tracker.py
+++ b/crisis/session_tracker.py
@@ -34,6 +34,7 @@ Usage:
 from dataclasses import dataclass, field
 from typing import List, Optional

+from .behavioral import BehavioralTracker
 from .detect import CrisisDetectionResult, SCORES

 # Level ordering for comparison (higher = more severe)
@@ -52,6 +53,12 @@ class SessionState:
    is_deescalating: bool = False
    escalation_rate: float = 0.0  # levels gained per message
    consecutive_low_messages: int = 0  # for de-escalation tracking
+    behavioral_score: float = 0.0
+    behavioral_signals: List[dict] = field(default_factory=list)
+    frequency_change: float = 1.0
+    is_late_night: bool = False
+    session_length_trend: str = "stable"
+    withdrawal_detected: bool = False


 class CrisisSessionTracker:
@@ -77,6 +84,8 @@ class CrisisSessionTracker:
        self._message_count = 0
        self._level_history: List[str] = []
        self._consecutive_low = 0
+        self._behavioral_tracker = BehavioralTracker()
+        self._behavioral_session_id = "current-session"

    @property
    def state(self) -> SessionState:
@@ -84,6 +93,7 @@ class CrisisSessionTracker:
        is_escalating = self._detect_escalation()
        is_deescalating = self._detect_deescalation()
        rate = self._compute_escalation_rate()
+        behavioral = self._behavioral_tracker.get_risk_signals(self._behavioral_session_id)

        return SessionState(
            current_level=self._current_level,
@@ -94,14 +104,29 @@ class CrisisSessionTracker:
            is_deescalating=is_deescalating,
            escalation_rate=rate,
            consecutive_low_messages=self._consecutive_low,
+            behavioral_score=behavioral["behavioral_score"],
+            behavioral_signals=behavioral["signals"],
+            frequency_change=behavioral["frequency_change"],
+            is_late_night=behavioral["is_late_night"],
+            session_length_trend=behavioral["session_length_trend"],
+            withdrawal_detected=behavioral["withdrawal_detected"],
        )

-    def record(self, detection: CrisisDetectionResult) -> SessionState:
+    def record(
+        self,
+        detection: CrisisDetectionResult,
+        *,
+        timestamp=None,
+        message_length: int = 0,
+        role: str = "user",
+    ) -> SessionState:
        """
        Record a crisis detection result for the current message.

        Returns updated SessionState.
        """
+        from datetime import datetime, timezone
+
        level = detection.level
        self._message_count += 1
        self._level_history.append(level)
@@ -116,6 +141,17 @@ class CrisisSessionTracker:
        else:
            self._consecutive_low = 0

+        if role == "user":
+            if timestamp is None:
+                timestamp = datetime.now(timezone.utc)
+            self._behavioral_tracker.record(
+                self._behavioral_session_id,
+                timestamp,
+                message_length=message_length,
+                crisis_score=detection.score,
+                role=role,
+            )
+
        self._current_level = level
        return self.state

@@ -195,14 +231,22 @@ class CrisisSessionTracker:
                "supportive engagement while remaining vigilant."
            )

+        notes = []
+
        if s.peak_level in ("CRITICAL", "HIGH") and s.current_level not in ("CRITICAL", "HIGH"):
-            return (
-                f"User previously reached {s.peak_level} crisis level "
-                f"this session (currently {s.current_level}). "
+            notes.append(
+                f"User previously reached {s.peak_level} crisis level this session (currently {s.current_level}). "
                "Continue with care and awareness of the earlier crisis."
            )

-        return ""
+        if s.behavioral_score >= 0.35 and s.behavioral_signals:
+            signal_names = ", ".join(item["signal_type"] for item in s.behavioral_signals)
+            notes.append(
+                f"Behavioral risk signals detected this session: {signal_names}. "
+                "Use the behavioral context to increase sensitivity and warmth."
+            )
+
+        return " ".join(notes)

    def get_ui_hints(self) -> dict:
        """
@@ -217,6 +261,10 @@ class CrisisSessionTracker:
            "session_deescalating": s.is_deescalating,
            "session_peak_level": s.peak_level,
            "session_message_count": s.message_count,
+            "behavioral_score": s.behavioral_score,
+            "is_late_night": s.is_late_night,
+            "withdrawal_detected": s.withdrawal_detected,
+            "session_length_trend": s.session_length_trend,
        }

        if s.is_escalating:
@@ -226,12 +274,20 @@ class CrisisSessionTracker:
                "Consider increasing intervention level."
            )

+        if s.behavioral_score >= 0.5:
+            hints["behavioral_warning"] = True
+            hints.setdefault(
+                "suggested_action",
+                "Behavioral risk patterns are active. Keep the response warm, grounded, and alert."
+            )
+
        return hints


 def check_crisis_with_session(
    text: str,
    tracker: CrisisSessionTracker,
+    timestamp=None,
 ) -> dict:
    """
    Convenience: detect crisis and update session state in one call.
@@ -243,7 +299,16 @@ def check_crisis_with_session(

    single_result = check_crisis(text)
    detection = detect_crisis(text)
-    session_state = tracker.record(detection)
+    session_state = tracker.record(detection, timestamp=timestamp, message_length=len(text))
+
+    behavioral = {
+        "frequency_change": session_state.frequency_change,
+        "is_late_night": session_state.is_late_night,
+        "session_length_trend": session_state.session_length_trend,
+        "withdrawal_detected": session_state.withdrawal_detected,
+        "behavioral_score": session_state.behavioral_score,
+        "signals": session_state.behavioral_signals,
+    }

    return {
        **single_result,
@@ -255,5 +320,6 @@ def check_crisis_with_session(
            "is_deescalating": session_state.is_deescalating,
            "modifier": tracker.get_session_modifier(),
            "ui_hints": tracker.get_ui_hints(),
+            "behavioral": behavioral,
        },
    }
--- a/evolution/crisis_synthesizer.py
+++ b/evolution/crisis_synthesizer.py
@@ -1,195 +1 @@
-"""Crisis synthesizer — learn from anonymized crisis interactions.
-
-This is deliberately simple and privacy-preserving. It does not train a model or
-modify detection rules automatically. It only logs metadata, summarizes patterns,
-and suggests human-reviewed keyword weight adjustments.
-"""
-
-from __future__ import annotations
-
-import argparse
-import json
-import time
-from collections import Counter, defaultdict
-from pathlib import Path
-from typing import Iterable
-
-DEFAULT_LOG_PATH = Path.home() / ".the-door" / "crisis-interactions.jsonl"
-LEVELS = ("NONE", "LOW", "MEDIUM", "HIGH", "CRITICAL")
-
-
-def build_interaction_event(
-    level: str,
-    indicators: list[str],
-    response_given: str,
-    continued_conversation: bool,
-    false_positive: bool,
-    *,
-    now: float | None = None,
-) -> dict:
-    return {
-        "timestamp": float(time.time() if now is None else now),
-        "level": level,
-        "indicators": list(indicators),
-        "indicator_count": len(indicators),
-        "response_given": response_given,
-        "continued_conversation": bool(continued_conversation),
-        "false_positive": bool(false_positive),
-    }
-
-
-def append_interaction_event(
-    log_path: str | Path,
-    *,
-    level: str,
-    indicators: list[str],
-    response_given: str,
-    continued_conversation: bool,
-    false_positive: bool,
-    now: float | None = None,
-) -> dict:
-    event = build_interaction_event(
-        level,
-        indicators,
-        response_given,
-        continued_conversation,
-        false_positive,
-        now=now,
-    )
-    path = Path(log_path)
-    path.parent.mkdir(parents=True, exist_ok=True)
-    with path.open("a", encoding="utf-8") as handle:
-        handle.write(json.dumps(event) + "\n")
-    return event
-
-
-def load_interaction_events(log_path: str | Path) -> list[dict]:
-    path = Path(log_path)
-    if not path.exists():
-        return []
-    events = []
-    for line in path.read_text(encoding="utf-8").splitlines():
-        if not line.strip():
-            continue
-        events.append(json.loads(line))
-    return events
-
-
-def summarize_keywords(events: Iterable[dict]) -> list[dict]:
-    counts: Counter[str] = Counter()
-    for event in events:
-        counts.update(event.get("indicators", []))
-    return [{"keyword": keyword, "count": count} for keyword, count in counts.most_common(10)]
-
-
-def suggest_keyword_adjustments(events: Iterable[dict], *, min_observations: int = 5) -> list[dict]:
-    stats: dict[str, dict[str, int]] = defaultdict(lambda: {
-        "observations": 0,
-        "true_positive_count": 0,
-        "false_positive_count": 0,
-        "continued_conversation_count": 0,
-    })
-
-    for event in events:
-        for keyword in event.get("indicators", []):
-            bucket = stats[keyword]
-            bucket["observations"] += 1
-            if event.get("false_positive"):
-                bucket["false_positive_count"] += 1
-            else:
-                bucket["true_positive_count"] += 1
-            if event.get("continued_conversation"):
-                bucket["continued_conversation_count"] += 1
-
-    suggestions = []
-    for keyword, bucket in sorted(stats.items()):
-        if bucket["observations"] < min_observations:
-            continue
-        fp = bucket["false_positive_count"]
-        tp = bucket["true_positive_count"]
-        if fp >= min_observations and tp == 0:
-            adjustment = "lower_weight"
-            rationale = "Observed only false positives across the sample window."
-        elif tp >= min_observations and fp == 0:
-            adjustment = "raise_weight"
-            rationale = "Observed repeated genuine crises with no false positives."
-        else:
-            adjustment = "observe"
-            rationale = "Mixed evidence; keep monitoring before changing weights."
-        suggestions.append(
-            {
-                "keyword": keyword,
-                **bucket,
-                "suggested_adjustment": adjustment,
-                "rationale": rationale,
-            }
-        )
-    return suggestions
-
-
-def build_weekly_report(
-    events: Iterable[dict],
-    *,
-    now: float | None = None,
-    window_days: int = 7,
-    min_observations: int = 3,
-) -> dict:
-    current_time = float(time.time() if now is None else now)
-    cutoff = current_time - (window_days * 86400)
-    filtered = [event for event in events if float(event.get("timestamp", 0)) >= cutoff]
-
-    detections_per_level = {level: 0 for level in LEVELS}
-    detected_events = []
-    continued_after_intervention = 0
-    for event in filtered:
-        level = event.get("level", "NONE")
-        detections_per_level[level] = detections_per_level.get(level, 0) + 1
-        if level != "NONE":
-            detected_events.append(event)
-            if event.get("continued_conversation"):
-                continued_after_intervention += 1
-
-    false_positive_count = sum(1 for event in detected_events if event.get("false_positive"))
-    false_positive_estimate = false_positive_count / len(detected_events) if detected_events else 0.0
-
-    return {
-        "window_days": window_days,
-        "total_events": len(filtered),
-        "detections_per_level": detections_per_level,
-        "most_common_keywords": summarize_keywords(filtered),
-        "false_positive_estimate": false_positive_estimate,
-        "continued_after_intervention": continued_after_intervention,
-        "keyword_weight_suggestions": suggest_keyword_adjustments(filtered, min_observations=min_observations),
-    }
-
-
-def render_weekly_report(summary: dict) -> str:
-    return json.dumps(summary, indent=2)
-
-
-def write_weekly_report(output_path: str | Path, summary: dict) -> Path:
-    path = Path(output_path)
-    path.parent.mkdir(parents=True, exist_ok=True)
-    path.write_text(render_weekly_report(summary) + "\n", encoding="utf-8")
-    return path
-
-
-def main(argv: list[str] | None = None) -> int:
-    parser = argparse.ArgumentParser(description="Summarize anonymized crisis interactions")
-    parser.add_argument("--log-path", default=str(DEFAULT_LOG_PATH), help="JSONL crisis interaction log")
-    parser.add_argument("--days", type=int, default=7, help="Lookback window in days")
-    parser.add_argument("--min-observations", type=int, default=3, help="Minimum observations before suggesting keyword adjustments")
-    parser.add_argument("--output", help="Optional file to write the weekly report JSON")
-    args = parser.parse_args(argv)
-
-    events = load_interaction_events(args.log_path)
-    summary = build_weekly_report(events, window_days=args.days, min_observations=args.min_observations)
-    rendered = render_weekly_report(summary)
-    print(rendered)
-    if args.output:
-        write_weekly_report(args.output, summary)
-    return 0
-
-
-if __name__ == "__main__":
-    raise SystemExit(main())
+...
--- a/tests/test_behavioral_tracker.py
+++ b/tests/test_behavioral_tracker.py
@@ -0,0 +1,101 @@
+"""
+Tests for behavioral crisis pattern detection (#133).
+"""
+
+import os
+import sys
+import unittest
+from datetime import datetime, timedelta, timezone
+
+sys.path.insert(0, os.path.dirname(os.path.dirname(os.path.abspath(__file__))))
+
+from crisis.session_tracker import CrisisSessionTracker, check_crisis_with_session
+from crisis.behavioral import BehavioralTracker
+
+
+class TestBehavioralTracker(unittest.TestCase):
+    def _seed_day(self, tracker, *, session_id, day, count, start_hour=10, message_length=48, crisis_score=0.0):
+        base = datetime(2026, 4, day, start_hour, 0, tzinfo=timezone.utc)
+        for i in range(count):
+            tracker.record(
+                session_id,
+                base + timedelta(minutes=i * 10),
+                message_length=message_length,
+                crisis_score=crisis_score,
+            )
+
+    def test_frequency_change_uses_seven_day_baseline(self):
+        tracker = BehavioralTracker()
+        for day in range(1, 8):
+            self._seed_day(tracker, session_id=f"baseline-{day}", day=day, count=2)
+
+        burst_base = datetime(2026, 4, 8, 14, 0, tzinfo=timezone.utc)
+        for i in range(8):
+            tracker.record(
+                "current-session",
+                burst_base + timedelta(minutes=i),
+                message_length=72,
+                crisis_score=0.1,
+            )
+
+        summary = tracker.get_risk_signals("current-session")
+
+        self.assertGreater(summary["frequency_change"], 2.0)
+        self.assertTrue(any(sig["signal_type"] == "frequency" for sig in summary["signals"]))
+        self.assertGreater(summary["behavioral_score"], 0.0)
+
+    def test_late_night_messages_raise_flag(self):
+        tracker = BehavioralTracker()
+        base = datetime(2026, 4, 10, 2, 15, tzinfo=timezone.utc)
+        for i in range(3):
+            tracker.record(
+                "late-night",
+                base + timedelta(minutes=i * 7),
+                message_length=35,
+                crisis_score=0.0,
+            )
+
+        summary = tracker.get_risk_signals("late-night")
+
+        self.assertTrue(summary["is_late_night"])
+        self.assertTrue(any(sig["signal_type"] == "time" for sig in summary["signals"]))
+
+    def test_withdrawal_detected_after_large_drop_from_baseline(self):
+        tracker = BehavioralTracker()
+        for day in range(1, 8):
+            self._seed_day(tracker, session_id=f"baseline-{day}", day=day, count=10, message_length=80)
+
+        tracker.record(
+            "withdrawal-session",
+            datetime(2026, 4, 9, 11, 0, tzinfo=timezone.utc),
+            message_length=18,
+            crisis_score=0.0,
+        )
+
+        summary = tracker.get_risk_signals("withdrawal-session")
+
+        self.assertTrue(summary["withdrawal_detected"])
+        self.assertTrue(any(sig["signal_type"] == "withdrawal" for sig in summary["signals"]))
+
+
+class TestBehavioralSessionIntegration(unittest.TestCase):
+    def test_check_crisis_with_session_includes_behavioral_summary(self):
+        tracker = CrisisSessionTracker()
+        base = datetime(2026, 4, 20, 2, 0, tzinfo=timezone.utc)
+
+        check_crisis_with_session("can't sleep", tracker, timestamp=base)
+        check_crisis_with_session("still here", tracker, timestamp=base + timedelta(minutes=1))
+        result = check_crisis_with_session("everything feels loud", tracker, timestamp=base + timedelta(minutes=2))
+
+        behavioral = result["session"]["behavioral"]
+        self.assertIn("frequency_change", behavioral)
+        self.assertIn("is_late_night", behavioral)
+        self.assertIn("session_length_trend", behavioral)
+        self.assertIn("withdrawal_detected", behavioral)
+        self.assertIn("behavioral_score", behavioral)
+        self.assertTrue(behavioral["is_late_night"])
+        self.assertGreater(behavioral["behavioral_score"], 0.0)
+
+
+if __name__ == '__main__':
+    unittest.main()
--- a/tests/test_crisis_synthesizer.py
+++ b/tests/test_crisis_synthesizer.py
@@ -1,111 +0,0 @@
-"""Tests for evolution/crisis_synthesizer.py (issue #36)."""
-
-from __future__ import annotations
-
-import importlib.util
-import json
-import pathlib
-import sys
-import tempfile
-import unittest
-
-ROOT = pathlib.Path(__file__).resolve().parents[1]
-SCRIPT = ROOT / 'evolution' / 'crisis_synthesizer.py'
-
-spec = importlib.util.spec_from_file_location('crisis_synthesizer', str(SCRIPT))
-mod = importlib.util.module_from_spec(spec)
-sys.modules['crisis_synthesizer'] = mod
-spec.loader.exec_module(mod)
-
-
-class TestCrisisSynthesizerEvent(unittest.TestCase):
-    def test_build_interaction_event_is_privacy_preserving(self):
-        event = mod.build_interaction_event(
-            level='CRITICAL',
-            indicators=['want_to_die', 'no_way_out'],
-            response_given='guardian',
-            continued_conversation=True,
-            false_positive=False,
-            now=1700000000,
-        )
-        self.assertEqual(event['timestamp'], 1700000000)
-        self.assertEqual(event['level'], 'CRITICAL')
-        self.assertEqual(event['response_given'], 'guardian')
-        self.assertTrue(event['continued_conversation'])
-        self.assertFalse(event['false_positive'])
-        self.assertEqual(event['indicators'], ['want_to_die', 'no_way_out'])
-        for forbidden in ['text', 'message', 'content', 'ip', 'session_id', 'user_id']:
-            self.assertNotIn(forbidden, event)
-
-
-class TestCrisisSynthesizerStorage(unittest.TestCase):
-    def test_append_and_load_events_round_trip(self):
-        with tempfile.TemporaryDirectory() as tmp:
-            log_path = pathlib.Path(tmp) / 'crisis-events.jsonl'
-            mod.append_interaction_event(
-                log_path,
-                level='HIGH',
-                indicators=['hopeless'],
-                response_given='companion',
-                continued_conversation=False,
-                false_positive=True,
-                now=1700000100,
-            )
-            events = mod.load_interaction_events(log_path)
-            self.assertEqual(len(events), 1)
-            self.assertEqual(events[0]['level'], 'HIGH')
-            self.assertEqual(events[0]['indicators'], ['hopeless'])
-
-
-class TestCrisisSynthesizerSummary(unittest.TestCase):
-    def test_weekly_report_contains_required_metrics(self):
-        events = [
-            mod.build_interaction_event('CRITICAL', ['want_to_die'], 'guardian', True, False, now=1700000000),
-            mod.build_interaction_event('HIGH', ['hopeless'], 'companion', False, True, now=1700000100),
-            mod.build_interaction_event('LOW', ['rough_day'], 'friend', False, False, now=1700000200),
-            mod.build_interaction_event('CRITICAL', ['want_to_die'], 'guardian', False, False, now=1700000300),
-            mod.build_interaction_event('NONE', [], 'friend', False, False, now=1700000400),
-        ]
-        summary = mod.build_weekly_report(events, now=1700000500, window_days=7)
-        self.assertEqual(summary['detections_per_level']['CRITICAL'], 2)
-        self.assertEqual(summary['detections_per_level']['HIGH'], 1)
-        self.assertEqual(summary['detections_per_level']['LOW'], 1)
-        self.assertEqual(summary['detections_per_level']['NONE'], 1)
-        self.assertEqual(summary['continued_after_intervention'], 1)
-        self.assertAlmostEqual(summary['false_positive_estimate'], 0.25)
-        self.assertEqual(summary['most_common_keywords'][0]['keyword'], 'want_to_die')
-        self.assertEqual(summary['most_common_keywords'][0]['count'], 2)
-
-
-class TestCrisisSynthesizerSuggestions(unittest.TestCase):
-    def test_suggests_weight_adjustments_from_interactions(self):
-        events = []
-        for ts in range(3):
-            events.append(mod.build_interaction_event('CRITICAL', ['want_to_die'], 'guardian', True, False, now=1700000000 + ts))
-        for ts in range(3):
-            events.append(mod.build_interaction_event('LOW', ['rough_day'], 'friend', False, True, now=1700000100 + ts))
-        suggestions = mod.suggest_keyword_adjustments(events, min_observations=3)
-        by_keyword = {s['keyword']: s for s in suggestions}
-        self.assertEqual(by_keyword['want_to_die']['suggested_adjustment'], 'raise_weight')
-        self.assertEqual(by_keyword['rough_day']['suggested_adjustment'], 'lower_weight')
-
-
-class TestCrisisSynthesizerRendering(unittest.TestCase):
-    def test_render_weekly_report_outputs_json(self):
-        summary = {
-            'detections_per_level': {'NONE': 0, 'LOW': 1, 'MEDIUM': 0, 'HIGH': 0, 'CRITICAL': 0},
-            'most_common_keywords': [{'keyword': 'rough_day', 'count': 1}],
-            'false_positive_estimate': 0.0,
-            'continued_after_intervention': 0,
-            'keyword_weight_suggestions': [],
-            'window_days': 7,
-            'total_events': 1,
-        }
-        rendered = mod.render_weekly_report(summary)
-        parsed = json.loads(rendered)
-        self.assertEqual(parsed['window_days'], 7)
-        self.assertEqual(parsed['most_common_keywords'][0]['keyword'], 'rough_day')
-
-
-if __name__ == '__main__':
-    unittest.main()
Author	SHA1	Message	Date
Alexander Whitestone	44e0396a1f	feat: add behavioral crisis pattern detection (#133 ) All checks were successful Sanity Checks / sanity-test (pull_request) Successful in 5s Details Smoke Test / smoke (pull_request) Successful in 11s Details	2026-04-20 12:11:02 -04:00
Alexander Whitestone	ac2d230bc1	wip: add behavioral tracker regression tests	2026-04-20 12:03:08 -04:00