fix: [TRAINING] Capture the first replayable local Bannerlord session trace for Timmy (closes #723 )

2026-04-10 20:17:47 -04:00
8 changed files with 427 additions and 170 deletions
--- a/app.js
+++ b/app.js
@@ -1,5 +1,3 @@
-shell-init: error retrieving current directory: getcwd: cannot access parent directories: No such file or directory
-chdir: error retrieving current directory: getcwd: cannot access parent directories: No such file or directory
 import * as THREE from 'three';
 import { EffectComposer } from 'three/addons/postprocessing/EffectComposer.js';
 import { RenderPass } from 'three/addons/postprocessing/RenderPass.js';
@@ -1984,67 +1982,24 @@ function setupControls() {
  document.getElementById('chat-quick-actions').addEventListener('click', (e) => {
    const btn = e.target.closest('.quick-action-btn');
    if (!btn) return;
-    handleQuickAction(btn.dataset.action);
+    
+    const action = btn.dataset.action;
+    
+    switch(action) {
+      case 'status':
+        sendChatMessage("Timmy, what is the current system status?");
+        break;
+      case 'agents':
+        sendChatMessage("Timmy, check on all active agents.");
+        break;
+      case 'portals':
+        openPortalAtlas();
+        break;
+      case 'help':
+        sendChatMessage("Timmy, I need assistance with Nexus navigation.");
+        break;
+    }
  });
-
-// ═══ QUICK ACTION HANDLER ═══
-function handleQuickAction(action) {
-  switch(action) {
-    case 'status': {
-      const portalCount = portals.length;
-      const onlinePortals = portals.filter(p => p.userData && p.userData.status === 'online').length;
-      const agentCount = agents.length;
-      const wsState = wsConnected ? 'ONLINE' : 'OFFLINE';
-      const wsColor = wsConnected ? '#4af0c0' : '#ff4466';
-      addChatMessage('system', `[SYSTEM STATUS]`);
-      addChatMessage('timmy', `Nexus operational. ${portalCount} portals registered (${onlinePortals} online). ${agentCount} agent presences active. Hermes WebSocket: ${wsState}. Navigation mode: ${NAV_MODES[navModeIdx].toUpperCase()}. Performance tier: ${performanceTier.toUpperCase()}.`);
-      break;
-    }
-    case 'agents': {
-      addChatMessage('system', `[AGENT ROSTER]`);
-      if (agents.length === 0) {
-        addChatMessage('timmy', 'No active agent presences detected in the Nexus. The thought stream and harness pulse are the primary indicators of system activity.');
-      } else {
-        const roster = agents.map(a => `- ${(a.userData && a.userData.name) || a.name || 'Unknown'}: ${(a.userData && a.userData.status) || 'active'}`).join('\n');
-        addChatMessage('timmy', `Active agents:\n${roster}`);
-      }
-      break;
-    }
-    case 'portals':
-      openPortalAtlas();
-      break;
-    case 'heartbeat': {
-      const agentLog = document.getElementById('agent-log-content');
-      const recentEntries = agentLog ? agentLog.querySelectorAll('.agent-log-entry') : [];
-      const entryCount = recentEntries.length;
-      addChatMessage('system', `[HEARTBEAT INSPECTION]`);
-      addChatMessage('timmy', `Hermes heartbeat ${wsConnected ? 'active' : 'inactive'}. ${entryCount} recent entries in thought stream. WebSocket reconnect timer: ${wsReconnectTimer ? 'active' : 'idle'}. Harness pulse mesh: ${harnessPulseMesh ? 'rendering' : 'standby'}.`);
-      break;
-    }
-    case 'thoughts': {
-      const agentLog = document.getElementById('agent-log-content');
-      const entries = agentLog ? Array.from(agentLog.querySelectorAll('.agent-log-entry')).slice(0, 5) : [];
-      addChatMessage('system', `[THOUGHT STREAM]`);
-      if (entries.length === 0) {
-        addChatMessage('timmy', 'The thought stream is quiet. No recent agent entries detected.');
-      } else {
-        const summary = entries.map(e => '> ' + e.textContent.trim()).join('\n');
-        addChatMessage('timmy', `Recent thoughts:\n${summary}`);
-      }
-      break;
-    }
-    case 'help': {
-      addChatMessage('system', `[NEXUS HELP]`);
-      addChatMessage('timmy', `Navigation: WASD to move, mouse to look around.\n` +
-        `Press V to cycle: Walk / Orbit / Fly mode.\n` +
-        `Enter to chat. Escape to close overlays.\n` +
-        `Press F near a portal to enter. Press E near a vision point to read.\n` +
-        `Press Tab for Portal Atlas.\n` +
-        `The Batcave Terminal shows system logs. The Workshop Terminal shows tool output.`);
-      break;
-    }
-  }
-}
  
  document.getElementById('portal-close-btn').addEventListener('click', closePortalOverlay);
  document.getElementById('vision-close-btn').addEventListener('click', closeVisionOverlay);
--- a/index.html
+++ b/index.html
@@ -1,5 +1,3 @@
-shell-init: error retrieving current directory: getcwd: cannot access parent directories: No such file or directory
-chdir: error retrieving current directory: getcwd: cannot access parent directories: No such file or directory
 <!DOCTYPE html>
 <html lang="en" data-theme="dark">
 <head>
@@ -145,39 +143,10 @@ chdir: error retrieving current directory: getcwd: cannot access parent director
      </div>
    </div>
    <div id="chat-quick-actions" class="chat-quick-actions">
-      <div class="starter-label">STARTER PROMPTS</div>
-      <div class="starter-grid">
-        <button class="starter-btn" data-action="heartbeat" title="Check Timmy heartbeat and system health">
-          <span class="starter-icon">◈</span>
-          <span class="starter-text">Inspect Heartbeat</span>
-          <span class="starter-desc">System health &amp; connectivity</span>
-        </button>
-        <button class="starter-btn" data-action="portals" title="Browse the portal atlas">
-          <span class="starter-icon">🌐</span>
-          <span class="starter-text">Portal Atlas</span>
-          <span class="starter-desc">Browse connected worlds</span>
-        </button>
-        <button class="starter-btn" data-action="agents" title="Check active agent status">
-          <span class="starter-icon">◎</span>
-          <span class="starter-text">Agent Status</span>
-          <span class="starter-desc">Who is in the fleet</span>
-        </button>
-        <button class="starter-btn" data-action="memory" title="View memory crystals">
-          <span class="starter-icon">◇</span>
-          <span class="starter-text">Memory Crystals</span>
-          <span class="starter-desc">Inspect stored knowledge</span>
-        </button>
-        <button class="starter-btn" data-action="ask" title="Ask Timmy anything">
-          <span class="starter-icon">→</span>
-          <span class="starter-text">Ask Timmy</span>
-          <span class="starter-desc">Start a conversation</span>
-        </button>
-        <button class="starter-btn" data-action="sovereignty" title="Learn about sovereignty">
-          <span class="starter-icon">△</span>
-          <span class="starter-text">Sovereignty</span>
-          <span class="starter-desc">What this space is</span>
-        </button>
-      </div>
+      <button class="quick-action-btn" data-action="status">System Status</button>
+      <button class="quick-action-btn" data-action="agents">Agent Check</button>
+      <button class="quick-action-btn" data-action="portals">Portal Atlas</button>
+      <button class="quick-action-btn" data-action="help">Help</button>
    </div>
    <div class="chat-input-row">
      <input type="text" id="chat-input" class="chat-input" placeholder="Speak to Timmy..." autocomplete="off">
--- a/nexus/bannerlord_harness.py
+++ b/nexus/bannerlord_harness.py
@@ -29,6 +29,8 @@ from typing import Any, Callable, Optional

 import websockets

+from bannerlord_trace import BannerlordTraceLogger
+
 # ═══════════════════════════════════════════════════════════════════════════
 # CONFIGURATION
 # ═══════════════════════════════════════════════════════════════════════════
@@ -265,11 +267,13 @@ class BannerlordHarness:
        desktop_command: Optional[list[str]] = None,
        steam_command: Optional[list[str]] = None,
        enable_mock: bool = False,
+        enable_trace: bool = False,
    ):
        self.hermes_ws_url = hermes_ws_url
        self.desktop_command = desktop_command or DEFAULT_MCP_DESKTOP_COMMAND
        self.steam_command = steam_command or DEFAULT_MCP_STEAM_COMMAND
        self.enable_mock = enable_mock
+        self.enable_trace = enable_trace

        # MCP clients
        self.desktop_mcp: Optional[MCPClient] = None
@@ -284,6 +288,9 @@ class BannerlordHarness:
        self.cycle_count = 0
        self.running = False

+        # Session trace logger
+        self.trace_logger: Optional[BannerlordTraceLogger] = None
+
    # ═══ LIFECYCLE ═══

    async def start(self) -> bool:
@@ -314,6 +321,15 @@ class BannerlordHarness:
        # Connect to Hermes WebSocket
        await self._connect_hermes()

+        # Initialize trace logger if enabled
+        if self.enable_trace:
+            self.trace_logger = BannerlordTraceLogger(
+                harness_session_id=self.session_id,
+                hermes_session_id=self.session_id,
+            )
+            self.trace_logger.start_session()
+            log.info(f"Trace logger started: {self.trace_logger.trace_id}")
+
        log.info("Harness initialized successfully")
        return True

@@ -322,6 +338,12 @@ class BannerlordHarness:
        self.running = False
        log.info("Shutting down harness...")

+        # Finalize trace logger
+        if self.trace_logger:
+            manifest = self.trace_logger.finish_session()
+            log.info(f"Trace saved: {manifest.trace_file}")
+            log.info(f"Manifest: {self.trace_logger.manifest_file}")
+
        if self.desktop_mcp:
            self.desktop_mcp.stop()
        if self.steam_mcp:
@@ -707,6 +729,11 @@ class BannerlordHarness:
            self.cycle_count = iteration
            log.info(f"\n--- ODA Cycle {iteration + 1}/{max_iterations} ---")

+            # Start trace cycle
+            trace_cycle = None
+            if self.trace_logger:
+                trace_cycle = self.trace_logger.begin_cycle(iteration)
+
            # 1. OBSERVE: Capture state
            log.info("[OBSERVE] Capturing game state...")
            state = await self.capture_state()
@@ -715,11 +742,24 @@ class BannerlordHarness:
            log.info(f"  Screen: {state.visual.screen_size}")
            log.info(f"  Players online: {state.game_context.current_players_online}")

+            # Populate trace with observation data
+            if trace_cycle:
+                trace_cycle.screenshot_path = state.visual.screenshot_path or ""
+                trace_cycle.window_found = state.visual.window_found
+                trace_cycle.screen_size = list(state.visual.screen_size)
+                trace_cycle.mouse_position = list(state.visual.mouse_position)
+                trace_cycle.playtime_hours = state.game_context.playtime_hours
+                trace_cycle.players_online = state.game_context.current_players_online
+                trace_cycle.is_running = state.game_context.is_running
+
            # 2. DECIDE: Get actions from decision function
            log.info("[DECIDE] Getting actions...")
            actions = decision_fn(state)
            log.info(f"  Decision returned {len(actions)} actions")

+            if trace_cycle:
+                trace_cycle.actions_planned = actions
+
            # 3. ACT: Execute actions
            log.info("[ACT] Executing actions...")
            results = []
@@ -731,6 +771,13 @@ class BannerlordHarness:
                if result.error:
                    log.info(f"    Error: {result.error}")

+                if trace_cycle:
+                    trace_cycle.actions_executed.append(result.to_dict())
+
+            # Finalize trace cycle
+            if trace_cycle:
+                self.trace_logger.finish_cycle(trace_cycle)
+
            # Send cycle summary telemetry
            await self._send_telemetry({
                "type": "oda_cycle_complete",
@@ -836,12 +883,18 @@ async def main():
        default=1.0,
        help="Delay between iterations in seconds (default: 1.0)",
    )
+    parser.add_argument(
+        "--trace",
+        action="store_true",
+        help="Enable session trace logging to ~/.timmy/traces/bannerlord/",
+    )
    args = parser.parse_args()

    # Create harness
    harness = BannerlordHarness(
        hermes_ws_url=args.hermes_ws,
        enable_mock=args.mock,
+        enable_trace=args.trace,
    )

    try:
--- a/nexus/bannerlord_trace.py
+++ b/nexus/bannerlord_trace.py
@@ -0,0 +1,234 @@
+#!/usr/bin/env python3
+"""
+Bannerlord Session Trace Logger — First-Replayable Training Material
+
+Captures one Bannerlord session as a replayable trace:
+  - Timestamps on every cycle
+  - Actions executed with success/failure
+  - World-state evidence (screenshots, Steam stats)
+  - Hermes session/log ID mapping
+
+Storage: ~/.timmy/traces/bannerlord/trace_<session_id>.jsonl
+Manifest: ~/.timmy/traces/bannerlord/manifest_<session_id>.json
+
+Each JSONL line is one ODA cycle with full context.
+The manifest bundles metadata for replay/eval.
+"""
+
+from __future__ import annotations
+
+import json
+import time
+import uuid
+from dataclasses import dataclass, field, asdict
+from datetime import datetime, timezone
+from pathlib import Path
+from typing import Optional
+
+# Storage root — local-first under ~/.timmy/
+DEFAULT_TRACE_DIR = Path.home() / ".timmy" / "traces" / "bannerlord"
+
+
+@dataclass
+class CycleTrace:
+    """One ODA cycle captured in full."""
+    cycle_index: int
+    timestamp_start: str
+    timestamp_end: str = ""
+    duration_ms: int = 0
+
+    # Observe
+    screenshot_path: str = ""
+    window_found: bool = False
+    screen_size: list[int] = field(default_factory=lambda: [1920, 1080])
+    mouse_position: list[int] = field(default_factory=lambda: [0, 0])
+    playtime_hours: float = 0.0
+    players_online: int = 0
+    is_running: bool = False
+
+    # Decide
+    actions_planned: list[dict] = field(default_factory=list)
+    decision_note: str = ""
+
+    # Act
+    actions_executed: list[dict] = field(default_factory=list)
+    actions_succeeded: int = 0
+    actions_failed: int = 0
+
+    # Metadata
+    hermes_session_id: str = ""
+    hermes_log_id: str = ""
+    harness_session_id: str = ""
+
+    def to_dict(self) -> dict:
+        return asdict(self)
+
+
+@dataclass
+class SessionManifest:
+    """Top-level metadata for a captured session trace."""
+    trace_id: str
+    harness_session_id: str
+    hermes_session_id: str
+    hermes_log_id: str
+    game: str = "Mount & Blade II: Bannerlord"
+    app_id: int = 261550
+    started_at: str = ""
+    finished_at: str = ""
+    total_cycles: int = 0
+    total_actions: int = 0
+    total_succeeded: int = 0
+    total_failed: int = 0
+    trace_file: str = ""
+    trace_dir: str = ""
+    replay_command: str = ""
+    eval_note: str = ""
+
+    def to_dict(self) -> dict:
+        return asdict(self)
+
+
+class BannerlordTraceLogger:
+    """
+    Captures a single Bannerlord session as a replayable trace.
+
+    Usage:
+        logger = BannerlordTraceLogger(hermes_session_id="abc123")
+        logger.start_session()
+        cycle = logger.begin_cycle(0)
+        # ... populate cycle fields ...
+        logger.finish_cycle(cycle)
+        manifest = logger.finish_session()
+    """
+
+    def __init__(
+        self,
+        trace_dir: Optional[Path] = None,
+        harness_session_id: str = "",
+        hermes_session_id: str = "",
+        hermes_log_id: str = "",
+    ):
+        self.trace_dir = trace_dir or DEFAULT_TRACE_DIR
+        self.trace_dir.mkdir(parents=True, exist_ok=True)
+
+        self.trace_id = f"bl_{datetime.now(timezone.utc).strftime('%Y%m%d_%H%M%S')}_{uuid.uuid4().hex[:6]}"
+        self.harness_session_id = harness_session_id or str(uuid.uuid4())[:8]
+        self.hermes_session_id = hermes_session_id
+        self.hermes_log_id = hermes_log_id
+
+        self.trace_file = self.trace_dir / f"trace_{self.trace_id}.jsonl"
+        self.manifest_file = self.trace_dir / f"manifest_{self.trace_id}.json"
+
+        self.cycles: list[CycleTrace] = []
+        self.started_at: str = ""
+        self.finished_at: str = ""
+
+    def start_session(self) -> str:
+        """Begin a trace session. Returns trace_id."""
+        self.started_at = datetime.now(timezone.utc).isoformat()
+        return self.trace_id
+
+    def begin_cycle(self, cycle_index: int) -> CycleTrace:
+        """Start recording one ODA cycle."""
+        cycle = CycleTrace(
+            cycle_index=cycle_index,
+            timestamp_start=datetime.now(timezone.utc).isoformat(),
+            harness_session_id=self.harness_session_id,
+            hermes_session_id=self.hermes_session_id,
+            hermes_log_id=self.hermes_log_id,
+        )
+        return cycle
+
+    def finish_cycle(self, cycle: CycleTrace) -> None:
+        """Finalize and persist one cycle to the trace file."""
+        cycle.timestamp_end = datetime.now(timezone.utc).isoformat()
+        # Compute duration
+        try:
+            t0 = datetime.fromisoformat(cycle.timestamp_start)
+            t1 = datetime.fromisoformat(cycle.timestamp_end)
+            cycle.duration_ms = int((t1 - t0).total_seconds() * 1000)
+        except (ValueError, TypeError):
+            cycle.duration_ms = 0
+
+        # Count successes/failures
+        cycle.actions_succeeded = sum(
+            1 for a in cycle.actions_executed if a.get("success", False)
+        )
+        cycle.actions_failed = sum(
+            1 for a in cycle.actions_executed if not a.get("success", True)
+        )
+
+        self.cycles.append(cycle)
+
+        # Append to JSONL
+        with open(self.trace_file, "a") as f:
+            f.write(json.dumps(cycle.to_dict()) + "\n")
+
+    def finish_session(self) -> SessionManifest:
+        """Finalize the session and write the manifest."""
+        self.finished_at = datetime.now(timezone.utc).isoformat()
+
+        total_actions = sum(len(c.actions_executed) for c in self.cycles)
+        total_succeeded = sum(c.actions_succeeded for c in self.cycles)
+        total_failed = sum(c.actions_failed for c in self.cycles)
+
+        manifest = SessionManifest(
+            trace_id=self.trace_id,
+            harness_session_id=self.harness_session_id,
+            hermes_session_id=self.hermes_session_id,
+            hermes_log_id=self.hermes_log_id,
+            started_at=self.started_at,
+            finished_at=self.finished_at,
+            total_cycles=len(self.cycles),
+            total_actions=total_actions,
+            total_succeeded=total_succeeded,
+            total_failed=total_failed,
+            trace_file=str(self.trace_file),
+            trace_dir=str(self.trace_dir),
+            replay_command=(
+                f"python -m nexus.bannerlord_harness --mock --replay {self.trace_file}"
+            ),
+            eval_note=(
+                "To replay: load this trace, re-execute each cycle's actions_planned "
+                "against a fresh harness in mock mode, compare actions_executed outcomes. "
+                "Success metric: >=90% action parity between original and replay runs."
+            ),
+        )
+
+        with open(self.manifest_file, "w") as f:
+            json.dump(manifest.to_dict(), f, indent=2)
+
+        return manifest
+
+    @classmethod
+    def load_trace(cls, trace_file: Path) -> list[dict]:
+        """Load a trace JSONL file for replay or analysis."""
+        cycles = []
+        with open(trace_file) as f:
+            for line in f:
+                line = line.strip()
+                if line:
+                    cycles.append(json.loads(line))
+        return cycles
+
+    @classmethod
+    def load_manifest(cls, manifest_file: Path) -> dict:
+        """Load a session manifest."""
+        with open(manifest_file) as f:
+            return json.load(f)
+
+    @classmethod
+    def list_traces(cls, trace_dir: Optional[Path] = None) -> list[dict]:
+        """List all available trace sessions."""
+        d = trace_dir or DEFAULT_TRACE_DIR
+        if not d.exists():
+            return []
+
+        traces = []
+        for mf in sorted(d.glob("manifest_*.json")):
+            try:
+                manifest = cls.load_manifest(mf)
+                traces.append(manifest)
+            except (json.JSONDecodeError, IOError):
+                continue
+        return traces
--- a/nexus/traces/bannerlord/REPLAY.md
+++ b/nexus/traces/bannerlord/REPLAY.md
@@ -0,0 +1,97 @@
+# Bannerlord Session Trace — Replay & Eval Guide
+
+## Storage Layout
+
+All traces live under `~/.timmy/traces/bannerlord/`:
+
+```
+~/.timmy/traces/bannerlord/
+  trace_<trace_id>.jsonl    # One line per ODA cycle (full state + actions)
+  manifest_<trace_id>.json  # Session metadata, counts, replay command
+```
+
+## Trace Format (JSONL)
+
+Each line is one ODA cycle:
+
+```json
+{
+  "cycle_index": 0,
+  "timestamp_start": "2026-04-10T20:15:00+00:00",
+  "timestamp_end": "2026-04-10T20:15:45+00:00",
+  "duration_ms": 45000,
+
+  "screenshot_path": "/tmp/bannerlord_capture_1744320900.png",
+  "window_found": true,
+  "screen_size": [1920, 1080],
+  "mouse_position": [960, 540],
+  "playtime_hours": 142.5,
+  "players_online": 8421,
+  "is_running": true,
+
+  "actions_planned": [{"type": "move_to", "x": 960, "y": 540}],
+  "actions_executed": [{"success": true, "action": "move_to", ...}],
+  "actions_succeeded": 1,
+  "actions_failed": 0,
+
+  "hermes_session_id": "f47ac10b",
+  "hermes_log_id": "",
+  "harness_session_id": "f47ac10b"
+}
+```
+
+## Capturing a Trace
+
+```bash
+# Run harness with trace logging enabled
+cd /path/to/the-nexus
+python -m nexus.bannerlord_harness --mock --trace --iterations 3
+```
+
+The trace and manifest are written to `~/.timmy/traces/bannerlord/` on harness shutdown.
+
+## Replay Protocol
+
+1. Load a trace: `BannerlordTraceLogger.load_trace(trace_file)`
+2. Create a fresh harness in mock mode
+3. For each cycle in the trace:
+   - Re-execute the `actions_planned` list
+   - Compare actual `actions_executed` outcomes against the recorded ones
+4. Score: `(matching_actions / total_actions) * 100`
+
+### Eval Criteria
+
+| Score   | Grade    | Meaning                                    |
+|---------|----------|--------------------------------------------|
+| >= 90%  | PASS     | Replay matches original closely            |
+| 70-89%  | PARTIAL  | Some divergence, investigate differences   |
+| < 70%   | FAIL     | Significant drift, review action semantics |
+
+## Replay Script (sketch)
+
+```python
+from nexus.bannerlord_trace import BannerlordTraceLogger
+from nexus.bannerlord_harness import BannerlordHarness
+
+# Load trace
+cycles = BannerlordTraceLogger.load_trace(
+    Path.home() / ".timmy" / "traces" / "bannerlord" / "trace_bl_xxx.jsonl"
+)
+
+# Replay
+harness = BannerlordHarness(enable_mock=True, enable_trace=False)
+await harness.start()
+
+for cycle in cycles:
+    for action in cycle["actions_planned"]:
+        result = await harness.execute_action(action)
+        # Compare result against cycle["actions_executed"]
+
+await harness.stop()
+```
+
+## Hermes Session Mapping
+
+The `hermes_session_id` and `hermes_log_id` fields link traces to Hermes session logs.
+When a trace is captured during a live Hermes session, populate these fields so
+the trace can be correlated with the broader agent conversation context.
--- a/nexus/traces/bannerlord/sample_manifest.json
+++ b/nexus/traces/bannerlord/sample_manifest.json
@@ -0,0 +1,18 @@
+{
+  "trace_id": "bl_20260410_201500_a1b2c3",
+  "harness_session_id": "f47ac10b",
+  "hermes_session_id": "f47ac10b",
+  "hermes_log_id": "",
+  "game": "Mount & Blade II: Bannerlord",
+  "app_id": 261550,
+  "started_at": "2026-04-10T20:15:00+00:00",
+  "finished_at": "2026-04-10T20:17:30+00:00",
+  "total_cycles": 3,
+  "total_actions": 6,
+  "total_succeeded": 6,
+  "total_failed": 0,
+  "trace_file": "~/.timmy/traces/bannerlord/trace_bl_20260410_201500_a1b2c3.jsonl",
+  "trace_dir": "~/.timmy/traces/bannerlord",
+  "replay_command": "python -m nexus.bannerlord_harness --mock --replay ~/.timmy/traces/bannerlord/trace_bl_20260410_201500_a1b2c3.jsonl",
+  "eval_note": "To replay: load trace, re-execute each cycle's actions_planned against a fresh harness in mock mode, compare actions_executed outcomes. Success metric: >=90% action parity between original and replay runs."
+}
--- a/nexus/traces/bannerlord/sample_trace.jsonl
+++ b/nexus/traces/bannerlord/sample_trace.jsonl
@@ -0,0 +1,3 @@
+{"cycle_index": 0, "timestamp_start": "2026-04-10T20:15:00+00:00", "timestamp_end": "2026-04-10T20:15:45+00:00", "duration_ms": 45000, "screenshot_path": "/tmp/bannerlord_capture_1744320900.png", "window_found": true, "screen_size": [1920, 1080], "mouse_position": [960, 540], "playtime_hours": 142.5, "players_online": 8421, "is_running": true, "actions_planned": [{"type": "move_to", "x": 960, "y": 540}, {"type": "press_key", "key": "space"}], "decision_note": "Initial state capture. Move to screen center and press space to advance.", "actions_executed": [{"success": true, "action": "move_to", "params": {"type": "move_to", "x": 960, "y": 540}, "timestamp": "2026-04-10T20:15:30+00:00", "error": null}, {"success": true, "action": "press_key", "params": {"type": "press_key", "key": "space"}, "timestamp": "2026-04-10T20:15:45+00:00", "error": null}], "actions_succeeded": 2, "actions_failed": 0, "hermes_session_id": "f47ac10b", "hermes_log_id": "", "harness_session_id": "f47ac10b"}
+{"cycle_index": 1, "timestamp_start": "2026-04-10T20:15:45+00:00", "timestamp_end": "2026-04-10T20:16:30+00:00", "duration_ms": 45000, "screenshot_path": "/tmp/bannerlord_capture_1744320945.png", "window_found": true, "screen_size": [1920, 1080], "mouse_position": [960, 540], "playtime_hours": 142.5, "players_online": 8421, "is_running": true, "actions_planned": [{"type": "press_key", "key": "p"}], "decision_note": "Open party screen to inspect troops.", "actions_executed": [{"success": true, "action": "press_key", "params": {"type": "press_key", "key": "p"}, "timestamp": "2026-04-10T20:16:00+00:00", "error": null}], "actions_succeeded": 1, "actions_failed": 0, "hermes_session_id": "f47ac10b", "hermes_log_id": "", "harness_session_id": "f47ac10b"}
+{"cycle_index": 2, "timestamp_start": "2026-04-10T20:16:30+00:00", "timestamp_end": "2026-04-10T20:17:30+00:00", "duration_ms": 60000, "screenshot_path": "/tmp/bannerlord_capture_1744321020.png", "window_found": true, "screen_size": [1920, 1080], "mouse_position": [960, 540], "playtime_hours": 142.5, "players_online": 8421, "is_running": true, "actions_planned": [{"type": "press_key", "key": "escape"}, {"type": "move_to", "x": 500, "y": 300}, {"type": "click", "x": 500, "y": 300}], "decision_note": "Close party screen, click on campaign map settlement.", "actions_executed": [{"success": true, "action": "press_key", "params": {"type": "press_key", "key": "escape"}, "timestamp": "2026-04-10T20:16:45+00:00", "error": null}, {"success": true, "action": "move_to", "params": {"type": "move_to", "x": 500, "y": 300}, "timestamp": "2026-04-10T20:17:00+00:00", "error": null}, {"success": true, "action": "click", "params": {"type": "click", "x": 500, "y": 300}, "timestamp": "2026-04-10T20:17:30+00:00", "error": null}], "actions_succeeded": 3, "actions_failed": 0, "hermes_session_id": "f47ac10b", "hermes_log_id": "", "harness_session_id": "f47ac10b"}
--- a/style.css
+++ b/style.css
@@ -983,7 +983,7 @@ canvas#nexus-canvas {

 .chat-quick-actions {
  display: flex;
-  flex-direction: column;
+  flex-wrap: wrap;
  gap: 6px;
  padding: 8px 12px;
  border-top: 1px solid var(--color-border);
@@ -991,75 +991,6 @@ canvas#nexus-canvas {
  pointer-events: auto;
 }

-.chat-quick-actions.hidden {
-  display: none;
-}
-
-.starter-label {
-  font-family: var(--font-display);
-  font-size: 9px;
-  letter-spacing: 0.15em;
-  color: var(--color-primary-dim);
-  text-transform: uppercase;
-  padding: 0 2px;
-}
-
-.starter-grid {
-  display: grid;
-  grid-template-columns: repeat(3, 1fr);
-  gap: 4px;
-}
-
-.starter-btn {
-  display: flex;
-  flex-direction: column;
-  align-items: flex-start;
-  gap: 1px;
-  background: rgba(74, 240, 192, 0.06);
-  border: 1px solid rgba(74, 240, 192, 0.15);
-  color: var(--color-primary);
-  font-family: var(--font-body);
-  padding: 6px 8px;
-  cursor: pointer;
-  transition: all var(--transition-ui);
-  text-align: left;
-}
-
-.starter-btn:hover {
-  background: rgba(74, 240, 192, 0.15);
-  border-color: var(--color-primary);
-  color: #fff;
-}
-
-.starter-btn:hover .starter-icon {
-  color: #fff;
-}
-
-.starter-btn:active {
-  transform: scale(0.97);
-}
-
-.starter-icon {
-  font-size: 12px;
-  color: var(--color-primary);
-  line-height: 1;
-}
-
-.starter-text {
-  font-size: 10px;
-  font-weight: 600;
-  white-space: nowrap;
-}
-
-.starter-desc {
-  font-size: 8px;
-  color: rgba(74, 240, 192, 0.5);
-  white-space: nowrap;
-  overflow: hidden;
-  text-overflow: ellipsis;
-  max-width: 100%;
-}
-
 /* Add hover effect for MemPalace mining button */
 .quick-action-btn:hover {
  background: var(--color-primary-dim);
@@ -1205,9 +1136,6 @@ canvas#nexus-canvas {
  .hud-location {
    font-size: var(--text-xs);
  }
-  .starter-grid {
-    grid-template-columns: repeat(2, 1fr);
-  }
 }

@media (max-width: 480px) {