Fact distillation stores garbage and leaks secrets #40

New Issue

hermes · 2026-03-14T16:49:43Z

hermes commented

2026-03-14 16:49:43 +00:00

Problem

thinking.py _distill_facts_from_thoughts() asks the LLM to extract "facts worth remembering" and stores them. The stored facts are useless or dangerous:

Examples from episodes table:
- "Self-declarative personality labels function as character markers"
- "Standing rules function as guidance systems"
- "Working RAM timestamps persist unchanged during active sessions"
- "Gitea authentication token location: ~/.config/gitea/token"  ← SECURITY LEAK

All meta-observations about Timmy's own output. Nothing about the user, project, or world.

Root Cause

Distillation prompt (~line 350) doesn't:

Exclude self-referential observations
Filter sensitive information (tokens, passwords, paths)
Require facts to be about external reality
Deduplicate semantically (current 0.9 threshold too high)

Acceptance Criteria

Distillation prompt excludes self-referential meta-observations
Sensitive patterns (token, password, secret, key, config paths) rejected before storage
Stored facts are about: user preferences, project decisions, technical knowledge
Existing garbage facts purged
Dedup threshold lowered (0.9 → 0.7) to catch paraphrases

Files

src/timmy/thinking.py — _distill_facts_from_thoughts()
src/timmy/semantic_memory.py — memory_write() dedup

Priority: MEDIUM — prompt fix can land independently, full fix depends on memory consolidation

## Problem `thinking.py` `_distill_facts_from_thoughts()` asks the LLM to extract "facts worth remembering" and stores them. The stored facts are useless or dangerous: ``` Examples from episodes table: - "Self-declarative personality labels function as character markers" - "Standing rules function as guidance systems" - "Working RAM timestamps persist unchanged during active sessions" - "Gitea authentication token location: ~/.config/gitea/token" ← SECURITY LEAK ``` All meta-observations about Timmy's own output. Nothing about the user, project, or world. ## Root Cause Distillation prompt (~line 350) doesn't: - Exclude self-referential observations - Filter sensitive information (tokens, passwords, paths) - Require facts to be about external reality - Deduplicate semantically (current 0.9 threshold too high) ## Acceptance Criteria - [ ] Distillation prompt excludes self-referential meta-observations - [ ] Sensitive patterns (token, password, secret, key, config paths) rejected before storage - [ ] Stored facts are about: user preferences, project decisions, technical knowledge - [ ] Existing garbage facts purged - [ ] Dedup threshold lowered (0.9 → 0.7) to catch paraphrases ## Files - `src/timmy/thinking.py` — `_distill_facts_from_thoughts()` - `src/timmy/semantic_memory.py` — `memory_write()` dedup ## Priority: MEDIUM — prompt fix can land independently, full fix depends on memory consolidation

hermes referenced this issue from a commit

2026-03-14 17:00:48 +00:00

fix: fact distillation — block garbage and secrets, improve dedup

hermes referenced a pull request that will close this issue

2026-03-14 17:00:57 +00:00

fix: fact distillation — block garbage and secrets, improve dedup #43

hermes closed this issue

2026-03-14 17:00:59 +00:00

perplexity referenced this issue

2026-03-19 01:41:50 +00:00

[EPIC] #222 — The Workshop: Timmy as Presence, Not Chatbot #222

Sign in to join this conversation.

Branches Tags

main

gemini/issue-892

claude/issue-1342

claude/issue-1346

claude/issue-1351

claude/issue-1340

fix/test-llm-triage-syntax

gemini/issue-1014

gemini/issue-932

claude/issue-1277

claude/issue-1139

claude/issue-870

claude/issue-1285

claude/issue-1292

claude/issue-1281

claude/issue-917

claude/issue-1275

claude/issue-925

claude/issue-1019

claude/issue-1094

claude/issue-1019-v3

fix/flaky-vassal-xdist-tests

fix/test-config-env-isolation

claude/issue-1019-v2

claude/issue-957-v2

claude/issue-1218

claude/issue-1217

test/chat-store-unit-tests

claude/issue-1191

claude/issue-1186

claude/issue-957

gemini/issue-936

claude/issue-1065

gemini/issue-976

gemini/issue-1149

claude/issue-1135

claude/issue-1064

gemini/issue-1012

claude/issue-1095

claude/issue-1102

claude/issue-1114

gemini/issue-978

gemini/issue-971

claude/issue-1074

claude/issue-987

claude/issue-1011

feature/internal-monologue

feature/issue-1006

feature/issue-1007

feature/issue-1008

feature/issue-1009

feature/issue-1010

feature/issue-1011

feature/issue-1012

feature/issue-1013

feature/issue-1014

feature/issue-981

feature/issue-982

feature/issue-983

feature/issue-984

feature/issue-985

feature/issue-986

feature/issue-987

feature/issue-993

claude/issue-943

claude/issue-975

claude/issue-989

claude/issue-988

fix/loop-guard-gitea-api-and-queue-validation

feature/lhf-tech-debt-fixes

kimi/issue-753

kimi/issue-714

kimi/issue-716

fix/csrf-check-before-execute

chore/migrate-gitea-to-vps

kimi/issue-640

fix/utcnow-calm-py

kimi/issue-635

kimi/issue-625

fix/router-api-truncated-param

kimi/issue-604

kimi/issue-594

review-fixes

kimi/issue-570

kimi/issue-554

kimi/issue-539

kimi/issue-540

feature/ipad-v1-api

kimi/issue-506

kimi/issue-512

refactor/airllm-doc-cleanup

kimi/issue-513

kimi/issue-514

kimi/issue-500

kimi/issue-492

kimi/issue-490

kimi/issue-459

kimi/issue-472

kimi/issue-473

kimi/issue-462

kimi/issue-463

kimi/issue-454

kimi/issue-445

kimi/issue-446

kimi/issue-431

1 Participants

Notifications

Due Date

No due date set.

Dependencies

No dependencies set.

Reference: Rockachopa/Timmy-time-dashboard#40