[loop-generated] [refactor] Split memory_system.py — 1577 lines violates single responsibility #344

New Issue

hermes · 2026-03-19T00:44:32Z

hermes commented

2026-03-19 00:44:32 +00:00

Problem

src/timmy/memory_system.py is the largest file in the codebase at 1577 lines. It contains:

Embedding functions (hash fallback, cosine similarity)
Database operations (SQLite CRUD)
HotMemory class (MEMORY.md file operations)
VaultMemory class (filesystem vault)
MemorySystem orchestrator
SemanticMemory class (vector search)
MemorySearcher class
Tool functions (memory_search, memory_read, memory_write, memory_forget)
Artifact tools (jot_note, log_decision) — recently added

These are at least 5 distinct concerns in one file.

Proposed split

src/timmy/memory/
    __init__.py          — public API re-exports
    embeddings.py        — embed_text, cosine_similarity, hash fallback
    database.py          — SQLite operations, store/search/delete
    hot.py               — HotMemory (MEMORY.md management)
    vault.py             — VaultMemory (filesystem)
    system.py            — MemorySystem orchestrator
    semantic.py          — SemanticMemory, MemorySearcher
    tools.py             — memory_search/read/write/forget tool functions
    artifacts.py         — jot_note, log_decision

Note: src/timmy/memory/ already exists with unified.py and vector_store.py. This refactor would consolidate both the old and new memory code into one coherent package.

Risk

High. Memory is critical path. Extensive test coverage exists but all imports would change.
Recommend: do it in phases. Extract one module at a time, update imports, verify tests.
Phase 1: Extract embeddings.py (pure functions, no side effects)
Phase 2: Extract artifacts.py (new code, few importers)
Phase 3-N: One module at a time

Who

Multi-ticket work. Architecture decision needed from Alexander.

Why

Lines of code are a liability. 1577-line files are hard to navigate, test, and reason about.

## Problem `src/timmy/memory_system.py` is the largest file in the codebase at 1577 lines. It contains: - Embedding functions (hash fallback, cosine similarity) - Database operations (SQLite CRUD) - HotMemory class (MEMORY.md file operations) - VaultMemory class (filesystem vault) - MemorySystem orchestrator - SemanticMemory class (vector search) - MemorySearcher class - Tool functions (memory_search, memory_read, memory_write, memory_forget) - Artifact tools (jot_note, log_decision) — recently added These are at least 5 distinct concerns in one file. ## Proposed split ``` src/timmy/memory/ __init__.py — public API re-exports embeddings.py — embed_text, cosine_similarity, hash fallback database.py — SQLite operations, store/search/delete hot.py — HotMemory (MEMORY.md management) vault.py — VaultMemory (filesystem) system.py — MemorySystem orchestrator semantic.py — SemanticMemory, MemorySearcher tools.py — memory_search/read/write/forget tool functions artifacts.py — jot_note, log_decision ``` Note: `src/timmy/memory/` already exists with `unified.py` and `vector_store.py`. This refactor would consolidate both the old and new memory code into one coherent package. ## Risk - High. Memory is critical path. Extensive test coverage exists but all imports would change. - Recommend: do it in phases. Extract one module at a time, update imports, verify tests. - Phase 1: Extract embeddings.py (pure functions, no side effects) - Phase 2: Extract artifacts.py (new code, few importers) - Phase 3-N: One module at a time ## Who Multi-ticket work. Architecture decision needed from Alexander. ## Why Lines of code are a liability. 1577-line files are hard to navigate, test, and reason about.

hermes commented

2026-03-19 01:17:19 +00:00

Architecture Decision: Phased Extraction

This is too large for a single PR. Breaking into phases:

Phase 1: Extract embeddings.py (Lines 34-112, ~78 lines)

Pure functions, zero side effects, lowest risk
, , , , , ,
Create
Update imports in to re-export from new location
Update and backward compat shims

Phase 2: Extract artifacts.py (Lines 1406-1482, ~76 lines)

, — recently added, few importers
Create
Only imports these directly

Phase 3-N: One module per PR (future)

hot.py (HotMemory), vault.py (VaultMemory), semantic.py, crud.py, tools.py, system.py

Unassigning from kimi. Creating scoped sub-issues.

## Architecture Decision: Phased Extraction This is too large for a single PR. Breaking into phases: ### Phase 1: Extract embeddings.py (Lines 34-112, ~78 lines) - Pure functions, zero side effects, lowest risk - , , , , , , - Create - Update imports in to re-export from new location - Update and backward compat shims ### Phase 2: Extract artifacts.py (Lines 1406-1482, ~76 lines) - , — recently added, few importers - Create - Only imports these directly ### Phase 3-N: One module per PR (future) - hot.py (HotMemory), vault.py (VaultMemory), semantic.py, crud.py, tools.py, system.py Unassigning from kimi. Creating scoped sub-issues.

hermes referenced this issue from a commit

2026-03-19 01:22:11 +00:00

refactor: extract embedding functions to memory/embeddings.py (#344)

hermes commented

2026-03-19 01:22:36 +00:00

Obsolete: memory_system.py belongs to old codebase being retired in Claude Code pivot.

hermes closed this issue

2026-03-19 01:22:36 +00:00

hermes referenced this issue

2026-03-19 01:24:13 +00:00

[loop-cycle-151] refactor: extract embedding functions to memory/embeddings.py (#344) #355

hermes referenced this issue from a commit

2026-03-19 01:24:52 +00:00

[loop-cycle-151] refactor: extract embedding functions to memory/embeddings.py (#344) (#355)

hermes commented

2026-03-19 01:26:08 +00:00

Progress update (cycle 151):

PR #355 merged — extracted embedding functions to memory/embeddings.py.

memory_system.py reduced from 1577 → 1507 lines (-70 lines).

Remaining extractions (in priority order):

SemanticMemory class (~270 lines, L896-1165) → memory/semantic.py
HotMemory class (~160 lines, L611-770) → memory/hot.py
VaultMemory class (~115 lines, L775-890) → memory/vault.py
Tool functions (~160 lines, L1176-1335) → memory/tools.py
Artifact tools (~70 lines, L1344-1412) → memory/artifacts.py
Database/schema (~140 lines, L50-192) → memory/database.py

Total remaining: ~915 lines extractable. Target: memory_system.py under 500 lines.

**Progress update (cycle 151):** PR #355 merged — extracted embedding functions to `memory/embeddings.py`. `memory_system.py` reduced from 1577 → 1507 lines (-70 lines). **Remaining extractions (in priority order):** 1. `SemanticMemory` class (~270 lines, L896-1165) → `memory/semantic.py` 2. `HotMemory` class (~160 lines, L611-770) → `memory/hot.py` 3. `VaultMemory` class (~115 lines, L775-890) → `memory/vault.py` 4. Tool functions (~160 lines, L1176-1335) → `memory/tools.py` 5. Artifact tools (~70 lines, L1344-1412) → `memory/artifacts.py` 6. Database/schema (~140 lines, L50-192) → `memory/database.py` Total remaining: ~915 lines extractable. Target: memory_system.py under 500 lines.

Sign in to join this conversation.

Branches Tags

main

gemini/issue-892

claude/issue-1342

claude/issue-1346

claude/issue-1351

claude/issue-1340

fix/test-llm-triage-syntax

gemini/issue-1014

gemini/issue-932

claude/issue-1277

claude/issue-1139

claude/issue-870

claude/issue-1285

claude/issue-1292

claude/issue-1281

claude/issue-917

claude/issue-1275

claude/issue-925

claude/issue-1019

claude/issue-1094

claude/issue-1019-v3

fix/flaky-vassal-xdist-tests

fix/test-config-env-isolation

claude/issue-1019-v2

claude/issue-957-v2

claude/issue-1218

claude/issue-1217

test/chat-store-unit-tests

claude/issue-1191

claude/issue-1186

claude/issue-957

gemini/issue-936

claude/issue-1065

gemini/issue-976

gemini/issue-1149

claude/issue-1135

claude/issue-1064

gemini/issue-1012

claude/issue-1095

claude/issue-1102

claude/issue-1114

gemini/issue-978

gemini/issue-971

claude/issue-1074

claude/issue-987

claude/issue-1011

feature/internal-monologue

feature/issue-1006

feature/issue-1007

feature/issue-1008

feature/issue-1009

feature/issue-1010

feature/issue-1011

feature/issue-1012

feature/issue-1013

feature/issue-1014

feature/issue-981

feature/issue-982

feature/issue-983

feature/issue-984

feature/issue-985

feature/issue-986

feature/issue-987

feature/issue-993

claude/issue-943

claude/issue-975

claude/issue-989

claude/issue-988

fix/loop-guard-gitea-api-and-queue-validation

feature/lhf-tech-debt-fixes

kimi/issue-753

kimi/issue-714

kimi/issue-716

fix/csrf-check-before-execute

chore/migrate-gitea-to-vps

kimi/issue-640

fix/utcnow-calm-py

kimi/issue-635

kimi/issue-625

fix/router-api-truncated-param

kimi/issue-604

kimi/issue-594

review-fixes

kimi/issue-570

kimi/issue-554

kimi/issue-539

kimi/issue-540

feature/ipad-v1-api

kimi/issue-506

kimi/issue-512

refactor/airllm-doc-cleanup

kimi/issue-513

kimi/issue-514

kimi/issue-500

kimi/issue-492

kimi/issue-490

kimi/issue-459

kimi/issue-472

kimi/issue-473

kimi/issue-462

kimi/issue-463

kimi/issue-454

kimi/issue-445

kimi/issue-446

kimi/issue-431

1 Participants

Notifications

Due Date

No due date set.

Dependencies

No dependencies set.

Reference: Rockachopa/Timmy-time-dashboard#344