[P0] Build ResearchOrchestrator pipeline (src/timmy/research.py) #975

New Issue

perplexity · 2026-03-22T19:08:53Z

perplexity commented

2026-03-22 19:08:53 +00:00

Parent

#972 — [GOVERNING] Replacing Claude — Autonomous Research Pipeline Spec

Objective

Implement the main research pipeline that chains Scope→Query→Search→Fetch→Synthesize→Deliver into an autonomous workflow. This is the core of research sovereignty.

Scope

Implement ResearchOrchestrator class with:

class ResearchOrchestrator:
    def __init__(self, cascade, memory, tools)
    async def run(self, topic, template, context) -> ResearchResult

Pipeline Steps:

CHECK LOCAL KNOWLEDGE FIRST — memory.search(topic, limit=10). If confidence > 0.85, return cached result. This is the critical line.
GENERATE QUERIES — Fill template, ask cascade to generate 8-12 search queries
SEARCH — Execute queries via web_search, collect top 5 results per query
FETCH — Rank snippets by relevance, fetch top 10 full pages via web_fetch (3000 tokens each)
SYNTHESIZE — Pass filled template + fetched pages to cascade.generate (max_tokens=4000)
CRYSTALLIZE — Store result in semantic memory (memory.store(topic, report, type="research"))
WRITE ARTIFACT — Commit to repo, extract action items, create Gitea issues

Dependencies

web_fetch tool (sibling P0 issue)
Research templates (sibling P0 issue)
cascade.py (exists — LLM router)
Semantic memory (exists or P1 enhancement)

Key Design Notes

Runs as Paperclip task via DistributedWorker (P1 integration)
The cascade router passes template's cascade_tier hint for model selection
Every research output gets embedded → compound interest of crystallized knowledge
Record metrics: research_cache_hit, research_api_call

Effort Estimate

1 day

Acceptance Criteria

Pipeline runs end-to-end: topic in → structured report out
Local knowledge check works (cache hit returns instantly)
Results are stored in semantic memory for future queries
Gitea issues are created from extracted action items
Metrics are recorded for sovereignty tracking

## Parent - #972 — [GOVERNING] Replacing Claude — Autonomous Research Pipeline Spec ## Objective Implement the main research pipeline that chains Scope→Query→Search→Fetch→Synthesize→Deliver into an autonomous workflow. This is the core of research sovereignty. ## Scope Implement `ResearchOrchestrator` class with: ``` class ResearchOrchestrator: def __init__(self, cascade, memory, tools) async def run(self, topic, template, context) -> ResearchResult ``` ### Pipeline Steps: 0. **CHECK LOCAL KNOWLEDGE FIRST** — `memory.search(topic, limit=10)`. If confidence > 0.85, return cached result. This is the critical line. 1. **GENERATE QUERIES** — Fill template, ask cascade to generate 8-12 search queries 2. **SEARCH** — Execute queries via web_search, collect top 5 results per query 3. **FETCH** — Rank snippets by relevance, fetch top 10 full pages via web_fetch (3000 tokens each) 4. **SYNTHESIZE** — Pass filled template + fetched pages to cascade.generate (max_tokens=4000) 5. **CRYSTALLIZE** — Store result in semantic memory (`memory.store(topic, report, type="research")`) 6. **WRITE ARTIFACT** — Commit to repo, extract action items, create Gitea issues ## Dependencies - web_fetch tool (sibling P0 issue) - Research templates (sibling P0 issue) - cascade.py (exists — LLM router) - Semantic memory (exists or P1 enhancement) ## Key Design Notes - Runs as Paperclip task via DistributedWorker (P1 integration) - The cascade router passes template's `cascade_tier` hint for model selection - Every research output gets embedded → compound interest of crystallized knowledge - Record metrics: `research_cache_hit`, `research_api_call` ## Effort Estimate 1 day ## Acceptance Criteria - [ ] Pipeline runs end-to-end: topic in → structured report out - [ ] Local knowledge check works (cache hit returns instantly) - [ ] Results are stored in semantic memory for future queries - [ ] Gitea issues are created from extracted action items - [ ] Metrics are recorded for sovereignty tracking

perplexity referenced this issue

2026-03-22 19:12:48 +00:00

[GOVERNING] Replacing Claude — Autonomous Research Pipeline Spec #972

claude was assigned by Rockachopa

2026-03-22 21:44:41 +00:00

Rockachopa referenced this issue from a commit

2026-03-22 22:44:27 +00:00

feat: add ResearchOrchestrator pipeline (src/timmy/research.py)

Rockachopa referenced a pull request that will close this issue

2026-03-22 22:44:39 +00:00

[claude] Add ResearchOrchestrator pipeline (#975) #1000

Rockachopa commented

2026-03-22 22:44:48 +00:00

PR #1000 created.

Implemented ResearchOrchestrator in src/timmy/research.py with full 7-step pipeline: local knowledge check → query generation → web search → fetch → synthesize → crystallize → write artifact. Includes 25 unit tests, graceful degradation at every step, and Gitea issue creation from extracted action items.

PR #1000 created. Implemented `ResearchOrchestrator` in `src/timmy/research.py` with full 7-step pipeline: local knowledge check → query generation → web search → fetch → synthesize → crystallize → write artifact. Includes 25 unit tests, graceful degradation at every step, and Gitea issue creation from extracted action items.

Rockachopa closed this issue

2026-03-22 22:45:05 +00:00

claude referenced this issue from a commit

2026-03-24 01:40:15 +00:00

feat: implement autonomous research pipeline (#972)

claude referenced this issue

2026-03-24 01:40:33 +00:00

[claude] Autonomous research pipeline — orchestrator + SOVEREIGNTY.md (#972) #1274

claude referenced this issue

2026-03-24 01:40:45 +00:00

[GOVERNING] Replacing Claude — Autonomous Research Pipeline Spec #972

claude referenced this issue

2026-03-24 01:56:29 +00:00

research: evaluate DeerFlow as autonomous research orchestration layer #1283

Sign in to join this conversation.

Branches Tags

main

gemini/issue-892

claude/issue-1342

claude/issue-1346

claude/issue-1351

claude/issue-1340

fix/test-llm-triage-syntax

gemini/issue-1014

gemini/issue-932

claude/issue-1277

claude/issue-1139

claude/issue-870

claude/issue-1285

claude/issue-1292

claude/issue-1281

claude/issue-917

claude/issue-1275

claude/issue-925

claude/issue-1019

claude/issue-1094

claude/issue-1019-v3

fix/flaky-vassal-xdist-tests

fix/test-config-env-isolation

claude/issue-1019-v2

claude/issue-957-v2

claude/issue-1218

claude/issue-1217

test/chat-store-unit-tests

claude/issue-1191

claude/issue-1186

claude/issue-957

gemini/issue-936

claude/issue-1065

gemini/issue-976

gemini/issue-1149

claude/issue-1135

claude/issue-1064

gemini/issue-1012

claude/issue-1095

claude/issue-1102

claude/issue-1114

gemini/issue-978

gemini/issue-971

claude/issue-1074

claude/issue-987

claude/issue-1011

feature/internal-monologue

feature/issue-1006

feature/issue-1007

feature/issue-1008

feature/issue-1009

feature/issue-1010

feature/issue-1011

feature/issue-1012

feature/issue-1013

feature/issue-1014

feature/issue-981

feature/issue-982

feature/issue-983

feature/issue-984

feature/issue-985

feature/issue-986

feature/issue-987

feature/issue-993

claude/issue-943

claude/issue-975

claude/issue-989

claude/issue-988

fix/loop-guard-gitea-api-and-queue-validation

feature/lhf-tech-debt-fixes

kimi/issue-753

kimi/issue-714

kimi/issue-716

fix/csrf-check-before-execute

chore/migrate-gitea-to-vps

kimi/issue-640

fix/utcnow-calm-py

kimi/issue-635

kimi/issue-625

fix/router-api-truncated-param

kimi/issue-604

kimi/issue-594

review-fixes

kimi/issue-570

kimi/issue-554

kimi/issue-539

kimi/issue-540

feature/ipad-v1-api

kimi/issue-506

kimi/issue-512

refactor/airllm-doc-cleanup

kimi/issue-513

kimi/issue-514

kimi/issue-500

kimi/issue-492

kimi/issue-490

kimi/issue-459

kimi/issue-472

kimi/issue-473

kimi/issue-462

kimi/issue-463

kimi/issue-454

kimi/issue-445

kimi/issue-446

kimi/issue-431

2 Participants

Notifications

Due Date

No due date set.

Dependencies

No dependencies set.

Reference: Rockachopa/Timmy-time-dashboard#975