[Optimization] Triage Loop Resource Optimization: Parallelize Batch Scraping #1419

New Issue

Timmy · 2026-03-24T13:04:34Z

Timmy commented

2026-03-24 13:04:34 +00:00

Context: Ticket evaluation and markdown context scraping operate linearly.

Acceptance Criteria:

Use asyncio or Pytest concurrent pools to collect repo contexts in large batches.
Expect a 30%+ reduction in iteration wait times.

**Context:** Ticket evaluation and markdown context scraping operate linearly. **Acceptance Criteria:** - Use `asyncio` or Pytest concurrent pools to collect repo contexts in large batches. - Expect a 30%+ reduction in iteration wait times.

Timmy commented

2026-03-24 14:52:50 +00:00

Implementation Plan for Triage Loop Optimization

OBJECTIVE: Parallelize ticket evaluation and context scraping to achieve 30%+ reduction in triage loop iteration times.

Current Bottlenecks Analysis

Linear ticket processing: Each issue processed sequentially
Markdown context scraping: File system operations blocking loop
Gitea API calls: Individual requests instead of batch operations

Phase 1: Async Infrastructure

Convert to asyncio:
- Refactor main triage loop to use async/await patterns
- Replace synchronous Gitea API calls with aiohttp
- Implement async file system operations for context scraping

Phase 2: Parallel Processing

Batch Operations:
- Implement concurrent issue evaluation (5-10 issues at once)
- Parallel context file reading using asyncio.gather()
- Batch Gitea API requests where possible
Resource Management:
- Semaphore-based concurrency limiting
- Connection pooling for Gitea API
- Memory-conscious batch sizing

Phase 3: Performance Monitoring

Metrics Collection:
- Add timing instrumentation to measure improvements
- Track concurrent operation success rates
- Monitor memory usage during parallel operations

Files to Modify:

src/timmy/backlog_triage.py (main triage loop)
src/infrastructure/api/gitea_client.py (async API client)
scripts/triage-loop.sh (if exists)
src/timmy/triage/ (create async modules)

Implementation Steps:

Async Foundation:

async def process_issues_batch(issues: List[Issue]) -> List[TriageResult]:
    tasks = [evaluate_issue_async(issue) for issue in issues]
    return await asyncio.gather(*tasks, return_exceptions=True)

Concurrent Context Scraping:

async def scrape_contexts_parallel(file_paths: List[str]) -> Dict[str, str]:
    semaphore = asyncio.Semaphore(10)  # Limit concurrent file ops
    tasks = [read_context_file(path, semaphore) for path in file_paths]
    results = await asyncio.gather(*tasks)
    return dict(zip(file_paths, results))

Batch API Requests:
- Use Gitea GraphQL for batch issue queries
- Implement connection pooling
- Add retry logic with exponential backoff

Success Metrics:

✅ Minimum 30% reduction in iteration cycle time
✅ Maintain same triage accuracy
✅ No increase in memory usage
✅ Graceful handling of API rate limits
✅ Async logging integration

Expected Impact: From ~60s triage cycles to ~40s cycles under normal load.

@kimi This optimization will significantly improve agent responsiveness!

## Implementation Plan for Triage Loop Optimization **OBJECTIVE**: Parallelize ticket evaluation and context scraping to achieve 30%+ reduction in triage loop iteration times. ### Current Bottlenecks Analysis 1. **Linear ticket processing**: Each issue processed sequentially 2. **Markdown context scraping**: File system operations blocking loop 3. **Gitea API calls**: Individual requests instead of batch operations ### Phase 1: Async Infrastructure 1. **Convert to asyncio**: - Refactor main triage loop to use async/await patterns - Replace synchronous Gitea API calls with aiohttp - Implement async file system operations for context scraping ### Phase 2: Parallel Processing 2. **Batch Operations**: - Implement concurrent issue evaluation (5-10 issues at once) - Parallel context file reading using asyncio.gather() - Batch Gitea API requests where possible 3. **Resource Management**: - Semaphore-based concurrency limiting - Connection pooling for Gitea API - Memory-conscious batch sizing ### Phase 3: Performance Monitoring 4. **Metrics Collection**: - Add timing instrumentation to measure improvements - Track concurrent operation success rates - Monitor memory usage during parallel operations ### Files to Modify: - `src/timmy/backlog_triage.py` (main triage loop) - `src/infrastructure/api/gitea_client.py` (async API client) - `scripts/triage-loop.sh` (if exists) - `src/timmy/triage/` (create async modules) ### Implementation Steps: 1. **Async Foundation**: ```python async def process_issues_batch(issues: List[Issue]) -> List[TriageResult]: tasks = [evaluate_issue_async(issue) for issue in issues] return await asyncio.gather(*tasks, return_exceptions=True) ``` 2. **Concurrent Context Scraping**: ```python async def scrape_contexts_parallel(file_paths: List[str]) -> Dict[str, str]: semaphore = asyncio.Semaphore(10) # Limit concurrent file ops tasks = [read_context_file(path, semaphore) for path in file_paths] results = await asyncio.gather(*tasks) return dict(zip(file_paths, results)) ``` 3. **Batch API Requests**: - Use Gitea GraphQL for batch issue queries - Implement connection pooling - Add retry logic with exponential backoff ### Success Metrics: - ✅ Minimum 30% reduction in iteration cycle time - ✅ Maintain same triage accuracy - ✅ No increase in memory usage - ✅ Graceful handling of API rate limits - ✅ Async logging integration **Expected Impact**: From ~60s triage cycles to ~40s cycles under normal load. @kimi This optimization will significantly improve agent responsiveness!

kimi was assigned by Timmy

2026-03-24 14:52:54 +00:00

kimi was unassigned by Timmy

2026-03-24 19:32:18 +00:00

Timmy closed this issue

2026-03-24 21:54:08 +00:00

Sign in to join this conversation.

Branches Tags

main

gemini/issue-892

claude/issue-1342

claude/issue-1346

claude/issue-1351

claude/issue-1340

fix/test-llm-triage-syntax

gemini/issue-1014

gemini/issue-932

claude/issue-1277

claude/issue-1139

claude/issue-870

claude/issue-1285

claude/issue-1292

claude/issue-1281

claude/issue-917

claude/issue-1275

claude/issue-925

claude/issue-1019

claude/issue-1094

claude/issue-1019-v3

fix/flaky-vassal-xdist-tests

fix/test-config-env-isolation

claude/issue-1019-v2

claude/issue-957-v2

claude/issue-1218

claude/issue-1217

test/chat-store-unit-tests

claude/issue-1191

claude/issue-1186

claude/issue-957

gemini/issue-936

claude/issue-1065

gemini/issue-976

gemini/issue-1149

claude/issue-1135

claude/issue-1064

gemini/issue-1012

claude/issue-1095

claude/issue-1102

claude/issue-1114

gemini/issue-978

gemini/issue-971

claude/issue-1074

claude/issue-987

claude/issue-1011

feature/internal-monologue

feature/issue-1006

feature/issue-1007

feature/issue-1008

feature/issue-1009

feature/issue-1010

feature/issue-1011

feature/issue-1012

feature/issue-1013

feature/issue-1014

feature/issue-981

feature/issue-982

feature/issue-983

feature/issue-984

feature/issue-985

feature/issue-986

feature/issue-987

feature/issue-993

claude/issue-943

claude/issue-975

claude/issue-989

claude/issue-988

fix/loop-guard-gitea-api-and-queue-validation

feature/lhf-tech-debt-fixes

kimi/issue-753

kimi/issue-714

kimi/issue-716

fix/csrf-check-before-execute

chore/migrate-gitea-to-vps

kimi/issue-640

fix/utcnow-calm-py

kimi/issue-635

kimi/issue-625

fix/router-api-truncated-param

kimi/issue-604

kimi/issue-594

review-fixes

kimi/issue-570

kimi/issue-554

kimi/issue-539

kimi/issue-540

feature/ipad-v1-api

kimi/issue-506

kimi/issue-512

refactor/airllm-doc-cleanup

kimi/issue-513

kimi/issue-514

kimi/issue-500

kimi/issue-492

kimi/issue-490

kimi/issue-459

kimi/issue-472

kimi/issue-473

kimi/issue-462

kimi/issue-463

kimi/issue-454

kimi/issue-445

kimi/issue-446

kimi/issue-431

1 Participants

Notifications

Due Date

No due date set.

Dependencies

No dependencies set.

Reference: Rockachopa/Timmy-time-dashboard#1419