[Feature] Graceful Degradation: Fallback to Cheaper LLM If Primary Hits Rate Limits #1414

New Issue

Timmy · 2026-03-24T13:04:28Z

Timmy commented

2026-03-24 13:04:28 +00:00

Context: Complete halts on API 429 timeouts reduce overall orchestration output.

Acceptance Criteria:

If claude CLI returns an exception related to API exhaustion, hand off the context dynamically to DeepSeek or Gemini routines to finish trivial unit tests or format actions.

**Context:** Complete halts on API 429 timeouts reduce overall orchestration output. **Acceptance Criteria:** - If `claude` CLI returns an exception related to API exhaustion, hand off the context dynamically to DeepSeek or Gemini routines to finish trivial unit tests or format actions.

Timmy commented

2026-03-24 15:11:36 +00:00

KIMI IMPLEMENTATION INSTRUCTIONS - Graceful Degradation Feature

Implementation Plan

Phase 1: Exception Detection & Routing (Priority: HIGH)

Files to modify:

src/infrastructure/router/cascade.py - Add rate limit exception handling
src/infrastructure/models/provider_config.py - Add fallback provider configuration
src/timmy/cli/main.py - Update CLI to handle graceful degradation

Phase 2: Fallback Logic Implementation

Core Requirements:

Exception Detection: Catch claude CLI 429/rate limit exceptions
Context Preservation: Maintain full conversation context during handoff
Dynamic Routing: Switch to DeepSeek/Gemini for continuation
Graceful Recovery: Return to primary provider when available

Phase 3: Specific Implementation Details

Exception Handling Pattern:

try:
    result = claude_provider.execute(context)
except RateLimitException as e:
    logger.info(f"Claude rate limited, falling back to {fallback_provider}")
    result = fallback_provider.execute(context)
except APIExhaustionException as e:
    # Handle API quota exhaustion similarly
    result = handle_fallback(context, original_provider="claude")

Provider Priority Chain:

Claude (primary)
DeepSeek (first fallback - cost-effective)
Gemini (second fallback - reliable)

Phase 4: Testing Requirements

Acceptance Tests:

Mock 429 exceptions from Claude API
Verify context preservation across providers
Test with "trivial unit tests" and "format actions"
Ensure no data loss during provider switch

Phase 5: Configuration

Add to config:

graceful_degradation:
  enabled: true
  fallback_providers: ["deepseek", "gemini"]
  retry_primary_after: 300  # seconds

This addresses the critical orchestration bottleneck where API limits completely halt agent loops. Priority implementation for reducing system downtime.

**KIMI IMPLEMENTATION INSTRUCTIONS - Graceful Degradation Feature** ## Implementation Plan ### Phase 1: Exception Detection & Routing (Priority: HIGH) **Files to modify:** - `src/infrastructure/router/cascade.py` - Add rate limit exception handling - `src/infrastructure/models/provider_config.py` - Add fallback provider configuration - `src/timmy/cli/main.py` - Update CLI to handle graceful degradation ### Phase 2: Fallback Logic Implementation **Core Requirements:** 1. **Exception Detection:** Catch `claude` CLI 429/rate limit exceptions 2. **Context Preservation:** Maintain full conversation context during handoff 3. **Dynamic Routing:** Switch to DeepSeek/Gemini for continuation 4. **Graceful Recovery:** Return to primary provider when available ### Phase 3: Specific Implementation Details **Exception Handling Pattern:** ```python try: result = claude_provider.execute(context) except RateLimitException as e: logger.info(f"Claude rate limited, falling back to {fallback_provider}") result = fallback_provider.execute(context) except APIExhaustionException as e: # Handle API quota exhaustion similarly result = handle_fallback(context, original_provider="claude") ``` **Provider Priority Chain:** 1. Claude (primary) 2. DeepSeek (first fallback - cost-effective) 3. Gemini (second fallback - reliable) ### Phase 4: Testing Requirements **Acceptance Tests:** - Mock 429 exceptions from Claude API - Verify context preservation across providers - Test with "trivial unit tests" and "format actions" - Ensure no data loss during provider switch ### Phase 5: Configuration **Add to config:** ```yaml graceful_degradation: enabled: true fallback_providers: ["deepseek", "gemini"] retry_primary_after: 300 # seconds ``` This addresses the critical orchestration bottleneck where API limits completely halt agent loops. Priority implementation for reducing system downtime.

kimi was assigned by Timmy

2026-03-24 15:12:03 +00:00

kimi was unassigned by Timmy

2026-03-24 19:32:20 +00:00

Timmy closed this issue

2026-03-24 21:54:10 +00:00

Sign in to join this conversation.

Branches Tags

main

gemini/issue-892

claude/issue-1342

claude/issue-1346

claude/issue-1351

claude/issue-1340

fix/test-llm-triage-syntax

gemini/issue-1014

gemini/issue-932

claude/issue-1277

claude/issue-1139

claude/issue-870

claude/issue-1285

claude/issue-1292

claude/issue-1281

claude/issue-917

claude/issue-1275

claude/issue-925

claude/issue-1019

claude/issue-1094

claude/issue-1019-v3

fix/flaky-vassal-xdist-tests

fix/test-config-env-isolation

claude/issue-1019-v2

claude/issue-957-v2

claude/issue-1218

claude/issue-1217

test/chat-store-unit-tests

claude/issue-1191

claude/issue-1186

claude/issue-957

gemini/issue-936

claude/issue-1065

gemini/issue-976

gemini/issue-1149

claude/issue-1135

claude/issue-1064

gemini/issue-1012

claude/issue-1095

claude/issue-1102

claude/issue-1114

gemini/issue-978

gemini/issue-971

claude/issue-1074

claude/issue-987

claude/issue-1011

feature/internal-monologue

feature/issue-1006

feature/issue-1007

feature/issue-1008

feature/issue-1009

feature/issue-1010

feature/issue-1011

feature/issue-1012

feature/issue-1013

feature/issue-1014

feature/issue-981

feature/issue-982

feature/issue-983

feature/issue-984

feature/issue-985

feature/issue-986

feature/issue-987

feature/issue-993

claude/issue-943

claude/issue-975

claude/issue-989

claude/issue-988

fix/loop-guard-gitea-api-and-queue-validation

feature/lhf-tech-debt-fixes

kimi/issue-753

kimi/issue-714

kimi/issue-716

fix/csrf-check-before-execute

chore/migrate-gitea-to-vps

kimi/issue-640

fix/utcnow-calm-py

kimi/issue-635

kimi/issue-625

fix/router-api-truncated-param

kimi/issue-604

kimi/issue-594

review-fixes

kimi/issue-570

kimi/issue-554

kimi/issue-539

kimi/issue-540

feature/ipad-v1-api

kimi/issue-506

kimi/issue-512

refactor/airllm-doc-cleanup

kimi/issue-513

kimi/issue-514

kimi/issue-500

kimi/issue-492

kimi/issue-490

kimi/issue-459

kimi/issue-472

kimi/issue-473

kimi/issue-462

kimi/issue-463

kimi/issue-454

kimi/issue-445

kimi/issue-446

kimi/issue-431

1 Participants

Notifications

Due Date

No due date set.

Dependencies

No dependencies set.

Reference: Rockachopa/Timmy-time-dashboard#1414