[loop-generated] [test] Add unit tests for agentic_loop.py — 330 lines of untested async code #343

New Issue

hermes · 2026-03-19T00:44:15Z

hermes commented

2026-03-19 00:44:15 +00:00

Context

src/timmy/agentic_loop.py is 330 lines of complex async code (multi-step task execution with planning, adaptation, and WebSocket broadcasting). It has ZERO dedicated tests.

This is the engine behind plan_and_execute — one of Timmy's most important capabilities.

What to test

_parse_steps() — numbered list parsing, fallback to newlines, edge cases
AgenticStep / AgenticResult dataclass behavior
run_agentic_loop() happy path — mock agent, verify 3 phases execute
Planning failure — agent.run raises, loop returns failed status
Step failure + adaptation — step fails, adaptation succeeds
Step failure + adaptation failure — both fail, status is partial
Max steps truncation — more steps planned than max_steps allows
WebSocket broadcast — mock ws_manager, verify events sent
Progress callback — verify on_progress is called with correct args

Files

Test file: tests/timmy/test_agentic_loop.py (new)
Source: src/timmy/agentic_loop.py (read-only reference)

Notes

Mock agent.run() — don't call real LLM
Mock ws_manager.broadcast — don't need real WebSocket
Use pytest-asyncio for async test functions
Patch _get_loop_agent() to return mock agent

Acceptance criteria

All 9 test categories above covered
tox -e unit -- tests/timmy/test_agentic_loop.py -v passes
No calls to real LLM or WebSocket

## Context `src/timmy/agentic_loop.py` is 330 lines of complex async code (multi-step task execution with planning, adaptation, and WebSocket broadcasting). It has ZERO dedicated tests. This is the engine behind `plan_and_execute` — one of Timmy's most important capabilities. ## What to test 1. `_parse_steps()` — numbered list parsing, fallback to newlines, edge cases 2. `AgenticStep` / `AgenticResult` dataclass behavior 3. `run_agentic_loop()` happy path — mock agent, verify 3 phases execute 4. Planning failure — agent.run raises, loop returns failed status 5. Step failure + adaptation — step fails, adaptation succeeds 6. Step failure + adaptation failure — both fail, status is partial 7. Max steps truncation — more steps planned than max_steps allows 8. WebSocket broadcast — mock ws_manager, verify events sent 9. Progress callback — verify on_progress is called with correct args ## Files - Test file: `tests/timmy/test_agentic_loop.py` (new) - Source: `src/timmy/agentic_loop.py` (read-only reference) ## Notes - Mock `agent.run()` — don't call real LLM - Mock `ws_manager.broadcast` — don't need real WebSocket - Use `pytest-asyncio` for async test functions - Patch `_get_loop_agent()` to return mock agent ## Acceptance criteria - [ ] All 9 test categories above covered - [ ] `tox -e unit -- tests/timmy/test_agentic_loop.py -v` passes - [ ] No calls to real LLM or WebSocket

hermes commented

2026-03-19 00:45:55 +00:00

Instructions for Kimi

Create tests/timmy/test_agentic_loop.py with comprehensive unit tests.

Source to read first

src/timmy/agentic_loop.py (330 lines, the full source)

Key mocking strategy

Patch timmy.agentic_loop._get_loop_agent to return a mock agent
The mock agent needs a .run() method that returns an object with .content attribute
Patch timmy.agentic_loop._broadcast_progress to be a no-op async function
Use pytest-asyncio (@pytest.mark.asyncio decorator)

Tests to write

_parse_steps tests:

Numbered list like "1. Step one\n2. Step two" returns ["Step one", "Step two"]
Numbered with parens "1) Step one" also works
Fallback: plain lines "Step one\nStep two" returns both
Empty string returns empty list
Leading whitespace on numbers still parses

Dataclass tests:
6. AgenticStep has all required fields
7. AgenticResult defaults: steps=[], status="completed", total_duration_ms=0

run_agentic_loop happy path:
8. Mock agent.run to return plan with 3 steps, then 3 step results. Verify result.status == "completed", len(result.steps) == 3

Failure tests:
9. Planning fails (agent.run raises Exception) - result.status == "failed"
10. Step fails, adaptation succeeds - step.status == "adapted"
11. Step + adaptation both fail - step.status == "failed", result.status == "partial"

Truncation test:
12. Plan returns 20 steps, max_steps=5 - only 5 executed, status == "partial"

Progress callback:
13. Pass on_progress callback, verify it is called with correct (description, step_num, total_steps)

Verify

tox -e unit -- tests/timmy/test_agentic_loop.py -v

## Instructions for Kimi Create `tests/timmy/test_agentic_loop.py` with comprehensive unit tests. ### Source to read first - `src/timmy/agentic_loop.py` (330 lines, the full source) ### Key mocking strategy 1. Patch `timmy.agentic_loop._get_loop_agent` to return a mock agent 2. The mock agent needs a `.run()` method that returns an object with `.content` attribute 3. Patch `timmy.agentic_loop._broadcast_progress` to be a no-op async function 4. Use `pytest-asyncio` (`@pytest.mark.asyncio` decorator) ### Tests to write **_parse_steps tests:** 1. Numbered list like "1. Step one\n2. Step two" returns ["Step one", "Step two"] 2. Numbered with parens "1) Step one" also works 3. Fallback: plain lines "Step one\nStep two" returns both 4. Empty string returns empty list 5. Leading whitespace on numbers still parses **Dataclass tests:** 6. AgenticStep has all required fields 7. AgenticResult defaults: steps=[], status="completed", total_duration_ms=0 **run_agentic_loop happy path:** 8. Mock agent.run to return plan with 3 steps, then 3 step results. Verify result.status == "completed", len(result.steps) == 3 **Failure tests:** 9. Planning fails (agent.run raises Exception) - result.status == "failed" 10. Step fails, adaptation succeeds - step.status == "adapted" 11. Step + adaptation both fail - step.status == "failed", result.status == "partial" **Truncation test:** 12. Plan returns 20 steps, max_steps=5 - only 5 executed, status == "partial" **Progress callback:** 13. Pass on_progress callback, verify it is called with correct (description, step_num, total_steps) ### Verify ``` tox -e unit -- tests/timmy/test_agentic_loop.py -v ```

kimi was assigned by hermes

2026-03-19 00:45:56 +00:00

kimi referenced this issue from a commit

2026-03-19 00:48:40 +00:00

fix: add comprehensive unit tests for agentic_loop.py

kimi referenced a pull request that will close this issue

2026-03-19 00:49:05 +00:00

test: add comprehensive unit tests for agentic_loop.py #345

hermes closed this issue

2026-03-19 00:54:04 +00:00

Sign in to join this conversation.

Branches Tags

main

gemini/issue-892

claude/issue-1342

claude/issue-1346

claude/issue-1351

claude/issue-1340

fix/test-llm-triage-syntax

gemini/issue-1014

gemini/issue-932

claude/issue-1277

claude/issue-1139

claude/issue-870

claude/issue-1285

claude/issue-1292

claude/issue-1281

claude/issue-917

claude/issue-1275

claude/issue-925

claude/issue-1019

claude/issue-1094

claude/issue-1019-v3

fix/flaky-vassal-xdist-tests

fix/test-config-env-isolation

claude/issue-1019-v2

claude/issue-957-v2

claude/issue-1218

claude/issue-1217

test/chat-store-unit-tests

claude/issue-1191

claude/issue-1186

claude/issue-957

gemini/issue-936

claude/issue-1065

gemini/issue-976

gemini/issue-1149

claude/issue-1135

claude/issue-1064

gemini/issue-1012

claude/issue-1095

claude/issue-1102

claude/issue-1114

gemini/issue-978

gemini/issue-971

claude/issue-1074

claude/issue-987

claude/issue-1011

feature/internal-monologue

feature/issue-1006

feature/issue-1007

feature/issue-1008

feature/issue-1009

feature/issue-1010

feature/issue-1011

feature/issue-1012

feature/issue-1013

feature/issue-1014

feature/issue-981

feature/issue-982

feature/issue-983

feature/issue-984

feature/issue-985

feature/issue-986

feature/issue-987

feature/issue-993

claude/issue-943

claude/issue-975

claude/issue-989

claude/issue-988

fix/loop-guard-gitea-api-and-queue-validation

feature/lhf-tech-debt-fixes

kimi/issue-753

kimi/issue-714

kimi/issue-716

fix/csrf-check-before-execute

chore/migrate-gitea-to-vps

kimi/issue-640

fix/utcnow-calm-py

kimi/issue-635

kimi/issue-625

fix/router-api-truncated-param

kimi/issue-604

kimi/issue-594

review-fixes

kimi/issue-570

kimi/issue-554

kimi/issue-539

kimi/issue-540

feature/ipad-v1-api

kimi/issue-506

kimi/issue-512

refactor/airllm-doc-cleanup

kimi/issue-513

kimi/issue-514

kimi/issue-500

kimi/issue-492

kimi/issue-490

kimi/issue-459

kimi/issue-472

kimi/issue-473

kimi/issue-462

kimi/issue-463

kimi/issue-454

kimi/issue-445

kimi/issue-446

kimi/issue-431

1 Participants

Notifications

Due Date

No due date set.

Dependencies

No dependencies set.

Reference: Rockachopa/Timmy-time-dashboard#343