Timmy_Foundation/timmy-config

Fork 0

Files

History

Alexander Whitestone b39aee90b4

Architecture Lint / Linter Tests (pull_request) Successful in 28s

Details

Smoke Test / smoke (pull_request) Failing after 26s

Details

Validate Config / YAML Lint (pull_request) Failing after 18s

Details

Validate Config / JSON Validate (pull_request) Successful in 22s

Details

Validate Config / Python Syntax & Import Check (pull_request) Failing after 1m3s

Details

Validate Config / Python Test Suite (pull_request) Has been skipped

Details

Validate Config / Shell Script Lint (pull_request) Failing after 1m6s

Details

Validate Config / Cron Syntax Check (pull_request) Successful in 13s

Details

Validate Config / Deploy Script Dry Run (pull_request) Successful in 14s

Details

Validate Config / Playbook Schema Validation (pull_request) Successful in 30s

Details

Architecture Lint / Lint Repository (pull_request) Failing after 24s

Details

PR Checklist / pr-checklist (pull_request) Successful in 6m22s

Details

fix(pipelines): resume checkpoints and atomically claim jobs (#621 )

Load checkpoints from the checkpoint table when resuming paused jobs and
atomically claim pending work so parallel runs do not process the same job twice.

2026-04-22 11:33:03 -04:00

tests

feat: orchestrator test suite — queue, resume, parallel, tokens

2026-04-17 05:20:02 +00:00

__init__.py

feat: pipelines __init__.py exports

2026-04-17 05:19:59 +00:00

orchestrator.py

fix(pipelines): resume checkpoints and atomically claim jobs (#621 )

2026-04-22 11:33:03 -04:00

README.md

Merge PR #626 : pipelines/README.md

2026-04-16 05:11:26 +00:00

README.md

Pipeline Infrastructure

Shared orchestrator for all batch pipelines.

Components

orchestrator.py

Shared orchestrator providing:

Job Queue: SQLite-backed with priority support
Worker Pool: Configurable parallelism (default 10)
Token Budget: Per-job tracking and limits
Checkpointing: Resume from any point after restart
Rate Limiting: Provider-aware request throttling
Retry Logic: Exponential backoff with configurable retries
Reporting: Generate summary reports

Usage

Python API

from pipelines.orchestrator import PipelineOrchestrator, JobPriority

# Create orchestrator
orchestrator = PipelineOrchestrator(max_workers=10)

# Register pipeline handler
def my_handler(job):
    # Process job.task
    return {"result": "done"}

orchestrator.register_handler("my_pipeline", my_handler)

# Submit jobs
job_id = orchestrator.submit_job(
    pipeline="my_pipeline",
    task={"action": "process", "data": "..."},
    priority=JobPriority.HIGH,
    token_budget=100000
)

# Run orchestrator
orchestrator.run()

CLI

# Submit a job
python -m pipelines.orchestrator submit my_pipeline --task '{"action": "process"}'

# Run orchestrator
python -m pipelines.orchestrator run --workers 10 --max-jobs 100

# Check job status
python -m pipelines.orchestrator status <job_id>

# Resume paused job
python -m pipelines.orchestrator resume <job_id>

# Show stats
python -m pipelines.orchestrator stats

# Generate report
python -m pipelines.orchestrator report

Database

Jobs are stored in ~/.hermes/pipelines/orchestrator.db:

jobs - Job queue and state
checkpoints - Resume points
reports - Generated reports

Configuration

Rate Limits

orchestrator.configure_rate_limit("Nous", rpm=60, tpm=1000000)
orchestrator.configure_rate_limit("Anthropic", rpm=50, tpm=800000)

Token Budgets

Default: 1M tokens per job. Override per-job:

orchestrator.submit_job("pipeline", task, token_budget=500000)

Pipelines

All pipelines share this orchestrator:

batch-runner - Run prompts across datasets
data-gen - Generate training data
eval-runner - Run evaluations
trajectory-compress - Compress trajectories
web-research - Research tasks