hermes-agent

Timmy_Foundation/hermes-agent

Fork 0

Files

History

Hermes Agent aa2809882e

Contributor Attribution Check / check-attribution (pull_request) Failing after 38s

Details

Docker Build and Publish / build-and-push (pull_request) Has been skipped

Details

Supply Chain Audit / Scan PR for supply chain risks (pull_request) Successful in 28s

Details

Tests / e2e (pull_request) Successful in 2m18s

Details

Tests / test (pull_request) Failing after 34m6s

Details

docs+feat: R@5 vs E2E accuracy gap analysis — WHY retrieval fails (#660 )

Resolves #660. Documents the 81-point gap between retrieval success
(98.4% R@5) and answering accuracy (17% E2E).

docs/r5-vs-e2e-gap-analysis.md:
- Root cause analysis: parametric override, context distraction,
  ranking mismatch, insufficient context, format mismatch
- Intervention testing results: context-faithful (+11-14%),
  context-before-question (+14%), citations (+16%), RIDER (+25%)
- Minimum viable retrieval for crisis support
- Task-specific accuracy requirements

scripts/benchmark_r5_e2e.py:
- Benchmark script for measuring R@5 vs E2E gap
- Supports baseline, context-faithful, and RIDER interventions
- Reports gap analysis with per-question details

2026-04-15 10:26:38 -04:00

migration

feat: rebrand OpenClaw references to Hermes during migration

2026-04-12 00:33:54 -07:00

plans

feat: add route-aware pricing estimates (#1695 )

2026-03-17 03:44:44 -07:00

skins

feat(skins): add built-in daylight skin

2026-04-13 23:51:21 -07:00

specs

feat(nix): container-aware CLI — auto-route into managed container (#7543 )