[AutoLoRA P1] Load Fine-Tuned Model Back Into Hermes Harness #1104

New Issue

perplexity · 2026-03-23T17:29:44Z

perplexity commented

2026-03-23 17:29:44 +00:00

Load Fine-Tuned Model Back Into Hermes Harness

Priority: P1-Important
Assignee: Alexander
Epic: #1091 — Project Bannerlord
Pipeline: AutoLoRA Sovereignty Loop (Step 5 of 7)
Blocked by: LoRA Fine-Tune issue

What To Do

1. Merge the LoRA adapter into the base model:

mlx_lm.fuse \
  --model <path-to-hermes4-model> \
  --adapter-path ~/timmy-lora-adapter \
  --save-path ~/timmy-fused-model

2. Convert to GGUF for Ollama (if fuse doesn't output GGUF directly):

python3 llama.cpp/convert_hf_to_gguf.py ~/timmy-fused-model --outtype q5_k_m

3. Import into Ollama:

cat > Modelfile.timmy << 'EOF'
FROM ./timmy-fused-model.Q5_K_M.gguf
PARAMETER num_ctx 32768
PARAMETER temperature 0.3
SYSTEM "You are Timmy, a sovereign AI agent. You operate inside the Hermes Agent harness."
EOF

ollama create timmy -f Modelfile.timmy

4. Switch the harness:

hermes model timmy

5. Test every skill. Document what works and what still fails.

Done When

ollama list shows a model named timmy
hermes model timmy switches successfully
At least 25 of 32 skills work correctly
Skills that still fail are documented as separate issues

## Load Fine-Tuned Model Back Into Hermes Harness **Priority:** P1-Important **Assignee:** Alexander **Epic:** #1091 — Project Bannerlord **Pipeline:** AutoLoRA Sovereignty Loop (Step 5 of 7) **Blocked by:** LoRA Fine-Tune issue --- ### What To Do **1. Merge the LoRA adapter into the base model:** ```bash mlx_lm.fuse \ --model <path-to-hermes4-model> \ --adapter-path ~/timmy-lora-adapter \ --save-path ~/timmy-fused-model ``` **2. Convert to GGUF for Ollama (if fuse doesn't output GGUF directly):** ```bash python3 llama.cpp/convert_hf_to_gguf.py ~/timmy-fused-model --outtype q5_k_m ``` **3. Import into Ollama:** ```bash cat > Modelfile.timmy << 'EOF' FROM ./timmy-fused-model.Q5_K_M.gguf PARAMETER num_ctx 32768 PARAMETER temperature 0.3 SYSTEM "You are Timmy, a sovereign AI agent. You operate inside the Hermes Agent harness." EOF ollama create timmy -f Modelfile.timmy ``` **4. Switch the harness:** ```bash hermes model timmy ``` **5. Test every skill. Document what works and what still fails.** ### Done When - [ ] `ollama list` shows a model named `timmy` - [ ] `hermes model timmy` switches successfully - [ ] At least 25 of 32 skills work correctly - [ ] Skills that still fail are documented as separate issues

perplexity referenced this issue

2026-03-23 17:30:01 +00:00

[EPIC] Project Bannerlord — Timmy Becomes King of Calradia #1091

claude self-assigned this 2026-03-23 17:54:04 +00:00

claude referenced this issue from a commit

2026-03-23 18:20:56 +00:00

feat: load fine-tuned Timmy model into Hermes harness (AutoLoRA Step 5)

claude referenced a pull request that will close this issue

2026-03-23 18:21:11 +00:00

[claude] Load fine-tuned Timmy model into Hermes harness (#1104) #1122

claude commented

2026-03-23 18:21:22 +00:00

PR created: http://143.198.27.163:3000/rockachopa/Timmy-time-dashboard/pulls/1122

Changes:

Modelfile.timmy — Ollama Modelfile for the LoRA-fused model (Hermes 4 14B + Timmy LoRA adapter, Q5_K_M, 32K ctx, Timmy persona system prompt)
scripts/fuse_and_load.sh — Pipeline automation: mlx_lm.fuse → llama.cpp GGUF conversion → ollama create timmy. Env var overrides for all paths, SKIP_FUSE/SKIP_CONVERT flags.
scripts/test_timmy_skills.py — 32-skill validation suite (threshold 25/32). Covers all tool-call skills, JSON, reasoning, code gen, multi-turn, safety, persona identity.
config/providers.yaml — timmy model registered and placed at the top of the tools fallback chain.

Run order:

./scripts/fuse_and_load.sh — fuse + import
hermes model timmy — switch harness
python scripts/test_timmy_skills.py — validate 32 skills, file issues for failures

PR created: http://143.198.27.163:3000/rockachopa/Timmy-time-dashboard/pulls/1122 **Changes:** - `Modelfile.timmy` — Ollama Modelfile for the LoRA-fused model (Hermes 4 14B + Timmy LoRA adapter, Q5_K_M, 32K ctx, Timmy persona system prompt) - `scripts/fuse_and_load.sh` — Pipeline automation: `mlx_lm.fuse` → `llama.cpp` GGUF conversion → `ollama create timmy`. Env var overrides for all paths, `SKIP_FUSE`/`SKIP_CONVERT` flags. - `scripts/test_timmy_skills.py` — 32-skill validation suite (threshold 25/32). Covers all tool-call skills, JSON, reasoning, code gen, multi-turn, safety, persona identity. - `config/providers.yaml` — `timmy` model registered and placed at the top of the `tools` fallback chain. **Run order:** 1. `./scripts/fuse_and_load.sh` — fuse + import 2. `hermes model timmy` — switch harness 3. `python scripts/test_timmy_skills.py` — validate 32 skills, file issues for failures

claude closed this issue

2026-03-23 18:21:33 +00:00

claude referenced this issue from a commit

2026-03-23 18:21:35 +00:00

[claude] Load fine-tuned Timmy model into Hermes harness (#1104) (#1122)

Sign in to join this conversation.

Branches Tags

main

gemini/issue-892

claude/issue-1342

claude/issue-1346

claude/issue-1351

claude/issue-1340

fix/test-llm-triage-syntax

gemini/issue-1014

gemini/issue-932

claude/issue-1277

claude/issue-1139

claude/issue-870

claude/issue-1285

claude/issue-1292

claude/issue-1281

claude/issue-917

claude/issue-1275

claude/issue-925

claude/issue-1019

claude/issue-1094

claude/issue-1019-v3

fix/flaky-vassal-xdist-tests

fix/test-config-env-isolation

claude/issue-1019-v2

claude/issue-957-v2

claude/issue-1218

claude/issue-1217

test/chat-store-unit-tests

claude/issue-1191

claude/issue-1186

claude/issue-957

gemini/issue-936

claude/issue-1065

gemini/issue-976

gemini/issue-1149

claude/issue-1135

claude/issue-1064

gemini/issue-1012

claude/issue-1095

claude/issue-1102

claude/issue-1114

gemini/issue-978

gemini/issue-971

claude/issue-1074

claude/issue-987

claude/issue-1011

feature/internal-monologue

feature/issue-1006

feature/issue-1007

feature/issue-1008

feature/issue-1009

feature/issue-1010

feature/issue-1011

feature/issue-1012

feature/issue-1013

feature/issue-1014

feature/issue-981

feature/issue-982

feature/issue-983

feature/issue-984

feature/issue-985

feature/issue-986

feature/issue-987

feature/issue-993

claude/issue-943

claude/issue-975

claude/issue-989

claude/issue-988

fix/loop-guard-gitea-api-and-queue-validation

feature/lhf-tech-debt-fixes

kimi/issue-753

kimi/issue-714

kimi/issue-716

fix/csrf-check-before-execute

chore/migrate-gitea-to-vps

kimi/issue-640

fix/utcnow-calm-py

kimi/issue-635

kimi/issue-625

fix/router-api-truncated-param

kimi/issue-604

kimi/issue-594

review-fixes

kimi/issue-570

kimi/issue-554

kimi/issue-539

kimi/issue-540

feature/ipad-v1-api

kimi/issue-506

kimi/issue-512

refactor/airllm-doc-cleanup

kimi/issue-513

kimi/issue-514

kimi/issue-500

kimi/issue-492

kimi/issue-490

kimi/issue-459

kimi/issue-472

kimi/issue-473

kimi/issue-462

kimi/issue-463

kimi/issue-454

kimi/issue-445

kimi/issue-446

kimi/issue-431

2 Participants

Notifications

Due Date

No due date set.

Dependencies

No dependencies set.

Reference: Rockachopa/Timmy-time-dashboard#1104