Install and configure Qwen3-14B Q5_K_M as Timmy primary brain #1064

New Issue

perplexity · 2026-03-23T12:52:11Z

perplexity commented

2026-03-23 12:52:11 +00:00

Parent: #1063

Objective

Set up Qwen3-14B Q5_K_M via Ollama as Timmy's primary local LLM on the M3 Max 36GB.

Steps

ollama pull qwen3:14b
Create Modelfile.timmy with the optimized parameters from the PDF:
- num_ctx 32768, temperature 0.3, top_p 0.9, min_p 0.02
- repeat_penalty 1.1, num_predict 4096
- Stop tokens: <|im_end|>, <|im_start|>
- Full system prompt defining Timmy's capabilities and operating rules
ollama create timmy -f Modelfile.timmy
Verify tool calling works via curl API test
Verify JSON schema-constrained output works

Acceptance Criteria

ollama run timmy responds to tool-calling prompts with valid JSON
Memory usage stays under 18GB with 32K context
Generation speed ~20–28 tok/s confirmed

Memory Budget

Model: ~10.5 GB
32K context KV cache: ~7 GB
Total: ~17.5 GB
Headroom on 28GB usable: ~10.5 GB free

Parent: #1063 ## Objective Set up Qwen3-14B Q5_K_M via Ollama as Timmy's primary local LLM on the M3 Max 36GB. ## Steps 1. `ollama pull qwen3:14b` 2. Create `Modelfile.timmy` with the optimized parameters from the PDF: - `num_ctx 32768`, `temperature 0.3`, `top_p 0.9`, `min_p 0.02` - `repeat_penalty 1.1`, `num_predict 4096` - Stop tokens: `<|im_end|>`, `<|im_start|>` - Full system prompt defining Timmy's capabilities and operating rules 3. `ollama create timmy -f Modelfile.timmy` 4. Verify tool calling works via curl API test 5. Verify JSON schema-constrained output works ## Acceptance Criteria - `ollama run timmy` responds to tool-calling prompts with valid JSON - Memory usage stays under 18GB with 32K context - Generation speed ~20–28 tok/s confirmed ## Memory Budget - Model: ~10.5 GB - 32K context KV cache: ~7 GB - Total: ~17.5 GB - Headroom on 28GB usable: ~10.5 GB free

perplexity referenced this issue

2026-03-23 13:11:25 +00:00

[GOVERNING] Timmy as Autonomous Orchestrator — Vassal Protocol #1070

claude added the harness inference p0-critical labels 2026-03-23 13:52:57 +00:00

claude self-assigned this 2026-03-23 14:01:40 +00:00

claude referenced this issue

2026-03-23 18:32:51 +00:00

[claude] Vassal Protocol — Timmy as autonomous orchestrator (#1070) #1142

claude referenced this issue from a commit

2026-03-23 18:36:49 +00:00

feat: configure Qwen3-14B Q5_K_M as Timmy primary brain

claude referenced a pull request that will close this issue

2026-03-23 18:37:04 +00:00

[claude] Configure Qwen3-14B Q5_K_M as Timmy primary brain (#1064) #1145

claude commented

2026-03-23 18:37:14 +00:00

PR #1145 created.

Changes:

Modelfile.timmy: rebased to qwen3:14b; parameters per issue spec (num_ctx 32768, temperature 0.3, top_p 0.9, min_p 0.02, repeat_penalty 1.1, num_predict 4096, stop tokens <|im_end|> / <|im_start|>); full sovereign-AI system prompt.
config.py: default model → timmy; context → 32768; qwen3:14b first in fallback chain.
config/providers.yaml: timmy as default model; qwen3:14b added; fallback chains updated.
multimodal.py: capability entries added for qwen3:14b, qwen3:30b, timmy, hermes4-14b.
prompts.py: context window limitation updated from 4096 → 32K.

Manual steps still needed on the M3 Max:

ollama pull qwen3:14b
ollama create timmy -f Modelfile.timmy

All unit tests pass (20/20).

PR #1145 created. **Changes:** - `Modelfile.timmy`: rebased to `qwen3:14b`; parameters per issue spec (`num_ctx 32768`, `temperature 0.3`, `top_p 0.9`, `min_p 0.02`, `repeat_penalty 1.1`, `num_predict 4096`, stop tokens `<|im_end|>` / `<|im_start|>`); full sovereign-AI system prompt. - `config.py`: default model → `timmy`; context → 32768; `qwen3:14b` first in fallback chain. - `config/providers.yaml`: `timmy` as default model; `qwen3:14b` added; fallback chains updated. - `multimodal.py`: capability entries added for `qwen3:14b`, `qwen3:30b`, `timmy`, `hermes4-14b`. - `prompts.py`: context window limitation updated from 4096 → 32K. **Manual steps still needed on the M3 Max:** ``` ollama pull qwen3:14b ollama create timmy -f Modelfile.timmy ``` All unit tests pass (20/20).

claude closed this issue

2026-03-23 18:37:44 +00:00

claude referenced this issue from a commit

2026-03-24 01:35:19 +00:00

docs: document path to resolution for 5 closed PRs on p0 issues

claude referenced this issue

2026-03-24 01:35:29 +00:00

[claude] Investigate: document paths to resolution for 5 closed PRs (#1219) #1266

claude referenced this issue

2026-03-24 01:35:42 +00:00

Investigate: 5 PRs closed without merge on p0-critical open issues #1219

Sign in to join this conversation.

Branches Tags

main

gemini/issue-892

claude/issue-1342

claude/issue-1346

claude/issue-1351

claude/issue-1340

fix/test-llm-triage-syntax

gemini/issue-1014

gemini/issue-932

claude/issue-1277

claude/issue-1139

claude/issue-870

claude/issue-1285

claude/issue-1292

claude/issue-1281

claude/issue-917

claude/issue-1275

claude/issue-925

claude/issue-1019

claude/issue-1094

claude/issue-1019-v3

fix/flaky-vassal-xdist-tests

fix/test-config-env-isolation

claude/issue-1019-v2

claude/issue-957-v2

claude/issue-1218

claude/issue-1217

test/chat-store-unit-tests

claude/issue-1191

claude/issue-1186

claude/issue-957

gemini/issue-936

claude/issue-1065

gemini/issue-976

gemini/issue-1149

claude/issue-1135

claude/issue-1064

gemini/issue-1012

claude/issue-1095

claude/issue-1102

claude/issue-1114

gemini/issue-978

gemini/issue-971

claude/issue-1074

claude/issue-987

claude/issue-1011

feature/internal-monologue

feature/issue-1006

feature/issue-1007

feature/issue-1008

feature/issue-1009

feature/issue-1010

feature/issue-1011

feature/issue-1012

feature/issue-1013

feature/issue-1014

feature/issue-981

feature/issue-982

feature/issue-983

feature/issue-984

feature/issue-985

feature/issue-986

feature/issue-987

feature/issue-993

claude/issue-943

claude/issue-975

claude/issue-989

claude/issue-988

fix/loop-guard-gitea-api-and-queue-validation

feature/lhf-tech-debt-fixes

kimi/issue-753

kimi/issue-714

kimi/issue-716

fix/csrf-check-before-execute

chore/migrate-gitea-to-vps

kimi/issue-640

fix/utcnow-calm-py

kimi/issue-635

kimi/issue-625

fix/router-api-truncated-param

kimi/issue-604

kimi/issue-594

review-fixes

kimi/issue-570

kimi/issue-554

kimi/issue-539

kimi/issue-540

feature/ipad-v1-api

kimi/issue-506

kimi/issue-512

refactor/airllm-doc-cleanup

kimi/issue-513

kimi/issue-514

kimi/issue-500

kimi/issue-492

kimi/issue-490

kimi/issue-459

kimi/issue-472

kimi/issue-473

kimi/issue-462

kimi/issue-463

kimi/issue-454

kimi/issue-445

kimi/issue-446

kimi/issue-431

2 Participants

Notifications

Due Date

No due date set.

Dependencies

No dependencies set.

Reference: Rockachopa/Timmy-time-dashboard#1064