turboquant

3 Commits 68 Branches 2 Tags

Author	SHA1	Message	Date
Timmy	441f4ee765	Phase 1 Report: PolarQuant MVP complete turbo4 KV: 73% memory savings, -1.1% prompt speed, -11% gen speed. Metal shaders verified. PolarQuant checklist 5/6 PASS. 128K context on 36GB hardware is viable. Closes #4 #5 #6 #7 #8	2026-03-30 16:12:01 -04:00
Timmy	cefaa6e778	Add build spec v2.2 and README TurboQuant KV cache compression for M4 Max local inference. Spec by Strago, triaged into 16 issues across 4 phases. Ref #1	2026-03-30 13:11:45 -04:00
Timmy Time	0b62c72737	Initial commit	2026-03-30 17:08:45 +00:00

Author

SHA1

Message

Date

Timmy

441f4ee765

Phase 1 Report: PolarQuant MVP complete

turbo4 KV: 73% memory savings, -1.1% prompt speed, -11% gen speed.
Metal shaders verified. PolarQuant checklist 5/6 PASS.
128K context on 36GB hardware is viable.

Closes #4 #5 #6 #7 #8

2026-03-30 16:12:01 -04:00

Timmy

cefaa6e778

Add build spec v2.2 and README

TurboQuant KV cache compression for M4 Max local inference.
Spec by Strago, triaged into 16 issues across 4 phases.

Ref #1

2026-03-30 13:11:45 -04:00

Timmy Time

0b62c72737

Initial commit

2026-03-30 17:08:45 +00:00