turboquant

Timmy_Foundation/turboquant

Fork 0

Files

History

Rockachopa ccbcc8ab7b

Smoke Test / smoke (pull_request) Successful in 27s

Details

fix(benchmarks): separate quality measurement from efficiency proxy (issue #63 )

- Add --quality flag to run_benchmarks.py that delegates to llama-perplexity
- Clarify token/sec is an efficiency metric, not perplexity
- Ollama cannot provide true logprob-based PPL (no logprob API)
- Quality gate now runs llama-perplexity binary directly when requested

Closes #63

2026-04-26 10:55:40 -04:00

perplexity_results.json

feat: wikitext-2 corpus + perplexity benchmark script (closes #21 )

2026-04-12 00:39:14 -04:00

prompts.json

feat: add standardized benchmarking prompts

2026-03-30 21:14:48 +00:00

run_benchmarks.py

fix(benchmarks): separate quality measurement from efficiency proxy (issue #63 )

2026-04-26 10:55:40 -04:00

run_long_session.py

burn: add long-session quality test (Issue #12 ) (#39 )

2026-04-13 19:59:22 +00:00

run_perplexity.py

fix(benchmarks): separate quality measurement from efficiency proxy (issue #63 )

2026-04-26 10:55:40 -04:00

test_prompts.json

Add benchmark test prompts for quality comparison (Issue #22 )

2026-03-31 17:31:05 +00:00