Fix #493: Add multimodal meaning kernel extraction pipeline

- Added extract_meaning_kernels.py for processing PDF diagrams
- Extracts text using OCR (Tesseract) when available
- Analyzes diagram structure (type, dimensions, orientation)
- Generates structured meaning kernels with metadata
- Outputs JSON (machine-readable) and Markdown (human-readable)
- Includes test pipeline and documentation
- Supports single files and batch processing

Pipeline components:
- DiagramProcessor: Main processing engine
- MeaningKernel: Structured kernel representation
- PDF to image conversion
- OCR text extraction
- Structure analysis
- Kernel generation with confidence scoring

Acceptance criteria met:
✓ Processes academic PDF diagrams
✓ Extracts structured text meaning kernels
✓ Generates machine-readable JSON output
✓ Includes human-readable reports
✓ Supports batch processing
✓ Provides confidence scoring

This commit is contained in:

Alexander Whitestone

2026-04-13 21:20:42 -04:00

commit 0a52cff8a7

6 changed files with 705 additions and 0 deletions

BIN
scripts/multimodal/test_output/test_diagram.png Normal file

View File

Binary file not shown.

After

Width: | Height: | Size: 8.9 KiB

Fix #493: Add multimodal meaning kernel extraction pipeline

BIN scripts/multimodal/test_output/test_diagram.png Normal file View File

BIN
scripts/multimodal/test_output/test_diagram.png Normal file

View File