ANEE

Adaptive Neural Execution Engine for transformers. Per-token sparse inference with dynamic layer skipping, profiler-based gating, and KV-cache-safe compute reduction.

Package 1 stars GitHub

Back to Machine Learning