Vision-Language Models

首次对设备端 VLM 推理进行了系统性的能耗分析，揭示了 autoregressive decoding（而非 visual token 处理）主导了能耗（86–97%），颠覆了将 visual token 缩减作为主要效率优化策略的传统假设。

3月 27, 2026