FastVLM - a apple Collection

apple 's Collections

Core ML Gallery Models

OpenELM Instruct Models

OpenELM Pretrained Models

MobileCLIP Models + DataCompDR Data

DepthPro Models

Core ML Stable Diffusion

Core ML FastViT

Core ML Depth Anything

DFN Models + Data

Core ML Segment Anything 2

FastVLM

updated Mar 2

Efficient Vision Encoding for Vision Language Models

FastVLM: Efficient Vision Encoding for Vision Language Models

Paper • 2412.13303 • Published Dec 17, 2024 • 77
Configuration error

Featured

446

FastVLM WebGPU

🍎

446

Real-time video captioning powered by FastVLM
apple/FastVLM-0.5B

Text Generation • 0.8B • Updated Sep 3, 2025 • 7.2k • 395
apple/FastVLM-1.5B

Text Generation • 2B • Updated Sep 3, 2025 • 3.53k • 80
apple/FastVLM-7B

Text Generation • 8B • Updated Sep 3, 2025 • 1.16k • 270
apple/FastVLM-0.5B-fp16

0.6B • Updated Sep 3, 2025 • 488 • 27

Note MLX checkpoint
apple/FastVLM-1.5B-int8

0.5B • Updated Sep 3, 2025 • 77 • 20

Note MLX checkpoint
apple/FastVLM-7B-int4

1B • Updated Sep 3, 2025 • 27 • 31

Note MLX checkpoint