Tags: #vision-language-model - OSS Alternative - Discover Top Open Source Alternatives to Popular Software

Tags: #vision-language-model

Multimodal AI Model

24.8k

An open-source large language and vision assistant (LLaVA) that achieves GPT-4V level multimodal capabilities through visual instruction tuning.

Replaces: