一个基于 Llama 3 Instruct 微调的 LLaVA 模型,在多个基准测试中取得了更好的分数。

视觉 8b

210.1K 6 个月前

自述文件

llava-llama3 是一个基于 Llama 3 Instruct 和 CLIP-ViT-Large-patch14-336 微调的 LLaVA 模型,并由 XTuner 使用 ShareGPT4V-PT 和 InternVL-SFT 进行了训练。

参考

Hugging Face

GitHub