一个基于 Llama 3 Instruct 微调的 LLaVA 模型,在多个基准测试中获得了更好的分数。

视觉 8b

448.7K 10 个月前

自述文件

llava-llama3 是一个基于 Llama 3 Instruct 和 CLIP-ViT-Large-patch14-336 微调的 LLaVA 模型,使用 XTuner 的 ShareGPT4V-PT 和 InternVL-SFT。

参考

Hugging Face

GitHub