更新于 4 个月前
4 个月前
790764642607 · 1.2GB
model
架构bert
·
参数567M
·
量化F16
1.2GB
license
MIT 许可证 版权所有 (c) [年份] [全名] 特此免费授予任何人
1.1kB
自述文件
BGE-M3 基于 XLM-RoBERTa 架构,以其在多功能性、多语言性和多粒度性方面的多功能性而著称
- 多功能性:它可以同时执行嵌入模型的三个常见检索功能:密集检索、多向量检索和稀疏检索。
- 多语言性:它可以支持超过 100 种工作语言。
- 多粒度性:它能够处理不同粒度的输入,从短句到长达 8192 个 token 的长文档。
来自开源社区的基准测试
@misc{bge-m3,
title={BGE M3-Embedding: Multi-Lingual, Multi-Functionality, Multi-Granularity Text Embeddings Through Self-Knowledge Distillation},
author={Jianlv Chen and Shitao Xiao and Peitian Zhang and Kun Luo and Defu Lian and Zheng Liu},
year={2024},
eprint={2402.03216},
archivePrefix={arXiv},
primaryClass={cs.CL}
}