更新于 7 个月前
7 个月前
468836162de7 · 670MB
model
架构bert
·
参数334M
·
量化F16
670MB
params
{ "num_ctx": 512 }
16B
license
Apache License Version 2.0, January 2004
11kB
自述文件
mxbai-embed-large
截至 2024 年 3 月,该模型在 MTEB 上实现了 Bert-large 尺寸模型的 SOTA 性能。它优于像 OpenAI 的 text-embedding-3-large
这样的商业模型,并且与 20 倍于其大小的模型的性能相当。
mxbai-embed-large
的训练没有使用 MTEB 数据的重叠部分,这表明该模型在多个领域、任务和文本长度上具有良好的泛化能力。
用法
REST API
curl https://127.0.0.1:11434/api/embeddings -d '{
"model": "mxbai-embed-large",
"prompt": "Represent this sentence for searching relevant passages: The sky is blue because of Rayleigh scattering"
}'
Python 库
ollama.embeddings(model='mxbai-embed-large', prompt='Represent this sentence for searching relevant passages: The sky is blue because of Rayleigh scattering')
Javascript 库
ollama.embeddings({ model: 'mxbai-embed-large', prompt: 'Represent this sentence for searching relevant passages: The sky is blue because of Rayleigh scattering' })