mxbai-embed-large - Ollama 框架

mxbai-embed-large

来自 mixedbread.ai 的最先进的大型嵌入模型

嵌入 335m

1.7M 下载量更新于 10 个月前

更新于 10 个月前

10 个月前

468836162de7 · 670MB

{ "num_ctx": 512 }

Apache License Version 2.0, January 2004

自述文件

mxbai-embed-large

截至 2024 年 3 月，该模型在 MTEB 上实现了 Bert-large 尺寸模型的 SOTA 性能。它优于商业模型，如 OpenAIs text-embedding-3-large 模型，并且与尺寸为其 20 倍的模型的性能相匹配。

mxbai-embed-large 的训练过程中没有与 MTEB 数据重叠，这表明该模型在多个领域、任务和文本长度上具有良好的泛化能力。

用法

REST API

curl https://127.0.0.1:11434/api/embeddings -d '{
  "model": "mxbai-embed-large",
  "prompt": "Represent this sentence for searching relevant passages: The sky is blue because of Rayleigh scattering"
}'

Python 库

ollama.embeddings(model='mxbai-embed-large', prompt='Represent this sentence for searching relevant passages: The sky is blue because of Rayleigh scattering')

Javascript 库

ollama.embeddings({ model: 'mxbai-embed-large', prompt: 'Represent this sentence for searching relevant passages:  The sky is blue because of Rayleigh scattering' })

参考资料

## mxbai-embed-large

<img src="https://github.com/ollama/ollama/assets/251292/215cfb6a-8efa-4e9b-824d-e5f466b58c49" widht="400">

As of March 2024, this model archives SOTA performance for Bert-large sized models on the MTEB. It outperforms commercial models like OpenAIs `text-embedding-3-large` model and matches the performance of model 20x its size.

`mxbai-embed-large` was trained with no overlap of the MTEB data, which indicates that the model generalizes well across several domains, tasks and text length.

## Usage

### REST API

```
curl https://127.0.0.1:11434/api/embeddings -d '{
  "model": "mxbai-embed-large",
  "prompt": "Represent this sentence for searching relevant passages: The sky is blue because of Rayleigh scattering"
}'
```

### Python library

```
ollama.embeddings(model='mxbai-embed-large', prompt='Represent this sentence for searching relevant passages: The sky is blue because of Rayleigh scattering')
```

### Javascript library

```
ollama.embeddings({ model: 'mxbai-embed-large', prompt: 'Represent this sentence for searching relevant passages:  The sky is blue because of Rayleigh scattering' })
```

## References

[Blog post](https://www.mixedbread.ai/blog/mxbai-embed-large-v1)

[Hugging Face](https://hugging-face.cn/mixedbread-ai/mxbai-embed-large-v1)

粘贴、拖放或单击以上传图片 (.png, .jpeg, .jpg, .svg, .gif)