一套由 Snowflake 提供的文本嵌入模型,针对性能进行了优化。

嵌入 22m 33m 110m 137m 335m

181.9K 6 个月前

自述文件

snowflake-arctic-embed 是一套专注于创建高质量检索模型的文本嵌入模型,这些模型针对性能进行了优化。

这些模型通过利用现有的开源文本表示模型(例如 bert-base-uncased)进行训练,并在多阶段管道中进行训练以优化其检索性能。

此模型有 5 种参数大小可供选择

  • snowflake-arctic-embed:335m (默认)
  • snowflake-arctic-embed:137m
  • snowflake-arctic-embed:110m
  • snowflake-arctic-embed:33m
  • snowflake-arctic-embed:22m

参考

博客文章

HuggingFace