Snowflake出品的一套文本嵌入模型,针对性能进行了优化。

嵌入 22m 33m 110m 137m 335m

25.85万 7个月前

自述文件

snowflake-arctic-embed 是一套文本嵌入模型,专注于创建针对性能优化的、高质量的检索模型。

这些模型的训练利用了现有的开源文本表示模型,例如 bert-base-uncased,并通过多阶段管道进行训练以优化其检索性能。

此模型提供5种参数大小

  • snowflake-arctic-embed:335m (默认)
  • snowflake-arctic-embed:137m
  • snowflake-arctic-embed:110m
  • snowflake-arctic-embed:33m
  • snowflake-arctic-embed:22m

参考

博客文章

HuggingFace