Windows 预览

2024 年 2 月 15 日

Ollama windows

Ollama 现在以预览版形式在 Windows 上提供,从而可以在全新的原生 Windows 体验中拉取、运行和创建大型语言模型。Windows 版 Ollama 包括内置 GPU 加速、访问完整的模型库以及 Ollama API,包括 OpenAI 兼容性

硬件加速

Ollama 使用 NVIDIA GPU 以及现代 CPU 指令集(如 AVX 和 AVX2,如果可用)来加速运行模型。无需配置或虚拟化!

完全访问模型库

完整的 Ollama 模型库可在 Windows 上运行,包括 视觉模型。当运行视觉模型(如 LLaVA 1.6)时,可以将图像拖放到 ollama run 中以将其添加到消息中。

始终开启的 Ollama API

Ollama 的 API 在后台自动运行,服务于 https://127.0.0.1:11434。工具和应用程序可以连接到它,无需任何额外设置。

ollama background

例如,以下是如何使用 PowerShell 调用 Ollama 的 API

(Invoke-WebRequest -method POST -Body '{"model":"llama2", "prompt":"Why is the sky blue?", "stream": false}' -uri https://127.0.0.1:11434/api/generate ).Content | ConvertFrom-json

Windows 版 Ollama 还支持与其他平台相同的 OpenAI 兼容性,从而可以使用为 OpenAI 构建的现有工具通过 Ollama 使用本地模型。

开始使用

要开始使用 Windows 预览版 Ollama

  • 下载 Windows 版 Ollama
  • 双击安装程序 OllamaSetup.exe
  • 安装完成后,打开您喜欢的终端并运行 ollama run llama2 来运行模型

当有新版本可用时,Ollama 将提示更新。我们欢迎您的反馈!如果您遇到任何问题,请通过打开 issue 或加入 Discord 服务器告知我们。