Windows preview· Ollama Blog

Ollama 现在以预览版形式在 Windows 上提供，从而可以在全新的原生 Windows 体验中拉取、运行和创建大型语言模型。Windows 版 Ollama 包括内置 GPU 加速、访问完整的模型库以及 Ollama API，包括 OpenAI 兼容性。

硬件加速

Ollama 使用 NVIDIA GPU 以及现代 CPU 指令集（如 AVX 和 AVX2，如果可用）来加速运行模型。无需配置或虚拟化！

完全访问模型库

完整的 Ollama 模型库可在 Windows 上运行，包括视觉模型。当运行视觉模型（如 LLaVA 1.6）时，可以将图像拖放到 ollama run 中以将其添加到消息中。

始终开启的 Ollama API

Ollama 的 API 在后台自动运行，服务于 https://127.0.0.1:11434。工具和应用程序可以连接到它，无需任何额外设置。

例如，以下是如何使用 PowerShell 调用 Ollama 的 API

(Invoke-WebRequest -method POST -Body '{"model":"llama2", "prompt":"Why is the sky blue?", "stream": false}' -uri https://127.0.0.1:11434/api/generate ).Content | ConvertFrom-json

Windows 版 Ollama 还支持与其他平台相同的 OpenAI 兼容性，从而可以使用为 OpenAI 构建的现有工具通过 Ollama 使用本地模型。

开始使用

要开始使用 Windows 预览版 Ollama

下载 Windows 版 Ollama
双击安装程序 OllamaSetup.exe
安装完成后，打开您喜欢的终端并运行 ollama run llama2 来运行模型

当有新版本可用时，Ollama 将提示更新。我们欢迎您的反馈！如果您遇到任何问题，请通过打开 issue 或加入 Discord 服务器告知我们。

Windows 预览

2024 年 2 月 15 日

硬件加速

完全访问模型库

始终开启的 Ollama API

开始使用