Leveraging LLMs in your Obsidian Notes· Ollama Blog

今天我在 Hacker News 上看到一篇关于另一个 Obsidian 插件的帖子，该插件集成了 ChatGPT。市面上有很多这样的工具，我很高兴看到将它们与 Obsidian 结合使用的不同方式。建立连接，让你的笔记更进一步。一些评论者认为它在做你需要自己做的工作，但我认为它以新的和不可思议的方式为你赋能。

与你的笔记对话

你可能想要做的第一件也是最明显的事情是能够与你的笔记对话。提出问题以获得更深入的见解。如果你可以直接将模型指向你的笔记并完成操作，那就太方便了。但是大多数模型无法一次性接受所有内容。

当你提出问题时，并非所有笔记都相关。因此，你需要找到相关的部分并将其交给模型。Obsidian 具有搜索功能，但它只是搜索确切的单词和短语，我们需要搜索概念。这就是嵌入 (embeddings) 发挥作用的地方。我们必须创建一个索引。事实证明这非常容易做到。

让我们构建索引器

当你创建一个 Obsidian 插件时，你可以让它在插件加载时执行某些操作，然后在你触发命令或打开笔记或 Obsidian 中的其他活动时执行其他操作。因此，我们希望在插件启动时能够理解你的笔记，并且它应该保存其进度，这样就不必再次重新生成索引。让我们看一个代码示例来索引我们的一个笔记。我将在此示例中使用 Llama Index，但 LangChain 是另一个不错的选择。

import { VectorStoreIndex, serviceContextFromDefaults, storageContextFromDefaults, MarkdownReader } from "llamaindex";

const service_context = serviceContextFromDefaults({ chunkSize: 256 })
const storage_context = await storageContextFromDefaults({ persistDir: "./storage" });

const mdpath = process.argv[2];
const mdreader = new MarkdownReader();
const thedoc = await mdreader.loadData(mdpath)

首先，我们需要初始化一个内存数据存储。这是 Llama Index 自带的内存存储，但 Chroma DB 是另一个流行的选择。第二行表示我们将持久化索引的所有内容。接下来，我获取文件的路径并初始化一个读取器。然后我读取文件。Llama Index 了解 Markdown，因此它可以适当地读取并索引它。它还了解 PDF、文本文件和 Notion 文档等等。它不仅存储单词，还理解单词的含义以及它们与文本中其他单词的关系。

await VectorStoreIndex.fromDocuments(thedoc, { storageContext: storage_context, serviceContext: service_context });

现在，这部分使用的是 OpenAI 的一项服务，但它与 ChatGPT 是分开的，不同的模型，不同的产品，并且 Langchain 中有替代方案可以在本地完成此操作，但速度会稍慢一些。Ollama 也具有嵌入函数。你也可以在超快的自托管云实例上使用这些服务，然后在索引完成后将其关闭。

现在让我们搜索我们的笔记

现在我们有了此文件的索引。Obsidian 可以为我们提供所有文件的列表，因此我们可以一遍又一遍地运行它。并且我们正在持久化，因此这是一次性操作。现在，我们如何提问？我们需要一些代码来查找笔记中的相关部分，将其交给模型，并使用该信息来提出答案。

const storage_context = await storageContextFromDefaults({ persistDir: "./storage" });
const index = await VectorStoreIndex.init({ storageContext: storage_context });
const ret = index.asRetriever();
ret.similarityTopK = 5
const prompt = process.argv[2];
const response = await ret.retrieve(prompt);
const systemPrompt = `Use the following text to help come up with an answer to the prompt: ${response.map(r => r.node.toJSON().text).join(" - ")} `

因此，在此代码示例中，我们使用已处理的内容初始化索引。Retriever.retrieve 行将获取提示并查找所有相关的笔记块，并将文本返回给我们。我们在这里说要使用前 5 个匹配项。因此，我将从我们的笔记中获得 5 个文本块。有了这些原始信息，我们可以生成一个系统提示，以帮助我们的模型了解我们在提问时该怎么做。

const ollama = new Ollama();
ollama.setModel("llama2");
ollama.setSystemPrompt(systemPrompt);
const genout = await ollama.generate(prompt);

现在我们可以使用模型了。我正在使用几天前创建的一个库，它在 npm 上。我可以将模型设置为使用 llama2，这已经使用命令 ollama pull llama2 下载到我的机器上。你可以尝试不同的模型，找到最适合你的模型。

为了快速获得答案，你将需要坚持使用小型模型。但你还需要一个输入上下文大小足够大的模型来接受我们所有的文本块。我最多有 5 个块，每个块 256 个 tokens。我将模型设置为使用包含我们文本块的系统提示。只需提出问题，它就会在几秒钟内给你答案。

太棒了。现在，我们的 Obsidian 插件将适当地显示该答案。

我们还能做什么？

你还可以考虑总结文本或查找与你的文本匹配的最佳关键词，并将它们添加到前言 (front matter) 中，这样你就可以在笔记之间建立更好的联系。我尝试过制作 10 个好的问答题发送到 Anki。你将需要尝试不同的模型和提示来完成这些不同的事情。更改提示，甚至将模型权重更改为更适合任务的内容非常容易。

我希望这篇文章给你带来了一些关于如何为 Obsidian 或任何其他笔记工具构建下一个伟大插件的想法。使用最新的本地 AI 工具，例如你可以在 ollama.com 找到的那些工具，这种能力轻而易举，我希望你能向我展示你正在做的事情。

在你的 Obsidian 笔记中利用 LLMs

2023 年 9 月 21 日

与你的笔记对话

让我们构建索引器

现在让我们搜索我们的笔记

我们还能做什么？