MCP 协议：语音笔记如何融入 AI Agent 工作流

探索 Model Context Protocol（MCP）如何将你的语音录音变成 AI Agent 的实时数据源——实现搜索、检索和自动化工作流。

什么是 Model Context Protocol？

Model Context Protocol（MCP）是一个开放标准，允许 AI 模型通过结构化接口访问外部数据和工具。你可以把它理解为一个通用适配器：MCP 提供了一种通用语言，让 AI Agent 能够发现、查询和操作各类信息，而不需要为每个数据源构建定制集成。

对于语音数据，这具有变革性意义。你的会议录音、语音备忘录和转录笔记包含了工作流中最丰富的上下文——做出的决策、分配的任务、探索的想法。MCP 让这些上下文可供 AI Agent 搜索、检索和推理。

大多数知识工作通过对话进行。会议、电话、头脑风暴、采访——最重要的决策是说出来的，而不是打出来的。然而这些口头知识通常在对话结束的瞬间就消失了。

当语音录音被转录和索引后，它们就变成了 AI Agent 可以利用的可搜索知识库：

Speechy 集成了 MCP SDK（v0.12.0+），将你的语音笔记库暴露为一组工具，任何兼容 MCP 的 AI Agent 都可以调用：

Speechy 使用 @Generable 结构化输出，以 AI Agent 可靠解析的格式返回数据——不只是原始文本，而是带有说话人、时间戳、摘要和行动项字段的类型化对象。

场景 1：会前简报

在周期性团队会议之前，AI Agent 查询你的 Speechy 笔记："上周会议分配了哪些行动项？哪些还未完成？"Agent 检索相关转录片段，与 Speechy AI 提取的行动项交叉对比，为你生成一份简报。

场景 2：追溯决策

你正在撰写产品文档，需要确认三周前会议中的一个决策。AI Agent 通过 MCP 搜索你的笔记："我们什么时候决定砍掉功能 X 的？原因是什么？"Agent 返回精确的转录片段，包含说话人和时间戳。

场景 3：自动化跟进

AI Agent 监控你的会议笔记中的行动项。当检测到新的承诺（"Sarah 将在周五前发送更新后的设计稿"），它可以创建提醒、起草跟进消息或更新项目追踪器——全部由通过 MCP 流动的语音数据触发。

AI 工作流中正在浮现的模式很明确：Agent 需要访问真实工作发生的数据。对大多数专业人士来说，那就是对话。MCP 使得语音录音不再是静态的音频文件，而是 AI Agent 可以交互的实时可查询数据源。

这创建了一个反馈循环：

在 Speechy 设置中启用 MCP——进入 AI 设置面板，开启 MCP 服务器。
选择 AI 提供商——MCP 可与所有支持的提供商配合：Apple Intelligence、Claude、GPT-4.1、Gemini 或本地 MLX 模型。
连接 AI Agent——将 MCP 兼容的 Agent（Claude Desktop、自定义 Agent 等）指向 Speechy 的 MCP 端点。
开始查询——你的 Agent 现在可以搜索语音笔记、检索转录稿，以及访问 AI 生成的摘要和行动项。

Speechy 中的 MCP 遵循与应用其他功能相同的本地优先理念。工具调用在你的设备上执行。语音数据只暴露给你明确连接的 Agent——没有云端中继，没有第三方索引，数据不会脱离你的控制。