苹果Siri AI系统提示词已经泄露 超过1,300行内行指令 提示词本身就有9,000 Tokens

https://www.landian.news/archives/113383.html
由 意外富翁 推荐 · 9小时前 · 技术 · 10 · 0

Siri 的"大脑"被人扒了底裤。1,300 行系统提示词、9,000+ Tokens 的指令集直接曝光——这比大多数 RAG 应用的完整 Prompt 还长。苹果花了几年时间把 Siri 从"语音助手"改造成"设备智能体",这套 Prompt 就是底层架构的 X 光片。

这套 Prompt 到底在控制什么?

泄露内容的核心设计就两块:实体系统 + 工具机制

实体系统把 iPhone 上的通讯录、日程、照片、位置等全部抽象成 JSON 实体。Siri 不是"理解"你有会议,而是实时读取结构化数据。等于说苹果在 Prompt 层就做了数据层的 Schema 定义,LLM 只负责决策,不碰原始隐私数据。

工具机制更狠——Siri 必须按优先级调用工具,而不是张嘴就编。搜索工具、设备控制工具、第三方 App 接口,全都有明确的调用顺序和兜底逻辑。(这里有个坑:如果工具调用失败,Prompt 里写了必须回退到"诚实告知无法完成",而不是幻觉一个答案)

苹果的 Prompt 工程哲学

泄露的指令里有句狠话:"必须先思考后行动,不得基于模型知识直接生成"

这等于给 LLM 戴了紧箍咒。传统 Chatbot 遇到不知道的就编,苹果直接禁止——Siri 的思考过程必须锚定在设备实时数据 + 可调用的工具集上,知识库权重被压到最低。

另一个细节:诚信原则被写进系统层。不是免责声明,是硬性约束。Prompt 里明确区分"事实陈述"和"推测性回答"的触发条件,推测必须标注不确定性。

为什么这值得开发者抄作业?

  • 长度≠冗余:9,000 Tokens 里大量是工具描述和边界 case 的 few-shot 示例,说明复杂 Agent 的 Prompt 根本省不了
  • 数据隔离设计:LLM 只操作抽象实体,原始数据在沙盒里,这是端侧 AI 的隐私标准答案
  • 调用链管控:工具优先级、并发限制、超时回退,全是生产环境必踩的坑

这套 Prompt 的完整结构大概率会成为开源 Agent 框架的参考模板。毕竟苹果已经替你验证了:消费级设备上的 LLM Agent,Prompt 工程的天花板在哪里。

获取完整的提示词:

有兴趣的用户可以在这里查看提示词:https://gist.github.com/julianschiavo/2da270868175f0a52e423340c30a30b6

提示词备份:https://dl.landian.news/?dir=tmp/siri


你现在的项目里,系统 Prompt 占多少 Tokens?有没有遇到过"模型太聪明反而坏事"的场景——比如绕过工具直接瞎答?

已复制到剪贴板

评论 0 条

暂无评论,来种下第一颗种子。