一、数据处理单元:Token
- 定义: 大模型处理文本的最小单位,通过分词器将文本切分为片段
二、临时记忆体:Context
- 定义:大模型每次处理任务是接收的信息总和
- 组成:用户问题,对话历史、当前输出Token、工具列表、System Prompt等
- 容量限制:由 Context Windows(上下文窗口)定义,即最大可以处理的Token数
三、互层的语义约束:Prompt 与 System Prompt
可以认为提示词是一种非确定性编程输入。
Prompt:即 RPF(Request Response Framework)中的 Request Body。它承载了用户的即时意图。
System Prompt:这是模型运行时的全局配置(Configuration)。它在 LLM 的 Attention 机制中通常拥有更高的权重,用于定义模型的输出 Schema(如 JSON/Markdown)、安全边界、语境约束以及 Chain-of-Thought(思维链)的引导逻辑。
关联建议:在开发中,建议将 System Prompt 模块化,作为环境变量或配置文件解耦,以便进行 A/B Testing。
例如:
- Cursor 的 .cursorrules
- Claude 的 Claude.md
四、知识外挂与上下文注入:RAG
LLM 的参数化知识(Parametric Knowledge)存在长尾效应和时效性缺陷。RAG 是通过向量空间检索实现的“外挂硬盘”。
- 核心链路:
Query -> Embedding -> Vector DB (ANN Search) -> Context Window -> Generation
五、外部扩展能力:Tool
定义:大模型调用外部函数,使其能够感知和影响外部环境
核心链路:
Query -> 平台转发(含Tools) -> 分析并确定工具调用指令 -> doing -> 整理结果 -> result
六、工具标准化:MCP
- 定义:Model Context Protocol 模型上下文协议
- 可以理解为统一工具的接入标准,解决不同平台工具接入不一致的问题
七、智能体:Agent
- 定义:是一个闭环控制系统。它具备 Planning(规划)、Memory(记忆) 和 Tool Use(工具使用) 三大核心能力。
八、说明文档:Agent SKills
- 定义:给 Agent 的说明文档,包含任务规则、执行步骤、输出格式等
- 结构:
- 元数据层:名称、描述
- 指令层:目标、执行步骤、判断规则、输出格式、示例
- 支持运行代码、引用资源,采用渐进式披露机制节省Token
Skills 也是“按规矩办事”,它与 Workflow 有什么区别呢?
Workflow:通过规则配置把多个步骤进行编排与调度的流程
某种意义上 Skills 也是这样做的,但 Workflow 的流程结构在设计阶段就已经确定了,而 Skills 实际上是由大模型驱动,所以更加灵活一些,但二者在最终都能实现相似的结果。