一、数据处理单元:Token

  • 定义: 大模型处理文本的最小单位,通过分词器将文本切分为片段

二、临时记忆体:Context

  • 定义:大模型每次处理任务是接收的信息总和
  • 组成:用户问题,对话历史、当前输出Token、工具列表、System Prompt等
  • 容量限制:由 Context Windows(上下文窗口)定义,即最大可以处理的Token数

三、互层的语义约束:Prompt 与 System Prompt

可以认为提示词是一种非确定性编程输入

  • Prompt:即 RPF(Request Response Framework)中的 Request Body。它承载了用户的即时意图。

  • System Prompt:这是模型运行时的全局配置(Configuration)。它在 LLM 的 Attention 机制中通常拥有更高的权重,用于定义模型的输出 Schema(如 JSON/Markdown)、安全边界、语境约束以及 Chain-of-Thought(思维链)的引导逻辑。

    关联建议:在开发中,建议将 System Prompt 模块化,作为环境变量或配置文件解耦,以便进行 A/B Testing。

    例如:

    • Cursor 的 .cursorrules
    • Claude 的 Claude.md

四、知识外挂与上下文注入:RAG

LLM 的参数化知识(Parametric Knowledge)存在长尾效应和时效性缺陷。RAG 是通过向量空间检索实现的“外挂硬盘”。

  • 核心链路Query -> Embedding -> Vector DB (ANN Search) -> Context Window -> Generation

五、外部扩展能力:Tool

  • 定义:大模型调用外部函数,使其能够感知和影响外部环境

  • 核心链路Query -> 平台转发(含Tools) -> 分析并确定工具调用指令 -> doing -> 整理结果 -> result


六、工具标准化:MCP

  • 定义:Model Context Protocol 模型上下文协议
  • 可以理解为统一工具的接入标准,解决不同平台工具接入不一致的问题

七、智能体:Agent

  • 定义:是一个闭环控制系统。它具备 Planning(规划)Memory(记忆)Tool Use(工具使用) 三大核心能力。

八、说明文档:Agent SKills

  • 定义:给 Agent 的说明文档,包含任务规则、执行步骤、输出格式等
  • 结构
    • 元数据层:名称、描述
    • 指令层:目标、执行步骤、判断规则、输出格式、示例
  • 支持运行代码、引用资源,采用渐进式披露机制节省Token

Skills 也是“按规矩办事”,它与 Workflow 有什么区别呢?

Workflow:通过规则配置把多个步骤进行编排与调度的流程

某种意义上 Skills 也是这样做的,但 Workflow 的流程结构在设计阶段就已经确定了,而 Skills 实际上是由大模型驱动,所以更加灵活一些,但二者在最终都能实现相似的结果。