大模型常见的各类名词都有什么 | Jizuiba`s Blog

大模型常见的各类名词都有什么

一、数据处理单元：Token

定义：大模型处理文本的最小单位，通过分词器将文本切分为片段

二、临时记忆体：Context

定义：大模型每次处理任务是接收的信息总和
组成：用户问题，对话历史、当前输出Token、工具列表、System Prompt等
容量限制：由 Context Windows（上下文窗口）定义，即最大可以处理的Token数

三、互层的语义约束：Prompt 与 System Prompt

可以认为提示词是一种非确定性编程输入。

Prompt：即 RPF（Request Response Framework）中的 Request Body。它承载了用户的即时意图。
System Prompt：这是模型运行时的全局配置（Configuration）。它在 LLM 的 Attention 机制中通常拥有更高的权重，用于定义模型的输出 Schema（如 JSON/Markdown）、安全边界、语境约束以及 Chain-of-Thought（思维链）的引导逻辑。
关联建议：在开发中，建议将 System Prompt 模块化，作为环境变量或配置文件解耦，以便进行 A/B Testing。
例如：
- Cursor 的 .cursorrules
- Claude 的 Claude.md

四、知识外挂与上下文注入：RAG

LLM 的参数化知识（Parametric Knowledge）存在长尾效应和时效性缺陷。RAG 是通过向量空间检索实现的“外挂硬盘”。

核心链路：Query -> Embedding -> Vector DB (ANN Search) -> Context Window -> Generation

五、外部扩展能力：Tool

定义：大模型调用外部函数，使其能够感知和影响外部环境
核心链路：Query -> 平台转发（含Tools） -> 分析并确定工具调用指令 -> doing -> 整理结果 -> result

六、工具标准化：MCP

定义：Model Context Protocol 模型上下文协议
可以理解为统一工具的接入标准，解决不同平台工具接入不一致的问题

七、智能体：Agent

定义：是一个闭环控制系统。它具备 Planning（规划）、Memory（记忆） 和 Tool Use（工具使用） 三大核心能力。

八、说明文档：Agent SKills

定义：给 Agent 的说明文档，包含任务规则、执行步骤、输出格式等
结构：
- 元数据层：名称、描述
- 指令层：目标、执行步骤、判断规则、输出格式、示例
支持运行代码、引用资源，采用渐进式披露机制节省Token

Skills 也是“按规矩办事”，它与 Workflow 有什么区别呢？
Workflow：通过规则配置把多个步骤进行编排与调度的流程
某种意义上 Skills 也是这样做的，但 Workflow 的流程结构在设计阶段就已经确定了，而 Skills 实际上是由大模型驱动，所以更加灵活一些，但二者在最终都能实现相似的结果。