AI相关概念简单介绍

介绍一些AI相关的概念

概念都是个人理解,如有错误欢迎指出。

LLM (大语言模型)

  • 定义:LLM是一个参数量巨大的数学模型(统计概率模型);本质上是词语接龙不断去预测下一个字。
  • 诞生:分为两个阶段
    • 训练
    • 推理
  • 涌现: 当参数达到一定规模时,AI 会突然获得原本不具备的复杂逻辑推理、代码理解等高级能力。

Token(词元)

  • 定义:是LLM(大语言模型)的最小语义单元
  • 本质:token是什么?其实就是代表单词的的编号

Tokenizer(分词器)

  • 作用:把文本切成一个个 token(子词 / 字 / 符号),再将token映射成token ID(整数编号);最后就变成了一串数字编号

Embedding(嵌入)

  • 定义:Embedding就是大模型自己的语言,注意:embedding模型属于LLM模型中的一部分。
  • 作用:把每个 token ID 转换成一个 高维向量

为什么要引入高维数据向量?

  • 主要是为了从更多的维度描述单词。

例如:维度1表示颜色;维度2表示形状;苹果和西瓜在向量坐标中虽然编号不同;但是空间位置很相近。

Function Call(方法调用)

  • 本质:工具调用函数。
  • 作用:允许模型在需要时调用预定义的函数来获取数据或执行操作。
  • 缺点
    • Function Call的平台依赖性强,没有一个统一的标准,不能做到即插即用。
    • 一般是本地程序调用,外界无法使用;也因此MCP应运而生。

MCP(模型上下文协议)

官方文档

什么是MCP?

  • 定义:MCP模型上下文协议 定义了应用程序和 AI 模型之间交换上下文信息的方式。
  • 作用:主要是为了增强AI的能力,作为使用者通过MCP我们可以轻松接入别人已经写好的服务。

注意:MCP只是一个标准协议,并不提供特定的服务,你可以按照要求编写自己的MCP服务。

MCP架构

分为:客户端、服务端;客户端可以连接多个MCP服务。

Agent Skills (智能体技能)

  • 本质:Agent Skills 的本质不是工具,而是:

    行为规范 + 专业知识 + 使用时机的组合

  • 组成:其实就是一个文件夹(相当于打包好的提示词工程);里面必须有一个 SKILL.md 文件(包含说明和元数据),可选其他资源文件(如脚本、示例、参考文档)。

  • 使用:Agent Skills 的关键是渐进式披露,分三层加载:

    • 技能发现 :AI 先读取所有技能的元数据(name 和 description),判断任务是否相关,注意:这些元数据始终在系统提示中。
    • 加载核心指令 : 如果相关,AI 自动读取 SKILL.md 的正文内容,获取详细指导。
    • 加载资源文件 :按需读取,执行脚本。

Agent Skills和MCP的区别?

MCP需要把完整的MCP协议规范告诉AI,占用大量上下文,即使你不去用他,如果你装的MCP多,就没多少可用的上下文了,必须手动控制启用和禁用以节省上下文空间。skills相当于打包好的一套提示词工程,包含提示词、文档、脚本、工具,然后把简单的元数据告诉AI。

简单来讲:
Agent Skills相当于懒加载,一个是按需加载自动决定上下文。
MCP是启动就加载,并且每次请求都会占用上下文。

大模型的幻觉

1.什么是幻觉?

其实就是大模型生成不合理或完全虚构的内容。

2.为什么会出现幻觉?

  • 一方面,模型的训练数据中可能包含错误或过时的信息。
  • 另一方面,大语言模型本质上是 预测下一个词的概率 模型,它们倾向于生成流畅而未必准确的内容。

RAG(检索增强生成)

  • 作用:可以解决‌大模型的知识时效性限制和幻觉问题。

  • 实现步骤

    1. 前置准备
    • 文档收集和切割
    • 向量转换和存储
    1. 实现增强
    • 文档过滤和检索
    • 查询增强和关联

注意:RAG进行向量转换的Embedding模型和LLM的Embedding的模型并不一致。LLM的Embedding模型是随着训练一起出来的,而RAG进行向量转换的Embedding模型是需要单独去训练的。

差异

  • RAG Embedding:对整段文本做语义压缩,输出一个向量。
  • LLM Embedding:对每个 token 编码,再通过 Transformer 整体理解整句话。

AI Agent(智能体)

  • 定义:会自己思考 + 能自己行动的 AI。
  • 分类
    • 反应式智能体
    • 有限规划智能体
    • 自主规划智能体

CoT(思维链)

  • 定义:让 AI 像人类一‌样 “思考” 的技术,帮助 AI 在处理复杂问题时能够先思考后执行。(思维链的实现主要是通过prompt实现)。

Agent Loop(执行循环)

  • 定义:智能体在没有用户输入‎的情况下,自主重复执‌行推理和工具调用的过程。

React模式(思考 - 行动 - 观察)

  1. 先思考执行需要哪些工具
  2. 执行工具
  3. 根据工具结果判断是否完成该任务
  4. 循环执行
最后更新于 2026-03-24