当前位置: 首页 > news >正文

大语言模型(LLM)笔记

一、什么是大语言模型(LLM)?

LLM(Large Language Model) 是基于 Transformer 架构构建,并在海量文本语料上训练出的具备自然语言理解和生成能力的深度神经网络模型。

其本质任务是**预测下一个 token(词/字/符号)**的概率分布,但通过大规模参数和数据的支持,表现出类人智能的行为。


二、核心架构:Transformer

由 Google 在 2017 年提出,是目前 LLM 的主流架构。

Transformer 特点

  • 自注意力机制(Self-Attention):建模所有 token 间的依赖关系
  • 位置编码:添加序列顺序信息
  • 多头机制:捕获不同维度的语义
  • 残差结构 + LayerNorm:稳定训练

三、训练范式:预训练 + 微调(Prompt Learning)

阶段内容
预训练在大规模文本语料上无监督训练,学语言规律
微调(Fine-tuning)对特定任务(QA/翻译等)继续训练,提升适应性
Prompt Learning通过构造提示(prompt)而非修改参数,让模型完成新任务

四、LLM 应用


RAG(Retrieval-Augmented Generation)

“用大模型回答问题,但知识来源来自自己

原理

通过检索器获取相关文本,再将其连同用户问题一并输入到大模型中生成回答。

技术流程

用户问题
向量检索
相关知识片段
构建 Prompt
LLM 生成答案

技术栈组件

  • 向量数据库:FAISS、Milvus、Pinecone
  • Embedding 模型:OpenAI、bge-base、m3e
  • 检索器:语义搜索 / BM25 混合
  • 构造 Prompt:Chunk 拼接或摘要

应用场景

  • 私有知识库问答
  • 法律、金融、医疗文档理解
  • 企业级文档助手 / RAG ChatBot

Agent(智能体系统)

“让大模型像人一样思考、行动、调用工具

概念

Agent 是结合 LLM、任务规划与工具调用能力的执行体,能够模拟多轮决策过程。

执行流程

用户提问 → LLM 规划意图 → 调用工具/API → 得到中间结果 → 再决策 → 最终回答

常用框架

  • LangChain Agent
  • OpenAI Function Calling / Assistant API
  • CrewAI(多 Agent 协同)
  • AutoGPT(任务型 Agent)

应用场景

  • 多轮任务助手(报表生成、数据分析)
  • 具备记忆的 AI 角色(助理、法务、客服)
  • 多功能插件集成(搜索、浏览器、计算器)

MCP(Multi-Component Prompting)

“把复杂任务模块化提示工程实现精准控制”

概念

MCP 是将一个大任务拆分成多个子任务/模块,每个模块用独立 Prompt 描述,结果串联执行。

示例结构

任务:软件开发需求 → 多组件提示如下:1️⃣ 功能需求分析 Prompt  
2️⃣ 领域术语解释 Prompt  
3️⃣ 接口定义 Prompt  
4️⃣ 测试用例生成 Prompt  
5️⃣ 架构建议 Prompt

优点

  • 可调试、可维护、易重用
  • 提高准确性与鲁棒性
  • 适合构建低代码 AI 工作流系统

应用场景

  • 编程辅助系统(DevCopilot)
  • AI 产品经理(写需求、定义模块)
  • 教育类内容生成(按知识点分段)

五、三者协同应用范式

模型能力说明
RAG为 LLM 提供外部知识 → 确保“知”
Agent让 LLM 能规划执行动作 → 确保“行”
MCP结构化分解任务 → 确保“准”

三者结合是构建大模型应用的主流路径,如企业问答 + 插件调用 + 多步流程编排。


六、大模型应用生态与项目案例

场景应用形态
企业知识库助手RAG + Chat UI
智能客服机器人RAG + Agent + 状态记忆
AI 写作 / 报告生成MCP + Agent
AI 编程助手(类 Copilot)MCP + Agent + RAG(搜索 Stack Overflow)
法律 / 医疗问答平台RAG + 数据过滤 + LLM

七、一图看懂:LLM 应用生态

用户输入
是否需要知识
RAG 检索 + 构造Prompt
直接进入Prompt流程
LLM 生成
是否需要工具执行
Agent调用插件
直接返回
工具结果嵌入上下文
输出最终回答

八、总结

大模型是“智能大脑”,但要让它真正服务于业务,需要 RAG 补“知识”、Agent 管“行为”、MCP 拆“结构”,三者结合形成 AI 原子能力组合,是构建现代 AI 应用的核心方法论。

LangChain vs Spring AI:构建 RAG + Agent 的对比与实战


一、LangChain 是什么?

LangChain 是一个专为构建大语言模型(LLM)应用设计的 Python 框架,强调:

  • RAG(检索增强生成)
  • Agent(多步推理与工具调用)
  • Memory(上下文记忆)
  • 工具链生态(向量库、模型、工具集成)

优点:

  • 社区活跃,生态丰富
  • 与 OpenAI、Llama、FAISS、Chroma、Pinecone 等集成紧密
  • 非常适合快速构建复杂的 LLM 工作流

二、Spring AI 是什么?

Spring AI 是 Spring 官方推出的 Java 生态中的 LLM 应用开发框架,目标是让 Java 开发者也能优雅地调用大模型(OpenAI, Ollama, Azure)构建智能应用。

特点:

  • Spring Boot 风格、注解驱动
  • 支持 Embedding、RAG、Chat 模型
  • 配合向量数据库(Postgres, Milvus, Redis)构建问答系统
  • 主要聚焦 RAG,目前 Agent 功能较弱但在发展中

三、RAG 构建对比:LangChain vs Spring AI

特性LangChainSpring AI
编程语言PythonJava / Kotlin
数据处理能力拥有强大的 text splitter, loader基于 Spring Resource loader
向量库支持FAISS, Pinecone, Chroma, WeaviateRedis, PGVector, Qdrant, Milvus
RAG 管理方式手动或 Retriever chain 组合使用 @RagRetriever, @ChatClient 注解
Prompt 定制性自由拼装,链式调用支持 system/user prompt 模板
部署集成需要额外部署 API/Web UI可原生集成在 Spring Web / API 项目中

LangChain RAG 示例(Python)

from langchain.chains import RetrievalQA
from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.llms import OpenAI
from langchain.document_loaders import TextLoader# 1. 加载文档并生成向量索引
loader = TextLoader("your_docs.txt")
docs = loader.load()
vectorstore = FAISS.from_documents(docs, OpenAIEmbeddings())# 2. 构建检索器+问答链
retriever = vectorstore.as_retriever()
qa = RetrievalQA.from_chain_type(llm=OpenAI(), retriever=retriever)# 3. 执行问答
qa.run("公司加班制度是?")

Spring AI RAG 示例(Java / YAML 配置)

spring:ai:openai:api-key: your-api-keychat:model: gpt-3.5-turbovectorstore:type: pgvectorindex-name: documents
@Service
public class HRBot {private final ChatClient chatClient;public HRBot(ChatClient chatClient) {this.chatClient = chatClient;}public String ask(String question) {Prompt prompt = Prompt.builder().system("你是企业员工手册智能助手").user(question).build();return chatClient.call(prompt).getResult().getOutput().getContent();}
}

可以结合 RagRetrieverEmbeddingClient 自动实现向量检索 + prompt 注入。


四、Agent 构建对比

特性LangChain AgentSpring AI Agent 支持(较弱)
工具调用支持✅ ReAct, Function Agent❌(暂无成熟官方实现)
多步推理✅ 可自动 Reasoning/Plan/Act
插件接入能力✅ 支持搜索、代码执行、数据库等❌(需手动集成)
框架使用门槛较高,需理解 agent 架构简单,适合纯 RAG/问答

LangChain Agent 示例

from langchain.agents import initialize_agent, Tool
from langchain.tools import SerpAPIWrapper
from langchain.llms import OpenAIsearch = SerpAPIWrapper()
tools = [Tool(name="Google Search", func=search.run, description="搜索引擎")]agent = initialize_agent(tools, OpenAI(), agent="zero-shot-react-description", verbose=True)
agent.run("Who is the CEO of OpenAI and their latest news?")

五、总结:如何选择?

适合你是…推荐框架理由
Python 开发,快速迭代LangChain最强生态 + RAG/Agent 样例多
Java 项目、Spring体系Spring AI快速集成微服务,维护方便
需要构建复杂多工具工作流LangChain AgentAgent 系统强大
仅需构建企业问答系统Spring AI RAG代码少、易部署
http://www.lqws.cn/news/577009.html

相关文章:

  • UE5 一台电脑+双显示器 配置nDisplay裸眼3D效果
  • 东芝TC78S600FNG在打印机中的应用:静音、防卡纸与能效
  • Python 数据分析与机器学习入门 (八):用 Scikit-Learn 跑通第一个机器学习模型
  • 智慧畜牧-猪场猪只行为状态检测数据集VOC+YOLO格式3790张15类别
  • Java中for与foreach
  • python+uniapp基于微信小程序的生鲜订购系统nodejs+java
  • 基于uniapp的老年皮肤健康管理微信小程序平台(源码+论文+部署+安装+售后)
  • JAVA八股文:异常有哪些种类,可以举几个例子吗?Throwable类有哪些常见方法?
  • HTML5 实现的圣诞主题网站源码,使用了 HTML5 和 CSS3 技术,界面美观、节日氛围浓厚。
  • 湖北理元理律师事务所债务解法:从法律技术到生活重建
  • 车载Tier1 supplier梳理
  • VMware vSphere 9与ESXi 9正式发布:云原生与AI驱动的虚拟化平台革新
  • Nginx反向代理与缓存功能
  • 【软考高项论文】信息系统项目的资源管理
  • GitHub Actions配置python flake8和black
  • 企业流程知识:《企业再造:企业革命的宣言》
  • 大语言模型 API 进阶指南:DeepSeek 与 Qwen 的深度应用与封装实践
  • 【Linux】Vi编辑器保存和退出
  • AIGC检测系统升级后的AI内容识别机制与系统性降重策略研究(三阶段降重法)
  • Windows桌面上的「了解此图片」怎么弄掉?
  • Day2 音频基础知识
  • HarmonyOS NEXT仓颉开发语言实战案例:电影App
  • CAU数据挖掘 支持向量机
  • 基于 SpringBoot+Vue.js 诗词鉴赏论坛交流平台设计与实现7000字论文实现
  • android APP 小米商店上架失败之《获取应用列表权限》
  • Flutter插件ios_pod
  • 地级市-固定资产投资数据(2000-2023年)-实证数据
  • 气候智能体:AI如何重构人类应对气候危机的决策体系?
  • LabVIEW荧光微管图像模拟
  • Swift 实现二叉树垂直遍历:LeetCode 314 完整解析与实战示例