当前位置: 首页 > news >正文

李宏毅2025《机器学习》第三讲-AI的脑科学

在之前的课程中探讨了如何利用大模型构建AI Agent,本科将暂时放下应用层面的探索,拿起“手术刀”和“显微镜”,深入剖析LLM的“大脑”,带您踏上一场“AI脑神经科学”的旅程。课程不讨论模型的训练过程,而是假设我们拥有一个已经训练好的、功能完备的LLM。我们的目标是:理解这个庞大而复杂的神经网络,在面对输入并生成输出的每一个瞬间,其内部究竟发生了什么。

重要提醒: 正如李宏毅老师在课程开始时强调的,目前绝大多数的这类分析研究,受限于计算资源,往往是在相对较小或较早期的开源模型(如GPT-2、LLaMA系列早期版本)上进行的。这就像是通过研究老鼠的大脑来推断人类大脑的运作机制。虽然基本原理可能相通,但我们必须认识到,这些结论不一定完全适用于最新、最顶尖的闭源模型。然而,这些开创性的研究为我们提供了一套宝贵的分析方法论和深刻的洞见。

本次探索将分为四个部分:

  1. 单个神经元在做什么?——从最基础的单元开始。
  2. 一层神经元在做什么?——从个体到群体的协作模式。
  3. 跨层神经元如何互动?——追踪信息在网络中的完整流动路径。
  4. 让模型亲口说出想法——利用LLM的语言能力进行自我剖析。

第一部分:一个神经元的使命——“川普神经元”与分布式表达的现实

要理解一个神经元,我们首先要明确它在Transformer中的位置。在Transformer的每个层块(Layer)中,除了自注意力(Self-Attention)机制外,还有一个重要的部分叫做前馈网络(Feed-Forward Network, FFN)。这个FFN通常由两个线性层和一个非线性激活函数(如ReLU)组成。当我们说“一个神经元”时,通常指的就是FFN中第一个线性层之后、激活函数之前或之后的一个节点。它的输出,是其输入向量的加权和,再通过激活函数(例如ReLU,将负值归零)处理后的结果。一个神经元的“激活”,通常意味着它的输出值大于零。

那么,我们如何探究一个神经元的功能呢?通常遵循一个三步流程:

  1. 观察(相关性):找到能最大化激活该神经元的输入文本。例如,我们发现当某个神经元被高度激活时,模型倾向于生成脏话。这说明该神经元与“说脏话”这一行为相关
  2. 干预(因果性):为了验证因果关系,我们需要进行实验。最直接的方法是“敲除”(Ablation)这个神经元,即强制将其输出设为零(或其在大量数据上的平均激活值)。如果敲除后,模型在各种挑衅下都无法生成脏话,我们就能更确信这个神经元对“说脏话”有因果作用。
  3. 控制(剂量效应):如果可能,尝试不同程度地激活该神经元,观察其输出的变化。比如,轻微激活时说轻度脏话,强烈激活时则言辞激烈。

历史上最著名的例子莫过

http://www.lqws.cn/news/471115.html

相关文章:

  • AI大模型学习之基础数学:微积分在AI大模型中的核心-梯度与优化(梯度下降)详解
  • FreeRTOS事件组(Event Group)
  • Rust调用 DeepSeek API
  • kibana和elasticsearch安装
  • Docker简单介绍与使用以及下载对应镜像(项目前置)
  • 《揭开CSS渲染的隐秘角落:重排与重绘的深度博弈》
  • 《Whisper:开启语音识别新时代的钥匙》
  • 【Redis】深入理解 Redis 事务:命令、应用与实战案例
  • SiteAzure:解决数据库服务器内存频繁吃满
  • 【Weaviate底层机制】分布式一致性深度解析:Raft算法与最终一致性的协同设计
  • PHP语法基础篇(五):流程控制
  • 给交叉工具链增加libelf.so
  • PowerShell读取CSV并遍历组数组
  • 在 `setup` 函数中实现路由跳转:Vue3与Vue Router 4的集成
  • 《Whisper模型版本及下载链接》
  • 网络钓鱼攻击
  • 【论文笔记】【强化微调】T-GRPO:对视频数据进行强化微调
  • [muduo] TcpConnection | 回调交互
  • LLM-201: OpenHands与LLM交互链路分析
  • Linux致命漏洞CVE-2025-6018和CVE-2025-6019
  • 1、自然语言处理任务全流程
  • 什么是redission看门狗机制
  • Redis 分布式锁、红锁分别是什么?红锁有什么问题?
  • Python漂浮的爱心
  • 【Ambari3.0.0 部署】Step2—免密登陆认证-适用于el8
  • 智能机器人后期会如何发展?
  • 【烧脑算法】枚举:有序穷举,分步排查
  • 植物神经小知识
  • 教育培训APP源码核心功能开发详解:直播、考试、组卷系统全拆解
  • 力扣1546. 和为目标值且不重叠的非空子数组的最大数目