当前位置: 首页 > news >正文

如果你在为理解RDA、PCA 和 PCoA而烦恼,不妨来看看丨TomatoSCI分析日记

当你学习了 RDA、PCA 和 PCoA 这三种常见排序方法后,脑子里是不是也冒出过类似的疑问:

PCA、PCoA、RDA 不都能画图吗?是不是可以互相替代?

RDA 图上也有样本点,那我还需要 PCoA 干什么?

...

这些看似“都在画点图”的方法,其实背后的原理、假设和适用场景大不相同。如果不搞清楚,就可能用错方法、画错图,甚至在结果解读上南辕北辙。


01 PCA:变量出发,寻找主要变异方向

PCA(主成分分析)关注的是样本在变量空间中的最大方差方向,分析的是变量之间的协方差结构,它强调正负方向。

举个例子:你有 10 个水样本,每个样本测了 5 种金属(铅、汞、铬、镉、锌)的浓度。你想知道哪些样本之间在“污染物组成”上差异最大,这时候就可以使用 PCA。

在 PCA 中,如果两个样本点在某条主成分轴(PC1、PC2 等)上方向相反,

那么它们在这个主成分所代表的变量组合上,存在“相反的趋势”或“对立的特征”。

适用场景:多个连续性变量之间的结构探索;没有主次之分的变量(不区分因变量、自变量)


02 PCoA:距离出发,还原相似性结构

PCoA是基于距离矩阵进行降维的排序方法。它的目标是:在保留样本之间原始距离关系的前提下,将样本映射到一个低维空间中进行展示。

举个例子:你采集了多个土壤样本,记录了每个样本中出现的真菌种类(是/否,0/1),这个时候可以利用Jaccard系数这个指标算出距离,再用 PCoA 展现样本之间的相似性或差异性。

数据类型可以是:二元数据(0/1,表示物种是否出现);丰度数据(连续型),非常灵活。

适用场景:样本之间差异更关注“距离感”而不是变量结构;适用于各种类型的数据,尤其是群落数据、稀疏数据(很多0);同样不区分因变量、自变量,属于“自由排序”


03 RDA:模型出发,解释结构背后的驱动因子

RDA是一个受约束的排序方法,它的本质是将多个因变量(如物种数据)在多个解释变量(如环境因子)构建的回归模型上做PCA,关注的是“解释变量是否能解释群落结构的差异”。

举个例子:你采集了 15 个浮游生物样本,同时记录了每个样本点的水温、盐度、pH 等环境数据。现在你不仅想知道样本之间群落结构是否不同,更重要的是——你想知道,“是不是温度或盐度影响了这些差异?”

这时,RDA 就可以帮你回答这个问题:它会把样本在被解释变量(如温度、盐度)张成的空间中排序,从而可视化这些因子的解释方向与作用强度。

适用场景:你同时有环境变量(解释变量)和群落结构(响应变量);想研究“哪些环境因子可能驱动了样本间的差异”;想对解释变量进行显著性检验,量化它们对群落结构的贡献。


04 总结与个人习惯

PCA 看重“方向”、PCoA 注重“距离”、而 RDA 的关键则在于“解释变量和响应变量”的对应关系。

PCA 是探索型的、PCoA 是结构还原型的,而 RDA 则是解释型的排序方法。 理解这三者背后的出发点不同,才能在实际应用中真正做到“方法对题、图对解”。

在实际分析中, 我更喜欢:用PCoA来确定样本之间的关系,PCoA 对“样本之间的距离感”还原得更加直观清晰;用PCA来探索“自由”的变量之间的关系;用RDA来探索“有因果关系”的变量之间的关系。


TomatoSCI科研数据分析平台,欢迎大家来访!

http://www.lqws.cn/news/534169.html

相关文章:

  • [Andrej Karpathy] 大型语言模型作为新型操作系统
  • vue3 json 转 实体
  • 2D 基准情况下贝叶斯优化应用的概率推理
  • Ubuntu下布署mediasoup-demo
  • zabbix监控Centos 服务器
  • 波动方程能量守恒证明
  • dockers virbox 安装
  • COZE API上传文件 直接从前端发送就可以,而通过后端发请求给CozeAPI就不行,为什么?
  • Spring Boot 部署与打包方式详解(Jar vs War)
  • Windows命令连接符的安全风险分析与防御策略
  • SQLMesh:数据建模与版本控制的革新者
  • inverse-design-of-grating-coupler-3d(2)
  • 鸿蒙实时音视频流处理框架开发实战——基于HarmonyOS 4.0与分布式软总线的低延时高可靠架构
  • 从提示工程(Prompt Engineering)到上下文工程(Context Engineering)
  • PyTorch 模型镜像下载与安装指南
  • R 语言简介:数据分析与统计的强大工具
  • DSP学习笔记1
  • 声网对话式AI构建商品场景语义理解能力
  • 基于SpringBoot文件管理系统中的分片上传实现
  • 使用API有效率地管理Dynadot域名,出售账户中的域名
  • OpenCV CUDA模块设备层-----逐通道最小值比较函数min()
  • SpringBoot 中 @Transactional 的使用
  • 【LLM安全】MCP(模型上下文协议)及其关键漏洞、技术细节
  • 力扣网C语言编程题:搜索插入位置
  • mac电脑安装vscode的力扣插件报错解决办法
  • element-plus 按钮 展开/隐藏
  • 百面Bert
  • Ubuntu 搭建Kubernetes 1.28版本集群
  • 代码随想录day16二叉树4
  • 参展回顾 | AI应用创新场景:数据分析助手ChatBI、璞公英教学平台亮相2025四川国际职教大会暨产教融合博览会