当前位置: 首页 > news >正文

从0开始学习R语言--Day15--非参数检验

非参数检验

如果在进行T检验去比较两组数据差异时,假如数据里存在异常值,会把数据之间的差异拉的很大,影响正常的判断。那么这个时候,我们可以尝试用非参数检验的方式来比较数据。

假设我们有A,B两筐苹果,我们并不知道重量具体是多少,且看着苹果有很多不同大小,有的异常大,有的特别小。此时,我们先对两筐苹果做上属于各自的A、B标记,然后混在一起,通过天平比较大小,也就是对苹果重量做个排名。然后计算各自分组的所有苹果的排名总和,并计算检验统计量U_{A} = R_{A} - \frac{n_{A}(n_{A}+1)}{2}U_{B} = R_{B} - \frac{n_{B}(n_{B}+1)}{2}U = min(U_{A},U_{B})

将求得的U与以两组苹果数量为基础查的查曼-惠特尼U检验临界值表的U做对比,如果小于后者,则说明两组苹果存在差异。

下面我们用一组例子来说明:

set.seed(123)# A筐苹果:偏重的苹果(大部分在150g-300g)
apple_A <- round(runif(10, min=150, max=300), 1)# B筐苹果:偏轻的苹果(大部分在100g-200g)
apple_B <- round(runif(10, min=100, max=200), 1)# 创建数据框
fruit_data <- data.frame(weight = c(apple_A, apple_B),basket = rep(c("A", "B"), each=10)  # 标记属于哪一筐
)# 查看数据
print(fruit_data)boxplot(weight ~ basket, data=fruit_data, col=c("lightgreen", "orange"),main="两筐苹果的重量对比")wilcox.test(weight ~ basket, data=fruit_data)

输出:

	Wilcoxon rank sum exact testdata:  weight by basket
W = 93, p-value = 0.0004871
alternative hypothesis: true location shift is not equal to 0

从输出中可以看到,首先根据箱线图判断,因为明显不重叠,所以判断出两组数据可能存在差异。此时我们进一步计算,由于p=0.0004871 ,小于等于0.05,从而可以确定存在显著的差异,而不是因为异常值导致的差异。

http://www.lqws.cn/news/68779.html

相关文章:

  • Origin将杂乱的分组散点图升级为美观的带颜色映射的气泡图
  • Qt OpenGL 相机实现
  • 《深入解析SPI协议及其FPGA高效实现》-- 第二篇:SPI控制器FPGA架构设计
  • 无他相机:专业摄影,触手可及
  • 相机--相机标定
  • vite构建工具
  • leetcode hot100刷题日记——35.子集
  • Rust 变量与可变性
  • 实现Cursor + Pycharm 交互
  • 【leetcode】459.重复的子字符串
  • Java实习面试题
  • arc3.2语言sort的时候报错:(sort < `(2 9 3 7 5 1)) 需要写成这种:(sort > (pair (list 3 2)))
  • Python 训练营打卡 Day 33-神经网络
  • 电脑的ip地址会自动变怎么办?原因解析和解决方法
  • 【Ragflow】24.Ragflow-plus开发日志:增加分词逻辑,修复关键词检索失效问题
  • 神经网络与深度学习(第二章)
  • 神经网络基础:从单个神经元到多层网络(superior哥AI系列第3期)
  • 玩客云 OEC/OECT 笔记(2) 运行RKNN程序
  • LazyOwn RedTeam/APT 框架是第一个具有人工智能驱动的 CC 的 RedTeam 框架
  • TS 星际通信指南:从 TCP 到 UDP 的宇宙漫游
  • StarRocks物化视图
  • 基于 StarRocks + Iceberg,TRM Labs 构建 PB 级数据分析平台实践
  • 4.大语言模型预备数学知识
  • 从线性方程组角度理解公式 s=n−r(3E−A)
  • 用go从零构建写一个RPC(4)--gonet网络框架重构+聚集发包
  • 一次借助ChatGPT抵御恶意攻击的经历,为个人服务器添加自动防御系统Fail2ban
  • spring-cloud-alibaba-sentinel-gateway
  • 基于 Alpine 定制单功能用途(kiosk)电脑
  • FPGA仿真中阻塞赋值(=)和非阻塞赋值(<=)区别
  • 线性代数复习