当前位置: 首页 > news >正文

什么是缺口箱线图?如何绘制?

       大家好,我是带我去滑雪!

       箱线图是一种用于展示数据分布特征的统计图表,又称为盒状图或盒须图。它主要通过一个“箱子”和延伸出的“须”来展示一组数据的中位数、上下四分位数、最大值、最小值以及异常值。箱子的中线表示中位数,上边缘和下边缘分别代表上四分位数(Q3)和下四分位数(Q1),而“须”则延伸至数据中非异常的最大值和最小值。任何超出上下“须”范围的点通常被视为异常值,并以小圆点等形式标出。箱线图的作用主要体现在能直观地比较不同数据集的分布情况,包括数据的集中趋势、离散程度以及是否存在异常值。这种图形广泛用于数据分析、科学实验、质量控制等领域,尤其适用于需要比较多个组别数据时,可以一眼看出哪些数据集偏高、偏低,哪一组数据更稳定或离散程度更大。箱线图是一种高效的可视化工具,能帮助我们快速掌握数据的总体结构和关键特征。

        现在越来越多的科研论文都在用缺口箱线图,缺口箱线图(Notched Box Plot)在展示数据集中趋势时具有更强的表达能力,特别是在比较不同组之间的中位数差异方面提供了更直观和统计学上的信息支持。缺口箱线图最早由约翰·图基(John Tukey)提出,是对传统箱线图的一种改进。在普通箱线图中,虽然可以看出中位数的位置,但无法判断不同组的中位数差异是否具有统计显著性。而缺口箱线图在箱子的中位数位置引入了“缺口”——即一个收缩的区域,这个缺口的宽度基于中位数的估计标准误差。如果两个箱线图的缺口区域没有重叠,则可以初步认为这两组数据的中位数在统计上是显著不同的。

       这种图形之所以受到科研人员的欢迎,在作者看来主要有以下几个优势。首先,它在可视化中融合了统计推断的功能,使读者无需额外计算即可大致判断组间差异的显著性;其次,它在图形简洁的基础上增强了解读深度,特别适合多组数据比较的情境;再次,缺口箱线图对异常值和离群点仍保留了标示能力,使数据的完整性得以体现。因此,在强调数据可视化与统计解释并重的当代科研中,缺口箱线图成为了一个功能丰富、表达精准的优选工具。

      下面我们开始代码实战。


library(ggplot2)
library(patchwork)
data(mpg)
mpg$class = as.factor(mpg$class)
mpg$class
ggplot(mpg, aes(class, hwy))+stat_boxplot(geom="errorbar",width=0.1,size=0.5) + geom_boxplot(aes(fill=class),color="blue",linewidth=0.5,outlier.color="blue",)p1 <- ggplot(mpg, aes(class, hwy)) +stat_boxplot(geom="errorbar", width=0.1, size=0.5) +geom_boxplot(aes(fill=class),linewidth=0.5,) +theme_bw() +theme(panel.background = element_rect(fill = "transparent", colour = NA),plot.background = element_rect(fill = "transparent", colour = NA),legend.background = element_rect(fill = "transparent", colour = NA),legend.box.background = element_rect(fill = "transparent", colour = NA),legend.position = "none"  # 隐藏图例) +ggtitle('Plot1')p1ggsave(filename = "E:/工作/硕士/boxplot_transparent.pdf",plot = p1,device = cairo_pdf, bg = "transparent",width = 10, height = 8, units = "in"
)save_path_pdf <- "E:/工作/硕士/boxplot.pdf"
p2 <-ggplot(mpg, aes(class, hwy)) +stat_boxplot(geom = "errorbar", width = 0.1, size = 0.5) +geom_boxplot(aes(fill = class),color = "blue",linewidth = 0.5,outlier.color = "blue",outlier.fill = "red") +theme_bw() +theme(panel.background = element_rect(fill = "transparent", colour = NA),plot.background = element_rect(fill = "transparent", colour = NA),legend.background = element_rect(fill = "transparent", colour = NA),legend.box.background = element_rect(fill = "transparent", colour = NA))+ggtitle('Plot2')
p2ggsave(filename = save_path_pdf,plot = p2,device = cairo_pdf,bg = "transparent",width = 10, height = 8, units = "in"
)cat("PDF 保存成功,路径为:", save_path_pdf)p1+p2ggsave(filename = "E:/工作/硕士/科研/Combination chart.pdf",plot = p1+p2,device = cairo_pdf,  # 使用cairo_pdf支持透明bg = "transparent",width = 10, height = 8, units = "in"
)

输出结果:


更多优质内容持续发布中,请移步主页查看。

若有问题可邮箱联系:1736732074@qq.com 

博主的WeChat:TCB1736732074

   点赞+关注,下次不迷路!

http://www.lqws.cn/news/478567.html

相关文章:

  • .Net 9.0环境下WebApi发布到IIS
  • VB.NET,C#在线程中修改UI的安全操作
  • rknn优化教程(三)
  • WEB3开启 Hardhat 自动验证有什么意义
  • uview ui request get / post 传参含params和json数据的分析和使用
  • 【Redis】解码Redis中hash类型:理解基础命令,以及内部编码方式和使用场景
  • 原创模板--微信小程序 实现的背单词程序
  • 62-Oracle ADR(Automatic Diagnostic Repository)
  • 二、Generative adversarial network (GAN)
  • Spring Boot Actuator 跟踪HTTP请求和响应
  • 【数据结构与算法】数据结构初阶:详解顺序表和链表(一)
  • C++,Qt事件处理机制编程开发练习全解析,23000字解析!!
  • RabbitMQ从入门到实践:消息队列核心原理与典型应用场景
  • Oracle 数据库查询:单表查询
  • 嵌入式通信协议框架的四层架构设计与实现
  • 【云原生】Docker 部署 Elasticsearch 9 操作详解
  • 华为OD-2024年E卷-字符串化繁为简[200分] -- python
  • 「Linux文件及目录管理」vi、vim编辑器
  • Ragflow 源码:task_executor.py
  • Sqlserver 设置对特定数据库特定表只读访问权限
  • 1928: 日期差值 codeup
  • MySQL安装与配置【windowsMac】
  • Unity3D仿星露谷物语开发69之动作声音
  • Unity Addressable使用之服务器远程加载
  • leetcode:面试题 08.01. 三步问题
  • AWS认证系列:考点解析 - cloud trail,cloud watch,aws config
  • JavaEE-Mybatis初阶
  • ubuntu24.04+5090显卡驱动安装踩坑
  • C4.5算法深度解析:决策树进化的里程碑
  • 低空经济三大赛道深度解析:交通、安防、能源领域的革命性突破