51个图表,完美展示数据分布关系!

本节介绍seaborn展示数据分布关系的图表(Distribution plots)的实现,该类图表用于展示数据集的分布规律,帮助快速获取数据多方面信息,例如,观测值的范围、中心趋势、是否存在某个方向上严重偏斜、是否存在双峰性、是否存在显著的异常值等等。

分布关系的图表包含:直方图、核密度估计(KDE)图、累积曲线图和轴须图(rug plot)。


直方图

直方图旨在通过分箱和计数观测值来近似生成数据的概率密度函数。

例如,堆积叠加直方图,

sns.displot(
    penguins,
    x="鳍长 (毫米)",
    kind='hist',
    hue="企鹅的种类",  #hue指定分组
    palette=["#006a8e", "#b1283a", "#a8a6a7"],
    multiple="stack")  #堆叠叠加

例如,百分比堆积,每个箱子中各组百分比累加为1,

sns.displot(
    penguins,
    x="鳍长 (毫米)",
    kind='hist',
    hue="企鹅的种类",  #hue指定分组
    palette=["#006a8e", "#b1283a", "#a8a6a7"],
    multiple="fill")  #百分比堆积


核密度估计图

核密度估计(KDE)图功能类似上文8.1 章节的直方图,区别于直方图使用离散箱,KDE图使用高斯核(Gaussian kernel)对观测值进行平滑处理,生成连续的密度估计,KDE图更清晰且更易解释。

例如,图层叠加,

sns.displot(
    penguins,
    x="鳍长 (毫米)",
    kind='kde',
    hue="岛屿",  #按照变量"岛屿"分组
    fill=True,
    multiple="layer",  #指定按照'layer'叠加
    palette=["#006a8e", "#b1283a", "#a8a6a7"],
)

例如,堆积叠加,

sns.displot(
    penguins,
    x="鳍长 (毫米)",
    kind='kde',
    hue="岛屿",
    fill=True,
    multiple="stack",  #"stack"设置堆积叠加
    palette=["#006a8e", "#b1283a", "#a8a6a7"],
)

例如,百分比叠加,

sns.displot(
    penguins,
    x="鳍长 (毫米)",
    kind='kde',
    hue="岛屿",
    fill=True,
    multiple="fill",  #"fill"设置百分比叠加
    palette=["#006a8e", "#b1283a", "#a8a6a7"],
)


累积曲线图

累积曲线图,全称“经验累积分布函数”(ecdf,empirical cumulative distribution functions),反映数据集中小于某值的观测比例,提供直观的分布图。

 例如,分组累积曲线图,

sns.displot(data=penguins,
            x="鳍长 (毫米)",
            hue="企鹅的种类", # hue设置分组
            kind="ecdf",
            palette=["#006a8e", "#b1283a", "#a8a6a7"])

例如,补集累积分布函数,

sns.displot(
    data=penguins,
    x="鳍长 (毫米)",
    hue="企鹅的种类",
    complementary=True,  #complementary开启补集累积分布函数complementary CDF (1 - CDF)
    kind="ecdf",
    palette=["#006a8e", "#b1283a", "#a8a6a7"])


轴须图

轴须图(rug plot)通过在x轴和y轴上绘制刻度以显示变量的位置,以补充其他图表。

例如,散点图和轴须图一起用,

sns.scatterplot(#使用axes-level方法:如上文的scatterplot()、lineplot()等
    data=penguins,  
    x="鳍长 (毫米)",
    y="喙长 (毫米)",
    hue="企鹅的种类",
    style="企鹅的种类",
    palette=["#006a8e", "#b1283a", "#a8a6a7"],
    s=200)
sns.rugplot(
    data=penguins,
    x="鳍长 (毫米)",  #x轴轴须图
    y="喙长 (毫米)",  #y轴轴须图
    hue="企鹅的种类",
    palette=["#006a8e", "#b1283a", "#a8a6a7"],
    legend=False  #关闭轴轴须图图例
)

再例如,kde图和轴须图一起使用,

sns.kdeplot(#使用axes-level方法:kdeplot()
    data=penguins,  
    x="鳍长 (毫米)",  #x轴轴须图
    hue="企鹅的种类",
    fill=True,
    multiple="layer",
    palette=["#006a8e", "#b1283a", "#a8a6a7"])
sns.rugplot(data=penguins,
            x="鳍长 (毫米)",
            hue="企鹅的种类",
            palette=["#006a8e", "#b1283a", "#a8a6a7"],
            legend=False)  #关闭轴轴须图图例


直方图、核密度估计(KDE)图、累积曲线图和轴须图(rug plot)更多变种,

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/759225.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

10大内网安全管理系统!企业内网安全必备系统

内网安全管理系统对于维护企业网络安全至关重要,它们帮助监控、管理内部网络资源,防止数据泄露和安全威胁。以下是十款知名的内网安全管理系统。 1. 安企神终端安全管理系统 详细介绍: 安企神是针对企业内网安全需求设计的一款综合管理系统&…

在大数据盛行的今天,为什么需要使用图数据库?

分类 性能 可扩展性 灵活性 复杂性 键值存储数据库 高 高 高 无 文档数据库 高 可变 高 低 列存储数据库 高 可变 一般 低 图数据库 可变 高 高 高 关系型数据库 可变 可变 低 一般 表1:5类主流数据库产品分析 对于深度数据的分析和…

数值分析笔记(四)数值微积分

牛顿-科茨公式 ∫ a b f ( x ) d x ≈ ( b − a ) ∑ k 0 n C k ( n ) f ( a k h ) \int_a^bf(x) \mathrm{d}x\approx(b-a)\sum_{k0}^nC_k^{(n)}f(akh) ∫ab​f(x)dx≈(b−a)k0∑n​Ck(n)​f(akh) 其中, C k ( n ) C_k^{(n)} Ck(n)​为科茨系数。 n1时&#xff…

Drag Select Compose:实现多平台图片多选功能的利器

Drag Select Compose:实现多平台图片多选功能的利器 在现代移动应用开发中,图片多选功能是一个常见且实用的需求。而实现这种功能可能涉及到复杂的手势处理和状态管理。今天,我将介绍一款强大的Compose多平台库——Drag Select Compose,它能够轻松实现类似于Google Photos…

Qt开发 | 无边框窗口 | 自定义标题栏 | 拖拽拉伸 | 窗口阴影 | 圆角窗口

文章目录 一、QWidget类介绍二、无边框窗口的基本实现三、自定义标题栏并实现拖拽拉伸四、设计一个无边框窗口公共类五、标题栏qss美化、关闭、最小化、最大化六、实现窗口阴影七、圆角窗口八、一个自定义标题栏带圆角阴影的窗口 一、QWidget类介绍 QWidget 是 Qt 框架中的一个…

SpringBoot整合MongoDB JPA使用

一、整合MongoDB SpringDataMongoDB是 SpringData家族成员之一,MongoDB的持久层框架,底层封装了 mongodb-driver。mongodb-driver 是 MongoDB官方推出的 Java连接 MongoDB的驱动包,相当于JDBC驱动。 SpringBoot整合 MongoDB,引入…

【MySQL】数据库——备份与恢复,日志管理1

一、数据备份的重要性 1.备份的主要目的是灾难恢复 在生产环境中,数据的安全性至关重要 任何数据的丢失都可能产生严重的后果造成数据丢失的原因: 程序错误人为,操作错误运算错误磁盘故障灾难(如火灾、地震)和盗窃 2.数据库备份…

pcap包常见拆分方法

文章目录 Wireshark 拆分流量包SplitCap使用简介魔数报错示例结果 在进行流量分析时,经常需要分析pcap流量包。但是体积过大的流量包不容易直接分析,经常需要按照一定的规则把它拆分成小的数据包。 这里统一选择cic数据集里的Thursday-WorkingHours.pcap…

【Oracle篇】逻辑备份工具expdp(exp)/impdp(imp)和物理备份工具rman的区别和各自的使用场景总汇(第八篇,总共八篇)

💫《博主介绍》:✨又是一天没白过,我是奈斯,DBA一名✨ 💫《擅长领域》:✌️擅长Oracle、MySQL、SQLserver、阿里云AnalyticDB for MySQL(分布式数据仓库)、Linux,也在扩展大数据方向的知识面✌️…

基于局域网下的服务器连接、文件传输以及内网穿透教程 | 服务器连接ssh | 服务器文件传输scp | 内网穿透frp | 研究生入学必备 | 深度学习必备

🙋大家好!我是毛毛张! 🌈个人首页: 神马都会亿点点的毛毛张 📌本篇博客分享的是基于局域网下的服务器连接🔗、文件传输以及内网穿透教程,内容非常完备✨,涵盖了在服务器上做深度学…

目标检测常用涨点方法:注意力机制小结(空间注意力、通道注意力、CBAM等)

1.通道注意力 通道注意力(Channel Attention)是在通道维度上对输入数据进行学习,再对不同的通道分配相应的权重表示重要性,从而达到“分配注意力”的效果。SENet(Squeeze and Excitation networks) 是一个典型的使用通…

J020_二分查找算法

一、查找过程 使用二分查找算法有一个必要的前提:数组已经是一个排好序的数组。 以下面数组为例,讲述二分查找过程: 二、代码实现 package com.itheima.sort;public class BinarySearch {public static void main(String[] args) {int[] a…

STM32第十三课:DMA多通道采集光照烟雾

文章目录 需求一、DMA(直接存储器存取)二、实现流程1.时钟使能2.设置外设寄存器地址3.设置存储器地址4.设置要传输的数据量5.设置通道优先级6.设置传输方向7.使通道和ADC转换 三、数据处理四、需求实现总结 需求 通过DMA实现光照强度和烟雾浓度的多通道…

VQVAE:Neural Discrete Representation Learning

论文名称:Neural Discrete Representation Learning 开源地址 发表时间:NIPS2017 作者及组织:Aaron van den Oord,Oriol Vinyals和Koray Kavukcuoglu, 来自DeepMind。 1、VAE 简单回顾下VAE的损失函数,ELBO的下界为: …

单晶层状氧化物制作方法技术资料 纳离子技术

网盘 https://pan.baidu.com/s/1hjHsXvTXG74-0fDo5TtXWQ?pwd10jk 单晶型高熵普鲁士蓝正极材料及其制备方法与应用.pdf 厘米级铬氧化物单晶及其制备方法和存储器件.pdf 多孔氧化物单晶材料及其制备方法和应用.pdf 大单晶层状氧化物正极材料及其制备方法和应用.pdf 富钠P2相层状…

3DMAX折纸插件FoldPoly使用方法详解

3DMAX折纸插件FoldPoly使用教程 3DMAX折纸插件FoldPoly,用于挤出可编辑多边形的边(边界)并可旋转(折叠)新生成的面,创建类似手工折纸以及纸箱包装盒的建模效果。 【版本要求】 3dMax2014 - 2025&#xff…

线性代数|机器学习-P20鞍点和极值

文章目录 1 . 瑞利商的思考1.1 瑞利商的定义1.2 投影向量 2. 拉格朗日乘子法3. 鞍点 1 . 瑞利商的思考 1.1 瑞利商的定义 假设A是n阶实对称矩阵,x是n维非零列向量,那么瑞利商表示如下: R ( A , x ) x T A x x T x \begin{equation} R(A,x…

嵌入式学习——硬件(ARM内核汇编指令)——day52

ARM汇编指令 学习arm汇编的主要目的是为了编写arm启动代码,启动代码启动以后,引导程序到c语言环境下运行。换句话说启动代码的目的是为了在处理器复位以后搭建c语言最基本的需求。因此启动代码的主要任务有: 初始化异常向量表;初…

前端学习 Vue 插槽如何实现组件内容分发?

目录 一、Vue.js框架介绍二、什么是Vue 插槽三、Vue 插槽的应用场景四、Vue 插槽如何实现组件内容分发 一、Vue.js框架介绍 Vue.js是一个用于构建用户界面的渐进式JavaScript框架。它设计得非常灵活,可以轻松地被集成到现有的项目中,也可以作为一个完整…

Redis-实战篇-缓存击穿问题及解决方案

文章目录 1、缓存击穿2、常见的解决方案有两种:2.1、互斥锁2.2、逻辑过期2.3、两种方案对比 3、利用互斥锁解决缓存击穿问题3.1、ShopServiceImpl.java3.2、使用 jmeter.bat 测试高并发 4、利用逻辑过期解决缓存击穿问题 1、缓存击穿 缓存击穿问题 也叫 热点key问题…