迹忆客 专注技术分享

当前位置:主页 > 学无止境 > 编程语言 > Python >

Matplotlib 生成 CDF 图

作者:迹忆客 最近更新:2023/03/17 浏览次数:

本篇文章解释了如何使用 Python 中的 Matplotlib 生成一个 CDF 图。CDF 是一个函数,它的 y 值代表一个随机变量取值小于或等于相应 x 值的概率。

在 Python 中使用 Matplotlib 绘制 CDF

CDF 是对连续概率分布和离散概率分布的定义。在连续概率分布中,随机变量可以从指定的范围内取任何值,但在离散概率分布中,我们只能有一组指定的值。

使用 Python 中的 Matplotlib 绘制离散分布的 CDF

import numpy as np
import matplotlib.pyplot as plt 

x=np.arange(1,7)
y=[0.2,0.1,0.1,0.2,0.1,0.3]
cdf=np.cumsum(y)

plt.plot(x,y, marker="o",label="PMF")
plt.plot(x,cdf,marker="o",label="CDF")
plt.xlim(0,7)
plt.ylim(0,1.5)
plt.xlabel("X")
plt.ylabel("Probability Values")
plt.title("CDF for discrete distribution")
plt.legend()
plt.show()

输出:

使用 Python 中的 Matplotlib 绘制离散分布的 CDF

它绘制给定分布的 PMFCDF。为了计算 CDF 的 y 值,我们使用 numpy.cumsum() 方法计算一个数组的累计和。

如果给定的是频率计数,我们必须对 y-值进行归一化,使其代表 PDF

import numpy as np
import matplotlib.pyplot as plt 

x=np.arange(1,7)
frequency=np.array([3,8,4,5,3,6])
pdf=frequency/np.sum(frequency)
cdf=np.cumsum(pdf)

plt.plot(x,pdf, marker="o",label="PMF")
plt.plot(x,cdf,marker="o",label="CDF")
plt.xlim(0,7)
plt.ylim(0,1.5)
plt.xlabel("X")
plt.ylabel("Probability Values")
plt.title("CDF for discrete distribution")
plt.legend()
plt.show()

输出:

使用 Python 中的 Matplotlib 绘制归一化后的离散分布的 CDF

这里,我们得到每个 X 值的频率值。我们将频率值转换为 pdf 值,方法是将 pdf 数组的每个元素除以频率之和。然后,我们使用 pdf 计算 CDF 值,绘制给定数据的 CDF

我们也可以使用直方图来查看 CDFPDF 图,这对于离散数据来说会更加直观。

import numpy as np
import matplotlib.pyplot as plt

data = [3,4,2,3,4,5,4,7,8,5,4,6,2,1,0,9,7,6,6,5,4]
plt.hist(data,bins=9,density=True)
plt.hist(data,bins=9, density=True, cumulative=True, label='CDF', histtype='step')
plt.xlabel("X")
plt.ylabel("Probability")
plt.xticks(np.arange(0,10))
plt.title("CDF using Histogram Plot")
plt.show()

输出:

使用直方图绘制离散分布的 CDF

它使用 hist() 方法绘制给定数据的 CDFPDF。为了绘制 CDF,我们设置 cumulative=True 和设置 density=True,以得到一个代表概率值相加为 1 的直方图。

在 Python 中使用 Matplotlib 绘制连续分布的 CDF

import numpy as np
import matplotlib.pyplot as plt 

dx = 0.005
x  = np.arange(-10, 10, dx)
y  = 0.25*np.exp((-x ** 2)/8)

y=y/ (np.sum(dx * y))
cdf = np.cumsum(y * dx)

plt.plot(x,y,label="pdf")
plt.plot(x,cdf,label="cdf")
plt.xlabel("X")
plt.ylabel("Probability Values")
plt.title("CDF for continuous distribution")
plt.legend()
plt.show()

输出:

使用 Python 中的 Matplotlib 绘制连续分布的 CDF

它绘制给定连续分布的 PMFCDF。为了计算 CDF 的 y 值,我们使用 numpy.cumsum() 方法计算一个数组的累积和。

我们将 y 除以数组 y 的总和乘以 dx,以使 CDF 值的范围从 0 到 1。

转载请发邮件至 1244347461@qq.com 进行申请,经作者同意之后,转载请以链接形式注明出处

本文地址:

相关文章

Pandas read_csv()函数

发布时间:2024/04/24 浏览次数:254 分类:Python

Pandas read_csv()函数将指定的逗号分隔值(csv)文件读取到 DataFrame 中。

Pandas 追加数据到 CSV 中

发布时间:2024/04/24 浏览次数:352 分类:Python

本教程演示了如何在追加模式下使用 to_csv()向现有的 CSV 文件添加数据。

Pandas 多列合并

发布时间:2024/04/24 浏览次数:628 分类:Python

本教程介绍了如何在 Pandas 中使用 DataFrame.merge()方法合并两个 DataFrames。

Pandas loc vs iloc

发布时间:2024/04/24 浏览次数:837 分类:Python

本教程介绍了如何使用 Python 中的 loc 和 iloc 从 Pandas DataFrame 中过滤数据。

扫一扫阅读全部技术教程

社交账号
  • https://www.github.com/onmpw
  • qq:1244347461

最新推荐

教程更新

热门标签

扫码一下
查看教程更方便