Matplotlib 生成 CDF 图
本篇文章解释了如何使用 Python 中的 Matplotlib 生成一个 CDF
图。CDF
是一个函数,它的 y 值代表一个随机变量取值小于或等于相应 x 值的概率。
在 Python 中使用 Matplotlib 绘制 CDF
CDF 是对连续概率分布和离散概率分布的定义。在连续概率分布中,随机变量可以从指定的范围内取任何值,但在离散概率分布中,我们只能有一组指定的值。
使用 Python 中的 Matplotlib 绘制离散分布的 CDF
import numpy as np
import matplotlib.pyplot as plt
x=np.arange(1,7)
y=[0.2,0.1,0.1,0.2,0.1,0.3]
cdf=np.cumsum(y)
plt.plot(x,y, marker="o",label="PMF")
plt.plot(x,cdf,marker="o",label="CDF")
plt.xlim(0,7)
plt.ylim(0,1.5)
plt.xlabel("X")
plt.ylabel("Probability Values")
plt.title("CDF for discrete distribution")
plt.legend()
plt.show()
输出:
它绘制给定分布的 PMF
和 CDF
。为了计算 CDF
的 y 值,我们使用 numpy.cumsum()
方法计算一个数组的累计和。
如果给定的是频率计数,我们必须对 y-值进行归一化,使其代表 PDF
。
import numpy as np
import matplotlib.pyplot as plt
x=np.arange(1,7)
frequency=np.array([3,8,4,5,3,6])
pdf=frequency/np.sum(frequency)
cdf=np.cumsum(pdf)
plt.plot(x,pdf, marker="o",label="PMF")
plt.plot(x,cdf,marker="o",label="CDF")
plt.xlim(0,7)
plt.ylim(0,1.5)
plt.xlabel("X")
plt.ylabel("Probability Values")
plt.title("CDF for discrete distribution")
plt.legend()
plt.show()
输出:
这里,我们得到每个 X 值的频率值。我们将频率值转换为 pdf
值,方法是将 pdf
数组的每个元素除以频率之和。然后,我们使用 pdf
计算 CDF
值,绘制给定数据的 CDF
。
我们也可以使用直方图来查看 CDF
和 PDF
图,这对于离散数据来说会更加直观。
import numpy as np
import matplotlib.pyplot as plt
data = [3,4,2,3,4,5,4,7,8,5,4,6,2,1,0,9,7,6,6,5,4]
plt.hist(data,bins=9,density=True)
plt.hist(data,bins=9, density=True, cumulative=True, label='CDF', histtype='step')
plt.xlabel("X")
plt.ylabel("Probability")
plt.xticks(np.arange(0,10))
plt.title("CDF using Histogram Plot")
plt.show()
输出:
它使用 hist()
方法绘制给定数据的 CDF
和 PDF
。为了绘制 CDF
,我们设置 cumulative=True
和设置 density=True
,以得到一个代表概率值相加为 1 的直方图。
在 Python 中使用 Matplotlib 绘制连续分布的 CDF
import numpy as np
import matplotlib.pyplot as plt
dx = 0.005
x = np.arange(-10, 10, dx)
y = 0.25*np.exp((-x ** 2)/8)
y=y/ (np.sum(dx * y))
cdf = np.cumsum(y * dx)
plt.plot(x,y,label="pdf")
plt.plot(x,cdf,label="cdf")
plt.xlabel("X")
plt.ylabel("Probability Values")
plt.title("CDF for continuous distribution")
plt.legend()
plt.show()
输出:
它绘制给定连续分布的 PMF
和 CDF
。为了计算 CDF
的 y 值,我们使用 numpy.cumsum()
方法计算一个数组的累积和。
我们将 y
除以数组 y
的总和乘以 dx
,以使 CDF
值的范围从 0 到 1。
相关文章
Django 中的 Slug
发布时间:2023/05/04 浏览次数:173 分类:Python
-
本篇文章旨在定义一个 slug 以及我们如何使用 slug 字段在 Python 中使用 Django 获得独特的帖子。
在 Django 中按降序过滤查询集中的项目
发布时间:2023/05/04 浏览次数:157 分类:Python
-
在这个讲解中,学习如何借助 Django 中的 order_by() 方法按降序过滤出查询集中的项目。
Django ALLOWED_HOSTS 介绍
发布时间:2023/05/04 浏览次数:181 分类:Python
-
本文展示了如何创建您的 Django 网站,为公开发布做好准备,如何设置 ALLOWED_HOSTS 以及如何在使用 Django 进行 Web 部署期间修复预期的主要问题。
Django 中的 Select_related 方法
发布时间:2023/05/04 浏览次数:129 分类:Python
-
本文介绍了什么是查询集,如何处理这些查询以及我们如何利用 select_related() 方法来过滤 Django 中相关模型的查询。
使用 Post 请求将数据发送到 Django 服务器
发布时间:2023/05/04 浏览次数:159 分类:Python
-
在这篇关于Django的讲解中,我们简要介绍了post和get请求以及如何在Django中用post实现CSRF token。
Django 返回 JSON
发布时间:2023/05/04 浏览次数:106 分类:Python
-
在与我们的讨论中,我们简要介绍了 JSON 格式,并讨论了如何借助 Django 中的 JsonResponse 类将数据返回为 JSON 格式。
在 Django 中创建对象
发布时间:2023/05/04 浏览次数:59 分类:Python
-
本文的目的是解释什么是模型以及如何使用 create() 方法创建对象,并了解如何在 Django 中使用 save() 方法。
在 Django 中为多项选择创建字段
发布时间:2023/05/04 浏览次数:75 分类:Python
-
在本文中,我们将着眼于为多项选择创建一个字段,并向您展示如何允许用户在 Django 中进行多项选择。