Matplotlib 密度图
为了使用 Python 生成密度图,我们首先使用 scipy.stats
模块中的 gaussian_kde()
方法从给定数据中估计密度函数。然后我们绘制密度函数,生成密度图。另外,我们也可以使用 seaborn
包中的 kdeplot()
或者在 pandas.DataFrame.plot()
方法中设置 kind='density'
来生成密度图。
使用 scipy.stats
模块中的 gaussian_kde()
方法生成密度图
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import kde
data = [2,3,3,4,2,1,5,6,4,3,3,3,6,4,5,4,3,2]
density = kde.gaussian_kde(data)
x = np.linspace(-2,10,300)
y=density(x)
plt.plot(x, y)
plt.title("Density Plot of the data")
plt.show()
输出:
在这里,我们首先使用 gaussian_kde()
方法估计给定数据的密度函数。然后,我们用 plot()
方法绘制出从 -2
到 10
的值的函数。
生成的密度图足够是不精确的,这是由 gaussian_kde
函数自动设置带宽而导致的。为了设置带宽,我们可以使用 gaussian_kde
类的 covariance_factor
函数。然后我们调用 _compute_covariance
方法,使所有的因子都能正确计算,从而生成精确的图。
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import kde
data = [2,3,3,4,2,1,5,6,4,3,3,3,6,4,5,4,3,2]
prob_density = kde.gaussian_kde(data)
prob_density.covariance_factor = lambda : .25
prob_density._compute_covariance()
x = np.linspace(-2,10,300)
y=prob_density(x)
plt.plot(x, y)
plt.title("Density Plot of the data")
plt.show()
输出:
使用 seaborn
包中的 kdeplot()
方法生成密度图
import matplotlib.pyplot as plt
import seaborn as sns
data = [2,3,3,4,2,1,5,6,4,3,3,3,6,4,5,4,3,2]
sns.kdeplot(data,bw=0.25)
plt.show()
输出:
这样,我们只需将数据传入 kdeplot()
方法就可以生成密度图。
使用 distplot()
方法从 seaborn
包中生成密度图
我们也可以使用 seaborn
包中的 distplot()
方法,并设置 hist=False
来生成密度图。
import matplotlib.pyplot as plt
import seaborn as sns
data = [2,3,3,4,2,1,5,6,4,3,3,3,6,4,5,4,3,2]
sns.distplot(data,hist=False)
plt.show()
输出:
在 pandas.DataFrame.plot()
方法中设置 kind='density'
来生成密度图
import pandas as pd
import matplotlib.pyplot as plt
data = [2,3,3,4,2,1,5,6,4,3,3,3,6,4,5,4,3,2]
df=pd.DataFrame(data)
df.plot(kind='density')
plt.show()
输出:
相关文章
Pandas DataFrame DataFrame.shift() 函数
发布时间:2024/04/24 浏览次数:133 分类:Python
-
DataFrame.shift() 函数是将 DataFrame 的索引按指定的周期数进行移位。
Python pandas.pivot_table() 函数
发布时间:2024/04/24 浏览次数:82 分类:Python
-
Python Pandas pivot_table()函数通过对数据进行汇总,避免了数据的重复。
Pandas read_csv()函数
发布时间:2024/04/24 浏览次数:254 分类:Python
-
Pandas read_csv()函数将指定的逗号分隔值(csv)文件读取到 DataFrame 中。
Pandas 多列合并
发布时间:2024/04/24 浏览次数:628 分类:Python
-
本教程介绍了如何在 Pandas 中使用 DataFrame.merge()方法合并两个 DataFrames。
Pandas loc vs iloc
发布时间:2024/04/24 浏览次数:837 分类:Python
-
本教程介绍了如何使用 Python 中的 loc 和 iloc 从 Pandas DataFrame 中过滤数据。
在 Python 中将 Pandas 系列的日期时间转换为字符串
发布时间:2024/04/24 浏览次数:894 分类:Python
-
了解如何在 Python 中将 Pandas 系列日期时间转换为字符串