Pandas DataFrame DataFrame.boxplot() 函数
pandas.DataFrame.boxplot() 从 DataFrame
列中绘制箱线图。箱线图总结了数据的最小值、第一四分位数、中位数、第三四分位数和最大值。
pandas.DataFrame.boxplot()
语法
DataFrame.boxplot(
column=None,
by=None,
ax=None,
fontsize=None,
rot=0,
grid=True,
figsize=None,
layout=None,
return_type=None,
backend=None,
**kwargs
)
参数
column |
用于生成箱线图的列名 |
by |
通过不同组中的列来绘制不同的箱形图分组 |
ax |
箱线图将使用的 Matplotlib 轴 |
grid |
布尔型。打开(True )和关闭(False )网格。 |
rot |
整数:标签沿 X 轴的旋转角度。标签沿 X 轴的旋转角度。 |
fontsize |
Boxplot 中标签的字体大小 |
layout |
用于控制或设置 Boxplot 布局的参数 |
return_type |
返回的对象类型 |
backend |
要使用的后端,而不是在选项 plotting.backend 中指定的后端。 |
**kwargs |
方法的关键字参数 |
示例代码:用 pandas.DataFrame.boxplot()
生成箱线图
import pandas as pd
import matplotlib.pyplot as plt
fruits=['Apple', 'Papaya', 'Banana', 'Mango','Litchi','Avocado']
prices=[3, 1, 2, 4,4,5]
df = pd.DataFrame({'Fruit':fruits ,
'Price': prices})
print(df)
boxplot = df.boxplot(column=['Price'])
boxplot.plot()
plt.show()
输出:
它从 DataFrame
的 Price
列生成一个箱线图。我们使用 matplotlib.pyplot
来显示生成的图。
示例代码:使用 pandas.DataFrame.boxplot()
生成基于列值的分组数据的箱线图
import pandas as pd
import numpy as np
import sklearn
dates=['April-10', 'April-10', 'April-11', 'April-11','April-11']
prices=[3, 1, 2, 4,5]
df = pd.DataFrame({'Date':dates ,
'Price': prices})
print(df)
boxplot = df.boxplot(column=['Price'],by="Date")
boxplot.plot()
plt.show()
输出:
首先,它将给定的 DataFrame
根据它们的 Date
列的值分成不同的组,然后为每个 DataFrame
生成一个箱线图。
我们可以使用 fontsize
、rot
和 grid
参数自定义我们的图。
import pandas as pd
import matplotlib.pyplot as plt
dates=['April-10', 'April-10', 'April-11', 'April-11','April-11']
prices=[3, 1, 2, 4,5]
df = pd.DataFrame({'Date':dates ,
'Price': prices})
print(df)
boxplot = df.boxplot(column=['Price'],by="Date",grid=False, rot=45, fontsize=15)
boxplot.plot()
plt.show()
输出:
这里,grid=False
关闭网格,rot=45
将 X 轴标签旋转 45 度,fontsize=15
将字体大小改为 15。
设置 layout
参数来改变箱线图的布局
import pandas as pd
dates=['April-10', 'April-10', 'April-11', 'April-11','April-11']
prices=[3, 1, 2, 4,5]
df = pd.DataFrame({'Date':dates ,
boxplot = df.boxplot(column=['Price'],by="Date",layout=(2,1),grid=False,fontsize=15)
输出:
这里,layout
参数改变了生成的箱线图的布局。layout=(2,1)
将箱线图排列成两行一列。
相关文章
Pandas DataFrame DataFrame.shift() 函数
发布时间:2024/04/24 浏览次数:133 分类:Python
-
DataFrame.shift() 函数是将 DataFrame 的索引按指定的周期数进行移位。
Python pandas.pivot_table() 函数
发布时间:2024/04/24 浏览次数:82 分类:Python
-
Python Pandas pivot_table()函数通过对数据进行汇总,避免了数据的重复。
Pandas read_csv()函数
发布时间:2024/04/24 浏览次数:254 分类:Python
-
Pandas read_csv()函数将指定的逗号分隔值(csv)文件读取到 DataFrame 中。
Pandas 多列合并
发布时间:2024/04/24 浏览次数:628 分类:Python
-
本教程介绍了如何在 Pandas 中使用 DataFrame.merge()方法合并两个 DataFrames。
Pandas loc vs iloc
发布时间:2024/04/24 浏览次数:837 分类:Python
-
本教程介绍了如何使用 Python 中的 loc 和 iloc 从 Pandas DataFrame 中过滤数据。
在 Python 中将 Pandas 系列的日期时间转换为字符串
发布时间:2024/04/24 浏览次数:894 分类:Python
-
了解如何在 Python 中将 Pandas 系列日期时间转换为字符串