Pandas DataFrame.describe()函数
Python Pandas DataFrame.describe() 函数返回一个 DataFrame 的统计数据。
pandas.DataFrame.describe()
语法
DataFrame.describe(
percentiles=None, include=None, exclude=None, datetime_is_numeric=False
)
参数
percentiles |
这个参数告诉了输出中要包含的百分位数,所有的值都应该在 0 和 1 之间。默认值是 [.25, .5, .75] ,返回第 25、50 和 75 个百分位数。 |
include |
输出中要包含的数据类型。它有三个选项。all :输入的所有列都将被包含在输出中。类似列表的数据类型:将结果限制在提供的数据类型中。None :结果将包括所有数字列。 |
exclude |
要从输出中排除的数据类型。它有两个选项。类似于数据类型的列表:从结果中排除所提供的数据类型。None 。结果将不包括任何东西。 |
datetime_is_numeric |
布尔参数。它指定我们是否将数据时间类型作为数字类型处理。 |
返回
它返回所传递的 Series
或 DataFrame 的统计摘要。
示例代码:DataFrame.describe()
方法查找 DataFrame 统计
import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)
dataframe1 = dataframe.describe()
print("Statistics are: \n")
print(dataframe1)
输出:
The Original Data frame is:
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
Statistics are:
Attendance Obtained Marks
count 5.000000 5.000000
mean 82.600000 71.200000
std 15.773395 17.484279
min 60.000000 45.000000
25% 78.000000 64.000000
50% 80.000000 75.000000
75% 95.000000 82.000000
max 100.000000 90.000000
该函数返回了 DataFrame 的统计摘要。我们没有传递任何参数,所以,函数使用了所有的默认值。
示例代码: DataFrame.describe()
方法查找各列统计数据
我们将使用 include
参数查找所有列的统计数据。
import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)
dataframe1 = dataframe.describe(include='all')
print("Statistics are: \n")
print(dataframe1)
输出:
The Original Data frame is:
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
Statistics are:
Attendance Name Obtained Marks
count 5.000000 5 5.000000
unique NaN 5 NaN
top NaN Kevin NaN
freq NaN 1 NaN
mean 82.600000 NaN 71.200000
std 15.773395 NaN 17.484279
min 60.000000 NaN 45.000000
25% 78.000000 NaN 64.000000
50% 80.000000 NaN 75.000000
75% 95.000000 NaN 82.000000
max 100.000000 NaN 90.000000
该函数返回了 DataFrame 中所有列的统计汇总。
示例代码:DataFrame.describe()
方法查找数值列统计
现在我们将使用 exclude
参数只查找数值列的统计。
import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)
dataframe1 = dataframe.describe(exclude=[object])
print("Statistics are: \n")
print(dataframe1)
输出:
The Original Data frame is:
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
Statistics are:
Attendance Obtained Marks
count 5.000000 5.000000
mean 82.600000 71.200000
std 15.773395 17.484279
min 60.000000 45.000000
25% 78.000000 64.000000
50% 80.000000 75.000000
75% 95.000000 82.000000
max 100.000000 90.000000
我们已经排除了数据类型 object
。
相关文章
将 NumPy 数组转换为 Pandas DataFrame
发布时间:2024/04/21 浏览次数:99 分类:Python
-
本教程介绍了如何使用 pandas.DataFrame()方法从 NumPy 数组生成 Pandas DataFrame。
Pandas DataFrame.corr()函数
发布时间:2024/04/21 浏览次数:111 分类:Python
-
DataFrame corr()函数查找 DataFrame 各列之间的相关性。
Pandas DataFrame.astype()函数
发布时间:2024/04/21 浏览次数:112 分类:Python
-
DataFrame astype()函数将对象的数据类型改变为指定的数据类型。
Pandas DataFrame.to_numeric()函数
发布时间:2024/04/21 浏览次数:177 分类:Python
-
DataFrame to_numeric()函数将通过的参数转换为数字类型。
Pandas DataFrame.to_dict()函数
发布时间:2024/04/21 浏览次数:192 分类:Python
-
DataFrame to_dict()函数将给定的 DataFrame 转换为一个字典。
将 Pandas DataFrame 转换为 Spark DataFrame
发布时间:2024/04/20 浏览次数:169 分类:Python
-
本教程将讨论将 Pandas DataFrame 转换为 Spark DataFrame 的不同方法。
将 Pandas DataFrame 导出到 Excel 文件
发布时间:2024/04/20 浏览次数:164 分类:Python
-
本教程介绍了有关如何将 Pandas DataFrame 导出到 excel 文件的各种方法
将 Lambda 函数应用于 Pandas DataFrame
发布时间:2024/04/20 浏览次数:113 分类:Python
-
本指南说明如何使用 DataFrame.assign() 和 DataFrame.apply() 方法将 Lambda 函数应用于 pandas DataFrame。
计算 Pandas 中两个 DataFrame 之间的交叉连接
发布时间:2024/04/20 浏览次数:114 分类:Python
-
本教程解释了如何在 Pandas 中计算两个 DataFrame 之间的交叉连接。