Pandas DataFrame DataFrame.aggregate() 函数
pandas.DataFrame.aggregate() 函数对一个 DataFrame
的列或行进行聚合。最常用的聚合函数是 min
、max
和 sum
。这些聚合函数的结果是减小 DataFrame
的大小。
pandas.DataFrame.aggregate()
语法
DataFrame.aggregate(func, axis, *args, **kwargs)
参数
func |
它是要应用的聚合函数。它可以是可调用函数或可调用函数列表,字符串或字符串列表,或字典 |
axis |
默认为 0。如果是 0 或'index' ,则函数应用于各个列。如果是 1 或'column' ,则函数应用于各个行 |
*args |
这是一个位置型参数 |
**kwargs |
这是一个关键字参数 |
返回值
该函数返回一个标量、Series
或 DataFrame
。
- 如果用
Series.aggressive()
调用一个函数,它返回一个scalar
。 - 如果用
DataFrame.agg()
调用一个函数,它返回一个Series
。 - 如果多个函数被调用
DataFrame.agg()
,它返回一个DataFrame
。
示例代码:Pandas DataFrame.aggregate()
DataFrame.agg()
是 DataFrame.aggregate()
的别名。因为简洁,我们最好使用别名。所以我们将在示例代码中使用 DataFrame.agg()
。
import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print(dataframe)
下面是 DataFrame
的示例。
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
我们先只用一个聚合函数来检查 DataFrame.agg()
函数。
import pandas as pd
dataframe = pd.DataFrame(
{
"Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
"Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
"Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
}
)
dataframe1 = dataframe.agg("sum")
print(dataframe1)
输出:
Attendance 413
Name OliviaJohnLauraBenKevin
Obtained Marks 356
dtype: object
聚合函数 sum
被应用于各个列。
对于整数类型的列,它生成了和;对于字符串类型的列,它对字符串进行了连接。dtype: object
表示出了函数返回 Series
。
示例代码:DataFrame.aggregate()
与多函数的关系
import pandas as pd
dataframe = pd.DataFrame(
{
"Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
"Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
"Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
}
)
dataframe1 = dataframe.agg(["sum", "min"])
print(dataframe1)
输出:
Attendance Name Obtained Marks
sum 413 OliviaJohnLauraBenKevin 356
min 60 Ben 45
聚合函数 sum
和 min
应用于各个列。
对于整数类型的列,min
函数生成了最小值,对于字符串类型的列,它显示了最小长度的字符串。
示例代码:DataFrame.aggregate()
与指定列的聚合
import pandas as pd
dataframe = pd.DataFrame(
{
"Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
"Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
"Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
}
)
dataframe1 = dataframe.agg({"Obtained Marks": "sum"})
print(dataframe1)
输出:
Obtained Marks 356
dtype: int64
返回单列之和。dtype: int64
表明该函数返回了一个 Series
。
我们也可以在一列上应用多个函数。
import pandas as pd
dataframe = pd.DataFrame(
{
"Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
"Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
"Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
}
)
dataframe1 = dataframe.agg({"Obtained Marks": ["sum", "max"]})
print(dataframe1)
输出:
Obtained Marks
sum 356
max 90
相关文章
Pandas DataFrame DataFrame.shift() 函数
发布时间:2024/04/24 浏览次数:133 分类:Python
-
DataFrame.shift() 函数是将 DataFrame 的索引按指定的周期数进行移位。
Python pandas.pivot_table() 函数
发布时间:2024/04/24 浏览次数:82 分类:Python
-
Python Pandas pivot_table()函数通过对数据进行汇总,避免了数据的重复。
Pandas read_csv()函数
发布时间:2024/04/24 浏览次数:254 分类:Python
-
Pandas read_csv()函数将指定的逗号分隔值(csv)文件读取到 DataFrame 中。
Pandas 多列合并
发布时间:2024/04/24 浏览次数:628 分类:Python
-
本教程介绍了如何在 Pandas 中使用 DataFrame.merge()方法合并两个 DataFrames。
Pandas loc vs iloc
发布时间:2024/04/24 浏览次数:837 分类:Python
-
本教程介绍了如何使用 Python 中的 loc 和 iloc 从 Pandas DataFrame 中过滤数据。
在 Python 中将 Pandas 系列的日期时间转换为字符串
发布时间:2024/04/24 浏览次数:894 分类:Python
-
了解如何在 Python 中将 Pandas 系列日期时间转换为字符串