Pandas DataFrame DataFrame.aggregate() 函数

当前位置：主页 > 学无止境 > 编程语言 > Python >

Python PHP Java Go TypeScript C++ Vba Node.js C语言 MATLAB

Pandas DataFrame DataFrame.aggregate() 函数

作者：迹忆客最近更新：2024/04/22 浏览次数：

pandas.DataFrame.aggregate() 函数对一个 DataFrame 的列或行进行聚合。最常用的聚合函数是 min、max 和 sum。这些聚合函数的结果是减小 DataFrame 的大小。

`pandas.DataFrame.aggregate()` 语法

DataFrame.aggregate(func, axis, *args, **kwargs)

参数


`func`	它是要应用的聚合函数。它可以是可调用函数或可调用函数列表，字符串或字符串列表，或字典
`axis`	默认为 0。如果是 0 或`'index'`，则函数应用于各个列。如果是 1 或`'column'`，则函数应用于各个行
`*args`	这是一个位置型参数
`**kwargs`	这是一个关键字参数

返回值

该函数返回一个标量、Series 或 DataFrame。

如果用 Series.aggressive() 调用一个函数，它返回一个 scalar。
如果用 DataFrame.agg() 调用一个函数，它返回一个 Series。
如果多个函数被调用 DataFrame.agg()，它返回一个 DataFrame。

示例代码：Pandas `DataFrame.aggregate()`

DataFrame.agg() 是 DataFrame.aggregate() 的别名。因为简洁，我们最好使用别名。所以我们将在示例代码中使用 DataFrame.agg()。

import pandas as pd

dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
                    'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
                    'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print(dataframe)

下面是 DataFrame 的示例。

   Attendance    Name Obtained Marks
0          60  Olivia            90
1         100    John            75
2          80   Laura            82
3          78     Ben            64
4          95   Kevin            45

我们先只用一个聚合函数来检查 DataFrame.agg() 函数。

import pandas as pd

dataframe = pd.DataFrame(
    {
        "Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
        "Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
        "Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
    }
)

dataframe1 = dataframe.agg("sum")
print(dataframe1)

输出：

Attendance                            413
Name              OliviaJohnLauraBenKevin
Obtained Marks                        356
dtype: object

聚合函数 sum 被应用于各个列。

对于整数类型的列，它生成了和；对于字符串类型的列，它对字符串进行了连接。dtype: object 表示出了函数返回 Series。

示例代码：`DataFrame.aggregate()` 与多函数的关系

import pandas as pd

dataframe = pd.DataFrame(
    {
        "Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
        "Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
        "Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
    }
)

dataframe1 = dataframe.agg(["sum", "min"])
print(dataframe1)

输出：

     Attendance                     Name  Obtained Marks
sum         413  OliviaJohnLauraBenKevin             356
min          60                      Ben              45

聚合函数 sum 和 min 应用于各个列。

对于整数类型的列，min 函数生成了最小值，对于字符串类型的列，它显示了最小长度的字符串。

示例代码：`DataFrame.aggregate()` 与指定列的聚合

import pandas as pd

dataframe = pd.DataFrame(
    {
        "Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
        "Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
        "Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
    }
)

dataframe1 = dataframe.agg({"Obtained Marks": "sum"})
print(dataframe1)

输出：

Obtained Marks    356
dtype: int64

返回单列之和。dtype: int64 表明该函数返回了一个 Series。

我们也可以在一列上应用多个函数。

import pandas as pd

dataframe = pd.DataFrame(
    {
        "Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
        "Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
        "Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
    }
)
dataframe1 = dataframe.agg({"Obtained Marks": ["sum", "max"]})
print(dataframe1)

输出：

     Obtained Marks
sum             356
max              90

上一篇：Pandas DataFrame DataFrame.to_excel() 函数

下一篇：Pandas DataFrame DataFrame.apply() 函数

转载请发邮件至 1244347461@qq.com 进行申请，经作者同意之后，转载请以链接形式注明出处

本文地址：

Pandas DataFrame DataFrame.shift() 函数

发布时间：2024/04/24 浏览次数：133 分类：Python

DataFrame.shift() 函数是将 DataFrame 的索引按指定的周期数进行移位。

Pandas pandas.melt() 函数

发布时间：2024/04/24 浏览次数：101 分类：Python

pandas.melt()函数可以转换 DataFrame。

Python pandas.pivot_table() 函数

发布时间：2024/04/24 浏览次数：82 分类：Python

Python Pandas pivot_table()函数通过对数据进行汇总，避免了数据的重复。

Pandas read_csv()函数

发布时间：2024/04/24 浏览次数：254 分类：Python

Pandas read_csv()函数将指定的逗号分隔值(csv)文件读取到 DataFrame 中。

Pandas 追加数据到 CSV 中

发布时间：2024/04/24 浏览次数：352 分类：Python

本教程演示了如何在追加模式下使用 to_csv()向现有的 CSV 文件添加数据。

Pandas 多列合并

发布时间：2024/04/24 浏览次数：628 分类：Python

本教程介绍了如何在 Pandas 中使用 DataFrame.merge()方法合并两个 DataFrames。

用多个条件过滤 Pandas DataFrame

发布时间：2024/04/24 浏览次数：649 分类：Python

本教程解释了如何根据多个条件从 DataFrame 中过滤元素。

Pandas loc vs iloc

发布时间：2024/04/24 浏览次数：837 分类：Python

本教程介绍了如何使用 Python 中的 loc 和 iloc 从 Pandas DataFrame 中过滤数据。

在 Python 中将 Pandas 系列的日期时间转换为字符串

发布时间：2024/04/24 浏览次数：894 分类：Python

了解如何在 Python 中将 Pandas 系列日期时间转换为字符串

迹忆客专注技术分享