如何将函数应用到 Pandas Dataframe 中的某一列中去
在 Pandas 中,可以使用 apply()
和 transform()
等方法对列和 DataFrame 进行转换和操作。所需的转换作为参数以函数的形式传递给这些方法。每种方法都有其细微的区别和作用。本文将介绍如何将一个函数应用于一列或整个 DataFrame。
Pandas apply()
和 transform()
方法
apply()
和 transform()
方法都是对单个列和整个 DataFrame 进行操作。apply()
方法沿着指定的轴应用函数。它将列作为 DataFrame 传递给自定义函数,而 transform()
方法将单个列作为 Pandas Series
传递给自定义函数。
apply()
方法的输出根据输入以 DataFrame
或 Series
的形式接收,而 transform()
方法则以 Series
的形式接收。apply()
和 transform()
方法的语法都类似于:
Dataframe.apply(customFunction, axis=0)
Dataframe.transform(customFunction, axis=0)
参数对应于
customFunction
:要应用于 DataFrame 或Series
的函数。axis
:0 指的是行,1 指的是列,函数需要应用在行或列上。
使用 apply()
将函数应用于 Pandas DataFrame 列
现在我们已经掌握了基础知识,让我们动手编写代码,了解如何使用 apply()
方法将一个函数应用到 DataFrame 列。
我们将使用下面的 DataFrame 示例。
import pandas as pd
import numpy as np
df = pd.DataFrame([[1, 2, 3], [4, 5, 6], [7, 8, 9]], columns=["A", "B", "C"])
print(df)
将函数应用到整个 DataFrame 的示例代码如下所示。
import pandas as pd
import numpy as np
df = pd.DataFrame([[1, 2, 3], [4, 5, 6], [7, 8, 9]], columns=["A", "B", "C"])
print(df)
def add_2(x):
return x + 2
df = df.apply(add_2)
print(df)
输出:
A B C
0 1 2 3
1 4 5 6
2 7 8 9
A B C
0 3 4 5
1 6 7 8
2 9 10 11
如上图所示,函数可以应用于整个 DataFrame。
将函数应用于单列
让我们来看看当函数沿单列应用时会发生什么。
import pandas as pd
import numpy as np
df = pd.DataFrame([[1, 2, 3], [4, 5, 6], [7, 8, 9]], columns=["A", "B", "C"])
print(df)
def add_2(x):
return x + 2
df["A"] = df["A"].apply(add_2)
print(df)
# or #
df["A"].transform(add_2)
print(df)
输出:
A B C
0 1 2 3
1 4 5 6
2 7 8 9
A B C
0 3 2 3
1 6 5 6
2 9 8 9
使用 transform()
将一个函数应用到 Pandas DataFrame 列
让我们看看如何使用 transform()
方法将一个函数应用到一个 DataFrame 列。我们将使用与上面相同的 DataFrame 示例。
应用函数到整个 DataFrame 的示例代码如下所示。
import pandas as pd
import numpy as np
df = pd.DataFrame([[1, 2, 3], [4, 5, 6], [7, 8, 9]], columns=["A", "B", "C"])
print(df)
def add_2(x):
return x + 2
df = df.transform(add_2)
print(df)
输出:
A B C
0 1 2 3
1 4 5 6
2 7 8 9
A B C
0 3 4 5
1 6 7 8
2 9 10 11
如上图所示,函数可以应用到整个 DataFrame。
将函数应用于单列
让我们来看看当函数沿单列应用时会发生什么。
import pandas as pd
import numpy as np
df = pd.DataFrame([[1, 2, 3], [4, 5, 6], [7, 8, 9]], columns=["A", "B", "C"])
print(df)
def add_2(x):
return x + 2
df["A"] = df["A"].transform(add_2)
print(df)
输出:
A B C
0 1 2 3
1 4 5 6
2 7 8 9
A B C
0 3 2 3
1 6 5 6
2 9 8 9
相关文章
DataFrame 获取给定列的第一行
发布时间:2024/04/22 浏览次数:51 分类:Python
-
本教程介绍了如何在 Pandas DataFrame 中使用 Series.loc()和 Series.iloc()方法获取给定列的第一行。
如何基于 Pandas 中的给定条件创建 DataFrame 列
发布时间:2024/04/22 浏览次数:147 分类:Python
-
我们可以使用列表推导技术,numpy 方法,apply()方法和 map()方法对 Pandas 中的给定条件创建 DataFrame 列。
在 Pandas 的 DataFrame 中合并两列文本
发布时间:2024/04/22 浏览次数:99 分类:Python
-
在 Pandas 库中使用 + 运算符,apply(),map(),str.cat(),agg()方法在 DataFrame 中合并列
Pandas DataFrame DataFrame.append() 函数
发布时间:2024/04/22 浏览次数:92 分类:Python
-
Pandas 中的 append 方法将两个不同 DataFrame 的行合并,并返回新的 DataFrame。
Pandas DataFrame DataFrame.apply() 函数
发布时间:2024/04/22 浏览次数:172 分类:Python
-
Pandas DataFrame apply()函数将输入的函数应用到 Pandas DataFrame 的每一个沿行或沿列的元素。
Pandas DataFrame DataFrame.aggregate() 函数
发布时间:2024/04/22 浏览次数:98 分类:Python
-
Pandas DataFrame aggregate()函数对 DataFrame 的列或行进行聚合。