迹忆客 专注技术分享

当前位置:主页 > 学无止境 > 编程语言 > Python >

如何在 Pandas 中使用默认值向现有 DataFrame 添加新列

作者:迹忆客 最近更新:2024/04/20 浏览次数:

我们可以使用 DataFrame 对象的 assign()insert() 方法,以默认值向现有 DataFrame 添加新列。我们还可以将默认值直接分配给要创建的 DataFrame 列。

在以下各节中,我们将使用以下 DataFrame 作为示例。

import pandas as pd

dates = ["April-10", "April-11", "April-12", "April-13"]
fruits = ["Apple", "Papaya", "Banana", "Mango"]
prices = [3, 1, 2, 4]

df = pd.DataFrame({"Date": dates, "Fruit": fruits, "Price": prices})

print(df)

输出:

       Date   Fruit  Price
0  April-10   Apple      3
1  April-11  Papaya      1
2  April-12  Banana      2
3  April-13   Mango      4

pandas.DataFrame.assign() 在 Pandas DataFrame 中添加新列

我们可以使用 pandas.DataFrame.assign() 方法向现有的 DataFrame 添加新列,并为新创建的 DataFrame 列分配默认值。

import pandas as pd

dates = ["April-10", "April-11", "April-12", "April-13"]
fruits = ["Apple", "Papaya", "Banana", "Mango"]
prices = [3, 1, 2, 4]

df = pd.DataFrame({"Date": dates, "Fruit": fruits, "Price": prices})

new_df = df.assign(Profit=6)
print(new_df)

输出:

       Date   Fruit  Price  Profit
0  April-10   Apple      3       6
1  April-11  Papaya      1       6
2  April-12  Banana      2       6
3  April-13   Mango      4       6

该代码在 DataFrame 中创建一个新列 Profit,并将整个列的值设置为 6


访问新列以将其设置为默认值

我们可以使用 DataFrame 索引在 DataFrame 中创建新列并将其设置为默认值。

语法:

df[col_name] = value

它在 DataFrame df 中创建一个新列 col_name,并将整个列的默认值设置为 value

import pandas as pd

dates = ["April-10", "April-11", "April-12", "April-13"]
fruits = ["Apple", "Papaya", "Banana", "Mango"]
prices = [3, 1, 2, 4]

df = pd.DataFrame({"Date": dates, "Fruit": fruits, "Price": prices})

df["Profit"] = 5
print(df)

输出:

       Date   Fruit  Price  Profit
0  April-10   Apple      3       5
1  April-11  Papaya      1       5
2  April-12  Banana      2       5
3  April-13   Mango      4       5

pandas.DataFrame.insert() 在 Pandas DataFrame 中添加新列

pandas.DataFrame.insert() 允许我们在 DataFrame 中在指定位置插入列。

语法:

DataFrame.insert(loc, column, value, allow_duplicates=False)

它在位置 loc 处创建一个名称为 column 的新列,默认值为 valueallow_duplicates=False 确保 dataFrame 中只有一列名为 column 的列。

import pandas as pd

dates = ["April-10", "April-11", "April-12", "April-13"]
fruits = ["Apple", "Papaya", "Banana", "Mango"]
prices = [3, 1, 2, 4]

df = pd.DataFrame({"Date": dates, "Fruit": fruits, "Price": prices})

df.insert(2, "profit", 4, allow_duplicates=False)
print(df)

输出:

       Date   Fruit  profit  Price
0  April-10   Apple       4      3
1  April-11  Papaya       4      1
2  April-12  Banana       4      2
3  April-13   Mango       4      4

在这里,名称为 profit 的列被插入到索引 2,默认值为 4

转载请发邮件至 1244347461@qq.com 进行申请,经作者同意之后,转载请以链接形式注明出处

本文地址:

相关文章

Pandas read_csv()函数

发布时间:2024/04/24 浏览次数:254 分类:Python

Pandas read_csv()函数将指定的逗号分隔值(csv)文件读取到 DataFrame 中。

Pandas 追加数据到 CSV 中

发布时间:2024/04/24 浏览次数:352 分类:Python

本教程演示了如何在追加模式下使用 to_csv()向现有的 CSV 文件添加数据。

Pandas 多列合并

发布时间:2024/04/24 浏览次数:628 分类:Python

本教程介绍了如何在 Pandas 中使用 DataFrame.merge()方法合并两个 DataFrames。

Pandas loc vs iloc

发布时间:2024/04/24 浏览次数:837 分类:Python

本教程介绍了如何使用 Python 中的 loc 和 iloc 从 Pandas DataFrame 中过滤数据。

扫一扫阅读全部技术教程

社交账号
  • https://www.github.com/onmpw
  • qq:1244347461

最新推荐

教程更新

热门标签

扫码一下
查看教程更方便