迹忆客 专注技术分享

当前位置:主页 > 学无止境 > 编程语言 > Python >

如何在 Pandas 中使用默认值向现有 DataFrame 添加新列

作者:迹忆客 最近更新:2024/04/20 浏览次数:

我们可以使用 DataFrame 对象的 assign()insert() 方法,以默认值向现有 DataFrame 添加新列。我们还可以将默认值直接分配给要创建的 DataFrame 列。

在以下各节中,我们将使用以下 DataFrame 作为示例。

import pandas as pd

dates = ["April-10", "April-11", "April-12", "April-13"]
fruits = ["Apple", "Papaya", "Banana", "Mango"]
prices = [3, 1, 2, 4]

df = pd.DataFrame({"Date": dates, "Fruit": fruits, "Price": prices})

print(df)

输出:

       Date   Fruit  Price
0  April-10   Apple      3
1  April-11  Papaya      1
2  April-12  Banana      2
3  April-13   Mango      4

pandas.DataFrame.assign() 在 Pandas DataFrame 中添加新列

我们可以使用 pandas.DataFrame.assign() 方法向现有的 DataFrame 添加新列,并为新创建的 DataFrame 列分配默认值。

import pandas as pd

dates = ["April-10", "April-11", "April-12", "April-13"]
fruits = ["Apple", "Papaya", "Banana", "Mango"]
prices = [3, 1, 2, 4]

df = pd.DataFrame({"Date": dates, "Fruit": fruits, "Price": prices})

new_df = df.assign(Profit=6)
print(new_df)

输出:

       Date   Fruit  Price  Profit
0  April-10   Apple      3       6
1  April-11  Papaya      1       6
2  April-12  Banana      2       6
3  April-13   Mango      4       6

该代码在 DataFrame 中创建一个新列 Profit,并将整个列的值设置为 6


访问新列以将其设置为默认值

我们可以使用 DataFrame 索引在 DataFrame 中创建新列并将其设置为默认值。

语法:

df[col_name] = value

它在 DataFrame df 中创建一个新列 col_name,并将整个列的默认值设置为 value

import pandas as pd

dates = ["April-10", "April-11", "April-12", "April-13"]
fruits = ["Apple", "Papaya", "Banana", "Mango"]
prices = [3, 1, 2, 4]

df = pd.DataFrame({"Date": dates, "Fruit": fruits, "Price": prices})

df["Profit"] = 5
print(df)

输出:

       Date   Fruit  Price  Profit
0  April-10   Apple      3       5
1  April-11  Papaya      1       5
2  April-12  Banana      2       5
3  April-13   Mango      4       5

pandas.DataFrame.insert() 在 Pandas DataFrame 中添加新列

pandas.DataFrame.insert() 允许我们在 DataFrame 中在指定位置插入列。

语法:

DataFrame.insert(loc, column, value, allow_duplicates=False)

它在位置 loc 处创建一个名称为 column 的新列,默认值为 valueallow_duplicates=False 确保 dataFrame 中只有一列名为 column 的列。

import pandas as pd

dates = ["April-10", "April-11", "April-12", "April-13"]
fruits = ["Apple", "Papaya", "Banana", "Mango"]
prices = [3, 1, 2, 4]

df = pd.DataFrame({"Date": dates, "Fruit": fruits, "Price": prices})

df.insert(2, "profit", 4, allow_duplicates=False)
print(df)

输出:

       Date   Fruit  profit  Price
0  April-10   Apple       4      3
1  April-11  Papaya       4      1
2  April-12  Banana       4      2
3  April-13   Mango       4      4

在这里,名称为 profit 的列被插入到索引 2,默认值为 4

转载请发邮件至 1244347461@qq.com 进行申请,经作者同意之后,转载请以链接形式注明出处

本文地址:

相关文章

计算 Pandas DataFrame 列的数量

发布时间:2024/04/20 浏览次数:113 分类:Python

本教程解释了如何使用各种方法计算 Pandas DataFrame 的列数,例如使用 shape 属性、列属性、使用类型转换和使用 info() 方法。

更改 Pandas DataFrame 列的顺序

发布时间:2024/04/20 浏览次数:116 分类:Python

在这篇文章中,我们将介绍如何使用 python pandas DataFrame 来更改列的顺序。在 pandas 中,使用 Python 中的 reindex() 方法重新排序或重新排列列。

扫一扫阅读全部技术教程

社交账号
  • https://www.github.com/onmpw
  • qq:1244347461

最新推荐

教程更新

热门标签

扫码一下
查看教程更方便