追加到 Pandas 中的空 DataFrame

当前位置：主页 > 学无止境 > 编程语言 > Python >

Python PHP Java Go TypeScript C++ Vba Node.js C语言 MATLAB

追加到 Pandas 中的空 DataFrame

作者：迹忆客最近更新：2024/04/21 浏览次数：

正如我们之前所了解的，Python 中的 Pandas 是一个开源模块，我们可以使用它进行数据分析和制作机器学习模型。它与另一个名为 Numpy 的包一起使用，因为它们携手支持多维数组。

许多数据科学模块可以与 Python 生态系统中的 Pandas 一起使用。我们将学习在 Pandas 中附加到空 DataFrame 的不同操作。

DataFrame 是表格形式的二维和潜在的异构数据。

本教程教授如何使用 Python 在 Pandas 的空 DataFrame 中添加行和列。我们将研究三种不同的方法来向空 DataFrame 添加数据，因为有多种方法。

在 Pandas 中创建一个空 DataFrame 并添加行和列

下面是导入所需包、制作空 DataFrame 和附加列的代码。

# import pandas library as pd
import pandas as pd

# create an Empty DataFrame object
df = pd.DataFrame()
print(df)
# append columns to an empty DataFrame
df["Name"] = ["Preet", "Parin", "Rajesh"]
df["Articles"] = [97, 600, 200]
df["Improved"] = [2200, 75, 100]

print(df)

上述代码片段的输出如下。

Empty DataFrame
Columns: []
Index: []
	Name	Articles  Improved
0	Preet	97		  2200
1	Parin	600		  75
2	Rajesh 	200		  100

在我们添加列和行之前，DataFrame 是空的。因此，打印空 DataFrame 为我们提供了输出 Empty DataFrame, Columns: [], Index: [] 作为输出，这是预期的，因为数据为空。

将行附加到具有 Pandas 列的空 DataFrame

在这个方法中，DataFrame 是空的，但是会有预定义的列名，我们唯一的任务就是在它下面的行中插入数据。

下面是上述方法的代码，我们最初导入库 Pandas，创建一个包含列的 DataFrame，然后以行的形式附加值。

# import pandas library as pd
import pandas as pd

# create an Empty DataFrame
# object With column names only
df = pd.DataFrame(columns=["Name", "Articles", "Improved"])
print(df)

# append rows to an empty DataFrame
df = df.append({"Name": "Preet", "Articles": 97, "Improved": 2200}, ignore_index=True)
df = df.append({"Name": "Parin", "Articles": 30, "Improved": 50}, ignore_index=True)
df = df.append({"Name": "Rajesh", "Articles": 17, "Improved": 220}, ignore_index=True)
print(df)

该代码将为我们提供以下输出。

Empty DataFrame
Columns: [Name, Articles, Improved]
Index: []
	Name	Articles  Improved
0	Preet	97		  2200
1	Parin	30	      50
2	Rajesh	17		  220

正如我们所看到的，由于我们已经在 DataFrame 中添加了列的名称，因此输出由 Columns: [Name, Articles, Improvement] 组成，它是数组中的列名称。

以下输出是因为我们使用了 .append() 函数。

使用 Pandas 中的 `.loc()` 函数创建一个空 DataFrame，包括带有索引的列和附加行

Pandas 中的 .loc() 方法可帮助用户轻松地从 DataFrame 中检索值，而不会带来任何复杂性。可以根据函数中传递的索引值访问特定行和列中的值。

在这种方法中，我们将创建一个空的 DataFrame 和列名。将使用索引来识别每一列来访问它。

接下来我们将一个接一个地追加行。

下面给出了证明这种方法的代码。

# import pandas library as pd
import pandas as pd

# create an Empty DataFrame object With
# column names and indices
df = pd.DataFrame(columns=["Name", "Articles", "Improved"], index=["a", "b", "c"])

print("Empty DataFrame With NaN values : \n\n", df)

# adding rows to an empty
# dataframe at existing index
df.loc["a"] = ["Preet", 50, 100]
df.loc["b"] = ["Parin", 60, 120]
df.loc["c"] = ["Rajesh", 30, 60]
print(df)

上面给出的代码的输出如下。

Empty DataFrame With NaN values :

   Name  Articles  Improved
a  NaN      NaN      NaN
b  NaN      NaN      NaN
c  NaN      NaN      NaN
   Name  Articles  Improved
a  Preet	50		 100
b  Parin	60	     120
c  Rajesh	30		 60

正如我们所观察到的，第一个表中的 NaN 值是因为我们提到了索引，但这些值仍然为空。

提供索引的数量会将表绑定到该特定实例的那么多值。增加索引的数量允许插入更多的值。

因此，在本教程中，我们学习了在 Pandas 中将值附加到 DataFrame 的三种不同方法。

上一篇：在 Pandas 中执行 T 检验

下一篇：Pandas apply, map 和 applymap 的区别

转载请发邮件至 1244347461@qq.com 进行申请，经作者同意之后，转载请以链接形式注明出处

本文地址：