在 Pandas 中删除最后一行和最后一列

当前位置：主页 > 学无止境 > 编程语言 >

Python PHP Java Go TypeScript C++ Vba Node.js C语言 MATLAB

在 Pandas 中删除最后一行和最后一列

作者：迹忆客最近更新：2023/03/21 浏览次数：

本文探讨了使用 Python 删除 Pandas DataFrame 中特定行的不同方法。

大多数数据工程师和数据分析师都使用 Python，因为它具有惊人的数据集中包生态系统。其中一些是 Pandas、Matplotlib、SciPy 等。

Pandas 具有强大的导入各种文件类型和高效探索数据的能力。分析师可以使用 .drop() 方法删除行和列中的各种元素。

在 Pandas 中使用 `drop()` 方法删除行和列

drop() 的语法：

DataFrame.drop(labels=None, axis=0, index=None, columns=None, level=None, inplace=False, errors='raise')

可用于删除行和列的不同参数如下。

label - 指行或列的名称。
axis - 主要是从 0 开始的整数或字符串值。
index - 用作 axis 的替代品。
level - 当数据在多个级别时用于指定级别。
inplace - 如果条件为 True，可以更改数据。

errors - 如果该值设置为 ignore，程序将忽略该特定错误并在不中断的情况下执行。此外，raise 可以用作 ignore 的替代品。

让我们首先在 Pandas 中创建一个虚拟 DataFrame，以便我们使用我们的技巧来操作数据和探索。

import numpy as np
import pandas as pd
df = pd.DataFrame(np.arange(12).reshape(3, 4),
                  columns=['P', 'Q', 'R', 'S'])
print(df)

上述代码的输出如下。

	P	Q	R	S
0	0	1	2	3
1	4	5	6	7
2	8	9	10	11

如你所见，DataFrame 已准备好处理。

虚拟 DataFrame

索引从 0 开始，列命名为 P、Q、R 和 S。reshape(x,y) 将行称为 x，将列称为 y。

让我们使用下面的代码从表中删除列。

print(df.drop(['Q', 'R'], axis=1))

上述代码的输出如下。

使用 drop 方法删除列

我们可以观察到，列 Q 和 R 已从 DataFrame 中删除。新形成的 DataFrame 仅由 P 和 S 组成。

在 Pandas 中使用 `drop()` 方法删除多索引 DataFrame 中的最后一行

让我们制作一个多索引 DataFrame，看看我们如何对该数据执行不同的操作。下面是用于生成多索引虚拟数据的代码。

midex = pd.MultiIndex(levels=[['deer', 'dog', 'eagle'],
                             ['speed', 'weight', 'length']],
                      codes=[[0, 0, 0, 1, 1, 1, 2, 2, 2],
                            [0, 1, 2, 0, 1, 2, 0, 1, 2]])
df = pd.DataFrame(index=midex, columns=['big', 'small'],
                   data=[[61, 36], [29, 14], [5.6, 2], [43, 24],
                         [27, 11], [4.5, 0.8], [300, 250],
                         [3, 0.9], [2.3, 0.3]])
print(df)

上面代码的输出如下。

                big  small
deer  speed    61.0   36.0
      weight   29.0   14.0
      length    5.6    2.0
dog   speed    43.0   24.0
      weight   27.0   11.0
      length    4.5    0.8
eagle speed   300.0  250.0
      weight    3.0    0.9
      length    2.3    0.3

多索引 DataFrame

正如我们所看到的，这里每个特征的索引，deer、dog 和 eagle，都是从 0 开始的，与表中的整体索引无关。我们称之为二级索引，一级索引仍然是 deer、dog 和 eagle。

我们可以提到要同时删除的最后 n 个行和列。例如，我们可以提到我们要删除最后 2 行或最后 3 列，程序会立即为我们执行此操作。

这是一个示例，说明我们如何从 Pandas 中的上述 DataFrame 中删除最后一行。我们现在将从我们创建的虚拟 DataFrame 中删除最后 3 行。

df.drop(df.tail(3).index,inplace=True) # drop last n rows
print(df)

在这里，我们给出了 3 作为要删除的最后 n 行数。

上述代码的输出如下。

              big  small
deer speed   61.0   36.0
     weight  29.0   14.0
     length   5.6    2.0
dog  speed   43.0   24.0
     weight  27.0   11.0
     length   4.5    0.8

同样，我们可以以相同的方式从 DataFrame 中删除列。

使用 `drop()` 方法删除 Pandas 中的最后一列

删除最后 n 列的语法如下。

df.drop(df.columns[[-n,]], axis=1, inplace=True)

我们必须用上面代码中给出的 n 替换我们需要删除的列数。如果我们想删除 DataFrame 最右边的一列，我们需要将 n 替换为 1。

上述代码的输出如下。

              big
deer speed   61.0
     weight  29.0
     length   5.6
dog  speed   43.0
     weight  27.0
     length   4.5

因此，通过这种方式，你只需正确提及标签或提及你要删除的列或行的索引即可轻松执行不同的操作。

因此，使用上述技术，我们可以有效地找到在 Python 中从 Pandas DataFrame 中删除行和列的方法。

上一篇：Pandas groupby 计数

下一篇：如何根据 Pandas 中的日期过滤 DataFrame 行

转载请发邮件至 1244347461@qq.com 进行申请，经作者同意之后，转载请以链接形式注明出处

本文地址：

Pandas DataFrame DataFrame.shift() 函数

发布时间：2024/04/24 浏览次数：133 分类：Python

DataFrame.shift() 函数是将 DataFrame 的索引按指定的周期数进行移位。

Pandas pandas.melt() 函数

发布时间：2024/04/24 浏览次数：101 分类：Python

pandas.melt()函数可以转换 DataFrame。

Python pandas.pivot_table() 函数

发布时间：2024/04/24 浏览次数：82 分类：Python

Python Pandas pivot_table()函数通过对数据进行汇总，避免了数据的重复。

Pandas read_csv()函数

发布时间：2024/04/24 浏览次数：254 分类：Python

Pandas read_csv()函数将指定的逗号分隔值(csv)文件读取到 DataFrame 中。

Pandas 追加数据到 CSV 中

发布时间：2024/04/24 浏览次数：352 分类：Python

本教程演示了如何在追加模式下使用 to_csv()向现有的 CSV 文件添加数据。

Pandas 多列合并

发布时间：2024/04/24 浏览次数：628 分类：Python

本教程介绍了如何在 Pandas 中使用 DataFrame.merge()方法合并两个 DataFrames。

用多个条件过滤 Pandas DataFrame

发布时间：2024/04/24 浏览次数：649 分类：Python

本教程解释了如何根据多个条件从 DataFrame 中过滤元素。

Pandas loc vs iloc

发布时间：2024/04/24 浏览次数：837 分类：Python

本教程介绍了如何使用 Python 中的 loc 和 iloc 从 Pandas DataFrame 中过滤数据。

在 Python 中将 Pandas 系列的日期时间转换为字符串

发布时间：2024/04/24 浏览次数：894 分类：Python

了解如何在 Python 中将 Pandas 系列日期时间转换为字符串

迹忆客专注技术分享