迹忆客 专注技术分享

当前位置:主页 > 学无止境 > 编程语言 > Python >

在 Pandas 中对 DataFrame 进行列切片

作者:迹忆客 最近更新:2024/04/22 浏览次数:

Pandas 中的列式切片允许我们将 DataFrame 切成子集,这意味着它从原来的 DataFrame 中创建一个新的 Pandas DataFrame,其中只包含所需的列。我们将以下面的 DataFrame 为例来进列切片操作。

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.rand(4, 4), columns=["a", "b", "c", "d"])
print(df)

输出:

          a         b         c         d
0  0.797321  0.468894  0.335781  0.956516
1  0.546303  0.567301  0.955228  0.557812
2  0.385315  0.706735  0.058784  0.578468
3  0.751037  0.248284  0.172229  0.493763

使用 loc() 对 Pandas DataFrame 中的列切片

Pandas 库为我们提供了一种以上的方法来进行列式切片。第一种是使用 loc() 函数。

Pandas 的 loc() 函数允许我们使用列名或索引标签来访问 DataFrame 的元素。使用 loc() 进行列切片的语法:

dataframe.loc[:, [columns]]

例子:

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.rand(4, 4), columns=["a", "b", "c", "d"])
df1 = df.loc[:, "a":"c"]  # Returns a new dataframe with columns a,b and c
print(df1)

输出:

          a         b         c
0  0.344952  0.611792  0.213331
1  0.907322  0.992097  0.080447
2  0.471611  0.625846  0.348778
3  0.656921  0.999646  0.976743

使用 iloc() 在 Pandas DataFrame 中列切片

我们也可以使用 iloc() 函数来使用行和列的整数索引来访问 DataFrame 的元素。使用 iloc() 对列进行切片的语法。

dataframe.iloc[:, [column - index]]

例:

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.rand(4, 4), columns=["a", "b", "c", "d"])
df1 = df.iloc[:, 0:2]  # Returns a new dataframe with first two columns
print(df1)

输出:

          a         b
0  0.034587  0.070249
1  0.648231  0.721517
2  0.485168  0.548045
3  0.377612  0.310408

使用 redindex() 在 Pandas DataFrame 中切列片

reindex() 函数也可用于改变 DataFrame 的索引,并可用于列的切片。reindex() 函数可以接受许多参数,但对于列的分割,我们只需要向函数提供列名。

使用 reindex() 进行列切片的语法:

dataframe.reindex(columns=[column_names])

例:

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.rand(4, 4), columns=["a", "b", "c", "d"])
# Returns a new dataframe with c and b columns
df1 = df.reindex(columns=["c", "b"])
print(df1)

输出:

          c         b
0  0.429790  0.962838
1  0.605381  0.463617
2  0.922489  0.733338
3  0.741352  0.118478

转载请发邮件至 1244347461@qq.com 进行申请,经作者同意之后,转载请以链接形式注明出处

本文地址:

相关文章

DataFrame 获取给定列的第一行

发布时间:2024/04/22 浏览次数:51 分类:Python

本教程介绍了如何在 Pandas DataFrame 中使用 Series.loc()和 Series.iloc()方法获取给定列的第一行。

Pandas 重命名多个列

发布时间:2024/04/22 浏览次数:186 分类:Python

本教程演示了如何使用 Pandas 重命名数据框中的多个列。

扫一扫阅读全部技术教程

社交账号
  • https://www.github.com/onmpw
  • qq:1244347461

最新推荐

教程更新

热门标签

扫码一下
查看教程更方便