在 Pandas 中对 DataFrame 进行列切片
Pandas 中的列式切片允许我们将 DataFrame 切成子集,这意味着它从原来的 DataFrame 中创建一个新的 Pandas DataFrame,其中只包含所需的列。我们将以下面的 DataFrame 为例来进列切片操作。
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(4, 4), columns=["a", "b", "c", "d"])
print(df)
输出:
a b c d
0 0.797321 0.468894 0.335781 0.956516
1 0.546303 0.567301 0.955228 0.557812
2 0.385315 0.706735 0.058784 0.578468
3 0.751037 0.248284 0.172229 0.493763
使用 loc()
对 Pandas DataFrame 中的列切片
Pandas 库为我们提供了一种以上的方法来进行列式切片。第一种是使用 loc()
函数。
Pandas 的 loc()
函数允许我们使用列名或索引标签来访问 DataFrame 的元素。使用 loc()
进行列切片的语法:
dataframe.loc[:, [columns]]
例子:
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(4, 4), columns=["a", "b", "c", "d"])
df1 = df.loc[:, "a":"c"] # Returns a new dataframe with columns a,b and c
print(df1)
输出:
a b c
0 0.344952 0.611792 0.213331
1 0.907322 0.992097 0.080447
2 0.471611 0.625846 0.348778
3 0.656921 0.999646 0.976743
使用 iloc()
在 Pandas DataFrame 中列切片
我们也可以使用 iloc()
函数来使用行和列的整数索引来访问 DataFrame 的元素。使用 iloc()
对列进行切片的语法。
dataframe.iloc[:, [column - index]]
例:
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(4, 4), columns=["a", "b", "c", "d"])
df1 = df.iloc[:, 0:2] # Returns a new dataframe with first two columns
print(df1)
输出:
a b
0 0.034587 0.070249
1 0.648231 0.721517
2 0.485168 0.548045
3 0.377612 0.310408
使用 redindex()
在 Pandas DataFrame 中切列片
reindex()
函数也可用于改变 DataFrame 的索引,并可用于列的切片。reindex()
函数可以接受许多参数,但对于列的分割,我们只需要向函数提供列名。
使用 reindex()
进行列切片的语法:
dataframe.reindex(columns=[column_names])
例:
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(4, 4), columns=["a", "b", "c", "d"])
# Returns a new dataframe with c and b columns
df1 = df.reindex(columns=["c", "b"])
print(df1)
输出:
c b
0 0.429790 0.962838
1 0.605381 0.463617
2 0.922489 0.733338
3 0.741352 0.118478
相关文章
Pandas DataFrame DataFrame.shift() 函数
发布时间:2024/04/24 浏览次数:133 分类:Python
-
DataFrame.shift() 函数是将 DataFrame 的索引按指定的周期数进行移位。
Python pandas.pivot_table() 函数
发布时间:2024/04/24 浏览次数:82 分类:Python
-
Python Pandas pivot_table()函数通过对数据进行汇总,避免了数据的重复。
Pandas read_csv()函数
发布时间:2024/04/24 浏览次数:254 分类:Python
-
Pandas read_csv()函数将指定的逗号分隔值(csv)文件读取到 DataFrame 中。
Pandas 多列合并
发布时间:2024/04/24 浏览次数:628 分类:Python
-
本教程介绍了如何在 Pandas 中使用 DataFrame.merge()方法合并两个 DataFrames。
Pandas loc vs iloc
发布时间:2024/04/24 浏览次数:837 分类:Python
-
本教程介绍了如何使用 Python 中的 loc 和 iloc 从 Pandas DataFrame 中过滤数据。
在 Python 中将 Pandas 系列的日期时间转换为字符串
发布时间:2024/04/24 浏览次数:894 分类:Python
-
了解如何在 Python 中将 Pandas 系列日期时间转换为字符串