Pandas read_csv()函数
Pandas read_csv() 方法将指定的 CSV
文件读取到 DataFrame
中。
pandas.read_csv()
语法
pandas.read_csv(filepath_or_buffer: Union[str, pathlib.Path, IO[~ AnyStr]],
sep=',',
delimiter=None,
header='infer',
names=None,
index_col=None,
usecols=None,
squeeze=False,
prefix=None,
mangle_dupe_cols=True,
dtype=None,
engine=None,
converters=None,
true_values=None,
false_values=None,
skipinitialspace=False,
skiprows=None,
skipfooter=0,
nrows=None,
na_values=None,
keep_default_na=True,
na_filter=True,
verbose=False,
skip_blank_lines=True,
parse_dates=False,
infer_datetime_format=False,
keep_date_col=False,
date_parser=None,
dayfirst=False,
cache_dates=True,
iterator=False,
chunksize=None,
compression='infer',
thousands=None,
decimal: str='.',
lineterminator=None,
quotechar='"',
quoting=0,
doublequote=True,
escapechar=None,
comment=None,
encoding=None,
dialect=None,
error_bad_lines=True,
warn_bad_lines=True,
delim_whitespace=False,
low_memory=True,
memory_map=False,
float_precision=None)
参数
filepath_or_buffer |
要导入的 CSV 文件的位置 |
delimiter |
用于解析 CSV 文件内容的定界符 |
usecols |
从 CSV 文件中形成 DataFrame 时,只包含列名。 |
header |
哪一行/几行作为标题的列名 |
squeeze |
如果解析的数据只包含一列,则返回 Pandas Series 。 |
skiprows |
跳过哪一行/几行 |
返回值
由带有标签轴的 CSV 文件形成的 Dataframe。
示例代码:Pandas 使用 pandas.read_csv()
函数读取 CSV
文件
import pandas as pd
df = pd.read_csv("dataset.csv")
print(df)
输出:
Country Item Type Sales Channel Order Priority
0 Tuvalu Baby Food Offline H
1 East Timor Meat Online L
2 Norway Baby Food Online L
3 Portugal Baby Food Online H
4 Honduras Snacks Online L
5 New Zealand Fruits Online H
6 Moldova Personal Care Online L
该方法将 CSV
文件加载到 DataFrame
中。在这里,我们可以使用绝对路径和相对路径来提供一个文件路径作为 pandas.read_csv()
函数的参数。
在这种情况下,dataset.csv
与程序文件在同一目录下,这意味着可以使用 CSV
文件名作为文件路径。
示例代码:在 pandas.read_csv()
函数中设置 usecols
参数
import pandas as pd
df = pd.read_csv("dataset.csv",usecols=["Country","Sales Channel","Order Priority"])
print(df)
输出:
Country Sales Channel Order Priority
0 Tuvalu Offline H
1 East Timor Online L
2 Norway Online L
3 Portugal Online H
4 Honduras Online L
5 New Zealand Online H
6 Moldova Online L
该案例通过只在 usecols
参数中包含指定的列,将 CSV
文件加载到 DataFrame
中。
Country
,Sales Channel
和 Order Priority
这几列只作为参数传递,所以它们只被包含在 DataFrame
中。
示例代码:带有表头的 pandas.read_csv()
函数
import pandas as pd
df = pd.read_csv("dataset.csv",header=1)
print(df)
输出:
Tuvalu Baby Food Offline H
0 East Timor Meat Online L
1 Norway Baby Food Online L
2 Portugal Baby Food Online H
3 Honduras Snacks Online L
4 New Zealand Fruits Online H
5 Moldova Personal Care Online L
该过程通过将第 1 行设置为 header
,将 CSV
文件加载到 DataFrame
中。
这里,第 1 行元素作为整个 DataFrame
的列名。
示例代码: 具有跳行的 pandas.read_csv()
函数
import pandas as pd
df = pd.read_csv("dataset.csv",skiprows=3)
print(df)
输出:
Norway Baby Food Online L
0 Portugal Baby Food Online H
1 Honduras Snacks Online L
2 New Zealand Fruits Online H
3 Moldova Personal Care Online L
这个过程通过跳过前 3 行将 CSV 文件加载到 DataFrame 中。
相关文章
Pandas DataFrame DataFrame.shift() 函数
发布时间:2024/04/24 浏览次数:114 分类:Python
-
DataFrame.shift() 函数是将 DataFrame 的索引按指定的周期数进行移位。
Python pandas.pivot_table() 函数
发布时间:2024/04/24 浏览次数:55 分类:Python
-
Python Pandas pivot_table()函数通过对数据进行汇总,避免了数据的重复。
在 Pandas 中使用 stack() 和 unstack() 函数重塑 DataFrame
发布时间:2024/04/24 浏览次数:175 分类:Python
-
本文讨论了 Pandas 中 stack() 和 unstack() 函数的使用。
计算 Pandas DataFrame 中的方差
发布时间:2024/04/23 浏览次数:181 分类:Python
-
本教程演示了如何计算 Python Pandas DataFrame 中的方差。
查找已安装的 Pandas 版本
发布时间:2024/04/23 浏览次数:116 分类:Python
-
在本文中,我们将介绍如何查找已安装的 Python Pandas 库版本。我们使用了内置版本功能和其他功能来显示其他已安装版本的详细信息。
Pandas 中的 Groupby 索引列
发布时间:2024/04/23 浏览次数:79 分类:Python
-
本教程将介绍如何使用 Python Pandas Groupby 对数据进行分类,然后将函数应用于类别。通过示例使用 groupby() 函数按 Pandas 中的多个索引列进行分组。