迹忆客 专注技术分享

当前位置:主页 > 学无止境 > 编程语言 > Python >

将 JSON 转换为 Pandas DataFrame

作者:迹忆客 最近更新:2024/04/20 浏览次数:

本文将介绍如何将 JSON 转换为 Pandas DataFrame。

JSON 是 JavaScript Object Notation 的缩写,它是基于 JavaScript 中对象的格式,是一种表示结构化数据的编码技术。它是基于 JavaScript 中对象的格式,是一种表示结构化数据的编码技术。目前,它被广泛使用,特别是在服务器和 Web 应用程序之间共享数据。

由于它的简单性和受编程语言数据结构的影响,JSON 正变得非常流行。它比较容易理解,下面是一个简单的 API 的 JSON 响应的例子。

{
"Results":
         [
         { "id": "01", "Name": "Jay" },
         { "id": "02", "Name": "Mark" },
         { "id": "03", "Name": "Jack" }
         ],
"status": ["ok"]
}

在我们的例子中可以看到,JSON 在某种程度上似乎是嵌套列表和字典的结合,因此,从 JSON 文件中提取数据,甚至将其存储为 Pandas DataFrame 是比较容易的。

Python 中的 Pandas 和 JSON 库可以帮助实现这个功能。我们有两个函数 read_json()json_normalize() 可以帮助将 JSON 字符串转换为 DataFrame。


使用 json_normalize() 将 JSON 转换为 Pandas DataFrame

json_normalize() 函数被非常广泛地用于读取嵌套的 JSON 字符串并返回一个 DataFrame。要使用这个函数,我们首先需要使用 Python 中 JSON 库中的 json.loads() 函数来读取 JSON 字符串,然后我们将这个 JSON 对象传递给 json_normalize(),它将返回一个包含所需数据的 Pandas DataFrame。

import pandas as pd
import json
from pandas import json_normalize

data = """
{
"Results":
         [
         { "id": "1", "Name": "Jay" },
         { "id": "2", "Name": "Mark" },
         { "id": "3", "Name": "Jack" }
         ],
"status": ["ok"]
}
    """

info = json.loads(data)

df = json_normalize(info["Results"])  # Results contain the required data
print(df)

输出:

   id  Name
0  1   Jay
1  2  Mark
2  3  Jack

使用 read_json() 将 JSON 转换为 Pandas DataFrame

另一个将 JSON 转换为 DataFrame 的 Pandas 函数是 read_json(),用于简单的 JSON 字符串。我们可以直接将 JSON 文件的路径或 JSON 字符串传递给函数,以便将数据存储在 Pandas DataFrame 中。read_json() 有很多参数,其中 orient 指定 JSON 字符串的格式。

缺点是它很难与嵌套的 JSON 字符串一起使用。因此,为了使用 read_json(),我们将使用一个简单得多的例子,如下所示。

import pandas as pd

data = """
          {
              "0":{
                  "Name": "Jay",
                  "Age": "17"
              },
              "1":{
                  "Name": "Mark",
                  "Age": "15"
              },
              "2":{
                  "Name": "Jack",
                  "Age":"16"
              }
          }
    """

df = pd.read_json(data, orient="index")
print(df)

输出:

   Name  Age
0   Jay   17
1  Mark   15
2  Jack   16

我们将 orient 设置为 'index',因为 fromat 的 JSON 字符串匹配的模式是 {index : {column: value}}

转载请发邮件至 1244347461@qq.com 进行申请,经作者同意之后,转载请以链接形式注明出处

本文地址:

相关文章

计算 Pandas DataFrame 列的数量

发布时间:2024/04/20 浏览次数:113 分类:Python

本教程解释了如何使用各种方法计算 Pandas DataFrame 的列数,例如使用 shape 属性、列属性、使用类型转换和使用 info() 方法。

更改 Pandas DataFrame 列的顺序

发布时间:2024/04/20 浏览次数:116 分类:Python

在这篇文章中,我们将介绍如何使用 python pandas DataFrame 来更改列的顺序。在 pandas 中,使用 Python 中的 reindex() 方法重新排序或重新排列列。

扫一扫阅读全部技术教程

社交账号
  • https://www.github.com/onmpw
  • qq:1244347461

最新推荐

教程更新

热门标签

扫码一下
查看教程更方便