深入理解Python中的JSON模块:基础大总结与实战代码解析【第102篇—JSON模块】

深入理解Python中的JSON模块:基础大总结与实战代码解析

在Python中,JSON(JavaScript Object Notation)模块是处理JSON数据的重要工具之一。JSON是一种轻量级的数据交换格式,广泛应用于Web开发、API通信等领域。本文将深入探讨JSON模块的基础知识,并通过实战代码解析来帮助读者更好地理解和运用该模块。

image-20240227001521952

1. JSON模块基础知识

1.1 JSON简介

JSON是一种轻量级的数据格式,易于阅读和编写,同时也易于机器解析和生成。它基于键值对的方式组织数据,支持嵌套结构,包括对象和数组。

1.2 JSON模块概述

Python的json模块提供了处理JSON数据的工具,包括序列化(将Python对象转换为JSON字符串)和反序列化(将JSON字符串转换为Python对象)功能。

1.3 基本函数和方法

  • json.dumps(obj, indent=4): 将Python对象序列化为JSON格式的字符串,可选参数indent用于指定缩进空格数。
  • json.dump(obj, fp, indent=4): 将Python对象序列化为JSON格式并写入文件中。
  • json.loads(json_str): 将JSON格式的字符串反序列化为Python对象。
  • json.load(fp): 从文件中读取JSON数据并反序列化为Python对象。

2. 实战代码解析

2.1 JSON序列化示例

让我们从一个简单的Python字典开始,演示如何使用json.dumps进行序列化:

import json

# 定义一个Python字典
data = {
    "name": "John",
    "age": 30,
    "city": "New York"
}

# 序列化为JSON字符串并打印
json_string = json.dumps(data, indent=2)
print(json_string)

上述代码将输出格式化的JSON字符串,包含键值对和缩进:

{
  "name": "John",
  "age": 30,
  "city": "New York"
}

2.2 JSON反序列化示例

接下来,我们将演示如何使用json.loads将JSON字符串反序列化为Python对象:

import json

# 定义一个JSON字符串
json_string = '{"name": "John", "age": 30, "city": "New York"}'

# 反序列化为Python对象并打印
python_object = json.loads(json_string)
print(python_object)

输出结果将是一个Python字典:

{'name': 'John', 'age': 30, 'city': 'New York'}

2.3 从文件读取和写入JSON数据

让我们看一个将JSON数据写入文件并从文件中读取的例子:

import json

# 定义一个Python字典
data = {
    "name": "Alice",
    "age": 25,
    "city": "London"
}

# 将数据写入JSON文件
with open("data.json", "w") as file:
    json.dump(data, file, indent=2)

# 从JSON文件中读取数据
with open("data.json", "r") as file:
    loaded_data = json.load(file)

# 打印加载后的数据
print(loaded_data)

这样,我们就完成了从Python对象到JSON字符串,以及从JSON字符串到Python对象的转换,同时通过文件进行读写。

3. 高级应用:自定义JSON序列化与反序列化

JSON模块不仅仅局限于基本的数据类型序列化,还支持用户自定义类的序列化与反序列化。通过defaultobject_hook参数,我们可以实现更高级的应用。

3.1 自定义序列化

考虑以下场景,有一个自定义的Person类:

class Person:
    def __init__(self, name, age):
        self.name = name
        self.age = age

我们可以通过自定义一个函数来告诉JSON模块如何序列化这个类的实例:

def person_encoder(obj):
    if isinstance(obj, Person):
        return {"name": obj.name, "age": obj.age}
    raise TypeError("Object of type 'Person' is not JSON serializable")

# 创建一个Person实例
person_instance = Person(name="Emma", age=28)

# 序列化为JSON字符串
json_string_custom = json.dumps(person_instance, default=person_encoder, indent=2)
print(json_string_custom)

3.2 自定义反序列化

同样,我们可以定义一个函数,告诉JSON模块如何将JSON数据转换为我们期望的自定义类的实例:

def person_decoder(obj):
    if "name" in obj and "age" in obj:
        return Person(name=obj["name"], age=obj["age"])
    return obj

# 反序列化JSON字符串
loaded_person = json.loads(json_string_custom, object_hook=person_decoder)
print(loaded_person.__dict__)

这样,我们就实现了自定义类的序列化与反序列化,使得JSON模块更加灵活,可以适应各种数据结构。

4. 异常处理与安全性考虑

在处理JSON数据时,我们也需要考虑一些异常情况,例如处理无效的JSON字符串或避免潜在的安全问题。

4.1 异常处理

在实际应用中,我们可能会遇到无效的JSON字符串,为了防止程序崩溃,可以使用try-except块进行异常处理:

json_str_invalid = '{"name": "Sam", "age": 25,}'

try:
    loaded_data_invalid = json.loads(json_str_invalid)
    print(loaded_data_invalid)
except json.JSONDecodeError as e:
    print(f"Error decoding JSON: {e}")

4.2 安全性考虑

当从不受信任的源加载JSON数据时,需要注意防范JSON注入攻击。在这种情况下,可以使用json.JSONEncoder的子类来自定义编码器,确保数据的安全性。

class SafeJSONEncoder(json.JSONEncoder):
    def default(self, obj):
        if isinstance(obj, (str, int, float, bool, list, dict, type(None))):
            return super().default(obj)
        else:
            return str(obj)

# 使用SafeJSONEncoder编码
unsafe_data = {"user": "admin", "password": "123456"}
json_string_safe = json.dumps(unsafe_data, cls=SafeJSONEncoder, indent=2)
print(json_string_safe)

5. JSON模块在Web开发中的应用

在现代的Web开发中,JSON广泛用于前后端之间的数据交换。在这个背景下,JSON模块成为了连接前后端的桥梁,促使了更加灵活和高效的数据通信方式。

5.1 API交互

许多Web服务和应用程序通过API(Application Programming Interface)进行数据交换,而API通常以JSON格式返回数据。使用JSON模块,我们能够轻松处理从API获取的JSON响应。

import requests
import json

# 发送API请求
response = requests.get("https://jsonplaceholder.typicode.com/todos/1")
data_from_api = response.json()

# 打印获取的数据
print(json.dumps(data_from_api, indent=2))

5.2 前后端数据交互

在前后端分离的架构中,前端通过JSON与后端进行数据交互。例如,使用Flask框架搭建的后端服务可以轻松将Python对象转换为JSON格式返回给前端:

from flask import Flask, jsonify

app = Flask(__name__)

@app.route('/get_user', methods=['GET'])
def get_user():
    user_data = {"username": "john_doe", "email": "john@example.com"}
    return jsonify(user_data)

if __name__ == '__main__':
    app.run(debug=True)

前端通过Ajax等方式请求后端数据,而后端则使用JSON模块处理数据,实现了前后端的高效通信。

7. 高级技巧:自定义JSON序列化器和反序列化器

在一些复杂的应用场景中,我们可能需要更灵活地控制对象的序列化和反序列化过程。为此,我们可以自定义JSON编码器和解码器,通过继承json.JSONEncoder和使用object_hook参数实现更高级的处理逻辑。

7.1 自定义JSON编码器

import json
from datetime import datetime

class CustomJSONEncoder(json.JSONEncoder):
    def default(self, obj):
        if isinstance(obj, datetime):
            return obj.strftime('%Y-%m-%d %H:%M:%S')
        return super().default(obj)

# 使用自定义编码器
data_with_datetime = {'event': 'meeting', 'time': datetime.now()}
json_string_custom_encoder = json.dumps(data_with_datetime, cls=CustomJSONEncoder, indent=2)
print(json_string_custom_encoder)

在上述例子中,我们自定义了一个JSON编码器,用于将datetime对象转换为特定格式的字符串。通过传递cls=CustomJSONEncoder参数,我们告诉json.dumps使用我们定义的编码器。

7.2 自定义JSON解码器

import json
from datetime import datetime

def custom_decoder(obj):
    if 'time' in obj:
        obj['time'] = datetime.strptime(obj['time'], '%Y-%m-%d %H:%M:%S')
    return obj

# 使用自定义解码器
json_string_custom_decoder = '{"event": "meeting", "time": "2024-02-27 15:30:00"}'
decoded_data = json.loads(json_string_custom_decoder, object_hook=custom_decoder)
print(decoded_data)

在这个例子中,我们定义了一个自定义的解码器函数custom_decoder,用于将JSON中的特定字段(例如时间戳)转换为Python对象。通过传递object_hook=custom_decoder参数,我们指定了解码时使用自定义的解码器。

8. JSON Schema验证

除了序列化和反序列化,JSON模块还支持使用JSON Schema验证JSON数据的有效性。JSON Schema是一种用于描述JSON数据结构的规范。

from jsonschema import validate

# 定义JSON Schema
schema = {
    "type": "object",
    "properties": {
        "name": {"type": "string"},
        "age": {"type": "integer"},
        "city": {"type": "string"}
    },
    "required": ["name", "age"]
}

# 待验证的JSON数据
json_data_to_validate = '{"name": "Alice", "age": 28}'

# 进行验证
try:
    validate(instance=json.loads(json_data_to_validate), schema=schema)
    print("JSON data is valid against the schema.")
except Exception as e:
    print(f"Validation failed: {e}")

在上述例子中,我们使用jsonschema库验证JSON数据是否符合预定义的JSON Schema。这有助于确保我们的数据满足特定的结构和约束。

9. JSON模块的性能优化

在处理大量数据或对性能要求较高的应用中,优化JSON模块的使用是一个重要的考虑因素。以下是一些性能优化的建议:

9.1 使用ujson替代json

ujson是一个C语言实现的JSON解析器,速度比Python标准库的json模块更快。在安装之前,需要先使用pip进行安装:

pip install ujson

然后,可以将代码中的json替换为ujson,享受更高的性能。

import ujson

data = {"name": "John", "age": 30, "city": "New York"}
json_string = ujson.dumps(data)
loaded_data = ujson.loads(json_string)

9.2 使用生成器减少内存消耗

当处理大型数据集时,可以考虑使用生成器来逐行读取和写入JSON数据,减少内存的占用。

import json

def read_large_json_file(file_path):
    with open(file_path, 'r') as file:
        for line in file:
            yield json.loads(line)

def write_large_json_file(file_path, data_generator):
    with open(file_path, 'w') as file:
        for data in data_generator:
            json.dump(data, file)
            file.write('\n')

# 读取大型JSON文件
large_data_generator = read_large_json_file('large_data.json')

# 处理数据并写入新文件
write_large_json_file('processed_large_data.json', processed_data_generator)

9.3 使用json.JSONEncoder自定义优化

通过继承json.JSONEncoder并覆写default方法,可以实现对特定对象的优化处理,提高序列化性能。

import json
from datetime import datetime

class OptimizedJSONEncoder(json.JSONEncoder):
    def default(self, obj):
        if isinstance(obj, datetime):
            return obj.isoformat()
        return super().default(obj)

# 使用自定义编码器
data_with_datetime = {'event': 'meeting', 'time': datetime.now()}
json_string_optimized_encoder = json.dumps(data_with_datetime, cls=OptimizedJSONEncoder, indent=2)
print(json_string_optimized_encoder)

10. JSON模块与其他模块的集成

JSON模块可以与其他Python模块集成,以实现更复杂的应用。以下是一些集成的示例:

10.1 与Pandas集成

Pandas是一个强大的数据处理库,可以轻松处理数据框。JSON数据可以与Pandas的数据框进行转换。

import pandas as pd
import json

# 创建一个数据框
df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'], 'age': [25, 30, 35]})

# 将数据框转为JSON字符串
json_string_from_df = df.to_json(orient='records', lines=True)

# 将JSON字符串转为数据框
df_from_json = pd.read_json(json_string_from_df, lines=True)
print(df_from_json)

10.2 与数据库集成

在与数据库交互时,可以使用JSON模块方便地将数据转换为JSON格式。

import sqlite3
import json

# 连接SQLite数据库
conn = sqlite3.connect('example.db')
cursor = conn.cursor()

# 创建表
cursor.execute('''CREATE TABLE IF NOT EXISTS users (id INTEGER PRIMARY KEY, name TEXT, age INTEGER)''')

# 插入数据
cursor.execute('''INSERT INTO users (name, age) VALUES (?, ?)''', ('Alice', 28))
cursor.execute('''INSERT INTO users (name, age) VALUES (?, ?)''', ('Bob', 35))

# 提交更改
conn.commit()

# 查询数据并转为JSON
cursor.execute('''SELECT * FROM users''')
rows = cursor.fetchall()
json_data_from_db = json.dumps(rows, indent=2)
print(json_data_from_db)

# 关闭连接
conn.close()

通过以上集成示例,我们展示了JSON模块如何与其他常用模块协同工作,使得在实际项目中更容易实现各种数据处理需求。

11. JSON Web Token (JWT) 与 JSON模块的结合

在Web开发中,JSON Web Token(JWT)是一种用于在用户和服务器之间传递安全信息的开放标准。JWT通常被用于身份验证和信息传递,其内容以JSON格式编码。

JSON模块可以方便地用于JWT的编码和解码过程。

11.1 JWT编码

import json
import jwt
from datetime import datetime, timedelta

# 密钥,用于签名
secret_key = "my_secret_key"

# 创建payload(负载)
payload = {
    "user_id": 123,
    "username": "john_doe",
    "exp": datetime.utcnow() + timedelta(days=1)  # 设置过期时间
}

# 使用json.dumps将payload转为JSON字符串,并使用jwt.encode生成JWT
jwt_token = jwt.encode(json.loads(json.dumps(payload)), secret_key, algorithm='HS256')

print("JWT Token:", jwt_token)

11.2 JWT解码

import jwt

# 解码JWT Token,获取原始payload
decoded_payload = jwt.decode(jwt_token, secret_key, algorithms=['HS256'])

print("Decoded Payload:", decoded_payload)

通过上述示例,我们演示了如何使用JSON模块将Python字典转换为JSON字符串,然后使用JWT对其进行编码和解码。JWT的使用在实际Web应用中非常广泛,结合JSON模块使得对JWT的操作更为灵活和方便。

12. JSON模块的异步支持

在异步编程中,Python提供了asyncio库,而JSON模块也提供了对异步编程的支持。aiohttp库是一种常用的异步HTTP客户端库,结合JSON模块,我们可以进行异步的JSON数据交互。

12.1 异步JSON编码

import json
import asyncio
import aiohttp

async def async_json_encode():
    data = {"name": "Alice", "age": 28}
    json_string = json.dumps(data)
    return json_string

async def main():
    json_data = await async_json_encode()
    print("Async JSON Encoding Result:", json_data)

# 运行异步主函数
asyncio.run(main())

12.2 异步JSON解码

import json
import asyncio
import aiohttp

async def async_json_decode(json_string):
    data = json.loads(json_string)
    return data

async def main():
    json_data = '{"name": "Bob", "age": 35}'
    decoded_data = await async_json_decode(json_data)
    print("Async JSON Decoding Result:", decoded_data)

# 运行异步主函数
asyncio.run(main())

在异步编程中,可以通过asyncioaiohttp库结合使用JSON模块,实现异步的JSON编码和解码,使得在异步环境中更加高效。

总结:

本文深入探讨了Python中的JSON模块,从基础知识到高级应用,以及性能优化和与其他模块的集成,全面展示了JSON模块在实际开发中的重要性和灵活性。以下是本文的主要亮点:

  1. 基础知识概述: 文章以JSON的简介为切入点,详细介绍了Python中的json模块的基础函数和方法,包括序列化、反序列化等基本操作。

  2. 实战代码解析: 通过实际的代码示例,展示了JSON模块的基本使用,包括对象的序列化与反序列化、文件的读写操作,使读者能够快速上手使用JSON模块。

  3. 高级应用: 文章深入探讨了自定义JSON序列化与反序列化、异常处理与安全性考虑、性能优化等高级应用。通过自定义编码器、解码器以及异常处理等方式,读者可以更灵活地处理复杂的数据场景。

  4. 与其他模块的集成: 文章展示了JSON模块与Pandas、数据库等模块的集成,使得在处理数据时更加灵活,适应不同需求。

  5. JWT与异步支持: 文章介绍了JSON模块与JSON Web Token(JWT)的结合,以及在异步编程中的应用,展示了JSON模块在不同场景下的多样化使用。

  6. 总结与展望: 最后,文章对所学内容进行了总结,强调了JSON模块的重要性,并鼓励读者深入探索更多应用领域。

通过这篇文章,读者可以全面了解JSON模块的各种应用场景,从基础到高级,以及与其他模块的协同使用,为读者提供了丰富的知识和实用的技能,帮助其在实际项目中更加高效地处理和交换数据。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/412283.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

2023 re:Invent 用 Amazon Q 打造你的知识库

前言 随着 ChatGPT 的问世,我们迎来了许多创新和变革的机会。一年一度的亚马逊云科技大会 re:Invent 也带来了许多前言的技术,其中 Amazon CEO Adam Selipsky 在 2023 re:Invent 大会中介绍 Amazon Q 让我印象深刻,这预示着生成式 AI 的又一…

【wu-acw-client 使用】案例

wu-acw-client 使用 项目介绍,使用acw-client,创建对应Java项目的增删改查(ORM:Lazy ORM、mybatis),项目模块架构:mvc、feign、ddd 演示项目环境:idea 、mac、mysql、jdk17 spring …

geotools解析shp 提示 opengis.*.SimpleFeatureType‘ 不在其界限内

问题:( geotools.version:31-SNAPSHOT) 解析shp文件时提示类型SimpleFeatureType不在其界限内 解决: 在引用处将org.opengis.feature.simple.SimpleFeatureType 改为 org.geotools.api.feature.simple.SimpleFeatureType

qt-C++笔记之使用QProcess去执行一个可执行文件时指定动态库所存放的文件夹lib的路径

qt-C笔记之使用QProcess去执行一个可执行文件时指定动态库所存放的文件夹lib的路径 参考博文: 1.C笔记之执行一个可执行文件时指定动态库所存放的文件夹lib的路径 2.Linux笔记之LD_LIBRARY_PATH详解 3.qt-C笔记之使用QProcess去执行一个可执行文件时指定动态库所存放…

LeetCode 0938.二叉搜索树的范围和:深度优先搜索(可中序遍历)

【LetMeFly】938.二叉搜索树的范围和:深度优先搜索(可中序遍历) 力扣题目链接:https://leetcode.cn/problems/range-sum-of-bst/ 给定二叉搜索树的根结点 root,返回值位于范围 [low, high] 之间的所有结点的值的和。…

数一满分150分总分451东南大学920电子信息通信考研Jenny老师辅导班同学,真题大纲,参考书。

记录用来打破的,信息通信考研Jenny老师2024级辅导班同学,数一满分150分,专业课920专业基础综合143,总分451分,一位及其优秀的本科985报考东南大学信息学院的学生,东南大学920考研,东南大学信息科…

查看NGINX版本

查看Nginx版本有几种常用方法: 命令行: 在Linux或macOS系统中打开终端,然后输入以下命令之一: nginx -v 或者 nginx -V -v 参数将输出简短的nginx版本信息。 -V 参数(大写)将输出更详细的版本和配置信息&am…

Zoho ToDo 满足您的需求:任务管理满足隐私和安全要求

任务管理工具已经成为我们日常生活中不可或缺的一部分,它们帮助我们处理各种事务,从杂项和愿望清单到管理截止日期和资源。这些工具不仅仅是简单的任务列表,它们掌握了项目的蓝图、雄心勃勃的目标和完成的最后期限。然而随着这些工具的使用越…

【web APIs】1、(学习笔记)有案例!

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、概念二、使用步骤1.获取DOM对象2.操作元素内容3.属性修改3.1.常用属性修改3.2.控制样式属性3.3.操作类名(className) 操作CSS3.4.操作表单元素属性3.5.自定…

YOLOv9-Openvino和ONNXRuntime推理【CPU】

1 环境: CPU:i5-12500 Python:3.8.18 2 安装Openvino和ONNXRuntime 2.1 Openvino简介 Openvino是由Intel开发的专门用于优化和部署人工智能推理的半开源的工具包,主要用于对深度推理做优化。 Openvino内部集成了Opencv、Tens…

小龙虾优化算法COA求解不闭合SD-MTSP,可以修改旅行商个数及起点(提供MATLAB代码)

一、小龙虾优化算法COA 小龙虾优化算法(Crayfsh optimization algorithm,COA)由Jia Heming 等人于2023年提出,该算法模拟小龙虾的避暑、竞争和觅食行为,具有搜索速度快,搜索能力强,能够有效平衡…

Windows已经安装了QT 6.3.0,如何再安装一个QT 5.12

要在Windows上安装Qt 5.12,您可以按照以下步骤操作: 下载Qt 5.12:访问Qt官方网站或其他可信赖的来源,下载Qt 5.12的安装包。 下载安装地址 下载安装详细教程 安装问题点 qt安装时“Error during installation process(qt.tools…

静态方法,类的主方法

静态变量 同一个类的不同实例对象,可以共用同一静态变量。(如果有一个对象将静态变量更改,另外一个对象的静态变量也会随之更改) 静态方法 使用类中的方法就必须将这个类实例化 ,调用静态方法无需创造类的对象 实例 p…

【论文精读】LLaMA1

摘要 以往的LLM(Large Languages Models)研究都遵从一个假设,即更多的参数将导致更好的性能。但也发现,给定计算预算限制后,最佳性能的模型不是参数最大的,而是数据更多的。对于实际场景,首选的…

2024 CKS 题库 | 13、Container安全上下文

不等更新题库 CKS 题库 13、Container安全上下文 Context Container Security Context应在特定namespace中修改Deployment。 Task 按照如下要求修改 sec-ns 命名空间里的 Deployment secdep 用ID为 30000 的用户启动容器(设置用户ID为: 30000)不允许…

机器学习-01-课程目标与职位分析

总结 本系列是机器学习课程的第01篇,主要介绍本门课程的课程目标与职位分析 教材 数据挖掘与机器学习 课程教学方法 布鲁姆教学法 认知领域(cognitive domain) 1.知道(知识)(knowledge) 是指…

逆序或者正序打印一个数的每一位数,递归实现(C语言)

从键盘上输入一个不多于5位(包括5位)的正整数,要求 (1)求出它是几位数;(2)分别输出每一位数字(3)按逆序输出各位数字 (1)求出它是几位…

产品经理学习-产品运营《社群活跃度打造》

目录: 社群运营普遍问题 社群是否需要活跃 提升活跃的方法 衡量社群的3个标准 社群运营普遍问题 在做社群运营的时候通常会进入一个相似的循环,拉群后会活跃一段时间变成广告群,不断的发商品链接、广告,一段时候后社群变成了一…

本地复制文本无法在Ubuntu终端中粘贴问题

在公司,安装Ubuntu环境后无法粘贴。 查询并自己实践后,解决方法如下: 1. sudo apt-get autoremove open-vm-tools 2. sudo apt-get install open-vm-tools-desktop 3.重启虚拟机 又可以愉快的复制粘贴了

CMU15445实验总结(Spring 2023)

CMU15445实验总结(Spring 2023) 背景 菜鸟博主是2024届毕业生,学历背景太差,导致23年秋招无果,准备奋战春招。此前有读过LevelDB源码的经历,对数据库的了解也仅限于LevelDB。奔着”有对比才能学的深“的理念,以及缓解…