本文关键词:Python、Django、ORM。
概要
在 Python Web 开发中,ORM(Object-Relational Mapping,对象关系映射)是一个非常重要的概念。ORM 框架可以让我们不用编写 SQL 语句,就能够使用对象的方式来操作数据库,大大提高了代码的可读性和可维护性。Django 作为一款流行的 Web 框架,自带了强大的 ORM 框架。
本文将会详细介绍 Django 的 ORM 框架,包括基本使用方法、高级查询、性能优化等方面。
1. 基本使用方法
1.1 定义模型类
在 Django 里可以使用模型类来定义数据库表。模型类需要继承自 django.db.models.Model
,并且定义表的各个字段。例如,下面是一个简单的模型类,用来表示一个博客文章:
from django.db import models
class Blog(models.Model):
title = models.CharField(max_length=100)
content = models.TextField()
pub_date = models.DateTimeField(auto_now_add=True)
上面的代码定义了一个 Blog
类来表示博客文章。这个类继承自 django.db.models.Model
,并且定义了三个字段:标题、内容和发布日期。其中,标题和内容都是字符串类型,使用 CharField
和 TextField
来定义。pub_date
是一个日期时间类型,使用 DateTimeField
来定义。auto_now_add=True
表示在创建新记录时自动设置为当前时间。
1.2 创建表
定义完模型类之后,我们需要创建对应的数据库表。在 Django 中,可以使用 manage.py
命令来进行数据库迁移操作。具体来说,我们需要执行以下两个命令:
# 生成迁移文件
python manage.py makemigrations
# 执行迁移操作
python manage.py migrate
执行完上面的两个命令之后,Django 会根据模型类自动生成对应的数据库表。
注意:在进行迁移操作之前,请确保已经仔细确认了所有相关设置和代码,并且备份了数据。
1.3 插入数据
插入数据可以使用模型类来表示一条记录,并且调用 save()
方法来将记录保存到数据库中。例如,下面的代码演示了如何向 Blog
表中插入一条记录:
blog = Blog(title='Hello World', content='This is my first blog post.')
blog.save()
1.4 查询数据
查询数据可以使用模型类的 objects
属性,该属性是 Manager
类的实例,提供了各种查询方法。例如从 Blog
表中查询所有记录:
blogs = Blog.objects.all()
for blog in blogs:
print(blog.title, blog.content, blog.pub_date)
1.5 更新数据
更新数据可以先查询出需要更新的记录,然后修改对应的字段,最后调用 save()
方法进行保存。例如将 Blog
表中所有记录的标题修改为 'Hello Django'
:
blogs = Blog.objects.all()
for blog in blogs:
blog.title = 'Hello Django'
blog.save()
1.6 删除数据
删除数据可以先查询出需要删除的记录,然后调用 delete()
方法进行删除。例如删除 Blog
表中所有记录:
blogs = Blog.objects.all()
for blog in blogs:
blog.delete()
2. 高级查询
2.1 条件查询
Django 的 ORM 框架提供了非常方便的条件查询功能。例如查询 Blog
表中标题为 'Hello World'
的记录:
blogs = Blog.objects.filter(title='Hello World')
for blog in blogs:
print(blog.title, blog.content,blog.pub_date)
可以看到,我们使用了 filter()
方法来指定查询条件,其中 title='Hello World'
表示标题等于 'Hello World'
。filter()
方法返回一个 QuerySet
对象,可以使用 for
循环遍历查询结果。
2.2 聚合查询
聚合查询可以使用 aggregate()
方法来实现。例如统计 Blog
表中记录的数量:
from django.db.models import Count
count = Blog.objects.aggregate(Count('id'))
print(count['id__count'])
可以看到,我们使用了 aggregate()
方法来指定聚合操作,其中 Count('id')
表示统计 id
字段的数量。aggregate()
方法返回一个字典,其中键是聚合操作的名称(例如,id__count
表示统计数量),值是聚合操作的结果。
2.3 连接查询
连接查询可以使用 select_related()
方法和 prefetch_related()
方法来实现。例如,下面的代码演示了如何查询 Blog
表中的记录,并且同时连接查询关联的 Author
表中的作者信息:
class Author(models.Model):
name = models.CharField(max_length=50)
class Blog(models.Model):
title = models.CharField(max_length=100)
content = models.TextField()
pub_date = models.DateTimeField(auto_now_add=True)
author = models.ForeignKey(Author, on_delete=models.CASCADE)
blogs = Blog.objects.select_related('author')
for blog in blogs:
print(blog.title, blog.content, blog.pub_date, blog.author.name)
可以看到,我们使用了 select_related('author')
方法来指定需要连接查询的外键字段(即 author
字段),这样就可以同时查询 Blog
表和 Author
表中的数据。注意,select_related()
方法只能用于一对一和多对一关系的查询,上面的例子是多对一关系。
2.4 原生 SQL 查询
Django 的 ORM 框架也支持原生 SQL 查询。例如使用原生 SQL 查询 Blog
表中的记录:
from django.db import connection
with connection.cursor() as cursor:
cursor.execute("SELECT * FROM myapp_blog")
blogs = cursor.fetchall()
for blog in blogs:
print(blog[1], blog[2], blog[3])
可以看到,我们使用了 connection.cursor()
方法来获取数据库连接的游标,然后调用 execute()
方法执行 SQL 查询。最后,使用 fetchall()
方法获取查询结果。
3. 性能优化
3.1 使用索引
索引是提高数据库查询性能的重要手段。在 Django 中,可以使用 db_index=True
参数来为字段创建索引。例如为 title
字段创建索引:
class Blog(models.Model):
title = models.CharField(max_length=100, db_index=True)
content = models.TextField()
pub_date = models.DateTimeField(auto_now_add=True)
3.2 批量操作
批量操作可以使用 bulk_create()
方法和 bulk_update()
方法来实现。例如,下面的代码演示了如何批量插入 Blog
表中的记录:
blogs = [
Blog(title='Blog 1', content='Content 1'),
Blog(title='Blog 2', content='Content 2'),
Blog(title='Blog 3', content='Content 3'),
]
Blog.objects.bulk_create(blogs)
可以看到,我们使用了 bulk_create()
方法来批量插入记录,其中 blogs
是一个包含多个 Blog
实例的列表。
3.3 延迟加载
延迟加载可以使用 defer()
方法和 only()
方法来实现。
使用 defer() 方法时,Django 将不会立即从数据库中获取指定字段的数据。它会在需要访问这些字段的数据时,再去查询数据库。这样可以避免一次性从数据库中取出大量的数据,减轻数据库的负担,提高查询效率。
使用 only() 方法可以指定只查询需要的字段,而不是查询整个表的所有字段。这样可以减少数据传输的大小,节省网络带宽和内存资源,提高查询效率。
例如延迟加载 Blog
表中的记录,并且只查询 title
和 pub_date
两个字段:
blogs = Blog.objects.defer('content').only('title', 'pub_date')
for blog in blogs:
print(blog.title, blog.pub_date)
可以看到,我们使用了 defer('content')
方法来延迟加载 content
字段,这样查询结果中就不会包含 content
字段的数据。同时,使用 only('title', 'pub_date')
方法来指定只查询 title
和 pub_date
两个字段的数据。
3.4 缓存查询结果
缓存查询结果可以使用 Django 的缓存框架来实现。Django的缓存框架可以配置为使用不同的缓存后端,下面是常见的几种缓存后端的配置方法:
3.4.1 内存缓存
使用内存缓存作为缓存后端是最简单的配置方式,它可以快速地缓存数据并且不需要额外的配置。在settings.py文件中进行如下配置:
CACHES = {
'default': {
'BACKEND': 'django.core.cache.backends.locmem.LocMemCache',
'LOCATION': 'unique-snowflake',
}
}
BACKEND
指定了缓存后端为内存缓存,LOCATION
是一个可选的参数,用于指定缓存的名称,可以是任何字符串。
3.4.2 文件缓存
使用文件缓存作为缓存后端可以将缓存数据存储到文件系统中,需要指定缓存文件的路径。在settings.py文件中进行如下配置:
CACHES = {
'default': {
'BACKEND': 'django.core.cache.backends.filebased.FileBasedCache',
'LOCATION': '/var/tmp/django_cache',
}
}
BACKEND
指定了缓存后端为文件缓存,LOCATION
是一个必选的参数,用于指定缓存文件的路径。
3.4.3 Memcached
使用Memcached作为缓存后端可以将缓存数据存储到Memcached服务器中,需要指定Memcached服务器的地址和端口号。在settings.py文件中进行如下配置:
CACHES = {
'default': {
'BACKEND': 'django.core.cache.backends.memcached.MemcachedCache',
'LOCATION': '127.0.0.1:11211',
}
}
BACKEND
指定了缓存后端为Memcached,LOCATION
是一个必选的参数,用于指定Memcached服务器的地址和端口号。
3.4.4 Redis
使用Redis作为缓存后端可以将缓存数据存储到Redis服务器中,需要指定Redis服务器的地址、端口号和数据库编号。在settings.py文件中进行如下配置:
CACHES = {
'default': {
'BACKEND': 'django_redis.cache.RedisCache',
'LOCATION': 'redis://127.0.0.1:6379/0',
'OPTIONS': {
'CLIENT_CLASS': 'django_redis.client.DefaultClient',
},
}
}
BACKEND
指定了缓存后端为Redis,LOCATION
是一个必选的参数,用于指定Redis服务器的地址、端口号和数据库编号。OPTIONS
是一个可选的参数,用于指定Redis客户端的选项,这里使用默认选项。
需要注意的是,在使用Redis作为缓存后端时,需要额外安装 django-redis
库。可以使用pip命令进行安装:
pip install django-redis
例如缓存 Blog
表中的记录:
from django.core.cache import cache
blogs = cache.get('blogs')
if blogs is None:
blogs = Blog.objects.all()
cache.set('blogs', blogs, timeout=3600)
for blog in blogs:
print(blog.title, blog.content, blog.pub_date)
可以看到,我们使用了 cache.get('blogs')
方法来从缓存中获取查询结果。如果缓存中不存在查询结果,则使用 Blog.objects.all()
来查询数据库,并且使用 cache.set('blogs', blogs, timeout=3600)
方法将查询结果存入缓存中。其中,timeout=3600
表示缓存的过期时间为 3600 秒。
技术总结
本文详细介绍了 Django 的 ORM 框架,包括基本使用方法、高级查询和性能优化等方面。ORM 框架可以让我们不用编写 SQL 语句,就能够使用对象的方式来操作数据库,大大提高了代码的可读性和可维护性。同时,我们还介绍了一些性能优化技巧,例如使用索引、批量操作、延迟加载和缓存查询结果等。希望本文对你学习 Django 的 ORM 框架有所帮助!
欢迎点赞收藏转发,感谢🙏