Python 可以在数据库应用程序中使用。
最受欢迎的 NoSQL 数据库之一是 MongoDB。
MongoDB
MongoDB 将数据存储在类似 JSON 的文档中,这使得数据库非常灵活和可伸缩。
为了能够测试本教程中的代码示例,您需要访问 MongoDB 数据库。
您可以在 https://www.mongodb.com 下载免费的 MongoDB 数据库。
PyMongo
Python 需要 MongoDB 驱动程序来访问 MongoDB 数据库。
在本教程中,我们会使用 MongoDB 驱动程序 "PyMongo"。
我们建议您使用 PIP 安装 "PyMongo"。
PIP 很可能已经安装在 Python 环境中。
将命令行导航到 PIP 的位置,然后键入以下内容:
下载并安装 "PyMongo":
python -m pip install pymongo
现在您已经下载并安装了 mongoDB 驱动程序。
测试 PyMongo
如需测试安装是否成功,或者您是否已安装 "pymongo",请创建一张包含以下内容的 Python 页面:
demo_mongodb_test.py:
import pymongo
如果执行上述代码没有错误,则 "pymongo" 已安装就绪。
Python MongoDB 创建数据库
创建数据库
要在 MongoDB 中创建数据库,首先要创建 MongoClient 对象,然后使用正确的 IP 地址和要创建的数据库的名称指定连接 URL。
如果数据库不存在,MongoDB 将创建数据库并建立连接。
实例
创建名为 "mydatabase" 的数据库:
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
重要说明:在 MongoDB 中,数据库在获取内容之前不会创建!
在实际创建数据库(和集合)之前,MongoDB 会一直等待您创建至少有一个文档(记录)的集合(表)。
检查数据库是否存在
请记住:在 MongoDB 中,数据库在获取内容之前不会创建,因此如果这是您第一次创建数据库,则应在检查数据库是否存在之前完成接下来的两章(创建集合和创建文档)!
您可以通过列出系统中的所有数据库来检查数据库是否存在:
实例
返回系统中的数据库列表:
print(myclient.list_database_names())
或者您可以按名称检查特定数据库:
实例
检查 "mydatabase" 是否存在:
dblist = myclient.list_database_names()
if "mydatabase" in dblist:
print("The database exists.")
Python MongoDB 创建集合
MongoDB 中的集合与 SQL 数据库中的表相同。
创建集合
要在 MongoDB 中创建集合,请使用数据库对象并指定要创建的集合的名称。
如果它不存在,MongoDB 会创建该集合。
实例
创建名为 "customers" 的集合:
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
重要提示:在 MongoDB 中,集合在获得内容之前不会被创建!
在实际创建集合之前,MongoDB 会等待直到您已插入文档。
检查集合是否存在
请记住:在 MongoDB 中,集合在获取内容之前不会创建,因此如果这是您第一次创建集合,则应在检查集合是否存在之前完成下一章(创建文档)!
您可以通过列出所有集合来检查数据库中是否存在集合:
实例
返回数据库中所有集合的列表:
print(mydb.list_collection_names())
或者您可以按名称检查特定集合:
实例
检查 "customers" 集合是否存在:
collist = mydb.list_collection_names()
if "customers" in collist:
print("The collection exists.")
Python MongoDB 插入文档
MongoDB 中的文档与 SQL 数据库中的记录相同。
插入集合
要在 MongoDB 中把记录或我们所称的文档插入集合,我们使用 insert_one()
方法。
insert_one()
方法的第一个参数是字典,其中包含希望插入文档中的每个字段名称和值。
实例
在 "customers" 集合中插入记录:
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
mydict = { "name": "Bill", "address": "Highway 37" }
x = mycol.insert_one(mydict)
返回 _id 字段
insert_one()
方法返回 InsertOneResult 对象,该对象拥有属性 inserted_id
,用于保存插入文档的 id。
实例
在 "customers" 集合中插入另一条记录,并返回 _id 字段的值:
mydict = { "name": "Peter", "address": "Lowstreet 27" }
x = mycol.insert_one(mydict)
print(x.inserted_id)
如果您没有指定 _id
字段,那么 MongoDB 将为您添加一个,并为每个文档分配一个唯一的 ID。
在上例中,没有指定 _id
字段,因此 MongoDB 为记录(文档)分配了唯一的 _id。
插入多个文档
要将多个文档插入 MongoDB 中的集合,我们使用 insert_many()
方法。
insert_many()
方法的第一个参数是包含字典的列表,其中包含要插入的数据:
实例
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
mylist = [
{ "name": "Amy", "address": "Apple st 652"},
{ "name": "Hannah", "address": "Mountain 21"},
{ "name": "Michael", "address": "Valley 345"},
{ "name": "Sandy", "address": "Ocean blvd 2"},
{ "name": "Betty", "address": "Green Grass 1"},
{ "name": "Richard", "address": "Sky st 331"},
{ "name": "Susan", "address": "One way 98"},
{ "name": "Vicky", "address": "Yellow Garden 2"},
{ "name": "Ben", "address": "Park Lane 38"},
{ "name": "William", "address": "Central st 954"},
{ "name": "Chuck", "address": "Main Road 989"},
{ "name": "Viola", "address": "Sideway 1633"}
]
x = mycol.insert_many(mylist)
# 打印被插入文档的 _id 值列表:
print(x.inserted_ids)
insert_many()
方法返回 InsertManyResult 对象,该对象拥有属性 inserted_ids
,用于保存被插入文档的 id。
插入带有指定 ID 的多个文档
如果您不希望 MongoDB 为您的文档分配唯一 id,则可以在插入文档时指定 _id 字段。
请记住,值必须是唯一的。两个文件不能有相同的 _id。
实例
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
mylist = [
{ "_id": 1, "name": "John", "address": "Highway 37"},
{ "_id": 2, "name": "Peter", "address": "Lowstreet 27"},
{ "_id": 3, "name": "Amy", "address": "Apple st 652"},
{ "_id": 4, "name": "Hannah", "address": "Mountain 21"},
{ "_id": 5, "name": "Michael", "address": "Valley 345"},
{ "_id": 6, "name": "Sandy", "address": "Ocean blvd 2"},
{ "_id": 7, "name": "Betty", "address": "Green Grass 1"},
{ "_id": 8, "name": "Richard", "address": "Sky st 331"},
{ "_id": 9, "name": "Susan", "address": "One way 98"},
{ "_id": 10, "name": "Vicky", "address": "Yellow Garden 2"},
{ "_id": 11, "name": "Ben", "address": "Park Lane 38"},
{ "_id": 12, "name": "William", "address": "Central st 954"},
{ "_id": 13, "name": "Chuck", "address": "Main Road 989"},
{ "_id": 14, "name": "Viola", "address": "Sideway 1633"}
]
x = mycol.insert_many(mylist)
# 打印被插入文档的 _id 值列表:
print(x.inserted_ids)
Python MongoDB 查找
在 MongoDB 中,我们使用 find 和 findOne 方法来查找集合中的数据。
就像 SELECT 语句用于查找 MySQL 数据库中的表中的数据一样。
查找一项
如需在 MongoDB 中的集合中选取数据,我们可以使用 find_one()
方法。
find_one()
方法返回选择中的第一个匹配项。
实例
查找 customers 集合中的首个文档:
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
x = mycol.find_one()
print(x)
查找全部
如需从 MongoDB 中的表中选取数据,我们还可以使用 find()
方法。
find()
方法返回选择中的所有匹配项。
find()
方法的第一个参数是 query 对象。在这个例子中,我们用了一个空的 query 对象,它会选取集合中的所有文档。
find()
方法没有参数提供与 MySQL 中的 SELECT * 相同的结果。
实例
返回 "customers" 集合中的所有文档,并打印每个文档:
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
for x in mycol.find():
print(x)
只返回某些字段
find()
方法的第二个参数是描述包含在结果中字段的对象。
此参数是可选的,如果省略,则所有字段都将包含在结果中。
实例
只返回姓名和地址,而不是 _ids:
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
for x in mycol.find({},{ "_id": 0, "name": 1, "address": 1 }):
print(x)
不允许在同一对象中同时指定 0 和 1 值(除非其中一个字段是 _id 字段)。如果指定值为 0 的字段,则所有其他字段的值为 1,反之亦然:
实例
这个例子从结果中排出 "address":
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
for x in mycol.find({},{ "address": 0 }):
print(x)
实例
如果在同一对象中同时指定 0 和 1 值,则会出现错误(除非其中一个字段是 _id 字段):
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
for x in mycol.find({},{ "name": 1, "address": 0 }):
print(x)
Python MongoDB 查询
筛选结果
在集合中查找文档时,您能够使用 query 对象过滤结果。
find()
方法的第一个参数是 query 对象,用于限定搜索。
实例
查找地址为 "Park Lane 38" 的文档:
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
myquery = { "address": "Park Lane 38" }
mydoc = mycol.find(myquery)
for x in mydoc:
print(x)
高级查询
如需进行高级查询,可以使用修饰符作为查询对象中的值。
例如,要查找 "address" 字段以字母 "S" 或更高(按字母顺序)开头的文档,请使用大于修饰符:{"$gt": "S"}
:
实例
查找地址以字母 "S" 或更高开头的文档:
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
myquery = { "address": { "$gt": "S" } }
mydoc = mycol.find(myquery)
for x in mydoc:
print(x)
使用正则表达式来筛选
您也可以将正则表达式用作修饰符。
正则表达式只能用于查询字符串。
如果只查找 "address" 字段以字母 "S" 开头的文档,请使用正则表达式 {"$regex": "^S"}
:
实例
查找地址以字母 "S" 开头的文档:
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
myquery = { "address": { "$regex": "^S" } }
mydoc = mycol.find(myquery)
for x in mydoc:
print(x)
Python MongoDB 排序
结果排序
请使用 sort()
方法按升序或降序对结果进行排序。
sort()
方法为 "fieldname"(字段名称)提供一个参数,为 "direction"(方向)提供一个参数(升序是默认方向)。
实例
按姓名的字母顺序对结果进行排序:
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
mydoc = mycol.find().sort("name")
for x in mydoc:
print(x)
降序排序
使用值 -1 作为第二个参数进行降序排序。
sort("name", 1) # 升序
sort("name", -1) # 降序
实例
按名称的逆向字母顺序对结果进行排序:
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
mydoc = mycol.find().sort("name", -1)
for x in mydoc:
print(x)
本篇MongoDB复习的第一篇文章就到这吧,接下来第二篇马上开始,请一键三连