术→技巧, 研发

Python连接和使用MongoDB

钱魏Way · · 908 次浏览

MongoDB相对于传统的关系型数据库,可以存储JSON数据,非常适合存储数据抓取返回的JSON数据。先前介绍过MongoDB在Windows的安装,今天主要学习的是使用Python连接MongoDB,并进行增删改查的操作。

在连接MongoDB前 首先要安装的是Python包:PyMongo,包的安装非常的简单。只需执行pip install pymongo 即可。

创建连接

在安装完PyMongo以后,使用Python连接MongoDB变得异常简单。具体方式为:

from pymongo import MongoClient

client = MongoClient('localhost', 27017)

或使用如下方式:

from pymongo import MongoClient

client = MongoClient('mongodb://localhost:27017')

如果连接含有账号密码等,请参考:pymongo.mongo_client.MongoClient

连接数据库

连接数据库的操作也非常的简单,最为重要的是,在你连接数据库之前无需先创建数据库,如果数据库存在则直接连接,如果数据库不存在则会创建新的库。具体方式为:

# 方式一
db = client.pymongo_test
# 方式二
db = client['pymongo_test']

以上两种方式任选一种即可。

Collection概念

在MongoDB中存在一个Collection的概念,我将其理解为命名空间,类似其他数据库中Scheme的概念,Collection可以理解为一些表的集合。Collection可以使用也可以不使用,具体看你是否要给库下的表分类。相关的操作:

#方法一:
collection = db.test_collection
#方法二
collection = db['test-collection']

需要知晓的是,collection的创建是在第一张表创建时才会创建。

插入数据

插入数据的方式的凡是非常的简单,最长使用的方法是,insert_one()和inert_many()方法,从字面上就可以看出来一个是插入一条数据,另外一个是插入多条数据,示例:

from pymongo import MongoClient

client = MongoClient('localhost', 27017)
db = client.testdb
posts = db.posts

post_1 = {
    'title': 'Python and MongoDB',
    'content': 'PyMongo is fun, you guys',
    'author': 'Scott'
}
post_2 = {
    'title': 'Virtual Environments',
    'content': 'Use virtual environments, you guys',
    'author': 'Scott'
}
post_3 = {
    'title': 'Learning Python',
    'content': 'Learn Python, it is easy',
    'author': 'Bill'
}


#每次插入一条数据
posts.insert_one(post_1)
posts.insert_one(post_2)
posts.insert_one(post_3)

#一次插入多条数据
posts.insert_many([post_1, post_2, post_3])

查询数据

和插入数据一样,查询数据的时候,提供查询一条或多条数据的方法,方法分别为find_one()和find()。示例:

# 查询一条数据
bills_post = posts.find_one({'author': 'Bill'})
print(bills_post)

# 查询多条数据
scotts_posts = posts.find({'author': 'Scott'})
for post in scotts_posts:
    print(post)

另外,查询多条时,可以设定返回的数量或其他限定条件:pymongo.collection.Collection.find

另外条件中如需支持类似的关系数据库中的WHERE条件,需要使用特定的关键词。示例:

d = datetime.datetime(2009, 11, 12, 12)
for post in posts.find({"date": {"$lt": d}}).sort("author"):
    pprint.pprint(post)

删除数据

删除数据同样非常的简单,主要用到的方法为:delete_one()delete_many()

更新数据

更新数据的主要方法是,update_one()update_many(),除此之外,还有一个replace_one()方法用来替换,由于用的不多,具体看文档。

创建索引

pyMongo还支持创建索引,可以进一步提升查询的性能,示例:

result = db.profiles.create_index([('user_id', pymongo.ASCENDING)],unique=True)
sorted(list(db.profiles.index_information()))

参考链接:

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注