# PyMongo Tutorial

### 1. Connect to a database

In [1]:
from pymongo import MongoClient

client = MongoClient()

print(client)

MongoClient(host=['localhost:27017'], document_class=dict, tz_aware=False, connect=True)


### 2. Three main operations of MongoClient
- Check the current database
- Create a new database
- Delete a database

In [2]:
# 列出当前所有数据库名称
database_names = client.database_names()
print('Current database {}'.format(database_names))
# 使用现有数据库，假设已存在数据库，数据库名称为 test_database
test_database = client.test_database
# 创建不存在的数据库并使用
new_database = client.new_database
# 删除现有数据库
client.drop_database('new_database')

Current database ['Hanwei', 'RHDHV_Ship_DB', 'admin', 'config', 'local', 'pymongo_test', 'runoobdb', 'test_database', 'zfdb']


  


### 3. Colloections related operations

In [3]:
collection_names = test_database.collection_names()
posts = test_database.posts
# create
new_collection = test_database.new_collection
# delete
test_database.drop_collection(new_collection) # argument is the collection object

  """Entry point for launching an IPython kernel.


{'code': 26,
 'codeName': 'NamespaceNotFound',
 'errmsg': 'ns not found',
 'ok': 0.0}

### 4. Add documents to a collection
- insert_one
- insert-many

In [4]:
foo = test_database.foo
foo.insert_one({'_id': 0})
for data in foo.find():
    print(data)

{'_id': 0}


In [5]:
foo.insert_many([{'_id': 1}, {'_id': 2}])
for data in foo.find():
    print(data)

{'_id': 0}
{'_id': 1}
{'_id': 2}


In [6]:
for data in foo.find():
    print(data)

{'_id': 0}
{'_id': 1}
{'_id': 2}


### 5. Delete documents from a collection
- remove one
- remove all

In [7]:
foo.remove({'_id': 2})
for data in foo.find():
    print(data)
foo.remove()
foo.count()

{'_id': 0}
{'_id': 1}


  """Entry point for launching an IPython kernel.
  after removing the cwd from sys.path.
  """


0

### 6. Update

In [8]:
# create a new collection if the collection does not exist
user = test_database.user
joe = {'name': 'joe', 'friends': 32, 'enemies': 2}
user.insert_one(joe)
user.find()

<pymongo.cursor.Cursor at 0x1c219fcdb00>

In [9]:
joe = user.find_one()
print(type(joe))
joe

<class 'dict'>


{'_id': ObjectId('5f4273607aa1d38bb7600045'),
 'enemies': 2,
 'friend': 32,
 'name': 'joe'}

In [10]:
joe['relationships'] = {'friends': joe['friend'], 'enemies': joe['enemies']}
joe['username'] = joe['name']
joe
del joe['name']
del joe['enemies']
del joe['friend']

In [11]:
print(joe)

{'_id': ObjectId('5f4273607aa1d38bb7600045'), 'relationships': {'friends': 32, 'enemies': 2}, 'username': 'joe'}


In [13]:
user.replace_one({'name': 'joe'}, joe)
joe = user.find_one()

WriteError: After applying the update, the (immutable) field '_id' was found to have been altered to _id: ObjectId('5f4273607aa1d38bb7600045')

In [14]:
joe

{'_id': ObjectId('5f4273607aa1d38bb7600045'),
 'relationships': {'enemies': 2, 'friends': 32},
 'username': 'joe'}

### 6 update modifier
我们可以使用更新修改器 (update modifier) 来对文档中某些字段进行更新，常用的修改器有以下几个：
- set 用来指定一个字段的值，如果不存在，将创建一个新的字段
- unset 删除一个字段
- inc 用来增加(或减少)一个已有键的值，如果不存在将会创建一个
- push 向已有的数组末尾添加一个元素
- addToSet 避免插入重复数据
- pull 删除元素，基于特定条件
- each 遍历列表操作
- pop 删除元素


### 6.1 set

In [127]:
user.drop()
user.count()

  


0

In [128]:
Hanwei = {'name': 'Hanwei', 'age':30, 'sex': 'male', 'location': 'Wisconsin'}
user.insert_one(Hanwei)
print(user)

Collection(Database(MongoClient(host=['localhost:27017'], document_class=dict, tz_aware=False, connect=True), 'test_database'), 'user')


In [129]:
print(user.find_one())

{'_id': ObjectId('5f42a7b1eaae64c68f4ceffd'), 'name': 'Hanwei', 'age': 30, 'sex': 'male', 'location': 'Wisconsin'}


In [130]:
name = {'name': 'Hanwei'}
favourite  = {'$set':{'favourite': 'Peace and war'}}
user.update_one(name, favourite)
user.find_one()

{'_id': ObjectId('5f42a7b1eaae64c68f4ceffd'),
 'age': 30,
 'favourite': 'Peace and war',
 'location': 'Wisconsin',
 'name': 'Hanwei',
 'sex': 'male'}

In [131]:
user.update_one({'name': 'Hanwei'}, {'$set': {'favorite': 'Green Eggs and Ham'}})
user.find_one()

{'_id': ObjectId('5f42a7b1eaae64c68f4ceffd'),
 'age': 30,
 'favorite': 'Green Eggs and Ham',
 'favourite': 'Peace and war',
 'location': 'Wisconsin',
 'name': 'Hanwei',
 'sex': 'male'}

In [132]:
user.update_one({'name': 'Hanwei'}, {'$set': {'favorite': ["Cat's Cradle", "Foundation Trilogy", "Ender's Game"]}})
user.find_one()

{'_id': ObjectId('5f42a7b1eaae64c68f4ceffd'),
 'age': 30,
 'favorite': ["Cat's Cradle", 'Foundation Trilogy', "Ender's Game"],
 'favourite': 'Peace and war',
 'location': 'Wisconsin',
 'name': 'Hanwei',
 'sex': 'male'}

In [133]:
# 内嵌文档修改
blog = test_database.blog
posts = {'title': 'A Blog Post', 'content': '...', 'author': {'name': 'joe', 'email': 'joe@example.com'}} # 创建一个 posts 文档
blog.insert_one(posts)
blog.find_one()

{'_id': ObjectId('5f42985aeaae64c68f4ceff3'),
 'author': {'email': 'joe@example.com', 'name': 'joe schmoe'},
 'comments': [{'content': 'nice post.',
   'email': 'joe@example.com',
   'name': 'joe'},
  {'content': 'good post.', 'email': 'bob@example.com', 'name': 'bob'},
  {'content': 'nice post.', 'email': 'joe@example.com', 'name': 'joe'},
  {'content': 'good post.', 'email': 'bob@example.com', 'name': 'bob'},
  {'content': 'nice post.', 'email': 'joe@example.com', 'name': 'joe'},
  {'content': 'good post.', 'email': 'bob@example.com', 'name': 'bob'}],
 'content': '...',
 'title': 'A Blog Post'}

In [134]:
blog.update_one({'author.name': 'joe'}, {'$set': {'author.name': 'joe schmoe'}})
blog.find_one()

{'_id': ObjectId('5f42985aeaae64c68f4ceff3'),
 'author': {'email': 'joe@example.com', 'name': 'joe schmoe'},
 'comments': [{'content': 'nice post.',
   'email': 'joe@example.com',
   'name': 'joe'},
  {'content': 'good post.', 'email': 'bob@example.com', 'name': 'bob'},
  {'content': 'nice post.', 'email': 'joe@example.com', 'name': 'joe'},
  {'content': 'good post.', 'email': 'bob@example.com', 'name': 'bob'},
  {'content': 'nice post.', 'email': 'joe@example.com', 'name': 'joe'},
  {'content': 'good post.', 'email': 'bob@example.com', 'name': 'bob'}],
 'content': '...',
 'title': 'A Blog Post'}

### 6.2 unset

In [135]:
# 删除 user 集合中 joe 的 favorite 字段
user.update_one({'name': 'Hanwei'}, {'$unset': {'favourite':1}})
user.find_one()

{'_id': ObjectId('5f42a7b1eaae64c68f4ceffd'),
 'age': 30,
 'favorite': ["Cat's Cradle", 'Foundation Trilogy', "Ender's Game"],
 'location': 'Wisconsin',
 'name': 'Hanwei',
 'sex': 'male'}

### 6.3 inc

In [136]:
games = test_database.games
games.insert_one({'game': 'pinball', 'user': 'joe'})
games.find_one()

{'_id': ObjectId('5f429930eaae64c68f4ceff4'),
 'game': 'pinball',
 'score': 5050,
 'user': 'joe'}

In [137]:
games.update_one({'game': 'pinball', 'user': 'joe'}, {'$set': {'score': 50}})
games.find_one()

{'_id': ObjectId('5f429930eaae64c68f4ceff4'),
 'game': 'pinball',
 'score': 50,
 'user': 'joe'}

In [138]:
# 为 score 字段的值增加 5000
# 增加
games.update_one({'game': 'pinball', 'user': 'joe'}, {'$inc': {'score': 5000}})
games.find_one()

{'_id': ObjectId('5f429930eaae64c68f4ceff4'),
 'game': 'pinball',
 'score': 5050,
 'user': 'joe'}

### 6.4 push 向已有的数组末尾添加一个元素

In [139]:
# 选择 blog 数据库
blog = test_database.blog
blog.find_one()

# 添加一项评论字段 comment
blog.update_one({'title': 'A Blog Post'}, {'$push' : {'comments': {'name': 'joe', 'email': 'joe@example.com', 'content': 'nice post.'}}})
blog.find_one()

{'_id': ObjectId('5f42985aeaae64c68f4ceff3'),
 'author': {'email': 'joe@example.com', 'name': 'joe schmoe'},
 'comments': [{'content': 'nice post.',
   'email': 'joe@example.com',
   'name': 'joe'},
  {'content': 'good post.', 'email': 'bob@example.com', 'name': 'bob'},
  {'content': 'nice post.', 'email': 'joe@example.com', 'name': 'joe'},
  {'content': 'good post.', 'email': 'bob@example.com', 'name': 'bob'},
  {'content': 'nice post.', 'email': 'joe@example.com', 'name': 'joe'},
  {'content': 'good post.', 'email': 'bob@example.com', 'name': 'bob'},
  {'content': 'nice post.', 'email': 'joe@example.com', 'name': 'joe'}],
 'content': '...',
 'title': 'A Blog Post'}

In [140]:
# 在添加一条由 bob 发表的评论
blog.update_one({'title': 'A Blog Post'}, {'$push' : {'comments': {'name': 'bob', 'email': 'bob@example.com', 'content': 'good post.'}}})
blog.find_one()

{'_id': ObjectId('5f42985aeaae64c68f4ceff3'),
 'author': {'email': 'joe@example.com', 'name': 'joe schmoe'},
 'comments': [{'content': 'nice post.',
   'email': 'joe@example.com',
   'name': 'joe'},
  {'content': 'good post.', 'email': 'bob@example.com', 'name': 'bob'},
  {'content': 'nice post.', 'email': 'joe@example.com', 'name': 'joe'},
  {'content': 'good post.', 'email': 'bob@example.com', 'name': 'bob'},
  {'content': 'nice post.', 'email': 'joe@example.com', 'name': 'joe'},
  {'content': 'good post.', 'email': 'bob@example.com', 'name': 'bob'},
  {'content': 'nice post.', 'email': 'joe@example.com', 'name': 'joe'},
  {'content': 'good post.', 'email': 'bob@example.com', 'name': 'bob'}],
 'content': '...',
 'title': 'A Blog Post'}

### 6.5 addToSet 避免插入重复数据

In [141]:
user.update_one({'name': 'Hanwei'},{'$push': {'emails': 'joe@example.com'}})
user.update_one({'name': 'Hanwei'},{'$push': {'emails': 'joe@gmail.com'}})
user.find_one()

{'_id': ObjectId('5f42a7b1eaae64c68f4ceffd'),
 'age': 30,
 'emails': ['joe@example.com', 'joe@gmail.com'],
 'favorite': ["Cat's Cradle", 'Foundation Trilogy', "Ender's Game"],
 'location': 'Wisconsin',
 'name': 'Hanwei',
 'sex': 'male'}

In [142]:
# 使用 $addToSet 再添加一项 joe@example.com 的记录，因为存在重复，数据不会被重复添加
user.update_one({'name': 'Hanwei'}, {'$addToSet': {'emails': 'joe@example.com'}})
user.find_one()

{'_id': ObjectId('5f42a7b1eaae64c68f4ceffd'),
 'age': 30,
 'emails': ['joe@example.com', 'joe@gmail.com'],
 'favorite': ["Cat's Cradle", 'Foundation Trilogy', "Ender's Game"],
 'location': 'Wisconsin',
 'name': 'Hanwei',
 'sex': 'male'}

In [143]:
# 如果直接使用 $push ，记录会被重复添加
user.update_one({'name': 'Hanwei'}, {'$push': {'emails': 'joe@example.com'}})
user.find_one()

{'_id': ObjectId('5f42a7b1eaae64c68f4ceffd'),
 'age': 30,
 'emails': ['joe@example.com', 'joe@gmail.com', 'joe@example.com'],
 'favorite': ["Cat's Cradle", 'Foundation Trilogy', "Ender's Game"],
 'location': 'Wisconsin',
 'name': 'Hanwei',
 'sex': 'male'}

### 6.6 pull 删除元素，基于特定条件

In [144]:
# 删除 user 集合中 joe 文档重复的 emails 值 ($pull 会删除所有符合条件的记录)
user.update_one({'name': 'Hanwei'}, {'$pull': {'emails': 'joe@example.com'}})
user.find_one()

{'_id': ObjectId('5f42a7b1eaae64c68f4ceffd'),
 'age': 30,
 'emails': ['joe@gmail.com'],
 'favorite': ["Cat's Cradle", 'Foundation Trilogy', "Ender's Game"],
 'location': 'Wisconsin',
 'name': 'Hanwei',
 'sex': 'male'}

### 6.7 each 遍历列表操作

In [145]:
# each多个元素的列表相当于多次push
user.update_one({'name': 'Hanwei'}, {'$push':{'emails':{'$each':['joe@example.com', 'joe@outlook.com']}}})
user.find_one()

{'_id': ObjectId('5f42a7b1eaae64c68f4ceffd'),
 'age': 30,
 'emails': ['joe@gmail.com', 'joe@example.com', 'joe@outlook.com'],
 'favorite': ["Cat's Cradle", 'Foundation Trilogy', "Ender's Game"],
 'location': 'Wisconsin',
 'name': 'Hanwei',
 'sex': 'male'}

### 6.8 pop 删除元素

In [146]:
user.find_one()
# 删除集合user中Hanwei的email的第一个邮箱地址

{'_id': ObjectId('5f42a7b1eaae64c68f4ceffd'),
 'age': 30,
 'emails': ['joe@gmail.com', 'joe@example.com', 'joe@outlook.com'],
 'favorite': ["Cat's Cradle", 'Foundation Trilogy', "Ender's Game"],
 'location': 'Wisconsin',
 'name': 'Hanwei',
 'sex': 'male'}

In [151]:
# 删除集合 user 中 Hanwei 文档 emails 字段的第一个邮箱地址
user.update_one({'name': 'Hanwei'}, {'$pop': {'emails': -1}})
user.find_one()

{'_id': ObjectId('5f42a7b1eaae64c68f4ceffd'),
 'age': 30,
 'emails': ['joe@gmail.com', 'joe@example.com', 'joe@outlook.com'],
 'favorite': ["Cat's Cradle", 'Foundation Trilogy', "Ender's Game"],
 'location': 'Wisconsin',
 'name': 'Hanwei',
 'sex': 'male'}

In [152]:
# 删除集合 user 中 Hanwei 文档 emails 字段的最后一个邮箱地址
user.update_one({'name': 'Hanwei'}, {'$pop': {'emails': 1}})
user.find_one()

{'_id': ObjectId('5f42a7b1eaae64c68f4ceffd'),
 'age': 30,
 'emails': ['joe@gmail.com', 'joe@example.com'],
 'favorite': ["Cat's Cradle", 'Foundation Trilogy', "Ender's Game"],
 'location': 'Wisconsin',
 'name': 'Hanwei',
 'sex': 'male'}

## 7. modifier based on the index of list

In [154]:
blog.drop()
posts = {'content': '...', 'comments': [{'comment': 'good post', 'author': 'John', 'votes': 0}, {'comment': 'i thought it was too short', 'author': 'Claire', 'votes': 3}, {'comment': 'free watches', 'auth: or': 'Alice', 'votes': -1}]}
blog.insert_one(posts)
blog.find_one()

{'_id': ObjectId('5f42a9a9eaae64c68f4cf000'),
 'comments': [{'author': 'John', 'comment': 'good post', 'votes': 0},
  {'author': 'Claire', 'comment': 'i thought it was too short', 'votes': 3},
  {'auth: or': 'Alice', 'comment': 'free watches', 'votes': -1}],
 'content': '...'}

In [156]:
# 为第一条评论 comments 的 votes 字段增加 1
postId = blog.find_one()['_id']
blog.update_one({'_id':postId}, {'$inc':{'comments.0.votes': 1}})
blog.find_one()

{'_id': ObjectId('5f42a9a9eaae64c68f4cf000'),
 'comments': [{'author': 'John', 'comment': 'good post', 'votes': 2},
  {'author': 'Claire', 'comment': 'i thought it was too short', 'votes': 3},
  {'auth: or': 'Alice', 'comment': 'free watches', 'votes': -1}],
 'content': '...'}

In [157]:
# 定位符的使用，通常在不知道具体数组位置，使用定位查询文档来匹配数组元素
# {'comments.author': 'John'}
blog.update_one({'comments.author': 'John'}, {'$set': {'comments.$.author': 'Jim'}})
blog.find_one()

{'_id': ObjectId('5f42a9a9eaae64c68f4cf000'),
 'comments': [{'author': 'Jim', 'comment': 'good post', 'votes': 2},
  {'author': 'Claire', 'comment': 'i thought it was too short', 'votes': 3},
  {'auth: or': 'Alice', 'comment': 'free watches', 'votes': -1}],
 'content': '...'}

## 8. PyMongo Lookup: find_one() and find()

In [165]:
users = test_database.users
joe = {'name': 'joe', 'age': 26}
mike = {'name': 'mike', 'age': 28}
jake = {'name': 'jake', 'age': 26}
users.insert_many([joe, mike, jake])
for data in users.find():
    print(data)

{'_id': ObjectId('5f42ac85eaae64c68f4cf00d'), 'name': 'joe', 'age': 26}
{'_id': ObjectId('5f42ac85eaae64c68f4cf00e'), 'name': 'mike', 'age': 28}
{'_id': ObjectId('5f42ac85eaae64c68f4cf00f'), 'name': 'jake', 'age': 26}


find() 的使用方法

我们使用 find() 方法，如果不传入任何参数，将返回该集合中的所有数据的一个游标，然后我们可以通过 for 来遍历游标来打印查询结果。

如果我们需要查找特定的数据，比如年龄为 28 的用户，那么我们可以给 find() 方法传入一个匹配的规则。

In [166]:
result = users.find({'age': 28})
result.count()

  


1

In [167]:
result.next()

{'_id': ObjectId('5f42ac85eaae64c68f4cf00e'), 'age': 28, 'name': 'mike'}

In [170]:
result = users.find({'age': 26, 'name': 'jake'}) 
result.next()

{'_id': ObjectId('5f42ac85eaae64c68f4cf00f'), 'age': 26, 'name': 'jake'}

find_one() 的使用方法

上面我们演示了 find() 的用法，我们接下来将会演示 find_one() 的用法。 find_one() 的用法与 find() 的使用方法差别不大，他们的区别是使用 find_one() 最多只会返回一条文档记录，而 find() 则返回查询游标。以下是代码演示：

In [176]:
one_user = user.find_one({})
one_user

In [173]:
type(users.find_one({'name': 'kate'}))

NoneType

In [174]:
users.find_one({'age': 26})

{'_id': ObjectId('5f42ac85eaae64c68f4cf00d'), 'age': 26, 'name': 'joe'}

指定返回字段

我们在查询的时候，可能并不需要文档中的所有字段，这是我们可以在查询条件之后再传入一个参数来指定返回的字段。

In [175]:
# 不要 _id 字段
users.find_one({}, {'_id': 0})

{'age': 26, 'name': 'joe'}

In [177]:
# 只输出 _id 字段
users.find_one({}, {'_id': 1})

{'_id': ObjectId('5f42ac85eaae64c68f4cf00d')}