# MongoDB简介
[官网](https://www.mongodb.com/) | [文档入口](https://docs.mongodb.com/) | [MongoDB Python Drivers文档](https://docs.mongodb.com/ecosystem/drivers/python/) | [MongoDB 大学](https://university.mongodb.com/courses/M001/about)

https://juejin.im/post/5addbd0e518825671f2f62ee



## 安装

1. 下载[MongoDB Server](https://www.runoob.com/mongodb/mongodb-osx-install.html) | [PyMongo](https://www.runoob.com/python3/python-mongodb.html)
* 先创建数据存储地址 `mkdir -p ./data/db`
* 再启动 mongo 服务端 `mongod --dbpath=./data/db`
* 最后`import pymongo` 就可以操作了

## 概念
数据结构
* Databases 数据库
* Collections 表
* Documents JSON格式的数据

数据操作
* CRUD (Create Read Update Delete) 增删改查 

工具
* MongoDB Atlas 云服务
* MongoDB Compass 数据管理客户端

## 尝试数据操作
[PyMongo文档](https://pymongo.readthedocs.io/en/stable/)

In [None]:
from pymongo import MongoClient,DESCENDING
client = MongoClient('mongodb://127.0.0.1:27017')

### 新增

In [None]:
db = client.test_db
users = db.users
result = users.insert_one({'name':'hawk'})

In [None]:
result.inserted_id

ObjectId('5e904259368f587f61f9969d')

### 查询

In [None]:
client.list_database_names()

['admin', 'config', 'local', 'test_db']

In [None]:
db.list_collection_names()

['users']

In [None]:
users.find_one()

{'_id': ObjectId('5e90412a368f587f61f9969a'), 'name': 'hawk'}

In [None]:
for item in users.find({'name': 'hawk'}):
    print(item)

{'_id': ObjectId('5e90412a368f587f61f9969a'), 'name': 'hawk'}
{'_id': ObjectId('5e904187368f587f61f9969b'), 'name': 'hawk'}
{'_id': ObjectId('5e90418b368f587f61f9969c'), 'name': 'hawk'}
{'_id': ObjectId('5e904259368f587f61f9969d'), 'name': 'hawk'}


#### 计数

In [None]:
users.count_documents({'name': 'hawk'})

4

#### 排序

In [None]:
for item in users.find().sort('_id', DESCENDING):
    print(item)

{'_id': ObjectId('5e904259368f587f61f9969d'), 'name': 'hawk'}
{'_id': ObjectId('5e90418b368f587f61f9969c'), 'name': 'hawk'}
{'_id': ObjectId('5e904187368f587f61f9969b'), 'name': 'hawk'}
{'_id': ObjectId('5e90412a368f587f61f9969a'), 'name': 'hawk'}


#### 其他

In [None]:
for item in users.find().sort('_id', DESCENDING).skip(1).limit(2):
    print(item)

{'_id': ObjectId('5e90418b368f587f61f9969c'), 'name': 'hawk'}
{'_id': ObjectId('5e904187368f587f61f9969b'), 'name': 'hawk'}


### 删除

In [None]:
users.delete_one({'name':'hawk'})

<pymongo.results.DeleteResult at 0x10cc7e640>

In [None]:
db.drop_collection('users')

{'nIndexesWas': 1, 'ns': 'test_db.users', 'ok': 1.0}

In [None]:
client.drop_database('test_db')

### 修改
[Update Operator文档](https://docs.mongodb.com/manual/reference/operator/update/)

In [None]:
users.update_one({'name':'hawk'},{'$set':{'age':30}})
users.update_one({'age':30},{'$inc':{'age':2}})

<pymongo.results.UpdateResult at 0x10f42cd20>

In [None]:
for item in users.find():
    print(item)

{'_id': ObjectId('5e90412a368f587f61f9969a'), 'name': 'neo'}
{'_id': ObjectId('5e904187368f587f61f9969b'), 'name': 'neo'}
{'_id': ObjectId('5e90418b368f587f61f9969c'), 'name': 'hawk', 'age': 34}
{'_id': ObjectId('5e904259368f587f61f9969d'), 'name': 'hawk'}


### 筛选条件

In [None]:
%%html
<table><thead><tr><th>符号</th><th>含义</th><th>示例</th></tr></thead><tbody><tr><td><code>$lt</code></td><td>小于</td><td><code>{'age': {'$lt': 20}}</code></td></tr><tr><td><code>$gt</code></td><td>大于</td><td><code>{'age': {'$gt': 20}}</code></td></tr><tr><td><code>$lte</code></td><td>小于等于</td><td><code>{'age': {'$lte': 20}}</code></td></tr><tr><td><code>$gte</code></td><td>大于等于</td><td><code>{'age': {'$gte': 20}}</code></td></tr><tr><td><code>$ne</code></td><td>不等于</td><td><code>{'age': {'$ne': 20}}</code></td></tr><tr><td><code>$in</code></td><td>在范围内</td><td><code>{'age': {'$in': [20, 23]}}</code></td></tr><tr><td><code>$nin</code></td><td>不在范围内</td><td><code>{'age': {'$nin': [20, 23]}}</code></td></tr></tbody></table>

符号,含义,示例
$lt,小于,{'age': {'$lt': 20}}
$gt,大于,{'age': {'$gt': 20}}
$lte,小于等于,{'age': {'$lte': 20}}
$gte,大于等于,{'age': {'$gte': 20}}
$ne,不等于,{'age': {'$ne': 20}}
$in,在范围内,"{'age': {'$in': [20, 23]}}"
$nin,不在范围内,"{'age': {'$nin': [20, 23]}}"


In [None]:
%%html
<table><thead><tr><th>符号</th><th>含义</th><th>示例</th><th>示例含义</th></tr></thead><tbody><tr><td><code>$regex</code></td><td>匹配正则表达式</td><td><code>{'name': {'$regex': '^M.*'}}</code></td><td><code>name</code>以M开头</td></tr><tr><td><code>$exists</code></td><td>属性是否存在</td><td><code>{'name': {'$exists': True}}</code></td><td><code>name</code>属性存在</td></tr><tr><td><code>$type</code></td><td>类型判断</td><td><code>{'age': {'$type': 'int'}}</code></td><td><code>age</code>的类型为<code>int</code></td></tr><tr><td><code>$mod</code></td><td>数字模操作</td><td><code>{'age': {'$mod': [5, 0]}}</code></td><td>年龄模5余0</td></tr><tr><td><code>$text</code></td><td>文本查询</td><td><code>{'$text': {'$search': 'Mike'}}</code></td><td><code>text</code>类型的属性中包含<code>Mike</code>字符串</td></tr><tr><td><code>$where</code></td><td>高级条件查询</td><td><code>{'$where': 'obj.fans_count == obj.follows_count'}</code></td><td>自身粉丝数等于关注数</td></tr></tbody></table>

符号,含义,示例,示例含义
$regex,匹配正则表达式,{'name': {'$regex': '^M.*'}},name以M开头
$exists,属性是否存在,{'name': {'$exists': True}},name属性存在
$type,类型判断,{'age': {'$type': 'int'}},age的类型为int
$mod,数字模操作,"{'age': {'$mod': [5, 0]}}",年龄模5余0
$text,文本查询,{'$text': {'$search': 'Mike'}},text类型的属性中包含Mike字符串
$where,高级条件查询,{'$where': 'obj.fans_count == obj.follows_count'},自身粉丝数等于关注数


详细规则 https://docs.mongodb.com/manual/reference/operator/query/

### 合并操作

In [None]:
# find_one_and_delete
# find_one_and_replace
users.find_one_and_update({'age':32},{'$inc':{'age':2}})

# 实践案例，爬人人都是产品经理网站

In [None]:
http://www.woshipm.com/pd/3676855.html

In [None]:
from crawler_from_scratch import IpPool

In [None]:
IpPool.get_ip()

'107.163.117.13:808'