![](mongo.jpeg)

# MongoDB & Python

MongoDB é um banco de dados distribuído, baseado em documentos e de propósito geral, desenvolvido para desenvolvedores de aplicativos modernos e para era da nuvem. Também são chamados de Bancos **NoSQL** (Not Only SQL). Esse tipo de Banco de Dados não traz consigo as ideias do modelo relacional e nem a liguagem SQL 

O `pymongo` é uma excelente biblioteca para trabalhar com o MongoDB, porém em alguns projetos mais complexos às vezes é preciso uma coisa um pouco mais robusta. Uma alternativa interessante é a biblioteca `MongoEngine`, que trabalha os documentos do banco de dados como uma espécie de ORM.

### Intalação biblioteca 

A conexão do mongodb com o python é realizada de uma maneira simples, como na maioria das linguagens, temos uma lib que facilita o processo de comunicação. No Python temos o `pymongo`, para instalá-la basta executar o seguinte comando no shell:

In [2]:
!pip install pymongo

Collecting pymongo
  Using cached https://files.pythonhosted.org/packages/23/23/7666537adafcd232c88c156aa9382c859791d79bf12094005e009c2b6a3d/pymongo-3.9.0-cp37-cp37m-manylinux1_x86_64.whl
Installing collected packages: pymongo
Successfully installed pymongo-3.9.0


In [19]:
import pprint

### Estabelecendo um conexão

Para estabelecer uma conexão, usaremos o `MongoClient`.

A primeira coisa que precisamos fazer para estabelecer uma conexão é importar a classe `MongoClient`. Usaremos isso para se comunicar com a instância do banco de dados em execução

In [4]:
from pymongo import MongoClient

`client = MongoClient()`

Usando o trecho acima, a conexão será estabelecida com o host padrão (*localhost*) e a porta (*27017*). Você também pode especificar o host e/ou porta usando:

`client = MongoClient('localhost', 27017)`

Ou apenas use o formato Mongo URI:

`client = MongoClient('mongodb://localhost:27017')`

`client = MongoClient('mongodb+srv://dbSidiaUser:dbSidiaUser@cluster0-m2nb2.gcp.mongodb.net/test?retryWrites=true&w=majority')`

Todas essas chamadas `MongoClient` farão a mesma coisa; depende apenas de quão explícito você deseja ser no seu código.

In [5]:
client = MongoClient('localhost', 27017)

### Acessando Databases

Depois de ter uma instância conectada, você pode acessar qualquer um dos bancos de dados nesse servidor Mongo. Para especificar qual banco de dados você realmente deseja usar, você pode acessá-lo como um atributo:

In [6]:
db = client.pymongo_test

Ou usando o estilo de acesso dos dicionários:

`db = client['pymongo_test']`

Na verdade, não importa se o banco de dados especificado já foi criado. Ao especificar este nome de banco de dados e salvar dados nele, você cria o banco de dados automaticamente.

## Inserindo documentos

Armazenar dados no banco de dados é fácil e possível em duas linhas de código. A primeira linha especifica qual coleção você usará. Na terminologia do MongoDB, uma coleção é um grupo de documentos que são armazenados juntos no banco de dados. Coleções e documentos são semelhantes às tabelas e linhas SQL, respectivamente.

Recuperar uma coleção é tão fácil quanto obter um banco de dados.

A segunda linha é onde você realmente insere os dados na coleção usando o `insert_one()` método:

### Estrutura dos dados

O MongoDB armazena dados em documentos. Os documentos não são como documentos do Microsoft Word ou Adobe PDF, mas sim documentos JSON. Um exemplo de um documento JSON seria o seguinte:

![](js.png)

In [7]:
posts = db.posts

In [8]:
post_data = {
    'title': 'Python and MongoDB',
    'content': 'PyMongo is fun, you guys',
    'author': 'Scott'
}

In [9]:
result = posts.insert_one(post_data)

In [10]:
print('One post: {0}'.format(result.inserted_id))

One post: 5d9ce134acceef59b479e416


Podemos até inserir muitos documentos por vez, o que é muito mais rápido do que usar `insert_one()`, se você tiver muitos documentos para adicionar ao banco de dados. O método a ser usado aqui é `insert_many`. Este método utiliza uma matriz de dados do documento:

In [15]:
post_1  =  { 
    'title' :  'Python e MongoDB' , 
    'content' :  'PyMongo é divertido, pessoal' , 
    'author' :  'Scott' 
} 
post_2  =  { 
    'title' :  'Ambientes virtuais' , 
    'conteúdo' :  'Use ambientes virtuais, pessoal' , 
    'author' :  'Scott' 
} 
post_3  =  { 
    'title' :  'Aprendendo Python' , 
    'content' :  'Aprenda Python, é fácil', 
    'author' :  'Bill'
} 

In [16]:
new_result = posts.insert_many([post_1, post_2, post_3])

In [17]:
print('Multiple posts: {0}'.format(new_result.inserted_ids))

Multiple posts: [ObjectId('5d9ce852acceef59b479e41a'), ObjectId('5d9ce852acceef59b479e41b'), ObjectId('5d9ce852acceef59b479e41c')]


**Nota**: Os `ObjectIds` não correspondem aos mostrados acima. Eles são gerados dinamicamente quando inserimos dados.

## Recuperando documentos

Para recuperar um documento, usaremos o método `find_one()`, o argumento que usaremos aqui (embora ele suporte muitos outros) é um dicionário que contém campos a serem correspondidos. No exemplo abaixo, queremos recuperar a postagem que foi escrita por Bill:

In [18]:
bills_post = posts.find_one({'author':'Bill'})
print(bills_post)

{'_id': ObjectId('5d9ce852acceef59b479e41c'), 'title': 'Aprendendo Python', 'content': 'Aprenda Python, é fácil', 'author': 'Bill'}


Os `ObjectId` estão definidos sob o `_id`, que podemos usar posteriomente para identificá-las exclusivamente, se necessário. Se quisermos encontrar mais de um documento, podemos usar o método `find()`.

### Exercício:
- Encontrar todas as portagens escritas por `Scott`:

In [19]:
scotts_posts = posts.find({'author': 'Scott'})
print(scotts_posts)

<pymongo.cursor.Cursor object at 0x7fe6d2f2f208>


A principal diferença é que os dados do documento não são retornados diretamente. Em vez disso, obtemos uma instância do objeto Cursor. Este cursor é um objeto iterável que contém vários métodos auxiliares para ajudar a trabalhar com os dados. Desta forma, conseguimos iterar na seguinte forma:

In [20]:
for post in scotts_posts:
    print(post)

{'_id': ObjectId('5d9ce134acceef59b479e416'), 'title': 'Python and MongoDB', 'content': 'PyMongo is fun, you guys', 'author': 'Scott'}
{'_id': ObjectId('5d9ce852acceef59b479e41a'), 'title': 'Python e MongoDB', 'content': 'PyMongo é divertido, pessoal', 'author': 'Scott'}
{'_id': ObjectId('5d9ce852acceef59b479e41b'), 'title': 'Ambientes virtuais', 'conteúdo': 'Use ambientes virtuais, pessoal', 'author': 'Scott'}


### Querying By ObjectId

In [18]:
posts.find_one({'_id':'5d9ce134acceef59b479e416'})

NameError: name 'posts' is not defined

### Counting

Se queremos apenas saber quantos documentos correspondem a uma consulta, podemos executar uma `count_documents()` em vez de uma consulta completa. Podemos obter uma contagem de todos os documentos em uma coleção:

In [None]:
posts.count_documents({})

In [None]:
posts.count_documents({'author':'Mike'})

### Range Queries

O MongoDB suporta muitos tipos diferentes de consultas avançadas . Como exemplo, vamos executar uma consulta em que limitamos os resultados a postagens anteriores a uma determinada data, mas também classificamos os resultados por autor:

In [None]:
d = datetime.datetime(2009, 11, 12, 12)

In [None]:
for post in posts.find({'date': {'$lt':d}}).sort('author'):
    pprint.pprint(post)

Aqui, usamos o `$lt` operador especial para fazer uma consulta de intervalo e também chamamos sort()para classificar os resultados por autor.

### MongoEngine

Embora o `Py;mongo` seja muito fácil de usar e, em geral, seja uma ótima biblioteca, é provavelmente um nível muito baixo para muitos projetos por aí. Em outras palavras, você precisará escrever muito do seu próprio código para salvar, recuperar e excluir objetos de forma *consistente*.

Uma biblioteca que fornece uma abstração mais alta sobre o PyMongo é o `MongoEngine`. O `MongoEngine` é um mapeador de documentos de objetos (ODM), que é aproximandamente equivalente a um mapeador relacional de objetos (ORM) baseado em SQL. A abstração fornecida pelo `MongoEngine` é baseada em classes; portanto, todos os modelos que você cria são classes.


#### Instalação

`$ pip install mongoengine`

In [2]:
!pip install mongoengine

Collecting mongoengine
[?25l  Downloading https://files.pythonhosted.org/packages/a7/1c/0749992c7a2b6a2f1879ad44ba5285f907d2024838459b4cd635c5e5effd/mongoengine-0.18.2.tar.gz (151kB)
[K     |████████████████████████████████| 153kB 210kB/s eta 0:00:01
Building wheels for collected packages: mongoengine
  Building wheel for mongoengine (setup.py) ... [?25ldone
[?25h  Stored in directory: /home/jailson/.cache/pip/wheels/bd/49/42/507e9e034c74255f972032d3593c7a2a37a3e243d3e399efb7
Successfully built mongoengine
Installing collected packages: mongoengine
Successfully installed mongoengine-0.18.2


Uma vez instalado, precisamos direcionar a biblioteca para conectar-se à nossa instância do Mongo em execução. Para isso, teremos que usar o método `connect()` e passar o `host`e a `port` do banco de dados `MongoDB` para ela.

In [3]:
from mongoengine import *

connect('mongoengine_test', host='localhost', port=27017)

MongoClient(host=['localhost:27017'], document_class=dict, tz_aware=False, connect=True, read_preference=Primary())

Aqui, especificamos o nome do nosso banco de dados e a localização. Como ainda estamos usando o host e a porta padrão, você pode omitir esses parâmetros.

### Definindo um Documento

Para configurar nosso objeto de documento, precisamos definir quais dados queremos que nosso objeto de documento tenha. Semelhante a muitos outros ORMs, faremos isso subclassificando a classe Document e fornecendo os tipos de dados que queremos:

In [4]:
import datetime

In [5]:
class Post(Document):
    title = StringField(required=True, max_length=200)
    content = StringField(required=True)
    author = StringField(required=True, max_length=50)
    published = DateTimeField(default=datetime.datetime.now)

Neste modelo simples, nós dissemos ao `MongoEngine` que esperamos um `Post` com um `title`, `content`, `author` e uma `date`. Agora, o objeto base `Document` pode usar essas informações para validar os dados que fornecemos.

Por exemplo, se tentarmos salvar um `Post` sem um `title`, ele lançará um `Exception`. Podemos levar isso ainda mais longe e adicionar mais restrições, como o comprimento da string. Existem muitos outros parâmetros como este que podemos definir, incluindo:

- `db_field`: Especificar um nome de campo diferente
- `required`: Verificar se o campo está definido
- `default`: Utilizar o padrão fornecido se nenhum outro valor for passado
- `unique`: Verificar se nenhum outro documento da coleção tem o mesmo valor para este campo
- `choices`: Verifique se o valor do campo é igual a um dos valores fornecidos em uma matriz

Cada tipo de campo possui seu próprio conjunto de parâmetros, portanto, verifique a [documentação](http://docs.mongoengine.org/guide/defining-documents.html#field-arguments)

In [None]:
# Exemplos:
  
class ExampleFirst(Document):
    # Default an empty list
    values = ListField(IntField(), default=list)

class ExampleSecond(Document):
    # Default a set of values
    values = ListField(IntField(), default=lambda: [1,2,3])

class ExampleDangerous(Document):
    # This can make an .append call to  add values to the default (and all the following objects),
    # instead to just an object
    values = ListField(IntField(), default=[1,2,3])  

In [None]:
SIZE = ('S', 'M', 'L', 'XL', 'XXL')

class Shirt(Document):
    size = StringField(max_length=3, choices=SIZE)

### Salvando documentos

Para salvar um documento em nosso banco de dados, usaremos o método `save()`. Se o documento já existir no banco de dados, todas as alterações serão feitas no nível atômico do documento existente. Se não existir, no entanto, será criado.

Exemplo de criação e salvamento de um documento:

In [7]:
post_1 = Post(
    title = 'Sample Post',
    content = 'Some engaging content',
    author = 'Jailson'
)

post_1.save()
print(post_1.title)

Sample Post


In [8]:
post_1.title = 'A Better Post Title'
post_1.save()
print(post_1.title)

A Better Post Title


Algumas coisas a serem observadas sobre a chamada do método `save()`:

- O PyMongo realizará a validação quando vocÊ ligar `.save()`. Isso significa que ele verificará os dados que você está salvando no esquema que você declarou na classe. Se o esquema (ou uma restrição) for violado, uma exceção será lançada e os dados não serão salvos.


Exercício:

O que acontece quando você deixa de lado o `title`?

In [9]:
post_2 = Post(content='Content goes here', author='Michael')
post_2.save()

ValidationError: ValidationError (Post:None) (Field is required: ['title'])

### Recursos orientados a objetos

Com o MongoEngine sendo orientado a objetos, você também pode adicionar métodos ao seu documento em subclasse. Considere o exemplo a seguir, onde uma função é usada para modificar o conjunto de consultas padrão (que retorna todos os objetos da coleção). 

Usando isso, podemos aplicar um filtro padrão à classe e obter apenas os objetos desejados:

In [10]:
class Post(Document):
    title = StringField()
    published = BooleanField()
    
    @queryset_manager
    def live_posts(clazz, queryset):
        return queryset.filter(published=True)

### Referenciando Outros Documentos

Você também pode usar o `ReferenceField` para criar uma referência de um documento para outro. O `MongoEngine` lida com a raferência de forma automaticamente ao acessar.

In [16]:
class Author(Document):
    name = StringField()
    
class Post(Document):
    author = ReferenceField(Author)
    

Post.objects.first().author.name