# Conectando ao MongoDB

A integração do MongoDB com o [Jupyter Notebook](https://jupyter.org/) é feita através da [API  PyMongo](https://pymongo.readthedocs.io/en/stable/) da linugagem de programação [Python](https://www.python.org/). O PyMongo é uma distribuição Python recomendada que contém ferramentas para trabalhar com o MongoDB à partir do Python. Neste artigo você irá aprender como conectar o Jupyter Notebook com o seu cluster do MongoDB Atlas.

## Configuração de Ambiente

In [1]:
# Verifica a instalação do Python no ambiente
!python --version        

Python 3.8.5


In [3]:
# Faz a instalação do pymongo
!pip install pymongo[srv] 



In [7]:
# Testa a instalação do pymongo
pymongo.version

'3.11.1'

## 1. Importação de Bibliotecas

In [6]:
import pymongo
from pymongo import MongoClient

## 2. Conecte ao MongoDB

Para praticar o MongoDB, você pode usar vários serviços gratuitos com armazenamento limitado, por exemplo:

- **MongoDB Atlas**: [https://www.mongodb.com/cloud/atlas]
- **Clever Cloud**: [https://www.clever-cloud.com/]
- **mLab**: [https://mlab.com/]

Neste tutorial, usaremos a plataforma do [MongoDB Atlas](https://www.mongodb.com/cloud/atlas) para armazenar nossos dados. As etapas a seguir mostram como se conectar ao cluster usando o driver PyMongo:



1. Abra a caixa de diálogo **Conectar**; 

Na visualização Clusters, clique no botão Conectar em seu *cluster*.

![Conectar](https://docs.atlas.mongodb.com/_images/gswa-connect-button.png)

2. Clique em Conectar em sua aplicação (*Connect your application*);

3. Selecione Python na lista suspensa *Driver* e selecione sua versão do driver;

![Copia](https://docs.atlas.mongodb.com/_images/gswa-driver-cso-example.png)


4. Copie a string de conexão fornecida na guia da caixa de diálogo;

5. Em um editor de texto, atualize a string de conexão copiada com sua senha.

Por motivos de segurança, o Atlas não mostra a senha do usuário do seu banco de dados na string de conexão. Em vez disso, sua string de conexão tem um espaço reservado `<password>`. Abra seu editor de texto preferido e cole a string de conexão que você copiou do Atlas. Substitua `<password>` pela senha que você especificou quando criou o usuário do banco de dados.

```
mongodb+srv://admin:<password>@cluster0.v0gvz.mongodb.net/<dbname>?retryWrites=true&w=majority
```

> Substitua `<password>` pela senha do usuário admin, e, `<dbname>` pelo nome do banco de dados que as conexões usarão por padrão

In [8]:
client = pymongo.MongoClient("mongodb+srv://admin:admin@cluster0.s43rb.mongodb.net/<dbname>?retryWrites=true&w=majority")

## 3. Operações Básicas de Gerenciamento de Banco de Dados

In [9]:
# Mostra os nomes dos bancos de dados existentes
client.list_database_names()

['admin', 'local']

In [10]:
# Define o nome do banco de dados que iremos trabalhar.
# Ele será criado e estará visível, assim que o primeiro documento for adicionado.
db = client.frutas

In [11]:
db.frutas

Collection(Database(MongoClient(host=['cluster0-shard-00-01.s43rb.mongodb.net:27017', 'cluster0-shard-00-02.s43rb.mongodb.net:27017', 'cluster0-shard-00-00.s43rb.mongodb.net:27017'], document_class=dict, tz_aware=False, connect=True, retrywrites=True, w='majority', authsource='admin', replicaset='atlas-yjgy07-shard-0', ssl=True), 'frutas'), 'frutas')

In [12]:
# Exibe informações de AJUDA
help(db.frutas.insert_one)

Help on method insert_one in module pymongo.collection:

insert_one(document, bypass_document_validation=False, session=None) method of pymongo.collection.Collection instance
    Insert a single document.
    
      >>> db.test.count_documents({'x': 1})
      0
      >>> result = db.test.insert_one({'x': 1})
      >>> result.inserted_id
      ObjectId('54f112defba522406c9cc208')
      >>> db.test.find_one({'x': 1})
      {u'x': 1, u'_id': ObjectId('54f112defba522406c9cc208')}
    
    :Parameters:
      - `document`: The document to insert. Must be a mutable mapping
        type. If the document does not have an _id field one will be
        added automatically.
      - `bypass_document_validation`: (optional) If ``True``, allows the
        write to opt-out of document level validation. Default is
        ``False``.
      - `session` (optional): a
        :class:`~pymongo.client_session.ClientSession`.
    
    :Returns:
      - An instance of :class:`~pymongo.results.InsertOneResult`

In [13]:
db.frutas.count_documents({})

0

In [14]:
db.frutas.insert_one({
 "nome": 'Maçã',
"icone": '🍎'
})

<pymongo.results.InsertOneResult at 0x12376fbfb40>

In [15]:
db.frutas.count_documents({})

1

In [16]:
# Mostra os nomes dos bancos de dados existentes
client.list_database_names()

['frutas', 'admin', 'local']

In [17]:
# Exclui um banco de dados
client.drop_database('diego')

In [18]:
# Mostra os nomes dos bancos de dados existentes
client.list_database_names()

['frutas', 'admin', 'local']

In [19]:
db = client.mercearia

## 4. Operações Básicas de Gerenciamento de Coleções

### 4.1 Criar Coleção
Podemos deixar o MongoDB criar uma coleção assim que um documento for adicinado ou através do comando `db.create_collection('nome_coleção')`

In [20]:
db.create_collection('frutas')

Collection(Database(MongoClient(host=['cluster0-shard-00-01.s43rb.mongodb.net:27017', 'cluster0-shard-00-02.s43rb.mongodb.net:27017', 'cluster0-shard-00-00.s43rb.mongodb.net:27017'], document_class=dict, tz_aware=False, connect=True, retrywrites=True, w='majority', authsource='admin', replicaset='atlas-yjgy07-shard-0', ssl=True), 'mercearia'), 'frutas')

In [21]:
# Retorna um Cursor [ ], que é convertido para uma lista python.
# Lista vazia [], significa que não existem coleções no banco de dados.
list(db.list_collections())

[{'name': 'frutas',
  'type': 'collection',
  'options': {},
  'info': {'readOnly': False,
   'uuid': UUID('f8a606a0-5759-426a-8977-a5e6b1973850')},
  'idIndex': {'v': 2,
   'key': {'_id': 1},
   'name': '_id_',
   'ns': 'mercearia.frutas'}}]

### 4.2 Renomear Coleção

```python
db.nome_colecao.rename('novo_nome')
```

### 4.3 Excluir Coleção

```python
db.nome_colecao.drop('nome_coleção')
```

## 5. Operações CRUD

## 5.1 Inserir Documentos

In [22]:
banana_doc = {
    'nome': 'Banana',
    'icone': '🍌'
}

maca_doc = {
    'nome': 'Maçã',
    'icone': '🍎'
}

mexerica_doc = {
    'nome': 'Mexerica',
    'icone': '🍊'
}

abacaxi_doc = {
    'nome': 'Abacaxi',
    'icone': '🍍'
}

abacate_doc = {
    'nome': 'Abacate',
    'icone': '🥑'
}

pessego_doc = {
    'nome': 'Pêssego',
    'icone': '🍑'
}

melancia_doc = {
    'nome': 'Melancia',
    'icone': '🍉'
}

In [23]:
lista_frutas = [banana_doc, maca_doc, mexerica_doc, abacaxi_doc, abacate_doc, pessego_doc, melancia_doc]
len(lista_frutas) # Exibe o tamanho da lista, ou seja, o número de itens da lista

7

In [24]:
db.frutas.insert_many(lista_frutas)

<pymongo.results.InsertManyResult at 0x12376f97640>

## 5.2 Pesquisar Documentos

In [25]:
list(db.frutas.find()) # Pega todos os dados 

[{'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc4'), 'nome': 'Banana', 'icone': '🍌'},
 {'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc5'), 'nome': 'Maçã', 'icone': '🍎'},
 {'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc6'),
  'nome': 'Mexerica',
  'icone': '🍊'},
 {'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc7'),
  'nome': 'Abacaxi',
  'icone': '🍍'},
 {'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc8'),
  'nome': 'Abacate',
  'icone': '🥑'},
 {'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc9'),
  'nome': 'Pêssego',
  'icone': '🍑'},
 {'_id': ObjectId('5fbef50b9cacbb1dcf5ddbca'),
  'nome': 'Melancia',
  'icone': '🍉'}]

In [26]:
list(db.frutas.find({'nome': 'Abacate'}))

[{'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc8'),
  'nome': 'Abacate',
  'icone': '🥑'}]

In [27]:
list(db.frutas.find().limit(3)) # Retorna os 3 primeiros itens da coleção

[{'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc4'), 'nome': 'Banana', 'icone': '🍌'},
 {'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc5'), 'nome': 'Maçã', 'icone': '🍎'},
 {'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc6'),
  'nome': 'Mexerica',
  'icone': '🍊'}]

## 5.3 Atualizar Documentos

In [28]:
db.frutas.update_one(
    { 'nome': 'Mexerica' },
    { '$set': { 'nome': 'Laranja' }}
)

list(db.frutas.find({'nome': 'Laranja'}))

[{'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc6'),
  'nome': 'Laranja',
  'icone': '🍊'}]

## 5.4 Excluir Documentos

In [29]:
db.frutas.delete_one({'nome': 'Abacaxi'})

<pymongo.results.DeleteResult at 0x12376fe0c80>

In [30]:
print(list(db.frutas.find())) # Pega todos os dados 
print(len(list(db.frutas.find()))) # Pega todos os dados 

[{'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc4'), 'nome': 'Banana', 'icone': '🍌'}, {'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc5'), 'nome': 'Maçã', 'icone': '🍎'}, {'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc6'), 'nome': 'Laranja', 'icone': '🍊'}, {'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc8'), 'nome': 'Abacate', 'icone': '🥑'}, {'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc9'), 'nome': 'Pêssego', 'icone': '🍑'}, {'_id': ObjectId('5fbef50b9cacbb1dcf5ddbca'), 'nome': 'Melancia', 'icone': '🍉'}]
6


# EXERCÍCIOS

1. Conecte a ferramenta [MongoDB Compass](https://www.mongodb.com/products/compass) com o serviço Atlas e importe o dataset da [Anatel MG (2006 - 2019)](https://raw.githubusercontent.com/profdiegoaugusto/analise-dados/master/Pandas/Exerc%C3%ADcios/Anatel/data/anatel_mg_2006_2019.csv). 

* O banco de dados deverá chamar **anatel** e a coleção deverá chamar **minas**;
* O dicionário de dados pode ser encontrado [aqui](https://github.com/profdiegoaugusto/analise-dados/blob/master/Pandas/Exerc%C3%ADcios/Anatel/data/Reclama%C3%A7%C3%B5es_Gloss%C3%A1rio_e_Metadados.pdf)

2. Usando a ferramenta [Anaconda](https://www.anaconda.com/products/individual) crie um Jupyter Notebook, configure o ambiente e importe a biblioteca `pymongo` para estabelecer a conexão com a plataforma Atlas.

In [32]:
client = pymongo.MongoClient("mongodb+srv://admin:admin@cluster0.s43rb.mongodb.net/<dbname>?retryWrites=true&w=majority")
client.list_database_names()
db = client.anatel

3. Quantos documentos possui a coleção minas?

In [35]:
minas_docs = list(db.minas.find())
numero_docs_minas = len(minas_docs)
print(numero_docs_minas)

509706


4. Mostre os 5 primeiros documentos da coleção.

In [36]:
list(db.minas.find().limit(5))

[{'_id': ObjectId('5fbef73180edc713d040ab38'),
  'DataExtracao': datetime.datetime(2016, 4, 28, 0, 0),
  'Ano': 2006,
  'Mes': 1,
  'CanalEntrada': 'Atendimento Pessoal ',
  'Condicao': 'Nova',
  'GrupoEconNorm': 'Anatel',
  'Tipo': 'Denúncia',
  'Servico': 'Radiodifusão (Rádio e TV)',
  'Modalidade': 'Rádio FM',
  'Motivo': 'Interferência',
  'UF': 'MG',
  'QtdeSolic': 3},
 {'_id': ObjectId('5fbef73180edc713d040ab39'),
  'DataExtracao': datetime.datetime(2016, 4, 28, 0, 0),
  'Ano': 2006,
  'Mes': 1,
  'CanalEntrada': 'Atendimento Pessoal ',
  'Condicao': 'Nova',
  'GrupoEconNorm': 'Anatel',
  'Tipo': 'Denúncia',
  'Servico': 'Radiodifusão (Rádio e TV)',
  'Modalidade': 'Rádio FM',
  'Motivo': 'Outorga',
  'UF': 'MG',
  'QtdeSolic': 8},
 {'_id': ObjectId('5fbef73180edc713d040ab3a'),
  'DataExtracao': datetime.datetime(2016, 4, 28, 0, 0),
  'Ano': 2006,
  'Mes': 1,
  'CanalEntrada': 'Atendimento Pessoal ',
  'Condicao': 'Nova',
  'GrupoEconNorm': 'NET',
  'Tipo': 'Reclamação',
  'Servi

5. Selecione o documento que possui o maior número de solicitações `QtdeSolic` na Anatel.


In [38]:
db.minas.find_one(sort=[("QtdeSolic", -1)])

{'_id': ObjectId('5fbef74880edc713d042cb3e'),
 'DataExtracao': datetime.datetime(2016, 4, 19, 0, 0),
 'Ano': 2013,
 'Mes': 12,
 'CanalEntrada': 'Call Center',
 'Condicao': 'Nova',
 'GrupoEconNorm': 'OI',
 'Tipo': 'Reclamação',
 'Servico': 'Serviço Telefônico Fixo Comutado - STFC',
 'Modalidade': 'Local',
 'Motivo': 'Reparo',
 'UF': 'MG',
 'QtdeSolic': 4164}

6. Qual é o menor número de solicitações `QtdeSolic` na Anatel?

In [42]:
qtde_solicitacoes_min = db.minas.find_one(sort=[("QtdeSolic", 1)])
qtde_solicitacoes_min['QtdeSolic']

1

7. Mostre todos os documentos com o menor número de solicitações `QtdeSolic` na Anatel.

In [43]:
docs_qtde_solic_min = list(db.minas.find({ "QtdeSolic": qtde_solicitacoes_min }))
print(str(len(docs_qtde_solic_min)))

0


8. Mostre as contagens de solicitações `QtdeSolic` por tipo de serviço `Servico`, em ordem decrescente pelas contagens

In [44]:
pipeline = [
    { "$group": { "_id": "$Servico", "contagem": { "$sum": "$QtdeSolic"  } } },
    { "$sort": { "contagem": -1 }}
]

list(db.minas.aggregate(pipeline))

[{'_id': 'Móvel Pessoal', 'contagem': 1082677},
 {'_id': 'Celular Pós-Pago', 'contagem': 812191},
 {'_id': 'Serviço Telefônico Fixo Comutado - STFC', 'contagem': 532895},
 {'_id': 'Telefone Fixo', 'contagem': 514959},
 {'_id': 'TV por Assinatura', 'contagem': 394184},
 {'_id': 'Banda Larga Fixa', 'contagem': 349265},
 {'_id': 'Celular Pré-Pago', 'contagem': 307646},
 {'_id': 'Serviço de Comunicação Multimídia', 'contagem': 254742},
 {'_id': 'Serviços da Anatel', 'contagem': 46939},
 {'_id': 'Radiodifusão (Rádio e TV)', 'contagem': 6493},
 {'_id': 'Outros', 'contagem': 2972},
 {'_id': 'Rádio do Cidadão (PX)', 'contagem': 2963},
 {'_id': 'Serviço de Rede e Transporte de Telecomunicações - SRTT',
  'contagem': 2824},
 {'_id': 'Radioamador (PY)', 'contagem': 2810},
 {'_id': 'Troncalizado (Trunking)', 'contagem': 2286},
 {'_id': 'Limitado Privado', 'contagem': 1020},
 {'_id': 'Serviço Móvel Aeronáutico', 'contagem': 153},
 {'_id': 'Radiochamada (Paging)', 'contagem': 25},
 {'_id': 'Serviço 

9. Mostre todos os documentos com atributo `Tipo` igual a "Reclamação".

In [45]:
reclamacoes = list(db.minas.find({ "Tipo": "Reclamação"}))
len(reclamacoes)

['Denúncia', 'Elogio', 'Pedido de Informação', 'Reclamação', 'Sugestão']

10. Quais diferentes valores encontramos em Tipo?

In [46]:
db.minas.distinct("Tipo")

['Denúncia', 'Elogio', 'Pedido de Informação', 'Reclamação', 'Sugestão']