# Conectando ao MongoDB

A integração do MongoDB com o [Jupyter Notebook](https://jupyter.org/) é feita através da [API  PyMongo](https://pymongo.readthedocs.io/en/stable/) da linugagem de programação [Python](https://www.python.org/). O PyMongo é uma distribuição Python recomendada que contém ferramentas para trabalhar com o MongoDB à partir do Python. Neste artigo você irá aprender como conectar o Jupyter Notebook com o seu cluster do MongoDB Atlas.

## Configuração de Ambiente

In [4]:
# Verifica a instalação do Python no ambiente
!python --version        

Python 3.8.3


In [5]:
# Faz a instalação do pymongo
!pip install pymongo[srv] 



In [3]:
# Testa a instalação do pymongo
pymongo.version

NameError: name 'pymongo' is not defined

## 1. Importação de Bibliotecas

In [None]:
import pymongo
from pymongo import MongoClient

## 2. Conecte ao MongoDB

Para praticar o MongoDB, você pode usar vários serviços gratuitos com armazenamento limitado, por exemplo:

- **MongoDB Atlas**: [https://www.mongodb.com/cloud/atlas]
- **Clever Cloud**: [https://www.clever-cloud.com/]
- **mLab**: [https://mlab.com/]

Neste tutorial, usaremos a plataforma do [MongoDB Atlas](https://www.mongodb.com/cloud/atlas) para armazenar nossos dados. As etapas a seguir mostram como se conectar ao cluster usando o driver PyMongo:



1. Abra a caixa de diálogo **Conectar**; 

Na visualização Clusters, clique no botão Conectar em seu *cluster*.

![Conectar](https://docs.atlas.mongodb.com/_images/gswa-connect-button.png)

2. Clique em Conectar em sua aplicação (*Connect your application*);

3. Selecione Python na lista suspensa *Driver* e selecione sua versão do driver;

![Copia](https://docs.atlas.mongodb.com/_images/gswa-driver-cso-example.png)


4. Copie a string de conexão fornecida na guia da caixa de diálogo;

5. Em um editor de texto, atualize a string de conexão copiada com sua senha.

Por motivos de segurança, o Atlas não mostra a senha do usuário do seu banco de dados na string de conexão. Em vez disso, sua string de conexão tem um espaço reservado `<password>`. Abra seu editor de texto preferido e cole a string de conexão que você copiou do Atlas. Substitua `<password>` pela senha que você especificou quando criou o usuário do banco de dados.

```
mongodb+srv://admin:<password>@cluster0.v0gvz.mongodb.net/<dbname>?retryWrites=true&w=majority
```

> Substitua `<password>` pela senha do usuário admin, e, `<dbname>` pelo nome do banco de dados que as conexões usarão por padrão

In [None]:
client = pymongo.MongoClient("mongodb+srv://admin:admin@cluster0.v0gvz.mongodb.net/dados?retryWrites=true&w=majority")

## 3. Operações Básicas de Gerenciamento de Banco de Dados

In [None]:
# Mostra os nomes dos bancos de dados existentes
client.list_database_names()

In [None]:
# Define o nome do banco de dados que iremos trabalhar.
# Ele será criado e estará visível, assim que o primeiro documento for adicionado.
db = client.frutas

In [None]:
db.frutas

In [None]:
# Exibe informações de AJUDA
help(db.frutas.insert_one)

In [None]:
db.frutas.count_documents({})

In [None]:
db.frutas.insert_one({
 "nome": 'Maçã',
"icone": '🍎'
})

In [None]:
db.frutas.count_documents({})

In [None]:
# Mostra os nomes dos bancos de dados existentes
client.list_database_names()

In [None]:
# Exclui um banco de dados
client.drop_database('diego')

In [None]:
# Mostra os nomes dos bancos de dados existentes
client.list_database_names()

In [None]:
db = client.mercearia

## 4. Operações Básicas de Gerenciamento de Coleções

### 4.1 Criar Coleção
Podemos deixar o MongoDB criar uma coleção assim que um documento for adicinado ou através do comando `db.create_collection('nome_coleção')`

In [None]:
db.create_collection('frutas')

In [None]:
# Retorna um Cursor [ ], que é convertido para uma lista python.
# Lista vazia [], significa que não existem coleções no banco de dados.
list(db.list_collections())

### 4.2 Renomear Coleção

```python
db.nome_colecao.rename('novo_nome')
```

### 4.3 Excluir Coleção

```python
db.nome_colecao.drop('nome_coleção')
```

## 5. Operações CRUD

## 5.1 Inserir Documentos

In [None]:
banana_doc = {
    'nome': 'Banana',
    'icone': '🍌'
}

maca_doc = {
    'nome': 'Maçã',
    'icone': '🍎'
}

mexerica_doc = {
    'nome': 'Mexerica',
    'icone': '🍊'
}

abacaxi_doc = {
    'nome': 'Abacaxi',
    'icone': '🍍'
}

abacate_doc = {
    'nome': 'Abacate',
    'icone': '🥑'
}

pessego_doc = {
    'nome': 'Pêssego',
    'icone': '🍑'
}

melancia_doc = {
    'nome': 'Melancia',
    'icone': '🍉'
}

In [None]:
lista_frutas = [banana_doc, maca_doc, mexerica_doc, abacaxi_doc, abacate_doc, pessego_doc, melancia_doc]
len(lista_frutas) # Exibe o tamanho da lista, ou seja, o número de itens da lista

In [None]:
db.frutas.insert_many(lista_frutas)

## 5.2 Pesquisar Documentos

In [None]:
list(db.frutas.find()) # Pega todos os dados 

In [None]:
list(db.frutas.find({'nome': 'Abacate'}))

In [None]:
list(db.frutas.find().limit(3)) # Retorna os 3 primeiros itens da coleção

## 5.3 Atualizar Documentos

In [None]:
db.frutas.update_one(
    { 'nome': 'Mexerica' },
    { '$set': { 'nome': 'Laranja' }}
)

list(db.frutas.find({'nome': 'Laranja'}))

## 5.4 Excluir Documentos

In [None]:
db.frutas.delete_one({'nome': 'Abacaxi'})

In [None]:
print(list(db.frutas.find())) # Pega todos os dados 
print(len(list(db.frutas.find()))) # Pega todos os dados 

# EXERCÍCIOS

1. Conecte a ferramenta [MongoDB Compass](https://www.mongodb.com/products/compass) com o serviço Atlas e importe o dataset da [Anatel MG (2006 - 2019)](https://raw.githubusercontent.com/profdiegoaugusto/analise-dados/master/Pandas/Exerc%C3%ADcios/Anatel/data/anatel_mg_2006_2019.csv). 

* O banco de dados deverá chamar **anatel** e a coleção deverá chamar **minas**;
* O dicionário de dados pode ser encontrado [aqui](https://github.com/profdiegoaugusto/analise-dados/blob/master/Pandas/Exerc%C3%ADcios/Anatel/data/Reclama%C3%A7%C3%B5es_Gloss%C3%A1rio_e_Metadados.pdf)

In [13]:
!python --version

Python 3.8.3


In [14]:

!pip install pymongo[srv]



In [15]:
import pymongo
from pymongo import MongoClient

In [16]:
pymongo.version

'3.11.0'

In [25]:

db = client.Anatel

2. Usando a ferramenta [Anaconda](https://www.anaconda.com/products/individual) crie um Jupyter Notebook, configure o ambiente e importe a biblioteca `pymongo` para estabelecer a conexão com a plataforma Atlas.

In [26]:
client = pymongo.MongoClient("mongodb+srv://ADM:Welbert@cluster0.qqaod.mongodb.net/test?authSource=admin&replicaSet=atlas-1j83pi-shard-0&readPreference=primary&appname=MongoDB%20Compass&ssl=true")

3. Quantos documentos possui a coleção minas?

In [27]:
db.Minas.count_documents({})

509706

4. Mostre os 5 primeiros documentos da coleção.

In [29]:
print(list(db.Minas.find().limit(5)))

[{'_id': ObjectId('5fb31f9d794c590f584d7eb0'), 'DataExtracao': datetime.datetime(2016, 4, 28, 0, 0), 'Ano': 2006, 'Mes': 1, 'CanalEntrada': 'Atendimento Pessoal ', 'Condicao': 'Nova', 'GrupoEconNorm': 'Anatel', 'Tipo': 'Denúncia', 'Servico': 'Radiodifusão (Rádio e TV)', 'Modalidade': 'Rádio FM', 'Motivo': 'Interferência', 'UF': 'MG', 'QtdeSolic': 3}, {'_id': ObjectId('5fb31f9d794c590f584d7eb1'), 'DataExtracao': datetime.datetime(2016, 4, 28, 0, 0), 'Ano': 2006, 'Mes': 1, 'CanalEntrada': 'Atendimento Pessoal ', 'Condicao': 'Nova', 'GrupoEconNorm': 'Anatel', 'Tipo': 'Denúncia', 'Servico': 'Radiodifusão (Rádio e TV)', 'Modalidade': 'Rádio FM', 'Motivo': 'Outorga', 'UF': 'MG', 'QtdeSolic': 8}, {'_id': ObjectId('5fb31f9d794c590f584d7eb2'), 'DataExtracao': datetime.datetime(2016, 4, 28, 0, 0), 'Ano': 2006, 'Mes': 1, 'CanalEntrada': 'Atendimento Pessoal ', 'Condicao': 'Nova', 'GrupoEconNorm': 'NET', 'Tipo': 'Reclamação', 'Servico': 'Serviço Telefônico Fixo Comutado - STFC', 'Modalidade': 'Loc

5. Selecione o documento que possui o maior número de solicitações `QtdeSolic` na Anatel.


In [30]:
db.Minas.find_one(sort=[("QtdeSolic", pymongo.DESCENDING)])

{'_id': ObjectId('5fb320a1794c590f584f9eb6'),
 'DataExtracao': datetime.datetime(2016, 4, 19, 0, 0),
 'Ano': 2013,
 'Mes': 12,
 'CanalEntrada': 'Call Center',
 'Condicao': 'Nova',
 'GrupoEconNorm': 'OI',
 'Tipo': 'Reclamação',
 'Servico': 'Serviço Telefônico Fixo Comutado - STFC',
 'Modalidade': 'Local',
 'Motivo': 'Reparo',
 'UF': 'MG',
 'QtdeSolic': 4164}

6. Qual é o menor número de solicitações `QtdeSolic` na Anatel?

In [31]:
db.Minas.find_one(sort=[("QtdeSolic", pymongo.ASCENDING)])

{'_id': ObjectId('5fb31f9d794c590f584d7eb2'),
 'DataExtracao': datetime.datetime(2016, 4, 28, 0, 0),
 'Ano': 2006,
 'Mes': 1,
 'CanalEntrada': 'Atendimento Pessoal ',
 'Condicao': 'Nova',
 'GrupoEconNorm': 'NET',
 'Tipo': 'Reclamação',
 'Servico': 'Serviço Telefônico Fixo Comutado - STFC',
 'Modalidade': 'Local',
 'Motivo': 'Cobrança',
 'UF': 'MG',
 'QtdeSolic': 1}

7. Mostre todos os documentos com o menor número de solicitações `QtdeSolic` na Anatel.

In [None]:
list(db.Minas.find({'QtdeSolic': 1}))

8. Mostre as contagens de solicitações `QtdeSolic` por tipo de serviço `Servico`, em ordem decrescente pelas contagens

In [None]:
list(db.Minas.aggregate([
    {'$group': {'_id': "Servico", 'count': {'$sum': 1}}},
    {'$match': {'_id': {'$ne': "QtdeSolic"}}},
    {'$sort': {'count': -1}}
]))

9. Mostre todos os documentos com atributo `Tipo` igual a "Reclamação".

In [None]:
list(db.Minas.find({'Tipo': "Reclamação"}))

10. Quais diferentes valores encontramos em Tipo?

In [None]:
db.minas.distinct("Tipo")