# Conectando ao MongoDB

A integra√ß√£o do MongoDB com o [Jupyter Notebook](https://jupyter.org/) √© feita atrav√©s da [API  PyMongo](https://pymongo.readthedocs.io/en/stable/) da linugagem de programa√ß√£o [Python](https://www.python.org/). O PyMongo √© uma distribui√ß√£o Python recomendada que cont√©m ferramentas para trabalhar com o MongoDB √† partir do Python. Neste artigo voc√™ ir√° aprender como conectar o Jupyter Notebook com o seu cluster do MongoDB Atlas.

## Configura√ß√£o de Ambiente

In [1]:
# Verifica a instala√ß√£o do Python no ambiente
!python --version        

Python 3.8.5


In [3]:
# Faz a instala√ß√£o do pymongo
!pip install pymongo[srv] 



In [7]:
# Testa a instala√ß√£o do pymongo
pymongo.version

'3.11.1'

## 1. Importa√ß√£o de Bibliotecas

In [6]:
import pymongo
from pymongo import MongoClient

## 2. Conecte ao MongoDB

Para praticar o MongoDB, voc√™ pode usar v√°rios servi√ßos gratuitos com armazenamento limitado, por exemplo:

- **MongoDB Atlas**: [https://www.mongodb.com/cloud/atlas]
- **Clever Cloud**: [https://www.clever-cloud.com/]
- **mLab**: [https://mlab.com/]

Neste tutorial, usaremos a plataforma do [MongoDB Atlas](https://www.mongodb.com/cloud/atlas) para armazenar nossos dados. As etapas a seguir mostram como se conectar ao cluster usando o driver PyMongo:



1. Abra a caixa de di√°logo **Conectar**; 

Na visualiza√ß√£o Clusters, clique no bot√£o Conectar em seu *cluster*.

![Conectar](https://docs.atlas.mongodb.com/_images/gswa-connect-button.png)

2. Clique em Conectar em sua aplica√ß√£o (*Connect your application*);

3. Selecione Python na lista suspensa *Driver* e selecione sua vers√£o do driver;

![Copia](https://docs.atlas.mongodb.com/_images/gswa-driver-cso-example.png)


4. Copie a string de conex√£o fornecida na guia da caixa de di√°logo;

5. Em um editor de texto, atualize a string de conex√£o copiada com sua senha.

Por motivos de seguran√ßa, o Atlas n√£o mostra a senha do usu√°rio do seu banco de dados na string de conex√£o. Em vez disso, sua string de conex√£o tem um espa√ßo reservado `<password>`. Abra seu editor de texto preferido e cole a string de conex√£o que voc√™ copiou do Atlas. Substitua `<password>` pela senha que voc√™ especificou quando criou o usu√°rio do banco de dados.

```
mongodb+srv://admin:<password>@cluster0.v0gvz.mongodb.net/<dbname>?retryWrites=true&w=majority
```

> Substitua `<password>` pela senha do usu√°rio admin, e, `<dbname>` pelo nome do banco de dados que as conex√µes usar√£o por padr√£o

In [8]:
client = pymongo.MongoClient("mongodb+srv://admin:admin@cluster0.s43rb.mongodb.net/<dbname>?retryWrites=true&w=majority")

## 3. Opera√ß√µes B√°sicas de Gerenciamento de Banco de Dados

In [9]:
# Mostra os nomes dos bancos de dados existentes
client.list_database_names()

['admin', 'local']

In [10]:
# Define o nome do banco de dados que iremos trabalhar.
# Ele ser√° criado e estar√° vis√≠vel, assim que o primeiro documento for adicionado.
db = client.frutas

In [11]:
db.frutas

Collection(Database(MongoClient(host=['cluster0-shard-00-01.s43rb.mongodb.net:27017', 'cluster0-shard-00-02.s43rb.mongodb.net:27017', 'cluster0-shard-00-00.s43rb.mongodb.net:27017'], document_class=dict, tz_aware=False, connect=True, retrywrites=True, w='majority', authsource='admin', replicaset='atlas-yjgy07-shard-0', ssl=True), 'frutas'), 'frutas')

In [12]:
# Exibe informa√ß√µes de AJUDA
help(db.frutas.insert_one)

Help on method insert_one in module pymongo.collection:

insert_one(document, bypass_document_validation=False, session=None) method of pymongo.collection.Collection instance
    Insert a single document.
    
      >>> db.test.count_documents({'x': 1})
      0
      >>> result = db.test.insert_one({'x': 1})
      >>> result.inserted_id
      ObjectId('54f112defba522406c9cc208')
      >>> db.test.find_one({'x': 1})
      {u'x': 1, u'_id': ObjectId('54f112defba522406c9cc208')}
    
    :Parameters:
      - `document`: The document to insert. Must be a mutable mapping
        type. If the document does not have an _id field one will be
        added automatically.
      - `bypass_document_validation`: (optional) If ``True``, allows the
        write to opt-out of document level validation. Default is
        ``False``.
      - `session` (optional): a
        :class:`~pymongo.client_session.ClientSession`.
    
    :Returns:
      - An instance of :class:`~pymongo.results.InsertOneResult`

In [13]:
db.frutas.count_documents({})

0

In [14]:
db.frutas.insert_one({
 "nome": 'Ma√ß√£',
"icone": 'üçé'
})

<pymongo.results.InsertOneResult at 0x12376fbfb40>

In [15]:
db.frutas.count_documents({})

1

In [16]:
# Mostra os nomes dos bancos de dados existentes
client.list_database_names()

['frutas', 'admin', 'local']

In [17]:
# Exclui um banco de dados
client.drop_database('diego')

In [18]:
# Mostra os nomes dos bancos de dados existentes
client.list_database_names()

['frutas', 'admin', 'local']

In [19]:
db = client.mercearia

## 4. Opera√ß√µes B√°sicas de Gerenciamento de Cole√ß√µes

### 4.1 Criar Cole√ß√£o
Podemos deixar o MongoDB criar uma cole√ß√£o assim que um documento for adicinado ou atrav√©s do comando `db.create_collection('nome_cole√ß√£o')`

In [20]:
db.create_collection('frutas')

Collection(Database(MongoClient(host=['cluster0-shard-00-01.s43rb.mongodb.net:27017', 'cluster0-shard-00-02.s43rb.mongodb.net:27017', 'cluster0-shard-00-00.s43rb.mongodb.net:27017'], document_class=dict, tz_aware=False, connect=True, retrywrites=True, w='majority', authsource='admin', replicaset='atlas-yjgy07-shard-0', ssl=True), 'mercearia'), 'frutas')

In [21]:
# Retorna um Cursor [ ], que √© convertido para uma lista python.
# Lista vazia [], significa que n√£o existem cole√ß√µes no banco de dados.
list(db.list_collections())

[{'name': 'frutas',
  'type': 'collection',
  'options': {},
  'info': {'readOnly': False,
   'uuid': UUID('f8a606a0-5759-426a-8977-a5e6b1973850')},
  'idIndex': {'v': 2,
   'key': {'_id': 1},
   'name': '_id_',
   'ns': 'mercearia.frutas'}}]

### 4.2 Renomear Cole√ß√£o

```python
db.nome_colecao.rename('novo_nome')
```

### 4.3 Excluir Cole√ß√£o

```python
db.nome_colecao.drop('nome_cole√ß√£o')
```

## 5. Opera√ß√µes CRUD

## 5.1 Inserir Documentos

In [22]:
banana_doc = {
    'nome': 'Banana',
    'icone': 'üçå'
}

maca_doc = {
    'nome': 'Ma√ß√£',
    'icone': 'üçé'
}

mexerica_doc = {
    'nome': 'Mexerica',
    'icone': 'üçä'
}

abacaxi_doc = {
    'nome': 'Abacaxi',
    'icone': 'üçç'
}

abacate_doc = {
    'nome': 'Abacate',
    'icone': 'ü•ë'
}

pessego_doc = {
    'nome': 'P√™ssego',
    'icone': 'üçë'
}

melancia_doc = {
    'nome': 'Melancia',
    'icone': 'üçâ'
}

In [23]:
lista_frutas = [banana_doc, maca_doc, mexerica_doc, abacaxi_doc, abacate_doc, pessego_doc, melancia_doc]
len(lista_frutas) # Exibe o tamanho da lista, ou seja, o n√∫mero de itens da lista

7

In [24]:
db.frutas.insert_many(lista_frutas)

<pymongo.results.InsertManyResult at 0x12376f97640>

## 5.2 Pesquisar Documentos

In [25]:
list(db.frutas.find()) # Pega todos os dados 

[{'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc4'), 'nome': 'Banana', 'icone': 'üçå'},
 {'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc5'), 'nome': 'Ma√ß√£', 'icone': 'üçé'},
 {'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc6'),
  'nome': 'Mexerica',
  'icone': 'üçä'},
 {'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc7'),
  'nome': 'Abacaxi',
  'icone': 'üçç'},
 {'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc8'),
  'nome': 'Abacate',
  'icone': 'ü•ë'},
 {'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc9'),
  'nome': 'P√™ssego',
  'icone': 'üçë'},
 {'_id': ObjectId('5fbef50b9cacbb1dcf5ddbca'),
  'nome': 'Melancia',
  'icone': 'üçâ'}]

In [26]:
list(db.frutas.find({'nome': 'Abacate'}))

[{'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc8'),
  'nome': 'Abacate',
  'icone': 'ü•ë'}]

In [27]:
list(db.frutas.find().limit(3)) # Retorna os 3 primeiros itens da cole√ß√£o

[{'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc4'), 'nome': 'Banana', 'icone': 'üçå'},
 {'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc5'), 'nome': 'Ma√ß√£', 'icone': 'üçé'},
 {'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc6'),
  'nome': 'Mexerica',
  'icone': 'üçä'}]

## 5.3 Atualizar Documentos

In [28]:
db.frutas.update_one(
    { 'nome': 'Mexerica' },
    { '$set': { 'nome': 'Laranja' }}
)

list(db.frutas.find({'nome': 'Laranja'}))

[{'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc6'),
  'nome': 'Laranja',
  'icone': 'üçä'}]

## 5.4 Excluir Documentos

In [29]:
db.frutas.delete_one({'nome': 'Abacaxi'})

<pymongo.results.DeleteResult at 0x12376fe0c80>

In [30]:
print(list(db.frutas.find())) # Pega todos os dados 
print(len(list(db.frutas.find()))) # Pega todos os dados 

[{'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc4'), 'nome': 'Banana', 'icone': 'üçå'}, {'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc5'), 'nome': 'Ma√ß√£', 'icone': 'üçé'}, {'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc6'), 'nome': 'Laranja', 'icone': 'üçä'}, {'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc8'), 'nome': 'Abacate', 'icone': 'ü•ë'}, {'_id': ObjectId('5fbef50b9cacbb1dcf5ddbc9'), 'nome': 'P√™ssego', 'icone': 'üçë'}, {'_id': ObjectId('5fbef50b9cacbb1dcf5ddbca'), 'nome': 'Melancia', 'icone': 'üçâ'}]
6


# EXERC√çCIOS

1. Conecte a ferramenta [MongoDB Compass](https://www.mongodb.com/products/compass) com o servi√ßo Atlas e importe o dataset da [Anatel MG (2006 - 2019)](https://raw.githubusercontent.com/profdiegoaugusto/analise-dados/master/Pandas/Exerc%C3%ADcios/Anatel/data/anatel_mg_2006_2019.csv). 

* O banco de dados dever√° chamar **anatel** e a cole√ß√£o dever√° chamar **minas**;
* O dicion√°rio de dados pode ser encontrado [aqui](https://github.com/profdiegoaugusto/analise-dados/blob/master/Pandas/Exerc%C3%ADcios/Anatel/data/Reclama%C3%A7%C3%B5es_Gloss%C3%A1rio_e_Metadados.pdf)

2. Usando a ferramenta [Anaconda](https://www.anaconda.com/products/individual) crie um Jupyter Notebook, configure o ambiente e importe a biblioteca `pymongo` para estabelecer a conex√£o com a plataforma Atlas.

In [32]:
client = pymongo.MongoClient("mongodb+srv://admin:admin@cluster0.s43rb.mongodb.net/<dbname>?retryWrites=true&w=majority")
client.list_database_names()
db = client.anatel

3. Quantos documentos possui a cole√ß√£o minas?

In [35]:
minas_docs = list(db.minas.find())
numero_docs_minas = len(minas_docs)
print(numero_docs_minas)

509706


4. Mostre os 5 primeiros documentos da cole√ß√£o.

In [36]:
list(db.minas.find().limit(5))

[{'_id': ObjectId('5fbef73180edc713d040ab38'),
  'DataExtracao': datetime.datetime(2016, 4, 28, 0, 0),
  'Ano': 2006,
  'Mes': 1,
  'CanalEntrada': 'Atendimento Pessoal ',
  'Condicao': 'Nova',
  'GrupoEconNorm': 'Anatel',
  'Tipo': 'Den√∫ncia',
  'Servico': 'Radiodifus√£o (R√°dio e TV)',
  'Modalidade': 'R√°dio FM',
  'Motivo': 'Interfer√™ncia',
  'UF': 'MG',
  'QtdeSolic': 3},
 {'_id': ObjectId('5fbef73180edc713d040ab39'),
  'DataExtracao': datetime.datetime(2016, 4, 28, 0, 0),
  'Ano': 2006,
  'Mes': 1,
  'CanalEntrada': 'Atendimento Pessoal ',
  'Condicao': 'Nova',
  'GrupoEconNorm': 'Anatel',
  'Tipo': 'Den√∫ncia',
  'Servico': 'Radiodifus√£o (R√°dio e TV)',
  'Modalidade': 'R√°dio FM',
  'Motivo': 'Outorga',
  'UF': 'MG',
  'QtdeSolic': 8},
 {'_id': ObjectId('5fbef73180edc713d040ab3a'),
  'DataExtracao': datetime.datetime(2016, 4, 28, 0, 0),
  'Ano': 2006,
  'Mes': 1,
  'CanalEntrada': 'Atendimento Pessoal ',
  'Condicao': 'Nova',
  'GrupoEconNorm': 'NET',
  'Tipo': 'Reclama√ß√£o

5. Selecione o documento que possui o maior n√∫mero de solicita√ß√µes `QtdeSolic` na Anatel.


In [38]:
db.minas.find_one(sort=[("QtdeSolic", -1)])

{'_id': ObjectId('5fbef74880edc713d042cb3e'),
 'DataExtracao': datetime.datetime(2016, 4, 19, 0, 0),
 'Ano': 2013,
 'Mes': 12,
 'CanalEntrada': 'Call Center',
 'Condicao': 'Nova',
 'GrupoEconNorm': 'OI',
 'Tipo': 'Reclama√ß√£o',
 'Servico': 'Servi√ßo Telef√¥nico Fixo Comutado - STFC',
 'Modalidade': 'Local',
 'Motivo': 'Reparo',
 'UF': 'MG',
 'QtdeSolic': 4164}

6. Qual √© o menor n√∫mero de solicita√ß√µes `QtdeSolic` na Anatel?

In [42]:
qtde_solicitacoes_min = db.minas.find_one(sort=[("QtdeSolic", 1)])
qtde_solicitacoes_min['QtdeSolic']

1

7. Mostre todos os documentos com o menor n√∫mero de solicita√ß√µes `QtdeSolic` na Anatel.

In [43]:
docs_qtde_solic_min = list(db.minas.find({ "QtdeSolic": qtde_solicitacoes_min }))
print(str(len(docs_qtde_solic_min)))

0


8. Mostre as contagens de solicita√ß√µes `QtdeSolic` por tipo de servi√ßo `Servico`, em ordem decrescente pelas contagens

In [44]:
pipeline = [
    { "$group": { "_id": "$Servico", "contagem": { "$sum": "$QtdeSolic"  } } },
    { "$sort": { "contagem": -1 }}
]

list(db.minas.aggregate(pipeline))

[{'_id': 'M√≥vel Pessoal', 'contagem': 1082677},
 {'_id': 'Celular P√≥s-Pago', 'contagem': 812191},
 {'_id': 'Servi√ßo Telef√¥nico Fixo Comutado - STFC', 'contagem': 532895},
 {'_id': 'Telefone Fixo', 'contagem': 514959},
 {'_id': 'TV por Assinatura', 'contagem': 394184},
 {'_id': 'Banda Larga Fixa', 'contagem': 349265},
 {'_id': 'Celular Pr√©-Pago', 'contagem': 307646},
 {'_id': 'Servi√ßo de Comunica√ß√£o Multim√≠dia', 'contagem': 254742},
 {'_id': 'Servi√ßos da Anatel', 'contagem': 46939},
 {'_id': 'Radiodifus√£o (R√°dio e TV)', 'contagem': 6493},
 {'_id': 'Outros', 'contagem': 2972},
 {'_id': 'R√°dio do Cidad√£o (PX)', 'contagem': 2963},
 {'_id': 'Servi√ßo de Rede e Transporte de Telecomunica√ß√µes - SRTT',
  'contagem': 2824},
 {'_id': 'Radioamador (PY)', 'contagem': 2810},
 {'_id': 'Troncalizado (Trunking)', 'contagem': 2286},
 {'_id': 'Limitado Privado', 'contagem': 1020},
 {'_id': 'Servi√ßo M√≥vel Aeron√°utico', 'contagem': 153},
 {'_id': 'Radiochamada (Paging)', 'contagem': 25}

9. Mostre todos os documentos com atributo `Tipo` igual a "Reclama√ß√£o".

In [45]:
reclamacoes = list(db.minas.find({ "Tipo": "Reclama√ß√£o"}))
len(reclamacoes)

['Den√∫ncia', 'Elogio', 'Pedido de Informa√ß√£o', 'Reclama√ß√£o', 'Sugest√£o']

10. Quais diferentes valores encontramos em Tipo?

In [46]:
db.minas.distinct("Tipo")

['Den√∫ncia', 'Elogio', 'Pedido de Informa√ß√£o', 'Reclama√ß√£o', 'Sugest√£o']