# Notebook responsável por apresentar os comandos básicos para manipulação de dados no mongo

## Crud com apenas vários documentos:
- Inserir vários documentos **compostos**
- Recuperar vários documentos **compostos**
- Atualizar vários documentos **compostos**
- Excluir vários documentos **compostos**

## Bibliotecas importantes

In [1]:
from pymongo import MongoClient
import pprint
import numpy as np
import pandas as pd

# para geração de dados fake
from faker import Faker


## Funções uteis

In [2]:
def criar_endereco():
    return {
        'logradouro':fake.street_name(),
        'numero':fake.building_number(),
        'bairro':fake.bairro(),
        'cidade':fake.city(),
        'uf':fake.administrative_unit(),
        'cep':fake.postcode(),
    }

In [3]:
def criar_pessoa():
    primeiro_nome = fake.first_name()
    ultimo_nome = fake.last_name()
    
    idade = np.random.randint(18, 50)
    
    pessoa = {
        'cpf': fake.cpf(),
        'nome': f'{primeiro_nome} {ultimo_nome}' ,
        'idade': idade ,
        'data_nascimento':fake.date()
    }        
    pessoa['email']= f'{primeiro_nome.lower()}.{ultimo_nome.lower()}@{fake.free_email_domain()}'
    
    pessoa['endereco'] = criar_endereco()

    pessoa['telefones'] = []
    n = np.random.randint(1, 4)
    for i in range(n):
        pessoa['telefones'].append(fake.msisdn())

    pessoa['formacoes'] = []
    n = np.random.randint(1, 4)
    for i in range(n):
        pessoa['formacoes'].append(fake.job())
        
        
    return pessoa

## Configurações

In [4]:
pp = pprint.PrettyPrinter(compact=True)
# gerando dados fictícios em português do Brasil
fake = Faker(['pt_BR'])

## Inserção de vários documentos

### Conectando ao MongoDB

In [5]:
client = MongoClient('localhost', 27017)
# Se a base de dados não existir, ela é criada automagicamente :-)
db = client['techshot_mongo03']

### Exemplo - Criação de vários documentos compostos

In [6]:
lista_pessoas = []

for i in range(10):
    lista_pessoas.append(criar_pessoa())
    
pp.pprint(lista_pessoas)

[{'cpf': '176.024.395-70',
  'data_nascimento': '1986-08-13',
  'email': 'joão lucas.sales@hotmail.com',
  'endereco': {'bairro': 'Vista Do Sol',
               'cep': '21577-854',
               'cidade': 'Silva da Praia',
               'logradouro': 'Parque de Fogaça',
               'numero': '21',
               'uf': 'Goiás'},
  'formacoes': ['Técnico em arquivo', 'Taxidermista/Embalsamador'],
  'idade': 49,
  'nome': 'João Lucas Sales',
  'telefones': ['5511901835782', '5584949013961']},
 {'cpf': '513.684.920-70',
  'data_nascimento': '1983-04-21',
  'email': 'luiz felipe.da luz@hotmail.com',
  'endereco': {'bairro': 'Olaria',
               'cep': '05285152',
               'cidade': 'Correia',
               'logradouro': 'Esplanada da Cunha',
               'numero': '55',
               'uf': 'Ceará'},
  'formacoes': ['Tenista', 'Tecelão', 'Skatista'],
  'idade': 20,
  'nome': 'Luiz Felipe da Luz',
  'telefones': ['5584913991479', '5561942130070', '5581906927755']},
 {'cpf':

In [7]:
df = pd.DataFrame.from_records(lista_pessoas)
df

Unnamed: 0,cpf,nome,idade,data_nascimento,email,endereco,telefones,formacoes
0,176.024.395-70,João Lucas Sales,49,1986-08-13,joão lucas.sales@hotmail.com,"{'logradouro': 'Parque de Fogaça', 'numero': '...","[5511901835782, 5584949013961]","[Técnico em arquivo, Taxidermista/Embalsamador]"
1,513.684.920-70,Luiz Felipe da Luz,20,1983-04-21,luiz felipe.da luz@hotmail.com,"{'logradouro': 'Esplanada da Cunha', 'numero':...","[5584913991479, 5561942130070, 5581906927755]","[Tenista, Tecelão, Skatista]"
2,013.654.792-34,Alícia da Costa,23,1984-07-05,alícia.da costa@uol.com.br,"{'logradouro': 'Estação de da Cunha', 'numero'...","[5561973881287, 5571933652592]",[Naturólogo]
3,745.698.013-66,Luna Campos,28,1971-12-22,luna.campos@bol.com.br,"{'logradouro': 'Quadra da Cunha', 'numero': '2...","[5561905585601, 5531987621713, 5521946282774]",[Jogador de bocha]
4,876.149.305-84,Ana Julia da Rosa,33,2011-06-17,ana julia.da rosa@gmail.com,"{'logradouro': 'Pátio Vitor Gabriel Souza', 'n...","[5521912780502, 5511939662775]","[Topógrafo, Juiz de direito]"
5,617.425.890-49,Ana Vitória Nascimento,26,1995-06-20,ana vitória.nascimento@gmail.com,"{'logradouro': 'Aeroporto Rebeca Mendes', 'num...","[5581977249321, 5561944518055, 5521997967469]","[Lapidário, Governador]"
6,209.647.831-69,Ana Fogaça,46,1976-10-11,ana.fogaça@uol.com.br,"{'logradouro': 'Passarela Luiz Miguel Santos',...",[5571929989472],"[Contábil, Caminhoneiro, Cartunista]"
7,271.439.605-43,Julia Gomes,33,1976-06-27,julia.gomes@gmail.com,"{'logradouro': 'Estrada Brenda Martins', 'nume...","[5561976414830, 5561965344078, 5521957083988]",[Lavador]
8,814.230.756-17,Valentina Ramos,34,1986-09-16,valentina.ramos@gmail.com,"{'logradouro': 'Lagoa Evelyn Melo', 'numero': ...",[5531919214441],[Profissional de relações internacionais]
9,406.178.953-84,Nicolas Lima,21,1994-12-08,nicolas.lima@uol.com.br,"{'logradouro': 'Área Caroline Fogaça', 'numero...","[5581924469851, 5511941385811]","[Paramédico, Ginasta rítmica, Lutador de kung fu]"


In [8]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 10 entries, 0 to 9
Data columns (total 8 columns):
 #   Column           Non-Null Count  Dtype 
---  ------           --------------  ----- 
 0   cpf              10 non-null     object
 1   nome             10 non-null     object
 2   idade            10 non-null     int64 
 3   data_nascimento  10 non-null     object
 4   email            10 non-null     object
 5   endereco         10 non-null     object
 6   telefones        10 non-null     object
 7   formacoes        10 non-null     object
dtypes: int64(1), object(7)
memory usage: 768.0+ bytes


### Inserindo os documentos no banco de dados

In [9]:
# se a coleção não existir, ela é criada automagicamente :-)
colecao_pessoa = db['pessoas']
pessoa_ids = colecao_pessoa.insert_many(lista_pessoas).inserted_ids
pessoa_ids

[ObjectId('6259cfe444b8840f46114bac'),
 ObjectId('6259cfe444b8840f46114bad'),
 ObjectId('6259cfe444b8840f46114bae'),
 ObjectId('6259cfe444b8840f46114baf'),
 ObjectId('6259cfe444b8840f46114bb0'),
 ObjectId('6259cfe444b8840f46114bb1'),
 ObjectId('6259cfe444b8840f46114bb2'),
 ObjectId('6259cfe444b8840f46114bb3'),
 ObjectId('6259cfe444b8840f46114bb4'),
 ObjectId('6259cfe444b8840f46114bb5')]

## Recuperando os documentos inseridos

#### Recuperar todos

In [12]:
for p in colecao_pessoa.find({}):
    pp.pprint(p)

{'_id': ObjectId('6259cfe444b8840f46114bac'),
 'cpf': '176.024.395-70',
 'data_nascimento': '1986-08-13',
 'email': 'joão lucas.sales@hotmail.com',
 'endereco': {'bairro': 'Vista Do Sol',
              'cep': '21577-854',
              'cidade': 'Silva da Praia',
              'logradouro': 'Parque de Fogaça',
              'numero': '21',
              'uf': 'Goiás'},
 'formacoes': ['Técnico em arquivo', 'Taxidermista/Embalsamador'],
 'idade': 49,
 'nome': 'João Lucas Sales',
 'telefones': ['5511901835782', '5584949013961']}
{'_id': ObjectId('6259cfe444b8840f46114bad'),
 'cpf': '513.684.920-70',
 'data_nascimento': '1983-04-21',
 'email': 'luiz felipe.da luz@hotmail.com',
 'endereco': {'bairro': 'Olaria',
              'cep': '05285152',
              'cidade': 'Correia',
              'logradouro': 'Esplanada da Cunha',
              'numero': '55',
              'uf': 'Ceará'},
 'formacoes': ['Tenista', 'Tecelão', 'Skatista'],
 'idade': 20,
 'nome': 'Luiz Felipe da Luz',
 'telefones

In [13]:
type(colecao_pessoa.find({}))

pymongo.cursor.Cursor

In [14]:
colecao_pessoa.find({}).explain()

{'explainVersion': '1',
 'queryPlanner': {'namespace': 'techshot_mongo03.pessoas',
  'indexFilterSet': False,
  'parsedQuery': {},
  'maxIndexedOrSolutionsReached': False,
  'maxIndexedAndSolutionsReached': False,
  'maxScansToExplodeReached': False,
  'winningPlan': {'stage': 'COLLSCAN', 'direction': 'forward'},
  'rejectedPlans': []},
 'executionStats': {'executionSuccess': True,
  'nReturned': 10,
  'executionTimeMillis': 2,
  'totalKeysExamined': 0,
  'totalDocsExamined': 10,
  'executionStages': {'stage': 'COLLSCAN',
   'nReturned': 10,
   'executionTimeMillisEstimate': 0,
   'works': 12,
   'advanced': 10,
   'needTime': 1,
   'needYield': 0,
   'saveState': 0,
   'restoreState': 0,
   'isEOF': 1,
   'direction': 'forward',
   'docsExamined': 10},
  'allPlansExecution': []},
 'command': {'find': 'pessoas', 'filter': {}, '$db': 'techshot_mongo03'},
 'serverInfo': {'host': '82358baa65b1',
  'port': 27017,
  'version': '5.0.7',
  'gitVersion': 'b977129dc70eed766cbee7e412d901ee213acb

#### Recuperando por algum outro atributo

In [17]:
df['idade'].mean()

31.3

In [18]:

criterio = {
    'idade': {'$gt':df['idade'].mean()}
}
pp.pprint(criterio)


{'idade': {'$gt': 31.3}}


In [19]:
p = colecao_pessoa.find_one(criterio)
pp.pprint(p)

{'_id': ObjectId('6259cfe444b8840f46114bac'),
 'cpf': '176.024.395-70',
 'data_nascimento': '1986-08-13',
 'email': 'joão lucas.sales@hotmail.com',
 'endereco': {'bairro': 'Vista Do Sol',
              'cep': '21577-854',
              'cidade': 'Silva da Praia',
              'logradouro': 'Parque de Fogaça',
              'numero': '21',
              'uf': 'Goiás'},
 'formacoes': ['Técnico em arquivo', 'Taxidermista/Embalsamador'],
 'idade': 49,
 'nome': 'João Lucas Sales',
 'telefones': ['5511901835782', '5584949013961']}


In [20]:
for p in colecao_pessoa.find(criterio):
    pp.pprint(p)

{'_id': ObjectId('6259cfe444b8840f46114bac'),
 'cpf': '176.024.395-70',
 'data_nascimento': '1986-08-13',
 'email': 'joão lucas.sales@hotmail.com',
 'endereco': {'bairro': 'Vista Do Sol',
              'cep': '21577-854',
              'cidade': 'Silva da Praia',
              'logradouro': 'Parque de Fogaça',
              'numero': '21',
              'uf': 'Goiás'},
 'formacoes': ['Técnico em arquivo', 'Taxidermista/Embalsamador'],
 'idade': 49,
 'nome': 'João Lucas Sales',
 'telefones': ['5511901835782', '5584949013961']}
{'_id': ObjectId('6259cfe444b8840f46114bb0'),
 'cpf': '876.149.305-84',
 'data_nascimento': '2011-06-17',
 'email': 'ana julia.da rosa@gmail.com',
 'endereco': {'bairro': 'Vila Do Pombal',
              'cep': '15655-579',
              'cidade': 'da Luz de da Mota',
              'logradouro': 'Pátio Vitor Gabriel Souza',
              'numero': '11',
              'uf': 'São Paulo'},
 'formacoes': ['Topógrafo', 'Juiz de direito'],
 'idade': 33,
 'nome': 'Ana Jul

#### Recuperando por algum outro atributo

In [23]:
df.loc[5, 'endereco']['cidade']

'Rocha'

In [24]:
criterio = {
    'endereco.cidade': {'$eq':df.loc[5, 'endereco']['cidade']}
}
pp.pprint(criterio)


{'endereco.cidade': {'$eq': 'Rocha'}}


In [26]:
for p in colecao_pessoa.find(criterio):
    pp.pprint(p)

{'_id': ObjectId('6259cfe444b8840f46114bb1'),
 'cpf': '617.425.890-49',
 'data_nascimento': '1995-06-20',
 'email': 'ana vitória.nascimento@gmail.com',
 'endereco': {'bairro': 'Paquetá',
              'cep': '89209-204',
              'cidade': 'Rocha',
              'logradouro': 'Aeroporto Rebeca Mendes',
              'numero': '3',
              'uf': 'Acre'},
 'formacoes': ['Lapidário', 'Governador'],
 'idade': 26,
 'nome': 'Ana Vitória Nascimento',
 'telefones': ['5581977249321', '5561944518055', '5521997967469']}


## Atualizar o documento

In [30]:
df.loc[3, 'cpf']

'745.698.013-66'

In [31]:
criterio = {
    "cpf":df.loc[3, 'cpf']}

novo_valor = {
    "$set": { "endereco.bairro": "Pampulha" }
}
pp.pprint(novo_valor)


{'$set': {'endereco.bairro': 'Pampulha'}}


In [32]:
r = colecao_pessoa.update_many(criterio, novo_valor)
r

<pymongo.results.UpdateResult at 0x7f110346ac40>

In [33]:
# ref.: https://pymongo.readthedocs.io/en/stable/api/pymongo/results.html
r.matched_count

1

In [34]:
r.modified_count

1

In [35]:
r.raw_result

{'n': 1, 'nModified': 1, 'ok': 1.0, 'updatedExisting': True}

In [36]:
r.upserted_id

In [37]:
p = colecao_pessoa.find_one(criterio)
pp.pprint(p)

{'_id': ObjectId('6259cfe444b8840f46114baf'),
 'cpf': '745.698.013-66',
 'data_nascimento': '1971-12-22',
 'email': 'luna.campos@bol.com.br',
 'endereco': {'bairro': 'Pampulha',
              'cep': '63826-319',
              'cidade': 'Nascimento',
              'logradouro': 'Quadra da Cunha',
              'numero': '240',
              'uf': 'Alagoas'},
 'formacoes': ['Jogador de bocha'],
 'idade': 28,
 'nome': 'Luna Campos',
 'telefones': ['5561905585601', '5531987621713', '5521946282774']}


## Remover o documento

In [None]:
criterio = {
    "_id":pessoa_id}
pp.pprint(criterio)

In [None]:
r = colecao_pessoa.delete_one(criterio)

In [None]:
r.raw_result

In [None]:
p = colecao_pessoa.find_one({"_id":pessoa_id})
pp.pprint(p)