### Prof. Josenalde Oliveira@TADS-UFRN - Fundamentos e Técnicas em Ciências de Dados

#### CRUD em mongoDB: vamos aplicar os métodos básicos de inserção, atualização e remoção de documentos. Os métodos de atualização e remoção usualmente envolvem expressões de busca (find), portanto os exemplos abaixo procuram explorar as combinações de operadores de busca, para familiarização e referência básica de comandos para aplicação nos casos e problemas que venham a surgir. Usaremos a importação do arquivo CSV no mongoDB com os resultados da megasena para nossos exemplos.

#### Assumimos que o arquivo já encontra-se importado no mongoDB, no banco concursos, coleção megasena.

##### <span style="color:blue">1) vamos conectar ao mongodb server rodando localmente na máquina, acessar o banco concursos e a coleção megasena. Em seguida, vamos obter o número de documentos, com o método</span> <code>count()<code>

In [52]:
from pymongo import MongoClient

localConn = MongoClient('mongodb://127.0.0.1:27017')

# selecionar banco
db = localConn.concursos 
# acessar collection (equivalente a uma tabela no relacional), onde os documentos estão armazenados
tb = db.megasena # ou revisores = db['listingsAndReviews']

# obter quantidade de documentos (count() já está antigo, usar count_documents({}). Dentro das chaves é possível passar filtros)
# apenas {} retorna todos os documentos
print('Quantidade de documentos: ' + str(tb.count_documents({}))) # foi feito o typecast com str para concatenar no print

Quantidade de documentos: 2429


##### <span style="color:blue">2) uma descrição estatística geral sobre a coleção pode ser obtida com o método stats(), ![mongo](mongocrud1.png), executado a partir do shell (como Robo3T). Aqui, se usado apenas stats (sem os parênteses), retorna a informação abaixo</span>

In [18]:
db['megasena'].stats

Collection(Database(MongoClient(host=['127.0.0.1:27017'], document_class=dict, tz_aware=False, connect=True), 'concursos'), 'megasena.stats')

##### <span style="color:blue">3) Busca: para trazer apenas o primeiro registro, <code>find_one({})></code>; para trazer todos, apenas <code>find({})</code>. Existem algumas diferenças nos nomes de métodos, entre o uso no pymongo e o uso direto no shell. Por exemplo, find_one (pymongo) e findOne no shell ![](mongocrud2.png). No python, find_one e find retornam cursores, os quais devem ser atribuídos a listas para visualização e manipulação</span>

In [54]:
print('----- Apenas o primeiro, sem critérios de busca -----')
d1 = list(tb.find_one({}))
d1
print('----- trazendo todos, mostra por default os 20 primeiros -----')
dall = list(tb.find({}))
dall

----- Apenas o primeiro, sem critérios de busca -----
----- trazendo todos, mostra por default os 20 primeiros -----


[{'_id': ObjectId('602d3e5c6980848c48ba6e58'),
  '': '0',
  'Concurso': '1',
  'Local': 'Brasília, DF',
  'Data do Sorteio': '1996-03-11',
  'Coluna 1': '4',
  'Coluna 2': '5',
  'Coluna 3': '30',
  'Coluna 4': '33',
  'Coluna 5': '41',
  'Coluna 6': '52',
  'Ganhadores Faixa 1': '0',
  'Ganhadores Faixa 2': '17',
  'Ganhadores Faixa 3': '2016',
  'Rateio Faixa 1': '0',
  'Rateio Faixa 2': '39158.92',
  'Rateio Faixa 3': '330.21',
  'Cidade': '',
  'Unnamed: 16': '',
  'Valor Arrecadado': '0',
  'Estimativa para o próximo concurso': '0',
  'Valor Acumulado Próximo Concurso': '0',
  'Acumulado': 'SIM',
  'Sorteio Especial': 'SIM',
  'Observação': ''},
 {'_id': ObjectId('602d3e5c6980848c48ba6e59'),
  '': '1',
  'Concurso': '2',
  'Local': 'Belo Horizonte, MG',
  'Data do Sorteio': '1996-03-18',
  'Coluna 1': '9',
  'Coluna 2': '37',
  'Coluna 3': '39',
  'Coluna 4': '41',
  'Coluna 5': '43',
  'Coluna 6': '49',
  'Ganhadores Faixa 1': '1',
  'Ganhadores Faixa 2': '65',
  'Ganhadores Faix

##### <span style="color:blue">4) Ao find podem ser acrescentados os métodos skip, limit e sort. Skip pula os N primeiros documentos que atendem ao filtro; Limit controla a paginação do resultado; sort permite ordenar crescente (1) e decrescente (-1), de acordo com a chave passada. Vejam os exemplos</span>. 

In [55]:
# No shell, a sintaxe é .sort({'Data do Sorteio': -1})
data = list((tb.find({}).sort('Data do Sorteio', -1).limit(5))) # apenas 5 registros de retorno (limitando)
data

[{'_id': ObjectId('602d3e5d6980848c48ba77d3'),
  '': '2427',
  'Concurso': '2344',
  'Local': 'SÃO PAULO, SP',
  'Data do Sorteio': '2021-02-13',
  'Coluna 1': '11',
  'Coluna 2': '17',
  'Coluna 3': '25',
  'Coluna 4': '38',
  'Coluna 5': '52',
  'Coluna 6': '57',
  'Ganhadores Faixa 1': '0',
  'Ganhadores Faixa 2': '59',
  'Ganhadores Faixa 3': '4548',
  'Rateio Faixa 1': '0',
  'Rateio Faixa 2': '42795.9',
  'Rateio Faixa 3': '793.11',
  'Cidade': '',
  'Unnamed: 16': '',
  'Valor Arrecadado': '43793878.5',
  'Estimativa para o próximo concurso': '29000000',
  'Valor Acumulado Próximo Concurso': '7345762.6',
  'Acumulado': 'SIM',
  'Sorteio Especial': 'SIM',
  'Observação': ''},
 {'_id': ObjectId('602d3e5d6980848c48ba77d2'),
  '': '2426',
  'Concurso': '2343',
  'Local': 'SÃO PAULO, SP',
  'Data do Sorteio': '2021-02-10',
  'Coluna 1': '4',
  'Coluna 2': '31',
  'Coluna 3': '42',
  'Coluna 4': '45',
  'Coluna 5': '49',
  'Coluna 6': '56',
  'Ganhadores Faixa 1': '0',
  'Ganhadores F

##### <span style="color:blue">5) É importante notar que no .csv original não havia o campo _id, o qual é gerado e associado automaticamente a cada documento, sendo do tipo ObjectId: https://docs.mongodb.com/manual/reference/method/ObjectId/. Este não é um valor sequencial, mas seu algoritmo gerador considera o timestamp, o ID da máquina, o ID do processo e um contador local</span>

##### <span style="color:blue">6) Vamos agora ver várias possibilidades de filtragem (consulta). Estes operadores também são utilizados para buscar dados para atualização (update) e remoção (delete)</span>

In [78]:
# Busca direta por valor em chave
d1 = tb.find({'Concurso': '2340'})
d1 = list(d1)
d1

# Busca por dois ou mais critérios (E) - ao menos 1 ganhador da sena de 01.Jan.2015 até o último concurso em 13.02
d2 = tb.find({'Data do Sorteio': {'$gt': '2015-01-01'}, 'Ganhadores Faixa 1': {'$gt' : '0'}}) 
d2 = list(d2)
d2

# Se, neste resultado, quisermos mostrar apenas determinada chave, pode-se ao final colocar chave: 1 (ou 0), chave: true (ou false).
# Por exemplo, vamos mostrar apenas o local e não mostrar o _id, que sempre é mostrado por default
d2 = tb.find({'Data do Sorteio': {'$gt': '2015-01-01'}, 'Ganhadores Faixa 1': {'$gt' : '0'}}, {'Local': True, '_id': False}) 
d2 = list(d2)
d2

# procurar numa faixa com $in - número de ganhadores na faixa 2 entre 10 e 30

d2 = tb.find({'Ganhadores Faixa 2': {'$in' : ['10', '30']}}, {'Local': True, '_id': False, 'Ganhadores Faixa 2': True}) 
d2 = list(d2)
d2

# uso do ou, operador $or - retorna ganhadores que contenham no local SP ou RN (uso de Regex). Similar ao uso de LIKE em SQL
# A string .*<palavra> busca no campo Local textos que começam com qualquer coisa e possuem RN. 
# Para verificar se começa com RN, seria $regex: '^RN'

d2 = tb.find({'$or': [{'Local': {'$regex': '.*SP'}},{'Local': {'$regex': '.*RN'}}]})
d2 = list(d2)
d2

# inserir um único documento insert_one ou vários insert_many
import datetime
tb.insert_one(
{
"Concurso": 99998,
"Data Sorteio": datetime.datetime(2016,9,7), # ou "07-09-2016" como string
"1ª Dezena": 1,
"2ª Dezena": 2,
"3ª Dezena": 3,
"4ª Dezena": 4,
"5ª Dezena": 5,
"6ª Dezena": 6,
"Arrecadacao_Total":0,
"Ganhadores_Sena":0,
"Rateio_Sena":0,
"Ganhadores_Quina":1,
"Rateio_Quina":"88000",
"Ganhadores_Quadra":55,
"Rateio_Quadra":"76200",
"Acumulado":"NAO",
"Valor_Acumulado":0,
"Estimativa_Prêmio":0,
"Acumulado_Mega_da_Virada":0
})

<pymongo.results.InsertOneResult at 0x130e960e080>

Resultado da inserção: ![](mongocrud3.png)

##### <span style="color:blue">7) Atualização de dados - update_one, update_many e set</span>

In [93]:
# Deseja-se mudar para o documento do Concurso 99999 o Valor_Acumulado para 100.000,45. Pode-se passar a chave _id, como
# '_id': ObjectId('602d769575c3e5977478ba2c') e/ou criar um índice para agilizar as buscas

tb.create_index('Concurso')
tb.update_one({'Concurso': 99999}, {'$set': {'Valor_Acumulado': 100000.45}})

# Para alterar o valor de uma chave em todos os documentos, bastaria fazer
tb.update_many({}, {'$set': {'Acumulado_Mega_da_Virada': 100}})

# Com o upsert ao fim do update, caso o documento não exista é criado
tb.update_one({'Concurso': 100000}, {'$set': {'Ganhador': 'Josenalde'}}, True) #no shell seria upsert = 1

<pymongo.results.UpdateResult at 0x130e96a8340>

![](mongocrud4.png)

![](mongocrud5.png)

 ##### <span style="color:blue">8) Além de <code>set</code>, o update possui as opções $unset para remover chaves, $inc para auto incremento em uma unidade, ou no tamanho informado (size). </span>

In [96]:
tb.update_one({'Concurso': 100000}, {'$inc': {'Concurso': 1}}) # Concurso é incrementado em 1

<pymongo.results.UpdateResult at 0x130e95ea240>

##### <span style="color:blue">9)Ampliando conhecimentos: pesquise sobre as ações sobre chaves com valores vetorizados, pull, pop (remover primeiro ou último elemento) e push (adicionar elementos) para</span>

In [107]:
tb.insert_one({ "_id" : 1,
        "sem" : 1,
        "notas" : [
                70,
                87,
                90,
                90,
                65,
                81
        ]})

<pymongo.results.InsertOneResult at 0x130e96109c0>

In [101]:
tb.update_one( {'notas': 70 }, { '$pop': { 'notas' : 1 } } ) # primeiro elemento do array notas

<pymongo.results.UpdateResult at 0x130e96a8100>

In [102]:
d2 = list(tb.find({'_id': 1}, {'notas': True}))
d2

[{'_id': 1, 'notas': [70, 87, 90, 90, 65]}]

In [103]:
# Adicionando
tb.update_one({'notas': 70}, {'$push': {'notas': 81}})

<pymongo.results.UpdateResult at 0x130e9610e00>

In [104]:
d2 = list(tb.find({'_id': 1}, {'notas': True}))
d2

[{'_id': 1, 'notas': [70, 87, 90, 90, 65, 81]}]

##### <span style="color:blue">10) Enfim, comandos para apagar documentos seguem as mesmas regras de update, com os comandos <code>delete_one</code> e <code>delete_many</code>, ou seja, delete_one({filtro_busca}) - remove já está desatualizado</span>

In [106]:
tb.delete_one({'_id': 1})
d2 = list(tb.find({'_id': 1}, {'notas': True}))
d2

[]

##### <span style="color:blue">11) Para apagar uma coleção inteira, usa-se o método drop, algo como <code>tb.drop()</code> no exemplo em questão. Já a remoção de chaves é feito com <code>unset</code> dentro de um <code>update</code>. Exemplo, remover a chave 'sem' do documento de notas acima</span>

In [109]:
tb.update_one({'_id': 1}, {'$unset': {'sem': ''}})
d2 = list(tb.find({'_id': 1}))
d2

[{'_id': 1, 'notas': [70, 87, 90, 90, 65, 81]}]

##### <span style="color:blue">12) Este é o básico de CRUD no mongoDB. Outros comandos referem-se a agregações e agrupamentos de dados</span>