<a href="https://colab.research.google.com/github/valerio-unifei/ECAA07/blob/main/ECAA07_07_NoSQL_Basico.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# JSON

JSON é um acrônimo de JavaScript Object Notation, é um formato compacto, de padrão aberto independente, de troca de dados simples e rápida entre sistemas, especificado por Douglas Crockford em 2000.

Representa uma alternativa simplificada para o XML e adotado pela maioria dos sistemas de API para a troca de dados.

Vantagens do JSON sobre o XML:
- Não é uma linguagem de marcação. Não possui tags de abertura e de fechamento;
- Representa as informações de forma mais compacta;
- Não permite a execução de instruções de processamento, enquanto é possível em XML.

**Formato XML:**

```
<menu id="file" value="File">
  <popup>
    <menuitem value="New" onclick="CreateNewDoc()" />
    <menuitem value="Open" onclick="OpenDoc()" />
    <menuitem value="Close" onclick="CloseDoc()" />
  </popup>
</menu>
```

**Formato JSON:**

```
{"menu":{
    "id": "file",
    "value": "File",
    "popup":{
       "menuitem": [
       {"value": "New", "onclick": "CreateNewDoc()"},
       {"value": "Open", "onclick": "OpenDoc()"},
       {"value": "Close", "onclick": "CloseDoc()"}
      ]
    }
}}
```

Exemplo para troca de dados:

```
{"Alunos":[
     { "nome": "Edson Sales Arantes", "notas": [ 8, 9, 5 ]  },
     { "nome": "Luiz Livelli ", "notas": [ 8, 10, 7 ] },
     { "nome": "Caique Caicedo De Plata", "notas": [ 10, 10, 9 ] }
]}
```

In [None]:
# Exemplo de coleta de dados via Rest API com JSON
import requests
resposta = requests.get('https://api.covid19api.com/summary')
resposta.text

In [None]:
# Convertendo JSON para Dicionário em Python
import json
covid19 = json.loads(resposta.text)
for pais in covid19['Countries'][:10]:
  print(pais)

# Instalando o MongoDB no Ubuntu do Colab

O MongoDB é um banco de dados orientado a documentos que possui código aberto (open source) e foi projetado para armazenar uma grande escala de dados, além de permitir que se trabalhe de forma eficiente com grandes volumes.

Ele é categorizado no banco de dados NoSQL (not only SQL) pois o armazenamento e a recuperação de dados no MongoDB não são feitas no formato de tabelas.

https://www.mongodb.com/

In [None]:
!apt install mongodb >log
!service mongodb start

# Conectando no MongoDB



In [None]:
from pymongo import MongoClient

# conectando ao MongoDB Local
client = MongoClient()
#client = MongoClient(host='mongodb://localhost:27017')

# Listando os Bancos de Dados existentes
print('Bancos: ',client.list_database_names())

| SQL      | MongoDB    |
|----------|------------|
| database | database   |
| table    | collection |
| record   | object     |
| field    | -          |

## Criando Banco de Dados

In [None]:
db = client.get_database('ecaa07')

print('Só será criado quando conter objetos nas coleções:',db.name)
print('Bancos: ',client.list_database_names())

## Criando Coleção

In [None]:
col = db.get_collection('medidas')

print('Só será criado quando conter objetos:',col.name)

# Simulando a geração de medidas em IoT

In [None]:
import random
import string
import datetime

# proteção para inserção múltipla
inseridos = False

# semente para os geradores aleatórios
random.seed(int(input('Forneça sua matrícula: ')))

# lista de letras maiusculas e números
letras = string.ascii_uppercase + string.digits

# gerando dispositivos e sensores  com texto aleatório
dispositivos = []
for _ in range(random.randint(2,4)):
  # nome do dispositivo aleatório
  nome_dispositivo = ''.join(random.choice(letras) for i in range(7))
  # sensores do dispositivo
  sensores = []
  for _ in range(random.randint(4,10)):
      # nome do sensor aleatório
      nome_sensor = ''.join(random.choice(letras) for i in range(5))
      tipo = random.choice(['booleano','float','int','texto'])
      sensores.append({'sensor':nome_sensor,'tipo':tipo})
  #adiciondo dispositivo
  dispositivos.append({'dispositivo':nome_dispositivo,'sensores':sensores})
print(f'Dispositivos ({len(dispositivos)}):')
for d in dispositivos:
  print('   ',d)

# gerando instantes de medição
instantes = []
inicio = datetime.datetime(2022,random.randint(1,5),random.randint(1,28))
for i in range(random.randint(30000,40000)):
  inicio += datetime.timedelta(seconds=1)
  instantes.append(inicio)

# gerando medidas
medidas = []
for instante in instantes:
  for dispositivo in dispositivos:
    # gerando valores nos sensores
    valores = []
    for sensor in dispositivo['sensores']:
      if sensor['tipo'] == 'booleano':
        valores.append(random.choice([False,True]))
      elif sensor['tipo'] == 'float':
        valores.append(round(random.random()*200.0-100.0,2))
      elif sensor['tipo'] == 'int':
        valores.append(random.randint(-100,100))
      elif sensor['tipo'] == 'texto':
        valores.append(''.join(random.choice(letras) for i in range(3)))
    # inserindo medidas
    medida = {
        'dispositivo':dispositivo['dispositivo'],
        'instante':instante,
        }
    for s, v in zip(dispositivo['sensores'],valores):
      medida[s['sensor']] = v
    medidas.append(medida)
# medições obtidas
print(f'Medições ({len(medidas)}):')
for m in medidas[:10]:
  print('   ',m)

In [None]:
import json
with open('medidas.json', 'w') as file:
  json.dump(medidas, file, indent=3, sort_keys=True, default=str)

with open('medidas.json', 'r') as file:
  for _ in range(20):
    print(file.readline(),end='')

## Inserindo no MongoDB

In [None]:
if not inseridos:

  res = col.insert_many(medidas)
  print('Sucesso:',res.acknowledged,', inseridos:',len(res.inserted_ids))

  inseridos = True
else:
  print('Já foi inserido')

In [None]:
print('Bancos: ',client.list_database_names())
print('Banco:',db.name,'Coleções: ',db.list_collection_names())

# Consultas no MongoDB

https://www.mongodb.com/docs/manual/reference/sql-comparison/

In [None]:
%%time
# SELECT * FROM <col> WHERE dispositivo = '<nome>'
query = {'dispositivo': dispositivos[0]['dispositivo']}
print('Query:',query)

col.count_documents(query)

In [None]:
%%time
col.count_documents(query)

In [None]:
%%time
from datetime import datetime
# SELECT * FROM <col> WHERE instante >= '2022-01-01 00:08:01' and instante < '2022-02-01 00:09:01'
query = {'instante':
         {'$gte':datetime(2022,1,21,0,8,1),
          '$lt':datetime(2022,1,21,0,9,1)},
         }
print('Query:',query)

col.count_documents(query)

## Criando um Índice na Coleção

In [None]:
idx_dispositivo = col.create_index('dispositivo')
idx_dispositivo

In [None]:
col.drop_index(idx_dispositivo)

In [None]:
%%time
col.count_documents({'dispositivo':nome_dispositivo})

## Faixa de Valores

In [None]:
%%time
from datetime import datetime
# SELECT * FROM <col> WHERE instante >= '2022-01-01 00:08:01' and instante < '2022-02-01 00:09:01'
query = {'instante':
         {'$gte':datetime(2022,1,21,0,8,1),
          '$lt':datetime(2022,1,21,0,9,1)}}
print('Objetos:', col.count_documents(query))
for item in col.find(query):
  print(item)
  break

In [None]:
%%time
col.count_documents(query)

In [None]:
idx_instante = col.create_index('instante')
idx_instante

In [None]:
col.drop_index(idx_instante)

In [None]:
%%time
col.count_documents(query)

# Atividades

Obtenha a média das medidas do 2o dispositivo em um intervalo de 1 hora.

In [None]:
col.aggregate()

Crie um banco e uma coleção para armazenar os dados por país da COVID-19 pela Rest API do link:

https://api.covid19api.com/summary

In [None]:
import requests
import json
#consultando a RestAPI
resposta = requests.get('https://api.covid19api.com/summary')
# dicionario de dados da resposta json do RestAPI
covid19 = json.loads(resposta.text)
#criando o banco de dados
db = client.get_database('covid-19')
#criando coleção
col = db.get_collection('countries')
#inserindo dados dos paises
resp = col.insert_many(covid19['Countries'])
print('Sucesso:',resp.acknowledged,', inseridos:',len(resp.inserted_ids))
#consultando se foi inserido
for objeto in col.find():
  print(objeto)

In [None]:
col.delete_many({})