<a href="https://colab.research.google.com/github/valerio-unifei/ECAA07/blob/main/ECAA07_07_NoSQL_Basico.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Introdução ao MongoDB e Bancos de Dados NoSQL

Nos últimos anos, o mundo da tecnologia testemunhou uma explosão de dados, impulsionada por aplicativos da web, dispositivos móveis, sensores e muitas outras fontes de informação. Com esse crescimento exponencial, os bancos de dados tradicionais baseados em SQL (Structured Query Language) enfrentaram desafios significativos em termos de escalabilidade e flexibilidade para lidar com diversos tipos de dados e volumes massivos.

É nesse cenário que os bancos de dados NoSQL (Not Only SQL) ganharam destaque como uma alternativa inovadora. Os bancos de dados NoSQL são sistemas de gerenciamento de banco de dados projetados para superar as limitações dos bancos de dados SQL tradicionais. Eles se destacam pela sua capacidade de armazenar, recuperar e manipular dados não estruturados ou semiestruturados, como documentos, gráficos, colunas ou dados de chave-valor, de maneira eficiente.

O MongoDB é um dos bancos de dados NoSQL mais populares e amplamente adotados. Ele se destaca por seu modelo de dados baseado em documentos, o que significa que os dados são armazenados em documentos BSON (Binary JSON), que podem variar em estrutura e conteúdo. Isso proporciona uma flexibilidade significativa para desenvolvedores e permite que o MongoDB lide com dados heterogêneos de maneira eficaz.

O MongoDB também é altamente escalável e oferece suporte a clusters distribuídos, tornando-o adequado para aplicativos que precisam crescer horizontalmente à medida que a demanda aumenta. Além disso, ele é altamente tolerante a falhas, garantindo a disponibilidade contínua dos dados mesmo em situações de problemas de hardware ou rede.

1. **Modelo de Dados**:
   - MongoDB: Utiliza um modelo de dados baseado em documentos BSON (Binary JSON). Os dados são armazenados em coleções, onde cada documento pode ter uma estrutura diferente.
   - SQL Relacional: Utiliza um modelo de dados tabular, com tabelas que têm esquemas fixos e relações definidas.

2. **Esquema**:
   - MongoDB: Não requer um esquema rígido; os documentos podem ser adicionados ou removidos sem a necessidade de modificar um esquema central.
   - SQL Relacional: Exige um esquema definido com antecedência, e qualquer modificação no esquema geralmente requer alterações nas tabelas existentes.

3. **Consultas**:
   - MongoDB: Suporta consultas flexíveis e poderosas usando sua linguagem de consulta, como consulta por chave, consulta por intervalo, pesquisa de texto completo e agregações.
   - SQL Relacional: Usa SQL para consultas, o que permite consultas complexas, junções e agregações de dados.

4. **Escalabilidade**:
   - MongoDB: Escala horizontalmente facilmente, distribuindo dados em vários servidores ou nós (sharding) e oferece alta disponibilidade.
   - SQL Relacional: Escalar horizontalmente pode ser complexo e geralmente envolve replicação de bancos de dados, o que pode não ser tão simples quanto o sharding do MongoDB.

5. **Desempenho**:
   - MongoDB: Oferece desempenho excelente para cargas de trabalho de leitura intensiva e é especialmente adequado para aplicativos que precisam de baixa latência de leitura.
   - SQL Relacional: Pode ser mais eficiente para cargas de trabalho de consulta complexa e análises, especialmente quando os relacionamentos são bem definidos.

6. **Consistência**:
   - MongoDB: Fornece consistência eventual por padrão, mas permite configurar níveis de consistência mais fortes conforme necessário.
   - SQL Relacional: Geralmente segue um modelo de consistência forte e transações ACID (Atomicidade, Consistência, Isolamento e Durabilidade) por padrão.

7. **Uso Adequado**:
   - MongoDB: É uma escolha sólida para aplicativos que têm requisitos de flexibilidade de esquema, grande volume de gravações e leituras, ou quando é necessário escalabilidade horizontal.
   - SQL Relacional: É preferível para aplicativos com esquemas bem definidos, transações complexas e requisitos de integridade de dados estritos.

8. **Complexidade de Desenvolvimento**:
   - MongoDB: Pode simplificar o desenvolvimento em casos onde a estrutura de dados é dinâmica ou semiestruturada.
   - SQL Relacional: Pode ser mais complexo devido à necessidade de definir e manter esquemas rígidos.

A escolha entre MongoDB e um banco de dados relacional SQL depende das necessidades específicas do seu aplicativo. Muitas vezes, uma abordagem híbrida, usando ambos de acordo com os requisitos, é adotada para obter o melhor de ambos os mundos. É importante considerar fatores como flexibilidade, escalabilidade, complexidade e desempenho ao decidir qual tecnologia de banco de dados usar.

## JSON

JSON (JavaScript Object Notation) é um formato de dados leve e independente de linguagem de programação que é fácil de ler e escrever. Ele foi projetado originalmente para ser usado com JavaScript, mas é amplamente adotado como um formato de intercâmbio de dados em muitas linguagens de programação e é usado para representar estruturas de dados simples e complexas.

As características chave do JSON são as seguintes:

1. **Sintaxe Simples**: O JSON usa uma sintaxe simples que consiste em pares chave-valor. Os pares chave-valor são separados por dois pontos (`:`) e os pares são separados por vírgulas.

2. **Tipos de Dados Suportados**: O JSON suporta tipos de dados comuns, como números, strings, booleanos, objetos, arrays e valores nulos. Isso permite que você represente dados estruturados de forma eficaz.

3. **Legibilidade**: Os dados em formato JSON são fáceis de ler e escrever para humanos. A sintaxe é intuitiva e não requer uma análise complexa.

Aqui está um exemplo simples de um objeto JSON:

```json
{
  "nome": "João",
  "idade": 30,
  "cidade": "São Paulo",
  "hobbies": ["futebol", "leitura", "viagem"]
}
```

Neste exemplo, temos um objeto JSON com pares chave-valor, onde as chaves são strings e os valores podem ser números, strings, arrays ou outros objetos JSON.

O JSON é amplamente utilizado na comunicação entre aplicativos cliente e servidor, na configuração de arquivos de configuração, na representação de dados em APIs da web e em muitos outros cenários onde a simplicidade e a interoperabilidade entre diferentes linguagens de programação são importantes. Além disso, muitos bancos de dados NoSQL, como o MongoDB mencionado anteriormente, usam o formato JSON para armazenar e consultar dados.

Especificado por Douglas Crockford em 2000, representa uma alternativa simplificada para o XML e adotado pela maioria dos sistemas de API para a troca de dados.

Vantagens do JSON sobre o XML:
- Não é uma linguagem de marcação. Não possui tags de abertura e de fechamento;
- Representa as informações de forma mais compacta;
- Não permite a execução de instruções de processamento, enquanto é possível em XML.

**Formato XML:**

```
<menu id="file" value="File">
  <popup>
    <menuitem value="New" onclick="CreateNewDoc()" />
    <menuitem value="Open" onclick="OpenDoc()" />
    <menuitem value="Close" onclick="CloseDoc()" />
  </popup>
</menu>
```

**Formato JSON:**

```
{"menu":{
    "id": "file",
    "value": "File",
    "popup":{
       "menuitem": [
       {"value": "New", "onclick": "CreateNewDoc()"},
       {"value": "Open", "onclick": "OpenDoc()"},
       {"value": "Close", "onclick": "CloseDoc()"}
      ]
    }
}}
```

Exemplo para troca de dados:

```
{"Alunos":[
     { "nome": "Edson Sales Arantes", "notas": [ 8, 9, 5 ]  },
     { "nome": "Luiz Livelli ", "notas": [ 8, 10, 7 ] },
     { "nome": "Caique Caicedo De Plata", "notas": [ 10, 10, 9 ] }
]}
```

### Exemplo de Uso do JSON

Obtendo dados da Restful API do site: https://open-meteo.com/

In [None]:
# Exemplo de coleta de dados via Rest API com JSON
import requests
itajuba = (-22.4256,-45.4528)
api_url = f'https://api.open-meteo.com/v1/forecast?latitude={itajuba[0]}&longitude={itajuba[1]}&hourly=temperature_2m,relativehumidity_2m,dewpoint_2m,rain,visibility,windspeed_10m'
resposta = requests.get(api_url)
tempo = resposta.json()
for chave in tempo.keys():
  print(chave, ':',tempo[chave])

Convertendo dicionário de dados em DataFrame para exibição

In [None]:
import pandas as pd
df = pd.DataFrame(tempo['hourly'],columns=tempo['hourly_units'])
df

Convertendo tempo em string para data-hora e mudando indice da tabela para tempo:

In [None]:
df['time'] = pd.to_datetime(df['time'])
df = df.reset_index()
df = df.set_index('time')
df

# Criando um Servidor MongoDB GratuIto

O MongoDB é um banco de dados orientado a documentos que possui código aberto (open source) e foi projetado para armazenar uma grande escala de dados, além de permitir que se trabalhe de forma eficiente com grandes volumes.

Ele é categorizado no banco de dados NoSQL (not only SQL) pois o armazenamento e a recuperação de dados no MongoDB não são feitas no formato de tabelas.

Comparação entre SQL e Não-SQL:

| SQL      | MongoDB    |
|----------|------------|
| database | database   |
| table    | collection |
| record   | object     |
| field    | -          |


Acesse o site abaixo e registre usando sua conta UNIFEI: </BR>
https://www.mongodb.com/pt-br/cloud/atlas/register

No Dashboard da plataforma selecione: </BR></br>
**[Build a Database]**</BR>
Selecione: **M0 Free**</BR>
Provider: **AWS**</BR>
Region: **Sao Paulo (sa-east-1)**</BR>
Name: **ECAA07**</BR>
**[CREATE]**</BR></br>
**[Username and Password]**</BR>
Username: (user)</BR>
Password: (pass) *ANOTE A SENHA!!!*</BR>
**[Create User]**</br></br>
**My Local Environment**</br>
IP Access: **0.0.0.0/0**</br>
Description: **Qualquer IP**</br>
**[Finish and Close]**</br>


# Conectando no MongoDB



In [None]:
!pip install pymongo

Para obter o texto de conexão (*conection string*), vá em:

**ECAA07 [Connect]**

**[Drivers]**

Driver: Python Version: 3.12 or later

Copie o código no item: **3. Add your connection string into your application code**

In [None]:
from pymongo import MongoClient
user = "ecaa07_user" # @param {type:"string"}
pswd = "7eauzsnv5PLv9bVY" # @param {type:"string"}
connectionString = f'mongodb+srv://{user}:{pswd}@ecaa07.0fiuvmd.mongodb.net/?retryWrites=true&w=majority'
client = MongoClient(connectionString)
# Listando os Bancos de Dados existentes
print('Bancos Existentes:')
for dbname in client.list_database_names():
  print(' >',dbname)

## Criando Estrutura de Dados Completa

1. Banco de Dados
2. Coleção
3. Objetos

In [None]:
import random
from datetime import datetime as dt, timedelta as td
objetos = []
ini = dt(2022,1,21,0,0,0)
for i in range(20_000):
  ini += td(seconds=1)
  objetos.append({'instante':ini,'dispositivo':'esp32','voltage':(random.random()-0.5)*20. + 220.})
  objetos.append({'instante':ini,'dispositivo':'rasp-4','current':(random.random()-0.5)*20.})
  objetos.append({'instante':ini,'dispositivo':'stm32','lumens':random.random()*100.})
  objetos.append({'instante':ini,'dispositivo':'esp8266','temp':random.random()*30.,'humidity':random.random()*100.})

# criando/abrindo banco de dados
db = client.get_database('Aula07')

# apagando se existe
if db.list_collection_names()[0] == 'medidas': db.drop_collection('medidas')

# criando coleção
col = db.get_collection('medidas')

# inserindo objetos
res = col.insert_many(objetos)

print('Sucesso:',res.acknowledged,', inseridos:',len(res.inserted_ids))

# Consultas no MongoDB

https://www.mongodb.com/docs/manual/reference/sql-comparison/

In [None]:
%%time
# SELECT * FROM <col> WHERE dispositivo = '<nome>'
query = {'dispositivo':'esp32'}
print('Query:',query)

col.count_documents(query)

In [None]:
%%time
col.count_documents(query)

In [None]:
%%time
from datetime import datetime
# SELECT * FROM <col> WHERE instante >= '2022-01-01 00:08:01' and instante < '2022-02-01 00:09:01'
query = {'instante':
         {'$gte':datetime(2022,1,21,0,8,1),
          '$lt':datetime(2022,1,21,0,9,1)},
         }
print('Query:',query)

col.count_documents(query)

## Criando um Índice na Coleção

In [None]:
idx_dispositivo = col.create_index('dispositivo')
idx_dispositivo

In [None]:
col.drop_index(idx_dispositivo)

In [None]:
%%time
col.count_documents({'dispositivo':'rasp-4'})

## Faixa de Valores

In [None]:
%%time
from datetime import datetime
# SELECT * FROM <col> WHERE instante >= '2022-01-01 00:08:01' and instante < '2022-02-01 00:09:01'
query = {'instante':
         {'$gte':datetime(2022,1,21,0,8,1),
          '$lt':datetime(2022,1,21,0,9,1)}}
print('Objetos:', col.count_documents(query))
for item in col.find(query):
  print(item)
  break

In [None]:
%%time
col.count_documents(query)

In [None]:
idx_instante = col.create_index('instante')
idx_instante

In [None]:
col.drop_index(idx_instante)

In [None]:
%%time
col.count_documents(query)

# Atividades

## Atividade 1
Obtenha a média das medidas do 2o dispositivo em um intervalo de 1 hora.

In [None]:
col.aggregate()

## Atividade 2
Crie um banco de dados no MongoDB para armazenar as leituras obtidas desta Restful API.

In [None]:
# Exemplo de coleta de dados via Rest API com JSON
import requests
itajuba = (-22.4256,-45.4528)
medidas = 'temperature_2m,relativehumidity_2m,dewpoint_2m,rain,visibility,windspeed_10m'
api_url = f'https://api.open-meteo.com/v1/forecast?latitude={itajuba[0]}&longitude={itajuba[1]}&hourly={medidas}'
resposta = requests.get(api_url)
tempo = resposta.json()
for chave in tempo.keys():
  print(chave, ':',tempo[chave])