<span style="color: green; font-size: 40px; font-weight: bold;">Projeto 1 (Análise de Dados em Tempo Real) </span>

<br> <br>

# Análise de Dados de Sensores IoT (Internet das Coisas) em Tempo Real com Apache Spark Streaming e Apache Kafka

<br>

### Contexto

Uma determinada indústria de materiais esportivos tem diversos equipamentos no parque industrial da empresa usados para produção e que funcionam 24/7.

Cada equipamento tem um sensor que mede a temperatura em intervalos regulares. Os equipamentos que excedem uma determinada temperatura média por muito tempo, podem ter a vida útil reduzida, gerando custos adicionais de manutenção ou troca do equipamento.

O departamento de operações gostaria de ter uma **solução de análise de dados em tempo real que calculasse a média de temperatura de cada equipamento a partir da leitura dos dados emitidos pelos sensores IoT em intervalos regulares**. Isso ajudaria no monitoramento da operação e ainda permitiria criar um histórico de uso dos equipamentos.

Além de construir a solução com Spark e Kafka, vamos desenvolver um simulador para gerar dados de sensores IoT.

<br>

### Objetivo

O objetivo deste projeto é **demonstrar como configurar e executar uma pipeline de dados em tempo real que coleta, processa e analisa dados de sensores IoT utilizando Apache Kafka e Apache Spark Structured Streaming**. A análise se concentra em calcular a média das temperaturas reportadas por diferentes sensores em tempo real, permitindo monitorar e responder a condições específicas conforme os dados são gerados.

<br>

### Pergunta de Negócio Principal

> A principal pergunta de negócio que este projeto visa responder é: "**Qual é a temperatura média registrada por cada sensor IoT em tempo real, e como podemos monitorar e responder a temperaturas que excedem um determinado limiar?**"

<br>

### Entregável

O entregável deste projeto é uma aplicação de streaming em tempo real que:

- Coleta dados de sensores IoT em tempo real usando Apache Kafka.
- Processa e analisa esses dados em tempo real usando Apache Spark Structured Streaming.
- Calcula e exibe a média de temperatura por sensor.
- Permite a consulta em tempo real dos sensores que reportam temperaturas acima de um certo limite (por exemplo, acima de 65 graus Celsius).

<br>

### Sobre a Fonte de Dados

Os dados utilizados no projeto são gerados por sensores IoT que monitoram a temperatura (pequenos sensores em maquinas industrias que medem a temperatura das máquinas em tempos regulares). Cada entrada de dados inclui:

- **id_sensor**: Identificador único do sensor.
- **id_equipamento**: Identificador único do equipamento ao qual o sensor está conectado.
- **sensor**: Nome ou tipo do sensor.
- **data_evento**: Timestamp do evento de leitura.
- **padrao**: Objeto que encapsula as leituras do sensor, neste caso, a temperatura.

#### Exemplo de Entrada de Dados (json):

<br>

```
{
  "id_sensor": "S-DSA-MP6-CAP15-02468-374DM",
  "id_equipamento": "E-DSA-MP6-CAP15-13579-374DM",
  "sensor": "sensor25",
  "data_evento": "2022-11-05T15:22:16.968007Z",
  "padrao": {
    "formato": "iot:leitura:sensor:temp",
    "leitura": {
      "temperatura": 42.0
    }
  }
}

```

Cada leitura de temperatura é capturada em um formato JSON e enviada para o tópico Kafka, que é então consumido pelo Spark Structured Streaming para análise em tempo real.

#### Como simular isso?

Precisamos encontrar uma forma de simular a geração de dados em tempo real a partires de sensores IoT. Para isso será necessário a **construção de um simulador usando a linguagem python para gerar dados de sensores IoT**.

No dia a dia, bastaria solicitar os dados ao responsável pelas máquinas os arquivos gerados pelos sensores IoT.

<br><br>

## Considerações Finais

Este mini-projeto demonstra como é possível utilizar ferramentas modernas de big data para implementar soluções de análise em tempo real. A combinação de Apache Kafka e Apache Spark Structured Streaming oferece uma solução robusta e escalável para lidar com fluxos de dados contínuos, como os gerados por dispositivos IoT. Através desta pipeline, é possível monitorar, analisar e reagir aos dados à medida que são gerados, fornecendo insights imediatos e acionáveis para o negócio.

<br><br><br>


# Instruções para executar o projeto.

<br>

### Etapa 1 - Simulador IoT

1. Abra o terminal ou prompt de comando e acesse a pasta do projeto e vá para a pasta `simulador_iot` que contém o script `simulador.py`. Esta pasta é onde o simulador IoT está localizado, e esse script foi desenvolvido para gerar leituras simuladas de sensores IoT.

> **O que o script faz:** O script `simulador.py` gera dados simulados de sensores de temperatura em formato JSON. Ele atribui valores de temperatura a sensores fictícios e os salva em um arquivo de saída. Esses dados são então usados no restante do projeto para simular um fluxo de dados IoT em tempo real.

2. Execute o comando abaixo para gerar um arquivo com 10.000 leituras de sensores IoT (você pode ajustar o número de registros conforme desejar).

   `python simulador.py 10000 > ../dados/dados_sensores.txt`

### Etapa 2 - Apache Kafka

**O que é o Apache Kafka:** 

O Apache Kafka é uma plataforma de streaming distribuída que permite publicar, subscrever, armazenar e processar fluxos de registros em tempo real. Neste projeto, o Kafka atua como uma ponte entre a fonte de dados (sensores IoT) e o Spark Streaming, permitindo que os dados de sensores sejam capturados e transmitidos para processamento em tempo real.

<br><br>

- 1. Acesse a página do Kafka e faça o download da versão usada no curso conforme mostrado na aula em vídeo.

<br>

- 2. Descompacte o arquivo do Kafka dentro da pasta do Mini-Projeto 6.

> **Nota:** As instruções abaixo são para MacOS e Linux. Para Windows as instruções estão no manual em pdf no Capítulo 15 do curso.
   
<br>

- 3. Abra o **terminal 1**, navegue até a pasta do Kafka (`kafka_2.13-3.3.1`) e execute o comando abaixo para inicializar o Zookeepper (gerenciador de cluster do Kafka):

   `bin/zookeeper-server-start.sh config/zookeeper.properties`

<br>

- 4. Abra o **terminal 2**, navegue até a pasta do Kafka (`kafka_2.13-3.3.1`) e execute o comando abaixo para inicializar o Kafka:

   `bin/kafka-server-start.sh config/server.properties`

<br>

- 5. Abra o **terminal 3**, navegue até a pasta do Kafka (`kafka_2.13-3.3.1`) e execute o comando abaixo para criar um tópico no Kafka:

   `bin/kafka-topics.sh --create --topic dsamp6 --bootstrap-server localhost:9092`

<br>

- 6. No mesmo **terminal 3**, execute o comando abaixo para descrever o tópico:

   `bin/kafka-topics.sh --describe --topic dsamp6 --bootstrap-server localhost:9092`

<br>

- 7. No mesmo **terminal 3**, execute o comando abaixo para produzir o streaming de dados no Kafka (como um produtor de streaming):

   `bin/kafka-console-producer.sh --bootstrap-server localhost:9092 --topic dsamp6 < ../dados/dados_sensores.txt`

<br>

- 8. No mesmo **terminal 3**, execute o comando abaixo para listar o conteúdo do tópico (como um consumidor de streaming):

   `bin/kafka-console-consumer.sh --topic dsamp6 --from-beginning --bootstrap-server localhost:9092`

<br>

- 9. Pressione `Ctrl+C` a qualquer momento para interromper qualquer uma das janelas. Mantenha todas elas abertas enquanto executa a Etapa 3 do projeto.

<br>

### Etapa 3 - Apache Spark

1. Execute o Jupyter Notebook do projeto e execute célula a célula.

<br><br><br><br>

# Importando Pacotes e Configurando Ambiente

<br>

#### Importanto Pacotes

In [1]:
# Importa o findspark e inicializa
import findspark
findspark.init()

# Import required modules
import pyspark
from pyspark.streaming import StreamingContext
from pyspark.sql import SparkSession
from pyspark.sql.types import StructType, StructField, StringType, DoubleType
from pyspark.sql.functions import col, from_json

In [2]:
# Versões dos pacotes usados neste jupyter notebook
%reload_ext watermark
%watermark -a "Data Science Academy" --iversions

Author: Data Science Academy

findspark: 2.0.1
pyspark  : 3.5.1



####  Conector de integração do Spark Streaming com o Apache Kafka
https://spark.apache.org/docs/latest/structured-streaming-kafka-integration.html

In [3]:
# Conector
import os
os.environ['PYSPARK_SUBMIT_ARGS'] = '--packages org.apache.spark:spark-sql-kafka-0-10_2.12:3.3.0 pyspark-shell'

<br>

#### Criando a Sessão Spark

In [4]:
# Cria a sessão Spark
spark = SparkSession.builder.appName("Mini-Projeto6").getOrCreate()

24/08/21 18:14:23 WARN Utils: Your hostname, eduardo-Inspiron-15-3520 resolves to a loopback address: 127.0.1.1; using 192.168.0.13 instead (on interface wlp0s20f3)
24/08/21 18:14:23 WARN Utils: Set SPARK_LOCAL_IP if you need to bind to another address


:: loading settings :: url = jar:file:/home/eduardo/anaconda3/lib/python3.9/site-packages/pyspark/jars/ivy-2.5.1.jar!/org/apache/ivy/core/settings/ivysettings.xml


Ivy Default Cache set to: /home/eduardo/.ivy2/cache
The jars for the packages stored in: /home/eduardo/.ivy2/jars
org.apache.spark#spark-sql-kafka-0-10_2.12 added as a dependency
:: resolving dependencies :: org.apache.spark#spark-submit-parent-304040fe-06c8-45d0-91f6-d144d3f32c51;1.0
	confs: [default]
	found org.apache.spark#spark-sql-kafka-0-10_2.12;3.3.0 in central
	found org.apache.spark#spark-token-provider-kafka-0-10_2.12;3.3.0 in central
	found org.apache.kafka#kafka-clients;2.8.1 in central
	found org.lz4#lz4-java;1.8.0 in central
	found org.xerial.snappy#snappy-java;1.1.8.4 in central
	found org.slf4j#slf4j-api;1.7.32 in central
	found org.apache.hadoop#hadoop-client-runtime;3.3.2 in central
	found org.spark-project.spark#unused;1.0.0 in central
	found org.apache.hadoop#hadoop-client-api;3.3.2 in central
	found commons-logging#commons-logging;1.1.3 in central
	found com.google.code.findbugs#jsr305;3.0.0 in central
	found org.apache.commons#commons-pool2;2.11.1 in central
:: re

<br>

### Resumo

Neste trecho de código, foram realizadas as seguintes etapas essenciais para preparar o ambiente e garantir a integração entre Apache Spark e Apache Kafka para processamento de dados em tempo real:

<br>


1. **Inicialização do Ambiente Spark**:
   - **findspark**: O pacote `findspark` foi importado e inicializado. Isso é necessário para que o ambiente Spark seja corretamente configurado e reconhecido dentro do Jupyter Notebook ou qualquer outro ambiente Python.
   - **Importação de Pacotes**: Foram importados pacotes essenciais do PySpark, incluindo `StreamingContext` (para manipulação de streaming), `SparkSession` (para criação de sessões Spark), e classes relacionadas ao esquema de dados (`StructType`, `StructField`, `StringType`, `DoubleType`). Funções auxiliares como `col` e `from_json` foram importadas para manipulação de DataFrames.

<br>

2. **Verificação de Versões**:
   - O módulo `watermark` foi utilizado para exibir as versões dos pacotes instalados, assegurando que as versões compatíveis de `pyspark` e `findspark` estão em uso.

<br>

3. **Integração com Apache Kafka**:
   - **Conector Spark-Kafka**: Foi configurado o conector de integração entre Spark Streaming e Apache Kafka. A variável de ambiente `PYSPARK_SUBMIT_ARGS` foi ajustada para incluir o pacote `spark-sql-kafka-0-10_2.12:3.3.0`, que é necessário para que o Spark possa consumir streams de dados diretamente de tópicos Kafka.

<br>

4. **Criação da Sessão Spark**:
   - **SparkSession**: Foi criada uma sessão Spark com `SparkSession.builder.appName("Mini-Projeto6").getOrCreate()`. Esta sessão é a base de todas as operações realizadas no Spark, permitindo a execução de tarefas como a leitura de streams de dados e a aplicação de operações de análise.

<br>

5. **Log de Dependências**:
   - Durante a inicialização da sessão Spark, o ambiente carregou as dependências necessárias, baixando pacotes da internet se necessário. Esse processo garante que todas as bibliotecas e pacotes corretos estejam disponíveis para a execução do código.

<br>

Este código estabelece a base para todo o processamento de dados em tempo real, conectando Apache Spark a Apache Kafka e configurando o ambiente para execução de streaming de dados. A configuração correta dessas etapas é fundamental para garantir que os dados dos sensores IoT possam ser processados em tempo real.


<br><br><br>


# Leitura do Stream

#### Configurando a leitura de dados em tempo real a partir de um tópico Kafka utilizando Apache Spark.

In [5]:
# Vamos criar uma subscrição no tópico que tem o streaming de dados que desejamos "puxar" os dados.
df = spark \
  .readStream \
  .format("kafka") \
  .option("kafka.bootstrap.servers", "localhost:9092") \
  .option("subscribe", "dsamp6") \
  .load()

### Resumo

**Leitura do Stream**:

Neste trecho de código, é configurada a leitura de dados em tempo real a partir de um tópico Kafka utilizando Apache Spark. 

1. **Configuração do Stream**:
   - O código inicia uma subscrição para consumir dados de um tópico Kafka específico, neste caso, o tópico chamado `"dsamp6"`.
   - **Método `readStream`**: Utiliza o método `spark.readStream` para configurar a leitura do stream, indicando que os dados serão lidos continuamente à medida que são produzidos pelo Kafka.
   - **Formato Kafka**: Especifica que o formato do stream é Kafka através de `.format("kafka")`, integrando diretamente o stream Kafka com o Spark.
   - **Opções de Configuração**:
     - `.option("kafka.bootstrap.servers", "localhost:9092")`: Define o endereço do servidor Kafka, neste caso, localizado no `localhost` na porta `9092`.
     - `.option("subscribe", "dsamp6")`: Indica que o Spark deve subscrever-se ao tópico `"dsamp6"` para receber os dados.

<br>

2. **Carregamento do Stream**:
   - **Método `load`**: Finalmente, o método `load` é chamado para iniciar a leitura do stream de dados conforme configurado, estabelecendo a conexão entre o Spark e o Kafka para o tópico especificado.

<br>

Este código é crucial para estabelecer a ponte entre o Apache Kafka e o Apache Spark, permitindo que os dados dos sensores IoT, publicados no tópico Kafka `"dsamp6"`, sejam consumidos e processados em tempo real pelo Spark.


<br><br><br>

# Definição do Schema:

<br>

#### Definindo o Schema

In [6]:
# Definimos o schema dos dados que desejamos capturar para análise (temperatura)
esquema_dados_temp = StructType([StructField("leitura", 
                                             StructType([StructField("temperatura", DoubleType(), True)]), True)])

# Definimos o schema global dos dados no streaming
esquema_dados = StructType([ 
    StructField("id_sensor", StringType(), True), 
    StructField("id_equipamento", StringType(), True), 
    StructField("sensor", StringType(), True), 
    StructField("data_evento", StringType(), True), 
    StructField("padrao", esquema_dados_temp, True)
])

### Resumo

Neste trecho de código, são definidos dois schemas fundamentais para a estruturação e análise dos dados de sensores IoT em tempo real:

1. **Schema da Leitura da Temperatura (`esquema_dados_temp`)**:
   - **Objetivo**: Modelar a estrutura do JSON especificamente para a leitura de temperatura.
   - **Detalhes**: 
     - Define um campo chamado `leitura`, que é um objeto estruturado contendo o campo `temperatura` do tipo `DoubleType`.
   - **Importância**: Este esquema reflete a estrutura esperada do dado de temperatura dentro do JSON, permitindo que o Spark reconheça e extraia corretamente esse valor durante o processamento.

<br>

2. **Schema Global (`esquema_dados`)**:
   - **Objetivo**: Modelar a estrutura completa do JSON, incluindo todos os identificadores e a leitura da temperatura.
   - **Detalhes**:
     - Inclui os campos `id_sensor` (identificador do sensor), `id_equipamento` (identificador do equipamento), `sensor` (nome ou tipo do sensor), `data_evento` (timestamp do evento), e `padrao`, que encapsula a estrutura de leitura da temperatura definida pelo `esquema_dados_temp`.
   - **Importância**: Este esquema global é usado para mapear toda a estrutura do JSON que é transmitida no stream de dados. Ele garante que cada parte do dado recebido seja compreendida e organizada corretamente pelo Spark para análise subsequente.

A definição desses schemas é crucial para a interpretação correta dos dados JSON recebidos via Kafka, assegurando que o Apache Spark consiga processar e analisar as informações de maneira estruturada e eficiente.

<br><br>

# Parse e Preparo dos Dados:

<br>

#### Conversão de cada linha de dado do stream para JSON e transformação em um DataFrame estruturado

In [7]:
# Capturamos cada linha de dado (cada valor) como string
df_conversao = df.selectExpr("CAST(value AS STRING)")

# Parse do formato JSON em dataframe
df_conversao = df_conversao.withColumn("jsonData", from_json(col("value"), esquema_dados)).select("jsonData.*")

df_conversao.printSchema()

root
 |-- id_sensor: string (nullable = true)
 |-- id_equipamento: string (nullable = true)
 |-- sensor: string (nullable = true)
 |-- data_evento: string (nullable = true)
 |-- padrao: struct (nullable = true)
 |    |-- leitura: struct (nullable = true)
 |    |    |-- temperatura: double (nullable = true)



<br>

#### Preparamos o Dataframe 

Esse dataframe está no formato que precisamos para análise.

In [8]:
# Renomeamos as colunas para simplificar nossa análise
df_conversao_temp_sensor = df_conversao.select(col("padrao.leitura.temperatura").alias("temperatura"), 
                                               col("sensor"))

In [9]:
df_conversao_temp_sensor.printSchema()

root
 |-- temperatura: double (nullable = true)
 |-- sensor: string (nullable = true)



In [None]:
# Não podemos visualizar o dataframe, pois a fonte é de streaming
# df_conversao_temp_sensor.head()

### Resumo

Neste trecho de código, são realizadas as operações de conversão e preparação dos dados provenientes do stream Kafka para um formato que o Spark possa analisar eficientemente:

1. **Conversão para String**:
   - **Operação**: Cada linha de dado recebida no stream é convertida para string utilizando `CAST(value AS STRING)`.
   - **Propósito**: Como os dados no Kafka são transmitidos em formato binário, esta conversão para string é necessária para que possam ser manipulados como JSON no Spark.

<br>

2. **Parse do JSON para DataFrame**:
   - **Operação**: A string JSON é transformada em um DataFrame estruturado com `from_json(col("value"), esquema_dados)`. A função `from_json` aplica o schema definido anteriormente (`esquema_dados`) para decompor a string JSON em colunas individuais.
   - **Propósito**: Esta etapa permite a extração dos campos específicos do JSON, como `id_sensor`, `sensor`, `temperatura`, etc., convertendo o dado bruto em uma estrutura tabular que o Spark pode manipular diretamente.

<br>

3. **Preparação do DataFrame**:
   - **Seleção de Colunas**: O DataFrame resultante é refinado para incluir apenas as colunas relevantes para a análise — `temperatura` e `sensor`.
   - **Renomeação de Colunas**: As colunas são renomeadas para simplificar as referências posteriores, por exemplo, a coluna de temperatura é renomeada como `"temperatura"`.
   - **Propósito**: Essa preparação é essencial para focar a análise nos campos de interesse, facilitando cálculos como a média da temperatura por sensor.

Este processo de parse e preparo transforma os dados brutos do stream em uma estrutura organizada e acessível, pronta para ser utilizada nas análises em tempo real com Apache Spark.

<br><br>

# Análise de Dados em Tempo Real:

<br>

#### Criando Objeto Para Análise

In [10]:
# Aqui temos o objeto que irá conter nossa análise, o cálculo da média das temperaturas por sensor
df_media_temp_sensor = df_conversao_temp_sensor.groupby("sensor").mean("temperatura")

df_media_temp_sensor.printSchema()

root
 |-- sensor: string (nullable = true)
 |-- avg(temperatura): double (nullable = true)



In [11]:
# Renomeamos as colunas para simplificar nossa análise
df_media_temp_sensor = df_media_temp_sensor.select(col("sensor").alias("sensor"), 
                                                   col("avg(temperatura)").alias("media_temp"))

df_media_temp_sensor.printSchema()

root
 |-- sensor: string (nullable = true)
 |-- media_temp: double (nullable = true)



<br>

#### Imprimindo o resultado no console.

Abaixo abrimos o streaming para análise de dados em tempo real,

In [13]:
# Objeto que inicia a consulta ao streaming com formato de console
query = df_media_temp_sensor.writeStream.outputMode("complete").format("console").start()

24/08/23 11:33:58 WARN ResolveWriteToStream: Temporary checkpoint location created which is deleted normally when the query didn't fail: /tmp/temporary-fd519894-b176-47fd-90cb-906ffc12b164. If it's required to delete it under any circumstances, please set spark.sql.streaming.forceDeleteTempCheckpointLocation to true. Important to know deleting temp checkpoint folder is best effort.
24/08/23 11:33:58 WARN ResolveWriteToStream: spark.sql.adaptive.enabled is not supported in streaming DataFrames/Datasets and will be disabled.
24/08/23 11:33:58 WARN AdminClientConfig: The configuration 'key.deserializer' was supplied but isn't a known config.
24/08/23 11:33:58 WARN AdminClientConfig: The configuration 'value.deserializer' was supplied but isn't a known config.
24/08/23 11:33:58 WARN AdminClientConfig: The configuration 'enable.auto.commit' was supplied but isn't a known config.
24/08/23 11:33:58 WARN AdminClientConfig: The configuration 'max.poll.records' was supplied but isn't a known con

-------------------------------------------
Batch: 0
-------------------------------------------
+------+----------+
|sensor|media_temp|
+------+----------+
+------+----------+



                                                                                

-------------------------------------------
Batch: 5
-------------------------------------------
+--------+------------------+
|  sensor|        media_temp|
+--------+------------------+
| sensor7| 80.60149253731346|
|sensor34| 84.33309523809525|
|sensor41| 64.60853333333334|
|sensor50|58.499767981438545|
|sensor31| 37.75423340961099|
|sensor38| 57.65311720698256|
| sensor1| 38.25805555555556|
|sensor30| 71.98554216867474|
|sensor10|62.726817042606584|
|sensor25| 42.59560975609757|
| sensor4| 73.11347150259068|
| sensor5|   71.896675900277|
|sensor20| 49.55213032581455|
|sensor44| 39.85368956743001|
|sensor19| 59.20779220779216|
| sensor8| 51.64093023255816|
|sensor14| 48.89083769633508|
|sensor24|16.945177664974626|
|sensor43|54.214245014244995|
|sensor47| 53.32660550458717|
+--------+------------------+
only showing top 20 rows



                                                                                

-------------------------------------------
Batch: 1
-------------------------------------------
+--------+------------------+
|  sensor|        media_temp|
+--------+------------------+
| sensor7| 77.75714285714285|
|sensor34|            84.375|
|sensor41| 65.17142857142858|
|sensor50| 56.15999999999999|
|sensor38|59.260000000000005|
|sensor31| 38.93333333333333|
| sensor1|             35.45|
|sensor30| 69.47999999999999|
|sensor10| 62.06666666666666|
|sensor25|             42.75|
| sensor4|             70.95|
| sensor5|              67.1|
|sensor20|              46.9|
|sensor44| 40.63333333333333|
|sensor19| 60.28000000000001|
| sensor8|              53.5|
|sensor14|             48.85|
|sensor24|              16.2|
|sensor43| 51.93333333333334|
|sensor47|             53.05|
+--------+------------------+
only showing top 20 rows



                                                                                

-------------------------------------------
Batch: 6
-------------------------------------------
+--------+------------------+
|  sensor|        media_temp|
+--------+------------------+
| sensor7| 80.64458874458877|
|sensor34| 84.33269230769233|
|sensor41| 64.59782608695652|
|sensor50| 58.52723004694838|
|sensor31|37.746082949308764|
|sensor38|  57.6328282828283|
| sensor1| 38.27374301675978|
|sensor30| 72.01609756097565|
|sensor10| 62.73181818181825|
|sensor25| 42.59408866995075|
| sensor4| 73.13612565445027|
| sensor5| 71.90999999999998|
|sensor20| 49.57222222222224|
|sensor44|  39.8476923076923|
|sensor19|59.193684210526264|
| sensor8|51.632242990654234|
|sensor14| 48.89105263157895|
|sensor24| 16.95670103092784|
|sensor43|54.233908045976996|
|sensor47| 53.32916666666668|
+--------+------------------+
only showing top 20 rows



                                                                                

-------------------------------------------
Batch: 2
-------------------------------------------
+--------+------------------+
|  sensor|        media_temp|
+--------+------------------+
| sensor7| 80.64458874458877|
|sensor34| 84.33269230769233|
|sensor41| 64.59782608695652|
|sensor50| 58.52723004694838|
|sensor31|37.746082949308764|
|sensor38|  57.6328282828283|
| sensor1| 38.27374301675978|
|sensor30| 72.01609756097564|
|sensor10| 62.73181818181824|
|sensor25| 42.59408866995075|
| sensor4| 73.13612565445027|
| sensor5|             71.91|
|sensor20|49.572222222222244|
|sensor44| 39.84769230769229|
|sensor19|59.193684210526264|
| sensor8| 51.63224299065423|
|sensor14| 48.89105263157895|
|sensor24| 16.95670103092784|
|sensor43|54.233908045976996|
|sensor47| 53.32916666666669|
+--------+------------------+
only showing top 20 rows



                                                                                

-------------------------------------------
Batch: 3
-------------------------------------------
+--------+------------------+
|  sensor|        media_temp|
+--------+------------------+
| sensor7| 80.55966386554624|
|sensor34| 84.33349056603775|
|sensor41| 64.61884816753927|
|sensor50| 58.47293577981653|
|sensor31| 37.76227272727273|
|sensor38|  57.6729064039409|
| sensor1|38.242541436464094|
|sensor30| 71.95571428571432|
|sensor10| 62.72189054726375|
|sensor25| 42.59710144927537|
| sensor4| 73.09128205128205|
| sensor5| 71.88342541436464|
|sensor20| 49.53233830845774|
|sensor44| 39.85959595959594|
|sensor19| 59.22153846153841|
| sensor8| 51.64953703703706|
|sensor14| 48.89062500000001|
|sensor24|16.934000000000005|
|sensor43|54.194915254237266|
|sensor47|53.324090909090934|
+--------+------------------+
only showing top 20 rows



                                                                                

-------------------------------------------
Batch: 7
-------------------------------------------
+--------+------------------+
|  sensor|        media_temp|
+--------+------------------+
| sensor7| 80.61571428571432|
|sensor34| 84.33296178343952|
|sensor41| 64.60500894454383|
|sensor50|58.508850931677046|
|sensor31|37.751529051987774|
|sensor38| 57.64641068447414|
| sensor1|38.263265306122456|
|sensor30| 71.99564516129037|
|sensor10| 62.72847571189286|
|sensor25| 42.59510603588908|
| sensor4| 73.12097053726171|
| sensor5| 71.90110905730128|
|sensor20| 49.55879396984926|
|sensor44|  39.8517006802721|
|sensor19|59.203130434782565|
| sensor8|  51.6380434782609|
|sensor14|  48.8909090909091|
|sensor24| 16.94897959183674|
|sensor43|54.220761904761886|
|sensor47|53.327453987730074|
+--------+------------------+
only showing top 20 rows



                                                                                

-------------------------------------------
Batch: 4
-------------------------------------------
+--------+------------------+
|  sensor|        media_temp|
+--------+------------------+
| sensor7| 80.64458874458877|
|sensor34| 84.33269230769233|
|sensor41| 64.59782608695652|
|sensor50| 58.52723004694838|
|sensor31|37.746082949308764|
|sensor38|  57.6328282828283|
| sensor1| 38.27374301675978|
|sensor30| 72.01609756097564|
|sensor10| 62.73181818181824|
|sensor25| 42.59408866995075|
| sensor4| 73.13612565445027|
| sensor5|             71.91|
|sensor20|49.572222222222244|
|sensor44| 39.84769230769229|
|sensor19|59.193684210526264|
| sensor8| 51.63224299065423|
|sensor14| 48.89105263157895|
|sensor24| 16.95670103092784|
|sensor43|54.233908045976996|
|sensor47| 53.32916666666669|
+--------+------------------+
only showing top 20 rows



                                                                                

-------------------------------------------
Batch: 8
-------------------------------------------
+--------+------------------+
|  sensor|        media_temp|
+--------+------------------+
| sensor7| 80.64458874458879|
|sensor34| 84.33269230769233|
|sensor41| 64.59782608695652|
|sensor50| 58.52723004694839|
|sensor31|37.746082949308764|
|sensor38|  57.6328282828283|
| sensor1| 38.27374301675979|
|sensor30| 72.01609756097565|
|sensor10| 62.73181818181824|
|sensor25| 42.59408866995075|
| sensor4| 73.13612565445028|
| sensor5| 71.90999999999998|
|sensor20| 49.57222222222224|
|sensor44|  39.8476923076923|
|sensor19| 59.19368421052627|
| sensor8| 51.63224299065423|
|sensor14| 48.89105263157895|
|sensor24|16.956701030927842|
|sensor43|54.233908045976996|
|sensor47| 53.32916666666668|
+--------+------------------+
only showing top 20 rows



## Importante

- Agora é necessário abrir um **novo terminal 1** na pasta `simulador` onde está o conjunto de dados e digitar:

`python simulador.py 10000 > ../dados/dados_sensores.txt`

- Agora é necessário abrir um **novo terminal 2** na pasta do Kafka (`kafka_2.13-3.3.1`) e digitar:

`bin/kafka-console-producer.sh --bootstrap-server localhost:9092 --topic topic1 < ../dados/dados_sensores.txt`

<br>

> Após isso, a tabela acima será atualizada

<br>

#### Enviando novos arquivos para o Kafka a fim de ver a análise em tempo real

Clique no botão Stop no menu superior para interromper a célula a qualquer momento.

**Essa janela só irá para ao apertar `stop`**

In [14]:
# Executamos a query do streaming e evitamos que o processo seja encerrado
query.awaitTermination()

                                                                                

-------------------------------------------
Batch: 9
-------------------------------------------
+--------+------------------+
|  sensor|        media_temp|
+--------+------------------+
| sensor7| 80.62542735042739|
|sensor34| 84.32559241706163|
|sensor41| 64.62220744680852|
|sensor50| 58.52741935483874|
|sensor31| 37.74000000000001|
|sensor38| 57.63640897755612|
| sensor1|38.258653846153855|
|sensor30| 71.99987980769234|
|sensor10| 62.71985111662537|
|sensor25| 42.59781021897811|
| sensor4|  73.1200258397933|
| sensor5| 71.88561643835615|
|sensor20| 49.56442786069653|
|sensor44| 39.86552598225601|
|sensor19|59.200129198966366|
| sensor8| 51.62906574394466|
|sensor14| 48.89947916666667|
|sensor24|16.950508905852423|
|sensor43| 54.21133144475919|
|sensor47| 53.32937142857144|
+--------+------------------+
only showing top 20 rows



                                                                                

-------------------------------------------
Batch: 5
-------------------------------------------
+--------+------------------+
|  sensor|        media_temp|
+--------+------------------+
| sensor7| 80.60675105485235|
|sensor34| 84.31733021077285|
|sensor41| 64.63968668407311|
|sensor50|58.525454545454565|
|sensor31| 37.74486607142858|
|sensor38|57.651358024691376|
| sensor1|38.244054054054054|
|sensor30| 71.98717339667462|
|sensor10| 62.70565110565117|
|sensor25| 42.60144230769232|
| sensor4| 73.11176470588236|
| sensor5| 71.87656675749318|
|sensor20| 49.53423645320199|
|sensor44|  39.8829573934837|
|sensor19| 59.21530612244893|
| sensor8|   51.632183908046|
|sensor14| 48.92072538860104|
|sensor24|16.944472361809048|
|sensor43| 54.20140056022407|
|sensor47| 53.32805429864255|
+--------+------------------+
only showing top 20 rows



ERROR:root:KeyboardInterrupt while sending command.               (0 + 0) / 200]
Traceback (most recent call last):
  File "/home/eduardo/anaconda3/lib/python3.9/site-packages/py4j/java_gateway.py", line 1038, in send_command
    response = connection.send_command(command)
  File "/home/eduardo/anaconda3/lib/python3.9/site-packages/py4j/clientserver.py", line 511, in send_command
    answer = smart_decode(self.stream.readline()[:-1])
  File "/home/eduardo/anaconda3/lib/python3.9/socket.py", line 704, in readinto
    return self._sock.recv_into(b)
KeyboardInterrupt


KeyboardInterrupt: 

In [15]:
query.status

{'message': 'Waiting for data to arrive',
 'isDataAvailable': False,
 'isTriggerActive': False}

In [16]:
# Resumo do que foi feito na última execução
query.lastProgress

{'id': '744d8663-f9d7-4861-9eb7-bbd84840301b',
 'runId': 'ee4b63dd-55ee-4ce6-9e4e-9146f0f4d24a',
 'name': None,
 'timestamp': '2024-08-23T14:39:50.538Z',
 'batchId': 6,
 'numInputRows': 9472,
 'inputRowsPerSecond': 2791.629826112585,
 'processedRowsPerSecond': 2534.6534653465346,
 'durationMs': {'addBatch': 3687,
  'commitOffsets': 22,
  'getBatch': 0,
  'latestOffset': 1,
  'queryPlanning': 11,
  'triggerExecution': 3737,
  'walCommit': 15},
 'stateOperators': [{'operatorName': 'stateStoreSave',
   'numRowsTotal': 50,
   'numRowsUpdated': 50,
   'allUpdatesTimeMs': 1014,
   'numRowsRemoved': 0,
   'allRemovalsTimeMs': 0,
   'commitTimeMs': 13506,
   'memoryUsedBytes': 101936,
   'numRowsDroppedByWatermark': 0,
   'numShufflePartitions': 200,
   'numStateStoreInstances': 200,
   'customMetrics': {'loadedMapCacheHitCount': 2400,
    'loadedMapCacheMissCount': 0,
    'stateOnCurrentVersionSizeBytes': 30568}}],
 'sources': [{'description': 'KafkaV2[Subscribe[dsamp6]]',
   'startOffset': {

In [17]:
# Explica a query
query.explain()

== Physical Plan ==
WriteToDataSourceV2 MicroBatchWrite[epoch: 6, writer: ConsoleWriter[numRows=20, truncate=true]], org.apache.spark.sql.execution.datasources.v2.DataSourceV2Strategy$$Lambda$2371/0x0000000840fac040@787928dc
+- *(4) HashAggregate(keys=[sensor#28], functions=[avg(temperatura#36)])
   +- StateStoreSave [sensor#28], state info [ checkpoint = file:/tmp/temporary-fd519894-b176-47fd-90cb-906ffc12b164/state, runId = ee4b63dd-55ee-4ce6-9e4e-9146f0f4d24a, opId = 0, ver = 6, numPartitions = 200], Complete, 0, 0, 2
      +- *(3) HashAggregate(keys=[sensor#28], functions=[merge_avg(temperatura#36)])
         +- StateStoreRestore [sensor#28], state info [ checkpoint = file:/tmp/temporary-fd519894-b176-47fd-90cb-906ffc12b164/state, runId = ee4b63dd-55ee-4ce6-9e4e-9146f0f4d24a, opId = 0, ver = 6, numPartitions = 200], 2
            +- *(2) HashAggregate(keys=[sensor#28], functions=[merge_avg(temperatura#36)])
               +- Exchange hashpartitioning(sensor#28, 200), ENSURE_REQUIRE

### Resumo

Neste trecho de código, são realizadas as operações necessárias para calcular, exibir e monitorar a média da temperatura registrada por cada sensor IoT em tempo real utilizando Apache Spark Streaming:

1. **Criação do Objeto de Análise**:
   - **Operação**: Os dados processados são agrupados por sensor, e a média da temperatura é calculada para cada sensor usando `groupby("sensor").mean("temperatura")`.
   - **Propósito**: Essa operação permite monitorar as condições térmicas de cada equipamento em tempo real, fornecendo insights sobre o comportamento dos sensores.

<br>

2. **Renomeação das Colunas**:
   - **Operação**: As colunas resultantes são renomeadas para simplificar a análise e tornar os resultados mais legíveis, renomeando a coluna de média de temperatura como `"media_temp"`.
   - **Propósito**: A renomeação das colunas facilita a interpretação dos dados e melhora a clareza dos resultados exibidos.

<br>

3. **Execução da Query de Streaming**:
   - **Configuração**: A query de streaming é configurada para rodar em modo `complete`, que recalcula os resultados para todos os grupos (sensores) a cada novo batch de dados.
   - **Exibição no Console**: O resultado é exibido em tempo real no console utilizando o método `.format("console").start()`.
   - **Propósito**: A execução da query em modo `complete` permite visualizar continuamente as médias de temperatura por sensor à medida que os dados são processados em tempo real.

<br>

4. **Manutenção da Query Ativa**:
   - **Operação**: O método `query.awaitTermination()` mantém a query de streaming ativa, evitando que o processo seja encerrado.
   - **Propósito**: Isso garante que o processamento continue indefinidamente, permitindo que novos dados sejam continuamente analisados e os resultados atualizados em tempo real.

<br>

5. **Monitoramento do Progresso da Query**:
   - **Operações Adicionais**: Métodos como `query.status`, `query.lastProgress`, e `query.explain()` são utilizados para monitorar o status da query, visualizar o progresso dos dados processados, e explicar o plano físico da execução.
   - **Propósito**: Essas operações são importantes para depurar e entender o comportamento da query de streaming, garantindo que ela esteja funcionando conforme o esperado.

Este trecho de código é fundamental para a análise em tempo real dos dados de sensores IoT, proporcionando uma visão contínua e atualizada das condições térmicas de cada sensor. A exibição dos resultados em tempo real no console permite um monitoramento imediato, facilitando a tomada de decisões baseadas em dados ao vivo.


<br><br>

# Persistência e Visualização dos Resultados:

<br>

#### Criação de outra query de streaming configurada para manter os resultados em memória

In [18]:
# Objeto que inicia a consulta ao streaming com formato de memória (cria tabela temporária)
query_memoria = df_media_temp_sensor \
    .writeStream \
    .queryName("dsa") \
    .outputMode("complete") \
    .format("memory") \
    .start()

24/08/23 11:42:23 WARN ResolveWriteToStream: Temporary checkpoint location created which is deleted normally when the query didn't fail: /tmp/temporary-a81f5e97-2c24-4da3-8d6e-867a3bfe389d. If it's required to delete it under any circumstances, please set spark.sql.streaming.forceDeleteTempCheckpointLocation to true. Important to know deleting temp checkpoint folder is best effort.
24/08/23 11:42:23 WARN ResolveWriteToStream: spark.sql.adaptive.enabled is not supported in streaming DataFrames/Datasets and will be disabled.
24/08/23 11:42:23 WARN AdminClientConfig: The configuration 'key.deserializer' was supplied but isn't a known config.
24/08/23 11:42:23 WARN AdminClientConfig: The configuration 'value.deserializer' was supplied but isn't a known config.
24/08/23 11:42:23 WARN AdminClientConfig: The configuration 'enable.auto.commit' was supplied but isn't a known config.
24/08/23 11:42:23 WARN AdminClientConfig: The configuration 'max.poll.records' was supplied but isn't a known con

In [19]:
# Streams ativados
spark.streams.active

[<pyspark.sql.streaming.query.StreamingQuery at 0x7f4ad2f80070>,
 <pyspark.sql.streaming.query.StreamingQuery at 0x7f4ad2f80dc0>,
 <pyspark.sql.streaming.query.StreamingQuery at 0x7f4ad2f80910>]

In [21]:
# Vamos manter a query executando por algum tempo e aplicando SQL aos dados em tempo real
from time import sleep

for x in range(5):
    
    spark.sql("select sensor, round(media_temp, 2) as media from dsa where media_temp > 65").show()
    sleep(5)
    
query_memoria.stop()

+------+-----+
|sensor|media|
+------+-----+
+------+-----+

+------+-----+
|sensor|media|
+------+-----+
+------+-----+

+------+-----+
|sensor|media|
+------+-----+
+------+-----+

+------+-----+
|sensor|media|
+------+-----+
+------+-----+



                                                                                

-------------------------------------------
Batch: 11
-------------------------------------------
+--------+------------------+
|  sensor|        media_temp|
+--------+------------------+
| sensor7| 80.63623813632445|
|sensor34|  84.3328544061303|
|sensor41| 64.60356756756757|
|sensor50|   58.521274601687|
|sensor31|37.749356617647074|
|sensor38|  57.6394763343404|
| sensor1| 38.26830357142858|
|sensor30| 72.01245136186773|
|sensor10|  62.7323588709678|
|sensor25| 42.59656188605109|
| sensor4| 73.13420502092052|
| sensor5| 71.90999999999998|
|sensor20|49.566532258064534|
|sensor44| 39.85010224948875|
|sensor19| 59.19895178197061|
| sensor8| 51.63572761194031|
|sensor14| 48.89505783385909|
|sensor24|16.952049180327876|
|sensor43| 54.22600229095073|
|sensor47|53.328136531365324|
+--------+------------------+
only showing top 20 rows



                                                                                

-------------------------------------------
Batch: 7
-------------------------------------------
+--------+------------------+
|  sensor|        media_temp|
+--------+------------------+
| sensor7|  80.6307030129125|
|sensor34|  84.3329617834395|
|sensor41| 64.60736086175943|
|sensor50| 58.51731669266771|
|sensor31| 37.75152905198778|
|sensor38|57.643886097152446|
| sensor1| 38.26468401486989|
|sensor30| 72.01003236245958|
|sensor10| 62.73271812080542|
|sensor25| 42.59820261437909|
| sensor4| 73.13292682926831|
| sensor5| 71.90999999999998|
|sensor20| 49.56275167785236|
|sensor44|  39.8517006802721|
|sensor19|  59.2024390243902|
| sensor8| 51.63804347826088|
|sensor14| 48.89772329246936|
|sensor24| 16.94897959183674|
|sensor43|54.220761904761886|
|sensor47|53.327453987730074|
+--------+------------------+
only showing top 20 rows

+------+-----+
|sensor|media|
+------+-----+
+------+-----+





-------------------------------------------
Batch: 12
-------------------------------------------
+--------+------------------+
|  sensor|        media_temp|
+--------+------------------+
| sensor7| 80.64458874458879|
|sensor34| 84.33269230769234|
|sensor41| 64.59782608695652|
|sensor50| 58.52723004694838|
|sensor31| 37.74608294930877|
|sensor38|  57.6328282828283|
| sensor1| 38.27374301675978|
|sensor30| 72.01609756097564|
|sensor10| 62.73181818181824|
|sensor25| 42.59408866995075|
| sensor4| 73.13612565445028|
| sensor5| 71.90999999999998|
|sensor20| 49.57222222222224|
|sensor44|  39.8476923076923|
|sensor19|59.193684210526264|
| sensor8| 51.63224299065422|
|sensor14|48.891052631578944|
|sensor24|16.956701030927842|
|sensor43|54.233908045976996|
|sensor47| 53.32916666666668|
+--------+------------------+
only showing top 20 rows



                                                                                

-------------------------------------------
Batch: 8
-------------------------------------------
+--------+------------------+
|  sensor|        media_temp|
+--------+------------------+
| sensor7| 80.64458874458879|
|sensor34| 84.33269230769233|
|sensor41| 64.59782608695652|
|sensor50| 58.52723004694837|
|sensor31|37.746082949308764|
|sensor38|  57.6328282828283|
| sensor1| 38.27374301675978|
|sensor30| 72.01609756097564|
|sensor10|62.731818181818234|
|sensor25| 42.59408866995074|
| sensor4| 73.13612565445028|
| sensor5|             71.91|
|sensor20| 49.57222222222224|
|sensor44|  39.8476923076923|
|sensor19| 59.19368421052627|
| sensor8| 51.63224299065422|
|sensor14| 48.89105263157895|
|sensor24|16.956701030927842|
|sensor43|54.233908045976996|
|sensor47| 53.32916666666668|
+--------+------------------+
only showing top 20 rows



                                                                                

-------------------------------------------
Batch: 13
-------------------------------------------
+--------+------------------+
|  sensor|        media_temp|
+--------+------------------+
| sensor7| 80.64458874458877|
|sensor34| 84.33269230769234|
|sensor41| 64.59782608695652|
|sensor50| 58.52723004694838|
|sensor31|37.746082949308764|
|sensor38|  57.6328282828283|
| sensor1| 38.27374301675978|
|sensor30| 72.01609756097564|
|sensor10|62.731818181818234|
|sensor25| 42.59408866995075|
| sensor4| 73.13612565445028|
| sensor5|             71.91|
|sensor20| 49.57222222222224|
|sensor44|  39.8476923076923|
|sensor19|59.193684210526264|
| sensor8| 51.63224299065422|
|sensor14|48.891052631578944|
|sensor24|16.956701030927842|
|sensor43|54.233908045976996|
|sensor47| 53.32916666666669|
+--------+------------------+
only showing top 20 rows



                                                                                

-------------------------------------------
Batch: 9
-------------------------------------------
+--------+------------------+
|  sensor|        media_temp|
+--------+------------------+
| sensor7| 80.64458874458877|
|sensor34| 84.33269230769234|
|sensor41| 64.59782608695652|
|sensor50| 58.52723004694837|
|sensor31|37.746082949308764|
|sensor38| 57.63282828282827|
| sensor1| 38.27374301675978|
|sensor30| 72.01609756097564|
|sensor10| 62.73181818181823|
|sensor25| 42.59408866995074|
| sensor4| 73.13612565445028|
| sensor5| 71.90999999999998|
|sensor20| 49.57222222222224|
|sensor44| 39.84769230769229|
|sensor19| 59.19368421052629|
| sensor8|51.632242990654234|
|sensor14| 48.89105263157897|
|sensor24|16.956701030927835|
|sensor43|54.233908045976996|
|sensor47| 53.32916666666667|
+--------+------------------+
only showing top 20 rows



                                                                                

-------------------------------------------
Batch: 14
-------------------------------------------
+--------+------------------+
|  sensor|        media_temp|
+--------+------------------+
| sensor7| 80.64458874458877|
|sensor34| 84.33269230769234|
|sensor41| 64.59782608695652|
|sensor50| 58.52723004694838|
|sensor31|37.746082949308764|
|sensor38|  57.6328282828283|
| sensor1| 38.27374301675978|
|sensor30| 72.01609756097564|
|sensor10|62.731818181818234|
|sensor25| 42.59408866995075|
| sensor4| 73.13612565445028|
| sensor5|             71.91|
|sensor20| 49.57222222222224|
|sensor44| 39.84769230769229|
|sensor19|59.193684210526264|
| sensor8| 51.63224299065422|
|sensor14|48.891052631578944|
|sensor24|16.956701030927842|
|sensor43|54.233908045976996|
|sensor47| 53.32916666666669|
+--------+------------------+
only showing top 20 rows



### Resumo

Neste trecho de código, é configurada uma nova query de streaming para manter os resultados em memória, permitindo consultas SQL em tempo real sobre os dados processados:

1. **Configuração da Query de Streaming em Memória**:
   - **Operação**: Uma query de streaming é configurada para escrever os resultados em memória usando o método `.format("memory")`. A query é identificada com o nome `"dsa"` e é executada em modo `complete`, que recalcula os resultados para todos os grupos (sensores) a cada novo batch de dados.
   - **Propósito**: Manter os resultados em memória permite consultas SQL rápidas e eficientes sobre os dados em tempo real, facilitando a análise ad hoc e o monitoramento contínuo dos sensores.

<br>

2. **Ativação dos Streams**:
   - **Operação**: O método `spark.streams.active` é utilizado para verificar que as queries de streaming estão ativas, garantindo que o processamento dos dados está ocorrendo conforme esperado.
   - **Propósito**: Esta operação confirma que o fluxo de dados está sendo processado em tempo real e que a query está preparada para fornecer resultados atualizados.

<br>

3. **Execução de Consultas SQL em Tempo Real**:
   - **Operação**: Um loop é configurado para executar consultas SQL a cada 3 segundos, filtrando os sensores que registram temperaturas acima de 65 graus Celsius. As consultas usam a tabela temporária `"dsa"` criada pela query de streaming em memória.
   - **Propósito**: Este procedimento permite monitorar continuamente os sensores que excedem o limiar de temperatura, fornecendo insights acionáveis em tempo real.

<br>

4. **Exibição dos Resultados**:
   - **Resultado**: Os resultados das consultas SQL são exibidos no console, mostrando os sensores e suas respectivas médias de temperatura (`media`) que excedem o limiar especificado.
   - **Propósito**: A exibição em tempo real permite uma rápida visualização das condições dos sensores, facilitando a identificação de potenciais problemas e a tomada de decisões rápidas.

<br>

5. **Encerramento da Query**:
   - **Operação**: Após a execução do loop de consultas, a query de streaming em memória é encerrada com `query_memoria.stop()`.
   - **Propósito**: Isso libera recursos e encerra o processo de streaming de forma controlada após a análise.

<br>

Este código é essencial para permitir a persistência dos resultados em memória e a realização de consultas SQL em tempo real, proporcionando uma ferramenta poderosa para monitoramento contínuo e análise dos dados de sensores IoT.
