# 7 - Webhook, Batch x Streaming

##**Batch vs. Streaming Data:**

Existem diferenças significativas entre o processamento de dados em lote (carga em batch) e streaming:

1. **Modelo de Processamento de Dados:**
    - **Processamento em lote:** No processamento em lote, os dados são coletados, armazenados e processados em blocos ou lotes discretos. Normalmente é usado para análise de dados históricos e geração de relatórios.
    - **Processamento de streaming:** No processamento de streaming, os dados são processados em tempo real à medida que chegam. É usado para ações imediatas, monitoramento e análises em tempo real.

Exemplo de carga em batch

<div style="text-align: center;">
<img src="https://estuary.dev/static/95bfd47b6f3119035d2284a7c076fb5d/a4da0/02_Streaming_Data_Processing_Stream_Vs_Batch_Processing_7c1ac11dc8.png"  width="55%"> 
 <!-- height="40%"> -->
</div>
<br>

2. **Latência:**
    - **Processamento em lote:** O processamento em lote tem maior latência, pois aguarda o acúmulo de dados antes do processamento. É adequado para cenários onde as respostas em tempo real não são críticas.
    - **Processamento de streaming:** O processamento de streaming tem baixa latência e fornece insights e respostas em tempo real, tornando-o adequado para aplicações como detecção e monitoramento de fraudes.

3. **Complexidade:**
    - **Processamento em lote:** normalmente, os trabalhos de processamento em lote são mais fáceis de projetar e gerenciar, pois operam em conjuntos de dados estáticos.
    - **Processamento de streaming:** O processamento de streaming pode ser mais complexo devido à necessidade de gerenciamento de estado e manipulação de dados fora de ordem.

4. **Escalabilidade:**
    - **Processamento em lote:** dimensionar o processamento em lote pode ser mais desafiador, pois geralmente envolve o redimensionamento de clusters ou a alocação de recursos adicionais.
    - **Processamento de streaming:** Os sistemas de streaming são projetados para escalabilidade horizontal e podem lidar com volumes de dados variados com mais eficiência.

<img src="https://media.geeksforgeeks.org/wp-content/cdn-uploads/20210209202449/Scaling-Concept.png" width=400>

5. **Casos de uso:**
    - **Processamento em lote:** O processamento em lote é ideal para cenários como trabalhos diários de ETL, geração de relatórios mensais e análises baseadas em lote.
    - **Processamento de streaming:** O processamento de streaming é adequado para monitoramento em tempo real, detecção de fraudes, sistemas de recomendação e processamento de dados de IoT.

Em resumo, a escolha entre processamento de dados em lote e streaming depende do seu caso de uso e requisitos específicos. O processamento em lote é adequado para análises históricas e tarefas menos urgentes, enquanto o processamento de streaming é essencial para a tomada de decisões em tempo real e ações imediatas com base nos dados recebidos. A combinação de ambas as abordagens em um pipeline de dados pode fornecer uma solução abrangente para diversas necessidades de processamento de dados.

<br><br>
<img src="https://www.ml4devs.com/images/illustrations/big-data-pipeline-architecture.webp" width=800>

### Exemplos

A arquitetura de dados orientada a eventos é uma maneira de tratar dados de maneira mais flexível e ágil, reagindo a cada evento de maneira independente. Isso é contrário ao processamento em batch, em que os dados são agrupados e processados em lotes.

Exemplos de uso de arquitetura de dados orientada a eventos incluem:

- Sistemas de detecção de fraudes: quando um evento suspeito é detectado, uma ação é imediatamente tomada para evitar perdas financeiras.

- Sistemas de monitoramento de máquinas: eventos gerados por sensores são processados em tempo real para detectar problemas antes que eles causem danos maiores.

- Aplicativos de logística: eventos gerados por GPS e sensores são processados em tempo real para otimizar rotas e prever entregas.

- Sistemas de alerta de emergência: eventos são processados em tempo real para detectar situações de emergência e enviar alertas imediatos.

Já o processamento em batch é adequado para casos em que a latência não é crítica e a quantidade de dados é grande, como:

- Análise de dados de log de uma empresa: os dados são agrupados e processados em lotes todas as noites para produzir relatórios diários.

- Análise de dados de vendas: os dados são agrupados e processados mensalmente para produzir relatórios de vendas.

- Processamento de grandes conjuntos de dados climáticos: dados de sensores são agrupados e processados em lotes para produzir modelos climáticos precisos.


## Webhooks

Webhooks são usados para receber dados de um servidor conforme um evento acontece, em vez de pesquisar uma API (chamar uma API intermitentemente) para ver se há dados disponíveis. Com webhooks, você só precisa expressar interesse em um evento uma vez, ao criar o webhook.
<br><br>
<div style="text-align: center;">
<img src="https://res.cloudinary.com/practicaldev/image/fetch/s--bLQi7irI--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://dev-to-uploads.s3.amazonaws.com/uploads/articles/n5c64liu91rcqqha8zgk.png" width=40%>
</div>

Vamos supor que você realizou uma compra por um site através de boleto bancário que pode levar até 3 dias o pagamento. Como esse site fica sabendo do pagamento? Ele fica enviando uma pergunta pra API a cada 10s esperando a resposta "confirmado"? Isso traria um fluxo de requisição gigantesco e desnecessário para o banco. O que o banco faz é enviar um webhook para o site quando o pagamento for aprovado com o detalhamento do pagamento como valor, quantidade de parcelas, juros, etc.... Nesse caso temos o banco enviando o webhook e o site recebendo o webhook. Mais no final dessa aula veremos como enviar e receber um webhook.

Outros exemplos:

- gerenciamento de e-mail: as empresas disparam diversos e-mails e recebem um webhook toda vez que o cliente abre o e-mail. Com isso a empresa consegue calcular qual a taxa de abertura dos e-mails enviados



## API x Webhook

A API é o sistema inteiro e que pode conter diferentes endpoints para enviar e receber webhooks. As APIs definem o método de comunicação entre dois softwares, permitindo definir os tipos de requisições, como fazê-las e o formato dos dados utilizados.

Um **webhook** (às vezes chamado de API reversa) **é um dos endpoints de API** que serve a um propósito diferente: em vez de apenas procurar informações como um típico endpoint de API GET, nós podemos enviar (POST) para o webhook alguns dados e informações quando um evento acontece e então ele fará algo internamente. Isso significa que os webhooks podem servir como um tipo de sistema de eventos.

Basicamente, os webhooks são como endpoints anti-API. **Eles recebem dados e realizam trabalho interno, enquanto os endpoints de API padrão retornam dados para que o cliente que solicita esses dados possa fazer algo com eles.**

O termo webhook geralmente significa postar um evento em outro sistema pela web através de uma API. Os webhooks utilizam requisições HTTP do tipo POST para disparar ações em outra aplicação quando um evento ocorre. O formato de dados padrão atual para isso é JSON.

Um webhook precisa de duas coisas: um remetente com ferramentas para reconhecer um evento e fazer algo, e um receptor - uma aplicação com uma API para receber as mensagens.

<br><br>
<div style="text-align: center;">
<img src="https://miro.medium.com/v2/resize:fit:1400/1*q4VTCyqTXMgI8Y4isY354w.png" width=60%>
<img src="https://verloop.io/wp-content/uploads/API-vs-Webhook-1536x1373.jpg" width=50%>
</div>

<div style="text-align: center;">
<img src="https://five.co/wp-content/uploads/2023/01/Webhooks-APIs.png" width=50%>
</div>

## Como Webhooks funcionam

O fluxo de típico de um webhook envolve duas partes: um remetente e um receptor.

- Remetente: O remetente é um sistema ou serviço que gera eventos e precisa notificar outro sistema sobre esses eventos. Isso pode ser uma ação do usuário, uma atualização em um banco de dados, ou qualquer outro gatilho.

- Receptor: O receptor é um sistema ou aplicação que ouve as notificações de webhook recebidas e realiza ações específicas em resposta a essas notificações.

Aqui está uma explicação passo a passo de como os webhooks funcionam:

- O remetente detecta um evento ou mudança que deseja notificar ao receptor.

- O remetente cria uma solicitação HTTP POST contendo informações relevantes sobre o evento.

- O remetente envia esta solicitação POST para uma URL predefinida fornecida pelo receptor. Esta URL é frequentemente chamada de endpoint do webhook.

- O receptor ouve as solicitações HTTP POST recebidas no endpoint do webhook.

- Quando o receptor recebe uma solicitação POST, ele processa os dados na carga da solicitação e realiza as ações necessárias com base nas informações do evento.

## Enviando um Webhook

Acesse o site https://webhook.site e copie o sua URL.

In [8]:
import requests 

webhook_url = "https://webhook.site/c5ff4718-abaa-40a7-81c7-676cb08a94d4"

send_data = {
    "pagamento": "aprovado",
    "valor": "198.87",
    "data": "01/04/2024",
    "parcelas": 1,
    "nome": "Carlos"
}

data = requests.post(webhook_url, json=send_data)
data.json()


JSONDecodeError: Expecting value: line 1 column 1 (char 0)

In [3]:
data.status_code

200

## Criando um receptor de Webhook em uma API






In [6]:
pip install Flask

Note: you may need to restart the kernel to use updated packages.


Primeiro, vamos criar um aplicativo Flask básico que escuta solicitações de webhook recebidas e registra os dados recebidos.

```python
from flask import Flask, request, jsonify

app = Flask(__name__)

# define a route /webhook that listens for HTTP POST requests.
@app.route('/webhook', methods=['POST'])
# POST request is received at /webhook, the webhook_receiver function is called
def webhook_receiver():
    data = request.get_json()  # Get the JSON data from the incoming request
    # Process the data and perform actions based on the event
    print("Received webhook data:", data)
    return jsonify({'message': 'Webhook received successfully'}), 200

# Verifica se o script está sendo executado como um módulo principal
if __name__ == '__main__':
    # Inicia a execução da aplicação
    app.run(debug=True)
```

Neste exemplo, definimos uma rota `/webhook` que escuta solicitações POST. Quando uma solicitação é recebida, extraímos os dados JSON dela, processamos conforme necessário e registramos no console.

Esse código será rodado em um .py localmente.

No nosso caso, o webhook irá receber a solicitação e salvar em um arquivo.

In [9]:
from flask import Flask, jsonify
import pandas as pd 
app = Flask("webhook")

@app.route("/webhook", methods=["POST"])
def webhook_receiver():
    data = requests.get_json()
    df = pd.json.normalize(data)
    df.to_csv("saida_webhook.csv", index=False, mode="a")
    print(f"Webhook recebido {data}")
    return jsonify(f"Webhook recebido {data}")

app.run(port=5001)

 * Serving Flask app 'webhook'
 * Debug mode: off


 * Running on http://127.0.0.1:5001
Press CTRL+C to quit
[2024-04-01 21:12:32,413] ERROR in app: Exception on /webhook [POST]
Traceback (most recent call last):
  File "c:\Users\thaty\AppData\Local\Programs\Python\Python312\Lib\site-packages\flask\app.py", line 1463, in wsgi_app
    response = self.full_dispatch_request()
               ^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "c:\Users\thaty\AppData\Local\Programs\Python\Python312\Lib\site-packages\flask\app.py", line 872, in full_dispatch_request
    rv = self.handle_user_exception(e)
         ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "c:\Users\thaty\AppData\Local\Programs\Python\Python312\Lib\site-packages\flask\app.py", line 870, in full_dispatch_request
    rv = self.dispatch_request()
         ^^^^^^^^^^^^^^^^^^^^^^^
  File "c:\Users\thaty\AppData\Local\Programs\Python\Python312\Lib\site-packages\flask\app.py", line 855, in dispatch_request
    return self.ensure_sync(self.view_functions[rule.endpoint])(**view_args)  # type: ignore[no-any-

Para testar o receptor de webhook, você pode usar ferramentas como curl ou Postman para enviar uma solicitação POST para o endpoint http://localhost:5000/webhook (assumindo que você esteja executando o aplicativo Flask localmente). Certifique-se de incluir dados JSON no corpo da solicitação.

## Ngrok

O Ngrok é uma ferramenta que permite criar um túnel seguro para conectar um servidor local a um servidor remoto, tornando possível expor uma aplicação local para a Internet. Essa ferramenta é muito útil para desenvolvedores que precisam testar suas aplicações localmente antes de colocá-las em produção.

In [None]:
pip install pyngrok

- Acesse o site oficial do [ngrok](https://ngrok.com/) e faça seu cadastro;
- Entrar no dashboard https://dashboard.ngrok.com/get-started/your-authtoken
- Getting Started > Your AuthToken
- Salvar ele no arquivo de configuração

In [None]:
!ngrok config add-authtoken <seu-token>

In [None]:
if __name__ == "__main__":
    # define a porta da aplicação
    port = 5000
    # Inicia a execução da aplicação
    ngrok_tunnel = ngrok.connect(port)
    # Printa a URL pública
    print('Public URL:', ngrok_tunnel.public_url)

    try:
        app.run(port=port)
    except KeyboardInterrupt:
        print('Detected keyboard interrupt, stopping ngrok and Flask...')
    finally:
        ngrok.disconnect(ngrok_tunnel.public_url)
        ngrok.kill()

Real Time Viewer: http://localhost:4040/inspect/http

## [Avaliação anônima](https://forms.gle/tShxhxNYhvi6ZmQm8)

## Exercício

Nesse exercício você deve fazer solicitações de dados para uma das APIs fornecidas e criar um sistema de alerta que aciona um webhook quando um determinado limiar é ultrapassado.

Vocês têm duas opções:

- criar um sistema de alerta para quando a quantidade de chuvas ultrapassa determinado limiar [Weather Forecast API](https://open-meteo.com/en/docs)
- criar um sistema de alerta para quando o preço do dólar em reais ultrapassar determinado valor [Cotações](https://docs.awesomeapi.com.br/api-de-moedas)

Reforçando que a API de recebimento do webhook deve ser construída por vocês.

Exemplos: 

- faço solicitações a cada x tempos na API de temperatura/chuva e quando o valor de chuva ultrapassar 0.5mm/h disparo um webhook de um alerta que envia uma mensagem pro celular das pessoas
- faço solicitações na API de dólar e disparo um alerta para um webhook que envia um push para o celular de uma pessoa quando o preço for menor que 4.5

## Bibliografia e Aprofundamento

- https://snipcart.com/blog/webhook-vs-api

- https://towardsdatascience.com/webhook-vs-api-which-one-do-you-need-8c430f8ea71b

- https://zapier.com/blog/what-are-webhooks/