<a href="https://colab.research.google.com/github/scalabrinig/cdProjetoAplicadoIV/blob/master/projeto/cd_projeto_aplicado_IV_entrega_2.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

  <img src="https://raw.githubusercontent.com/scalabrinig/cdProjetoAplicadoIV/d093146488f56dfcf0ef286bcee8efe0e71b9c76/figuras/mackenzie_logo.jpg" width="25%" align="right"/>

# **PROJETO APLICADO IV - Ciência de Dados EaD - 2024/02**


# **Entrega 2**

---

# **Titulo do Projeto**: PREVISÃO DE TRÁFEGO URBANO NO BRASIL COM REDES DE ATENÇÃO ESPACIAL-TEMPORAL

---

In [None]:
#@title **Identificação do Grupo e Opção do Projeto**

#@markdown Integrantes do Grupo, nome completo em ordem alfabética (*informe: \<nome\>, \<matrícula\>*)
Aluno1 = 'Vinicius Telatim Sant´Anna, 10407038' #@param {type:"string"}



# **Introdução**

A previsão de tráfego urbano é uma área de pesquisa de extrema relevância, especialmente em grandes centros urbanos brasileiros, onde o crescimento acelerado das cidades tem gerado desafios significativos, como congestionamentos e aumento do tempo de deslocamento. Esses problemas não apenas afetam a qualidade de vida dos cidadãos, mas também têm implicações diretas na eficiência econômica e nas emissões de gases de efeito estufa, contribuindo para a degradação ambiental. Nesse contexto, a aplicação de modelos de aprendizado de máquina, como as Redes Neurais em Grafos (GNNs), surge como uma solução promissora para melhorar a gestão do tráfego urbano e promover cidades mais sustentáveis.

O objetivo geral deste trabalho é aplicar e avaliar a eficácia de dois modelos de previsão de tráfego em áreas urbanas brasileiras, especificamente o Attention Based Spatial-Temporal Graph Convolutional Networks (ASTGCN) e o Spatial-Temporal Graph Attention Networks (ST-GAT). Para isso, será explorado um conjunto de dados fornecido pela Autarquia de Trânsito e Transporte Urbano do Recife (CTTU), que inclui informações sobre a quantidade de veículos registrados por intervalos de velocidade média, além de dados complementares como a localização geográfica dos sensores, data de instalação e a velocidade máxima permitida em cada local monitorado.

Os objetivos específicos incluem a realização de uma análise exploratória dos dados, o pré-processamento das informações para garantir sua qualidade, a construção de um grafo que represente as interações entre os diferentes pontos de monitoramento e a aplicação dos modelos teóricos para prever o fluxo de tráfego. A justificativa para a realização deste estudo reside na necessidade urgente de desenvolver soluções tecnológicas que possam não apenas prever congestionamentos com antecedência, mas também permitir intervenções mais rápidas e eficazes por parte das autoridades de trânsito, melhorando a fluidez nas vias e reduzindo o tempo de viagem para os motoristas. Além disso, a implementação de modelos avançados pode servir como um marco para o desenvolvimento de cidades inteligentes no Brasil, incentivando a inovação tecnológica e a melhoria contínua dos serviços urbanos.




# **Referencial Teórico**

Nos últimos anos, a previsão de tráfego tem passado por transformações significativas com o avanço das Redes Neurais em Grafos (GNNs), que trazem novas abordagens para captar as complexas dinâmicas espaciais e temporais presentes nos dados de tráfego. Um exemplo de destaque é o modelo Attention Based Spatial-Temporal Graph Convolutional Networks (ASTGCN), proposto por Xu et al (2019). Esse modelo oferece uma solução avançada para prever o fluxo de tráfego em rodovias, sendo projetado para capturar as intricadas correlações espaciais e temporais dos dados de tráfego, que frequentemente apresentam padrões não lineares e dinâmicos.

O ASTGCN integra três componentes principais: (1) a modelagem das dependências temporais recentes, diárias e semanais, cada uma com seu próprio mecanismo de atenção espacial-temporal; (2) convoluções espacial-temporais baseadas em grafos para capturar padrões espaciais; e (3) convoluções tradicionais para descrever características temporais. A implementação desse modelo foi feita utilizando o framework MXNet e validada em dois conjuntos de dados reais do Caltrans Performance Measurement System (PeMS), especificamente os conjuntos PeMSD4 e PeMSD8. Os resultados mostraram que o ASTGCN supera os modelos de referência existentes em termos de precisão de previsão, além de oferecer interpretabilidade ao permitir a visualização das correlações entre diferentes detectores de tráfego.

Além disso, Zhang et al. (2019) introduziram o modelo Spatial-Temporal Graph Attention Networks (ST-GAT), uma abordagem de aprendizado profundo voltada para a previsão da velocidade do tráfego. O ST-GAT combina uma rede de atenção em grafos (GAT), que extrai dependências espaciais, com uma rede neural recorrente Long Short-Term Memory (LSTM), que captura as dinâmicas temporais. O diferencial desse modelo está no uso de um mecanismo de atenção que pondera a importância relativa de diferentes segmentos de estrada, resultando em previsões mais precisas da velocidade do tráfego. Para a representação dos dados, utiliza-se o método Speed2Vec, que transforma séries temporais de tráfego em vetores de características para o cálculo de atenção. Validado com o conjunto de dados PeMSD7, o ST-GAT demonstrou desempenho superior em relação aos métodos de última geração para previsão de velocidade de tráfego, incluindo modelos baseados em grafos convolucionais.




# **Pipeline da Solução**



**1.   Coleta de Dados**

O primeiro passo do pipeline é a coleta de dados. Os dados de tráfego são obtidos através de arquivos CSV disponibilizados pelo portal de dados abertos da cidade do Recife. Esses dados são referentes à quantidade de veículos registrados por intervalos de velocidade média em períodos de 15 minutos, cobrindo o ano de 2022 e incluindo informações de 38 equipamentos de monitoramento de tráfego.


**2.   Pré-processamento de Dados**

Após a coleta, os dados brutos precisam passar por um processo de pré-processamento. Isso inclui:
*   Limpeza de Dados: Remoção de duplicadas e tratamento de valores ausentes, que podem distorcer as análises.
*   Normalização: Ajuste das escalas dos dados para que todas as variáveis estejam em uma faixa semelhante, facilitando o treinamento do modelo.
*   Segmentação Temporal: Divisão dos dados em janelas temporais utilizando o método de Sliding Window.



**3.   Construção do Grafo de Tráfego**

Com base na matriz de adjacência, é construído um grafo onde cada nó representa um equipamento de monitoramento de tráfego. As arestas entre os nós são definidas com base nas distâncias geográficas, e cada aresta tem um peso correspondente à distância entre os equipamentos.

**4.   Aplicação dos Modelos**

São aplicados dois modelos de previsão de tráfego: o Attention Based Spatial-Temporal Graph Convolutional Networks (ASTGCN) e o Spatial-Temporal Graph Attention Networks (ST-GAT).
Os modelos são treinados em um conjunto de dados dividido em treino, validação e teste. Com o objetivo de prever a quantidade de tráfego nos próximos 15 minutos com base nas medições das últimas horas.

**5.   Avaliação dos Modelos**

Após o treinamento, os modelos são avaliados em relação a métricas como erro absoluto médio (MAE), erro percentual absoluto médio (MAPE) e raiz do erro quadrático médio (RMSE).




# **Cronograma**

**1.	Definição do Projeto e Equipe**
*   Data de Entrega: 06 de setembro de 2024
*   Descrição: Definição dos objetivos do projeto, formação da equipe e planejamento inicial, incluindo a proposta do projeto, motivações, justificativa, objetivos e descrição da base de dados a ser utilizada.

**2.	Referencial Teórico e Cronograma**
*   Data de Entrega: 30 de setembro de 2024
*   Descrição: Revisão da literatura relevante, discussão de trabalhos correlacionados, apresentação do pipeline da solução proposta e elaboração de um cronograma detalhado das atividades do projeto.

**3.	Implementação Parcial**
*   Data de Entrega: 28 de outubro de 2024
*   Descrição: Desenvolvimento inicial do modelo, incluindo a coleta e pré-processamento dos dados, análise exploratória utilizando Python e suas bibliotecas para visualização e limpeza dos dados, e aplicação de um modelo base para previsão de tráfego.

**4.	Implementação e Entrega Final**
*   Data de Entrega: 18 de novembro de 2024
*   Descrição: Finalização do modelo, avaliação de desempenho, documentação do projeto, criação de um repositório no GitHub com todos os artefatos e documentos, e produção de vídeos de apresentação do projeto e da solução técnica.



# **Referências**

Zhang, Chenhan & Yu, James Jianqiao & Liu, Yi. (2019). Spatial-Temporal Graph Attention Networks: A Deep Learning Approach for Traffic Forecasting.

Guo, Shengnan & Lin, Youfang & Feng, Ning & Song, Chao & Wan, Huaiyu. (2019). Attention Based Spatial-Temporal Graph Convolutional Networks for Traffic Flow Forecasting.

Luo, Ming & Dou, Huili & Zheng, Ning. (2024). Spatiotemporal Prediction of Urban Traffics Based on Deep GNN.

Chattopadhyay, Anasuya & Reti, Daniel & Schotten, Hans. (2024). GNN-based Anomaly Detection for Encoded Network Traffic.

L. N. N. Do, H. L. Vu, B. Q. Vo, Z. Liu, and D. Phung, An effective spatial-temporal attention based neural network for traffic flow prediction

T. N. Kipf and M. Welling, Semi-supervised classification with graph convolutional networks, 2016.

H. Yu, Z. Wu, S. Wang, Y. Wang, and X. Ma, Spatiotemporal recurrent convolutional networks for traffic prediction in transportation networks, Sensors, vol. 17, no. 7, p. 1501, Jun. 2017.

Guo, Shengnan & Lin, Youfang & Feng, Ning & Song, Chao & Wan, Huaiyu. (2019). Attention Based Spatial-Temporal Graph Convolutional Networks for Traffic Flow Forecasting.




In [None]:
#@title **Avaliação**
Referencial_teorico = 10 #@param {type:"slider", min:0, max:10, step:1}

Pipeline_solucao = 10 #@param {type:"slider", min:0, max:10, step:1}

Cronograma = 10 #@param {type:"slider", min:0, max:10, step:1}



In [None]:
#@title **Nota Final**
nota = 0.40*Referencial_teorico + 0.40*Pipeline_solucao + 0.20*Cronograma

print(f'Nota final do trabalho {nota :.1f}')

import numpy as np
import pandas as pd

alunos = pd.DataFrame()

lista_nome = []

for i in range(1,6):
  exec("if Aluno" + str(i) + " !='None':  lista = Aluno" + str(i) + ".split(','); lista_nome.append(lista[0]);")

alunos['nome'] = lista_nome
alunos['nota'] = np.round(nota,1)
print()
display(alunos)

Nota final do trabalho 10.0



Unnamed: 0,nome,nota
0,Aluno 1,10.0
1,Aluno 2,10.0
2,Aluno 3,10.0
3,Aluno 4,10.0
4,Aluno 5,10.0
