<br>

# Técnicas Matemáticas para Big Data - Project 02 - Hidden Markov Models
<br><br>


GROUP 05:
- João Vieitas - Nº 97632 - 33% Work Participation
- Margarida Oliveira - Nº 103112 - 33% Work Participation
- Maria Costa - Nº 124254 - 33% Work Participation

<br><br>

## 1. Introduction to the problem of study [1,0 valor]

O impacto climático nos tempos de entrega de produtos é um desafio significativo para empresas que dependem de um transporte eficiente para garantir a pontualidade. As condições climáticas, podem afetar a logística e, consequentemente, atrasar os prazos de entrega. Este estudo tem como objetivo explorar como as condições climáticas influenciam os tempos de entrega e como um Modelo de Markov Oculto (HMM) pode ser utilizado para prever esses impactos de forma precisa. 

<br><br>
## 2. Brief and general description of the approach and methods used [1,5 valor]

Como já referido anteriormente, a abordagem adotada neste estudo utiliza o modelo Hidden Markov Model (HMM) para prever os impactos climáticos nos tempos de entrega.

O Modelo Oculto de Markov é uma ferramenta probabilística amplamente utilizada para modelação de processos estocásticos onde o sistema subjacente opera em estados ocultos que não podem ser observados diretamente. No contexto deste estudo, os HMMs são aplicados para identificar padrões ocultos nos atrasos de entregas, condicionados pela variável clima.
Assim, os estados ocultos no nosso modelo representam os diferentes níveis de impacto nos tempos e entrega: Sem Impacto (Normal), Impacto Moderado e Impacto Severo. Estes estados não são diretamente observáveis, mas podem ser inferidos através de variáveis observadas, que no nosso caso são as condições meteorológicas: Sol, Chuva Moderada e Chuva Intensa.
A abordagem segue várias etapas: recolha e organização de dados, construção do modelo HMM, ou seja, estabelecemos as probabilidades de transição entre estados ocultos e de emissão das observações, treino do modelo, análise e previsão.

Desta forma, o HMM permite compreender de forma detalhada a ligação entre as condições meteorológicas e os tempos de entrega, identificar tendências ao longo do tempo e propor estratégias para minimizar atrasos, mesmo em cenários de crescente imprevisibilidade climática.

<br><br>
## 3. Brief History and literature review of the problem and methods/algorithms [1,5 valor]

Os atrasos nos sistemas de entrega, representam um problema crítico na gestão logística e na mobilidade moderna. As condições meteorológicas são um dos fatores externos mais significativos para a ocorrência de atrasos, uma vez que estes fenómenos afetam diretamente as operações. A análise e previsão de atrasos devido a fatores climáticos têm ganho relevância nos últimos anos, motivadas por implicações económicas, impactos das alterações climáticas e avanços tecnológicos em métodos de análise de dados.
Assim, O impacto das condições climáticas nos tempos de entrega é um tema amplamente reconhecido na logística e transporte. As alterações climáticas estão a intensificar fenómenos extremos, como chuvas fortes, tempestades e ondas de calor, que afetam diretamente a eficiência das cadeias de abastecimento. Desde atrasos nos transportes rodoviários devido a estradas inundadas até interrupções em portos e aeroportos durante tempestades severas, os desafios logísticos associados ao clima são uma preocupação crescente.

Historicamente, as empresas têm utilizado métodos tradicionais de previsão meteorológica para mitigar riscos, mas estas abordagens limitavam-se à observação básica e ao uso de calendários sazonais. Com o avanço da tecnologia, surgiram sistemas baseados em inteligência artificial e modelagem estatística, como os Modelos Ocultos de Markov (HMMs). Estes métodos são particularmente úteis, pois permitem estimar estados ocultos, como o impacto do clima nos atrasos, a partir de variáveis observáveis, como as condições meteorológicas.

Na literatura, estudos apontam que o uso de HMMs em logística pode prever atrasos com maior precisão ao analisar séries temporais de eventos climáticos e respetivas consequências. Por exemplo, empresas ferroviárias e de transporte rodoviário nos EUA utilizam dados climáticos históricos para adaptar operações em cenários de alto risco climático, reduzindo custos e melhorando a satisfação do cliente. Estas inovações demonstram como métodos analíticos avançados podem tornar a logística mais resiliente perante um clima em mudança.


<br><br>
## 4. About the main method/algorithm used [1,5 valor]

O principal método utilizado neste trabalho é o Modelo de Markov Oculto (HMM - Hidden Markov Model),um modelo estatístico amplamente reconhecido por sua capacidade de lidar com sistemas onde os estados subjacentes não são diretamente observáveis, mas podem ser inferidos a partir de dados visíveis. Este modelo é particularmente útil para capturar relações temporais e probabilísticas entre eventos, sendo amplamente aplicado em áreas como reconhecimento de fala, análise de séries temporais e, mais recentemente, em estudos logísticos relacionados a fatores climáticos.

No contexto deste estudo, as principais características do HMM são:

- Estados Ocultos: Representam os níveis de impacto no tempo de entrega (Normal, Moderado e Severo), que não podem ser diretamente observados.
- Variáveis Observadas: São as condições meteorológicas (Sol, Chuva Moderada e Chuva Intensa), que fornecem pistas sobre os estados ocultos.
- Probabilidades de Transição e Emissão:
    - Transições: A probabilidade de um estado oculto transitar para outro.
    - Emissões: A probabilidade de uma observação ser gerada por um determinado estado oculto.

Vantagens do HMM no Estudo:
- Capacidade de Inferência: Permite inferir o estado oculto atual (impacto no tempo de entrega) com base nas condições meteorológicas observadas.
- Flexibilidade: Adapta-se a sistemas dinâmicos, capturando mudanças de padrão ao longo do tempo.
- Previsão: Pode ser usado para prever atrasos futuros em função de padrões climáticos recorrentes.

<br><br>

## 5. Python imports and global configurations [0,5 valor]

### Install and import the necessary libraries

In [None]:
#import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
import networkx as nx
from hmmlearn.hmm import MultinomialHMM
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

sys.version_info(major=3, minor=12, micro=2, releaselevel='final', serial=0)


<br><br>

## 6. Dataset and variables explanation [1,5 valor]

O dataset utilizado, dataset_hmm_climate_impact.csv, contém duas variáveis principais:

Clima: Representa as condições climáticas observadas, como "Sol", "Chuva Moderada" e "Chuva Intensa".
Impacto no Tempo de Entrega: Classifica o impacto do clima no tempo de entrega em três categorias: "Sem Impacto", "Impacto Moderado" e "Impacto Severo".
Essas variáveis foram mapeadas para valores numéricos para facilitar a modelagem, com o clima mapeado para valores entre 0 e 2 e os impactos também representados por valores numéricos correspondentes.

<br><br>

## 7. Main code as possible solution to the problem [1,5 valor] 

In [None]:
# Carregar os dados
df = pd.read_csv("dataset_hmm_climate_impact.csv")
df.head()

In [None]:
clima_mapping = {
    "Sol": 0,
    "Chuva Moderada": 1,
    "Chuva Intensa": 2 
}

impacto_mapping = {
    "Sem Impacto (Normal)": 0,
    "Impacto Moderado": 1,
    "Impacto Severo": 2
}

df["Clima_Num"] = df["Clima"].map(clima_mapping)
df["Impacto_Num"] = df["Impacto no Tempo de Entrega"].map(impacto_mapping)

# Separar as observações (X) e estados ocultos (y)
X = df["Clima_Num"].values
y = df["Impacto_Num"].values

df.head()


In [None]:
initial_states = df["Impacto_Num"]

n_states = 3
start_probabilities = np.zeros(n_states)

for state in initial_states:
    start_probabilities[state] += 1

# Normalizar para obter porbabilidades
start_probabilities /= len(initial_states)

print("Probabilidades Iniciais:", start_probabilities)


In [None]:
n_states = len(impacto_mapping)  
n_observations = len(clima_mapping)  

# Inicializar matriz de transição
transition_matrix = np.zeros((n_states, n_states))

# Contar frequências de transições entre estados
for i in range(1, len(y)):
    prev_state = y[i - 1]
    curr_state = y[i]
    transition_matrix[prev_state, curr_state] += 1

# Normalizar as frequências para obter probabilidades
transition_matrix = transition_matrix / transition_matrix.sum(axis=1, keepdims=True)
print("Matriz de Transição:")
print(transition_matrix)

plt.figure(figsize=(8, 6))
sns.heatmap(transition_matrix, annot=True, cmap="Blues", cbar=True, fmt='.2f', 
            xticklabels=["Sem Impacto", "Impacto Moderado", "Impacto Severo"], 
            yticklabels=["Sem Impacto", "Impacto Moderado", "Impacto Severo"])
plt.title("Matriz de Transição (Impactos nos Tempos de Entrega)")
plt.xlabel("Estado de Destino")
plt.ylabel("Estado de Origem")
plt.show()

In [None]:
# Inicializar matriz de emissões
emission_matrix = np.zeros((n_states, n_observations))

# Contar frequências para cada par (estado, observação)
for i in range(len(y)):
    state = y[i]
    observation = X[i]
    emission_matrix[state, observation] += 1

# Normalizar as frequências para obter probabilidades
emission_matrix = emission_matrix / emission_matrix.sum(axis=1, keepdims=True)
print("Matriz de Emissão:")
print(emission_matrix)

# Visualização da matriz de emissão
plt.figure(figsize=(8, 6))
sns.heatmap(emission_matrix, annot=True, cmap="Greens", cbar=True, fmt='.2f', 
            xticklabels=["Sol", "Chuva Moderada", "Chuva Intensa"], 
            yticklabels=["Sem Impacto", "Impacto Moderado", "Impacto Severo"])
plt.title("Matriz de Emissão (Clima e Impacto nos Tempos de Entrega)")
plt.xlabel("Clima Observado")
plt.ylabel("Estado Oculto (Impacto)")
plt.show()



In [None]:
hidden_states = ["SI", "IM", "IS"]
observations = ["Sol", "CM", "CI"]

# Criar um grafo direcionado
G = nx.DiGraph()

# Adicionar um nó "Start" e conectá-lo aos estados ocultos com as probabilidades de início
G.add_node("Start", layer=-1, color='lightgray')

# Adicionar os estados ocultos ao grafo
for state in hidden_states:
    G.add_node(state, layer=0, color='lightblue')

# Adicionar as observações como nós separados
for obs in observations:
    G.add_node(obs, layer=1, color='lightgreen')

# Criar arestas do nó "Start" para os estados ocultos com as probabilidades de início
for i, state in enumerate(hidden_states):
    weight = start_probabilities[i]
    G.add_edge("Start", state, weight=weight)

# Adicionar arestas de transição entre os estados ocultos
for i, from_state in enumerate(hidden_states):
    for j, to_state in enumerate(hidden_states):
        weight = transition_matrix[i][j]
        if weight > 0:
            G.add_edge(from_state, to_state, weight=weight, style="solid")

# Adicionar arestas de emissão
for i, state in enumerate(hidden_states):
    for j, obs in enumerate(observations):
        weight = emission_matrix[i][j]
        if weight > 0:
            G.add_edge(state, obs, weight=weight, style="dashed")

# Configurar a posição dos nós para visualização
pos = {}
# Colocar o nó "Start" na parte superior
pos["Start"] = (len(hidden_states) / 3, 2)
# Colocar os estados ocultos na linha superior
for i, state in enumerate(hidden_states):
    pos[state] = (i, 1)
# Colocar as observações na linha inferior
for j, obs in enumerate(observations):
    pos[obs] = (j, 0)

# Atributos das arestas
edge_labels = nx.get_edge_attributes(G, "weight")
edge_styles = nx.get_edge_attributes(G, "style")

# Desenhar nós com cores diferentes
node_colors = [G.nodes[node].get('color', 'white') for node in G.nodes()]
nx.draw(G, pos, with_labels=True, node_color=node_colors, font_weight='bold', node_size=2000)

# Adicionar rótulos das arestas
nx.draw_networkx_edge_labels(G, pos, edge_labels={(u, v): f"{d['weight']:.2f}" for u, v, d in G.edges(data=True)})

# Título e exibição
plt.title("Modelo de Markov Oculto")
plt.show()

In [None]:
# Divisão  dos dados em treino e teste (80% treino, 20% teste)
X = df['Clima_Num'].values.reshape(-1, 1)  # Variáveis observadas
y = df['Impacto_Num'].values  # Estados ocultos 

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Resumo das divisões
X_train.shape, X_test.shape, y_train.shape, y_test.shape


In [None]:
# Configurar e treinar o modelo HMM
model = MultinomialHMM(n_components=3, init_params="mc")

# Configurar matrizes no modelo
model.startprob_ = start_probabilities
model.transmat_ = transition_matrix
model.emissionprob_ = emission_matrix

# Treinar o modelo com os dados de treino (apenas observações)
model.fit(X_train)

# Inferir os estados ocultos para o conjunto de treino
predicted_states_train = model.predict(X_train)
accuracy_train = accuracy_score(y_train, predicted_states_train)

# Inferir os estados ocultos para o conjunto de teste
predicted_states_test = model.predict(X_test)
accuracy_test = accuracy_score(y_test, predicted_states_test)

print(f"Accuracy Train: {accuracy_train}")
print(f"Accuracy Test: {accuracy_test}")

<br><br>

## 8. Analysis of Example 1 [3,0 valor] 

a

<br><br>

## 9. Analysis of Example 2 [3,0 valor]

a

<br><br>
## 10. Pros and cons of the approach [2,0 valor]

Pros:

- O HMM é eficaz para modelar sistemas estocásticos com estados ocultos e dependências temporais.
- A abordagem probabilística permite uma análise detalhada das transições e emissões, possibilitando previsões baseadas em dados históricos.


Cons:

- O modelo depende da qualidade dos dados, e dados ausentes ou errôneos podem afetar a precisão das previsões.
- A definição dos estados ocultos pode ser subjetiva e exigir uma interpretação cuidadosa dos dados.




<br><br>
## 11. Future improvements [2,0 valor]

Entre as melhorias possíveis, destaca-se a inclusão de mais variáveis no modelo, como dados temporais (hora do dia) e dados de tráfego. A utilização de técnicas de validação cruzada também pode ajudar a melhorar a generalização do modelo e evitar o overfitting. Além disso, a experimentação com outros tipos de modelos, como redes neurais ou algoritmos de aprendizado profundo, pode fornecer uma comparação interessante e eventualmente melhorar a precisão das previsões.

<br>
<div style="text-align: center;">
    <br><br>
    <p style="font-size: 40px;">References [1,0 valor]</p>
</div>
<br>


https://climavision.com/

https://www.ncei.noaa.gov/

https://www.benisonlogistics.com/