## Importando as bibliotecas necessárias

In [3]:
import pandas as pd

## Carregando o arquivo CSV com os dados dos passageiros

In [4]:
passageiros=pd.read_csv("raw-data/passageiros.csv")

## Visualizando as primeiras linhas dos dados

In [None]:
passageiros.head()

## Importando a biblioteca Seaborn

In [6]:
import seaborn as sns

## Configurando o tamanho e as fontes das figuras

In [7]:
import matplotlib as mpl
mpl.rcParams["figure.figsize"] = (10,6)
mpl.rcParams["font.size"] = 20

## Criando um gráfico de linha para visualizar a quantidade de passageiros ao longo do tempo

In [None]:
sns.lineplot(x="tempo", y="passageiros", data=passageiros, label="dado_completo")

## Importando o StandardScaler da biblioteca Scikit-learn para escalonamento dos dados

In [9]:
from sklearn.preprocessing import StandardScaler

## Instanciando o StandardScaler

In [10]:
sc=StandardScaler()

## Ajustando o StandardScaler aos dados

In [None]:
sc.fit(passageiros)

## Normalizando os dados

In [12]:
dado_normalizado=sc.transform(passageiros)

## Separando os dados normalizados em variáveis x e y

In [13]:
x=dado_normalizado[:,0]
y=dado_normalizado[:,1]

## Importando o Matplotlib para visualização

In [14]:
import matplotlib.pyplot as plt

## Plotando os dados normalizados em um gráfico de linha

In [None]:
sns.lineplot(x=x, y=y, label="dado_normalizado")
plt.ylabel("Passageiros")
plt.xlabel("Data")

## Definindo os tamanhos de treino e teste

In [16]:
size_treino=int(len(passageiros)*0.9)
size_teste=len(passageiros)-size_treino

## Separando os dados de treino

In [17]:
x_treino=x[0:size_treino]
y_treino=y[0:size_treino]

## Separando os dados de teste

In [18]:
x_teste=x[size_treino:len(passageiros)]
y_teste=y[size_treino:len(passageiros)]

## Plotando os dados de treino e teste

In [None]:
sns.lineplot(x=x_treino, y=y_treino, label="Treino")
sns.lineplot(x=x_teste, y=y_teste, label="Teste")
plt.ylabel("Passageiros")
plt.xlabel("Data")

## Importando as classes Sequential e Dense do TensorFlow

In [None]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

## Criando uma instância do modelo Sequential
Aqui estamos criando um modelo sequencial, que será usado para empilhar camadas de uma rede neural.

In [21]:
regressor=Sequential()

## Adicionando uma camada densa com ativação linear
Aqui estamos adicionando uma camada densa ao modelo, com 1 neurônio e ativação linear. O kernel é inicializado com valores "Ones" e a camada não utiliza bias.

In [None]:
regressor.add(Dense(1, input_dim=1, kernel_initializer="Ones", activation="linear", use_bias=False))

## Compilando o modelo
Nesta célula, o modelo é compilado com a função de perda mean squared error (erro quadrático médio) e o otimizador adam, que ajustará os pesos durante o treinamento.

In [23]:
regressor.compile(loss="mean_squared_error", optimizer="adam")

## Exibindo o resumo do modelo
Aqui, o método summary é usado para visualizar a arquitetura do modelo, incluindo o número de parâmetros treináveis em cada camada.

In [None]:
regressor.summary()

## Treinando o modelo
Nesta célula, o modelo é treinado com os dados de treino x_treino e y_treino.

In [None]:
regressor.fit(x_treino, y_treino)

## Fazendo previsões com o modelo
Aqui estamos utilizando o método predict para gerar as previsões com base nos dados de treino.

In [None]:
y_pred=regressor.predict(x_treino)

## Plotando o resultado do treino e as previsões
Nesta célula, são plotados os valores reais do treino e as previsões geradas pelo modelo em um gráfico de linha para comparação.

In [None]:
sns.lineplot(x=x_treino, y=y_treino, label="Treino")
sns.lineplot(x=x_treino, y=y_pred[:,0], label="Predição")

## Criando um dicionário com os dados para o DataFrame

In [28]:
d={"Tempo": x_treino, "Passageiros": y_pred[:,0]}

## Criando um DataFrame com o dicionário de dados

In [29]:
resultado=pd.DataFrame(data=d)

## Exibindo o DataFrame resultante

In [None]:
resultado

## Aplicando a transformação inversa para voltar à escala original
Nesta célula, estamos utilizando inverse_transform para aplicar a transformação inversa no DataFrame resultado, retornando os valores à escala original.

In [31]:
resultado_transf=sc.inverse_transform(resultado)

## Criando um DataFrame com os dados transformados
Aqui, criamos um DataFrame com os dados transformados para a escala original, armazenando em resultado_transf.

In [32]:
resultado_transf=pd.DataFrame(resultado_transf)

## Renomeando as colunas do DataFrame transformado
Nesta célula, estamos renomeando as colunas de resultado_transf para "Tempo" e "Passageiros" para que elas correspondam aos nomes das colunas do DataFrame original.

In [33]:
resultado_transf.columns=["Tempo", "Passageiros"]

## Plotando os dados originais e ajustados
Aqui, utilizamos o seaborn.lineplot para plotar os dados originais de passageiros e o ajuste de treino em dois gráficos de linha distintos para comparação.

In [None]:
sns.lineplot(x="tempo", y="passageiros", data=passageiros, label="dado_completo")
sns.lineplot(x="Tempo", y="Passageiros", data=resultado_transf, label="ajuste_treino")

## Fazendo previsões com os dados de teste

In [None]:
y_pred_teste=regressor.predict(x_teste)

## Criando um dicionário com as previsões do teste
Nesta célula, criamos um dicionário com as colunas "Tempo" e "Passageiros", onde "Tempo" contém os dados de x_teste e "Passageiros" contém as previsões de y_pred_teste.

In [36]:
d={"Tempo": x_teste, "Passageiros": y_pred_teste[:,0]}
resultado_teste=pd.DataFrame(data=d)

## Aplicando a transformação inversa aos dados de teste
Aqui aplicamos a função inverse_transform ao DataFrame de teste para retornar os dados à escala original.

In [37]:
resultado_transf_teste=sc.inverse_transform(resultado_teste)

## Criando um DataFrame com os dados transformados do teste
Nesta célula, criamos um novo DataFrame com os dados de teste transformados, armazenando-o como resultado_transf_teste.

In [38]:
resultado_transf_teste=pd.DataFrame(resultado_transf_teste)

## Renomeando as colunas do DataFrame de teste transformado

In [39]:
resultado_transf_teste.columns=["Tempo", "Passageiros"]

## Plotando os dados reais, o ajuste de treino e as previsões do teste
Nesta célula, são gerados gráficos de linha com os dados reais, o ajuste de treino e as previsões feitas sobre os dados de teste, permitindo comparar os três conjuntos de dados.

In [None]:
sns.lineplot(x="tempo", y="passageiros", data=passageiros, label="dado_completo")
sns.lineplot(x="Tempo", y="Passageiros", data=resultado_transf, label="ajuste_treino")
sns.lineplot(x="Tempo", y="Passageiros", data=resultado_transf_teste, label="previsão")

## Criando um novo modelo sequencial

In [41]:
regressor2=Sequential()

## Adicionando camadas densas ao modelo
Estamos adicionando três camadas densas (Dense) ao modelo:
1. A primeira camada com 8 neurônios e dimensão de entrada 1, com inicialização aleatória (random_uniform) e ativação linear.
2. A segunda camada com 8 neurônios, também com inicialização aleatória e ativação linear.
3. A terceira camada com 1 neurônio, para produzir a saída final, novamente com inicialização aleatória e ativação linear. Em todas as camadas, o bias não é utilizado.

In [None]:
regressor2.add(Dense(8, input_dim=1, kernel_initializer="random_uniform", activation="linear", use_bias=False))
regressor2.add(Dense(8, kernel_initializer="random_uniform", activation="linear", use_bias=False))
regressor2.add(Dense(1, kernel_initializer="random_uniform", activation="linear", use_bias=False))

## Compilando o novo modelo
Nesta célula, estamos compilando o modelo regressor2 utilizando a função de perda mean squared error (erro quadrático médio) e o otimizador adam.

In [43]:
regressor2.compile(loss="mean_squared_error", optimizer="adam")

## Exibindo o resumo do novo modelo

In [None]:
regressor2.summary()

## Treinando o modelo com os dados de treino
Nesta célula, estamos treinando o modelo regressor2 utilizando os dados de treino x_treino e y_treino por 200 épocas. Durante esse processo, o modelo ajusta seus pesos para minimizar o erro.

In [None]:
regressor2.fit(x_treino, y_treino, epochs=200)

## Fazendo previsões com os dados de treino

In [None]:
y_pred=regressor2.predict(x_treino)

## Fazendo previsões com os dados de teste

In [None]:
y_pred_teste=regressor2.predict(x_teste)

## Plotando os resultados das previsões e dos dados reais
Aqui estamos utilizando seaborn para gerar gráficos de linha que comparam:
1. Os dados reais de treino (x_treino, y_treino).
2. Os dados reais de teste (x_teste, y_teste).
3. As previsões feitas com os dados de treino (x_treino, y_pred).
4. As previsões feitas com os dados de teste (x_teste, y_pred_teste).
Esses gráficos permitem visualizar como o modelo se ajustou aos dados e a precisão das previsões.

In [None]:
sns.lineplot(x=x_treino, y=y_treino, label="Treino")
sns.lineplot(x=x_teste, y=y_teste, label="Teste")
sns.lineplot(x=x_treino, y=y_pred[:,0], label="Ajuste")
sns.lineplot(x=x_teste, y=y_pred_teste[:,0], label="Predição")

In [49]:
regressor2=Sequential()

## Adicionando camadas densas ao modelo com novas funções de ativação
Foram feitas as seguintes alterações nas camadas:
1. A primeira camada tem 8 neurônios com ativação sigmoid, dimensão de entrada 1, e inicialização aleatória (random_uniform). Não utiliza bias.
2. A segunda camada tem 8 neurônios com ativação sigmoid, e também não utiliza bias.
3. A terceira camada tem 1 neurônio com ativação linear para a saída final, mantendo a inicialização aleatória e sem utilizar bias.
Essas alterações no uso de funções de ativação podem influenciar a maneira como a rede aprende e ajusta os pesos.

In [None]:
regressor2.add(Dense(8, input_dim=1, kernel_initializer="random_uniform", activation="sigmoid", use_bias=False))
regressor2.add(Dense(8, kernel_initializer="random_uniform", activation="sigmoid", use_bias=False))
regressor2.add(Dense(1, kernel_initializer="random_uniform", activation="linear", use_bias=False))

## Compilando o novo modelo com as camadas ajustadas
Aqui, compilamos o modelo com a função de perda mean squared error (erro quadrático médio) e o otimizador adam, mantendo as mesmas configurações da versão anterior.

In [51]:
regressor2.compile(loss="mean_squared_error", optimizer="adam")

## Exibindo o resumo do novo modelo

In [None]:
regressor2.summary()

## Treinando o modelo com 500 épocas
Nesta célula, estamos treinando o modelo regressor2 por 500 épocas, uma mudança em relação ao treinamento anterior, que utilizava menos épocas. Esse aumento no número de épocas permite que o modelo tenha mais iterações sobre os dados de treino, potencialmente melhorando o ajuste da rede neural.

In [None]:
regressor2.fit(x_treino, y_treino, epochs=500)

In [None]:
y_pred=regressor2.predict(x_treino)

In [None]:
y_pred_teste=regressor2.predict(x_teste)

## Plotando os resultados do treino, teste, ajuste e previsão
Aqui utilizamos o seaborn para gerar gráficos de linha que comparam:
1. Os dados reais de treino (x_treino, y_treino).
2. Os dados reais de teste (x_teste, y_teste).
3. As previsões feitas pelo modelo para os dados de treino (x_treino, y_pred).
4. As previsões feitas pelo modelo para os dados de teste (x_teste, y_pred_teste).
Esses gráficos permitem visualizar como o modelo se ajustou aos dados e avaliar a precisão das previsões.

In [None]:
sns.lineplot(x=x_treino, y=y_treino, label="Treino")
sns.lineplot(x=x_teste, y=y_teste, label="Teste")
sns.lineplot(x=x_treino, y=y_pred[:,0], label="Ajuste")
sns.lineplot(x=x_teste, y=y_pred_teste[:,0], label="Predição")

Neste notebook, estamos desenvolvendo um modelo de regressão utilizando redes neurais, com a ajuda da biblioteca Keras (integrada ao TensorFlow). O objetivo principal é prever valores baseados em um conjunto de dados de treino e avaliar a performance do modelo com base em dados de teste. Vamos detalhar passo a passo o que fizemos até o momento.

### 1. Construção do Modelo Inicial

Iniciamos a criação do nosso modelo neural utilizando o Sequential, que permite empilhar camadas densas (fully connected) de forma simples e sequencial. Definimos três camadas:
- Primeira camada: Com 8 neurônios, função de ativação sigmoid, sem bias, e com inicialização aleatória dos pesos (random_uniform). Essa camada recebe os dados de entrada com dimensão 1.
- Segunda camada: Também com 8 neurônios e ativação sigmoid, sem bias, e mantendo a inicialização aleatória.
- Terceira camada: Camada de saída com 1 neurônio, ativação linear e sem bias. O uso de ativação linear nesta camada é importante, pois estamos realizando uma tarefa de regressão, que exige uma saída contínua.

### 2. Compilação do Modelo

Após definir a arquitetura, compilamos o modelo utilizando:
- Função de perda: mean squared error (erro quadrático médio), que é uma métrica comum em problemas de regressão, pois mede a diferença quadrática entre os valores reais e as previsões.
- Otimizador: adam, um algoritmo de otimização muito eficiente que combina as melhores características do método de descida de gradiente, adaptando a taxa de aprendizado ao longo do treinamento.

### 3. Treinamento do Modelo

O treinamento foi realizado utilizando os dados de treino (x_treino e y_treino), ajustando o modelo por 500 épocas. O número de épocas controla quantas vezes o modelo passa por todo o conjunto de dados de treino. Um número maior de épocas permite que o modelo tenha mais tempo para ajustar os pesos, embora isso também possa levar ao overfitting (quando o modelo se ajusta demais aos dados de treino e não generaliza bem para novos dados).

### 4. Previsões

Após o treinamento, utilizamos o modelo treinado para fazer previsões tanto com os dados de treino quanto com os dados de teste:
- Previsão com os dados de treino: Serve para avaliar como o modelo se ajustou ao próprio conjunto de dados com o qual foi treinado.
- Previsão com os dados de teste: Utilizamos dados nunca vistos pelo modelo para verificar sua capacidade de generalização, ou seja, o quão bem ele consegue prever novos dados.

### 5. Visualização dos Resultados

Para facilitar a compreensão dos resultados, utilizamos a biblioteca Seaborn para plotar gráficos de linha que mostram:
- Os valores reais dos dados de treino e teste.
- As previsões feitas pelo modelo tanto para o treino quanto para o teste.

Esses gráficos nos permitem comparar visualmente como o modelo está se comportando:
- Se as linhas das previsões e dos valores reais estão muito próximas, significa que o modelo está ajustado de maneira eficiente.
- Se houver uma discrepância grande entre as previsões e os valores reais (especialmente nos dados de teste), pode indicar que o modelo não generalizou bem ou está superajustado aos dados de treino.

### 6. Ajustes Finais no Modelo

O modelo foi modificado algumas vezes para incluir diferentes funções de ativação (sigmoid nas camadas ocultas e linear na camada de saída) e treinar por 500 épocas. Esses ajustes permitiram que a rede neural capturasse melhor as relações nos dados.

In [57]:
import numpy as np

In [58]:
vetor=pd.DataFrame(y_treino)[0]

In [60]:
def separa_dados(vetor, n_passos):
    x_novo, y_novo=[],[]
    for i in range(n_passos, vetor.shape[0]):
        x_novo.append(list(vetor[i-n_passos:i-1]))
        y_novo.append(vetor.loc[i])
    x_novo, y_novo=np.array(x_novo), np.array(y_novo)
    return x_novo, y_novo

In [61]:
x_treino_novo, y_treino_novo=separa_dados(vetor, 1)

In [None]:
x_treino_novo[0:5]

In [None]:
y_treino_novo[0:5]

In [65]:
vetor2=pd.DataFrame(y_teste)[0]

In [66]:
x_teste_novo, y_teste_novo=separa_dados(vetor2, 1)

In [67]:
regressor3=Sequential()

In [69]:
regressor3.add(Dense(8, input_dim=1, kernel_initializer="ones", activation="linear", use_bias=False))
regressor3.add(Dense(64, kernel_initializer="random_uniform", activation="sigmoid", use_bias=False))
regressor3.add(Dense(1, kernel_initializer="random_uniform", activation="linear", use_bias=False))

In [70]:
regressor3.compile(loss="mean_squared_error", optimizer="adam")

In [None]:
print(x_treino_novo.shape)
print(y_treino_novo.shape)

In [None]:
regressor3.fit(x_treino_novo, y_treino_novo, epochs=100)