# Introdução ao Business Intelligence e Analytics (BI&A)

### 1.1  - Conceitos básicos e terminologias
* ``Business Intelligence (BI)``: Processo de coleta, armazenamento, análise e transformação de dados brutos em informações úteis para tomada de decisões.

* ``Business Analytics (BA)``: Aplicação de técnicas estatísticas, computacionais e de aprendizado de máquina para analisar e interpretar dados, identificar padrões e tendências, e gerar insights de negócios.
* ``Data Warehouse``: Repositório centralizado de dados de uma organização, projetado para facilitar a análise e geração de relatórios.
* ``Data Mart``: Subconjunto de um data warehouse focado em uma área específica de negócio.

### 1.2 - Importância e benefícios do BI&A
* ``Melhor tomada de decisões``: BI&A oferece insights e informações baseadas em dados para apoiar decisões mais eficazes e informadas.

* ``Maior eficiência operacional``: A análise de dados pode revelar áreas de melhoria e otimização nos processos de negócios.
* ``Aumento da competitividade``: O uso de BI&A pode ajudar as empresas a identificar oportunidades e ameaças no mercado e se posicionar de forma mais competitiva.
* ``Melhoria na satisfação do cliente``: A análise de dados permite compreender melhor as necessidades e preferências dos clientes, permitindo oferecer produtos e serviços mais personalizados.

### 1.3 - Diferença entre Business Intelligence e Business Analytics

``Business Intelligence (BI)``:

Focado em análises descritivas e diagnósticas.
Responde às perguntas "o que aconteceu?" e "por que aconteceu?"
Relatórios históricos e dashboards de desempenho.
Exemplos de ferramentas: Tableau, Power BI, QlikView.

``Business Analytics (BA)``:

Focado em análises preditivas e prescritivas.
Responde às perguntas "o que vai acontecer?" e "o que devemos fazer?"
Modelagem preditiva, análise de cenários e otimização.
Exemplos de ferramentas: Python, R, SAS, Apache Spark.

### 1.4 - Conclusão

BI&A são fundamentais para apoiar a tomada de decisões baseada em dados e impulsionar o sucesso dos negócios.

BI e BA são complementares: BI ajuda a entender o passado e o presente, enquanto BA busca prever e influenciar o futuro.
O domínio desses conceitos e técnicas é essencial para profissionais que desejam trabalhar com análise de dados e gestão de negócios.

# 2 - Componentes do BI&A

### 2.1 ETL (Extração, Transformação e Carregamento)

* ``Extração``: Coleta de dados de várias fontes (sistemas de gestão, bases de dados, arquivos, etc.).

* ``Transformação``: Processamento e limpeza dos dados extraídos para garantir qualidade, consistência e adequação ao propósito de análise.
* ``Carregamento``: Inserção dos dados transformados no Data Warehouse ou Data Mart para armazenamento e análise.

Importância do ETL: Garante a disponibilidade, integridade e qualidade dos dados para análise e tomada de decisões.

Exemplos de ferramentas ETL: Talend, Microsoft SQL Server Integration Services, Apache NiFi.


### 2.2 - Data Warehouse e Data Marts

``Data Warehouse``:

Repositório centralizado de dados de uma organização.
Armazena dados históricos e atuais de várias fontes.
Facilita a análise e geração de relatórios.
Estruturado em esquemas como o Star Schema e o Snowflake Schema.

``Data Mart``:

Subconjunto de um Data Warehouse focado em uma área específica de negócio.
Permite análises mais rápidas e eficientes para departamentos ou equipes específicas.
Pode ser construído de forma independente ou a partir de um Data Warehouse existente.


### 2.3 - Ferramentas de visualização e relatórios

* Objetivo: Apresentar informações e insights gerados a partir dos dados em formatos visualmente atraentes e facilmente compreensíveis (gráficos, tabelas, mapas, etc.).

* Importância: Facilita a comunicação e a compreensão dos resultados das análises de dados por tomadores de decisão e stakeholders.
* Exemplos de ferramentas de visualização e relatórios:
    * Tableau: Ferramenta de visualização de dados interativa e fácil de usar, com recursos avançados de análise e integração de dados.
    
    * Microsoft Power BI: Plataforma de BI que oferece visualizações interativas e recursos de análise integrados com o Microsoft Office.
    * QlikView: Solução de BI que permite a criação de visualizações personalizadas e relatórios interativos.
Slide 5: Conclusão

Os componentes do BI&A, como ETL, Data Warehouse e Data Marts, e ferramentas de visualização e relatórios, são essenciais para a construção de uma solução de BI&A eficiente e eficaz.

Conhecer e entender esses componentes permite que os profissionais de BI&A selecionem e implementem as melhores soluções e práticas para suas necessidades de negócio.

# 3 - Introdução ao Python para BI&A

### 3.1 - Por que Python?

* Linguagem de programação popular, versátil e fácil de aprender.

* Grande ecossistema de bibliotecas e módulos para análise de dados, visualização e aprendizado de máquina.
* Ampla comunidade e suporte, com muitos recursos, tutoriais e exemplos disponíveis.
* Python é uma escolha popular em empresas e instituições acadêmicas para BI&A devido à sua flexibilidade e capacidade de integração com outras tecnologias.

### 3.2 - Bibliotecas Python para BI&A

* Pandas: Biblioteca para manipulação e análise de dados, oferece estruturas de dados flexíveis e eficientes (DataFrame e Series).

* NumPy: Biblioteca para computação numérica, oferece suporte para arrays multidimensionais e funções matemáticas de alto nível.
* Matplotlib: Biblioteca para criação de gráficos e visualizações 2D e 3D.
* Seaborn: Biblioteca de visualização de dados baseada no Matplotlib, oferece uma interface de alto nível para criar gráficos estatísticos mais atraentes e informativos.
* Scikit-learn: Biblioteca para aprendizado de máquina e análise preditiva, oferece uma ampla gama de algoritmos e ferramentas para modelagem e validação de dados.

### 3.3 - Demonstração de importação e manipulação de dados com Pandas

Objetivo: Mostrar um exemplo prático de como usar o Pandas para importar e manipular dados em Python.

Exemplo de código:

Este exemplo analisa o desempenho das vendas por categoria de produto e gênero do cliente, fornecendo insights mais detalhados sobre os padrões de compra. Além disso, calculamos a média do lucro por item vendido em cada categoria de produto, o que pode ser útil para entender a rentabilidade de diferentes produtos. Ao final, criamos uma tabela dinâmica (tabela_dinamica) para facilitar a visualização e análise dos resultados.

In [None]:
# Importar bibliotecas
import pandas as pd

# Ler arquivo CSV e criar um DataFrame
url = "https://raw.githubusercontent.com/ine-rmotr-curriculum/FreeCodeCamp-Pandas-Real-Life-Example/master/data/sales_data.csv"
dados_vendas = pd.read_csv(url, parse_dates=["Date"])


In [None]:
# Visualizar as primeiras linhas do DataFrame
dados_vendas.head()

In [None]:
# Adicionar coluna 'Mês' para agrupar vendas por mês
dados_vendas['Mês'] = dados_vendas['Date'].dt.to_period('M')

In [None]:
dados_vendas['Date'].head(2)

In [None]:
dados_vendas['Date'].dt.to_period('M').head(2)

In [None]:
# Calcular o lucro médio por item e adicionar como uma nova coluna
dados_vendas['Lucro_por_Item'] = dados_vendas['Profit'] / dados_vendas['Order_Quantity']

# Agrupar os dados por 'Mês', 'Product_Category' e 'Customer_Gender'
# Calcular a soma da receita, lucro e quantidade de pedidos e a média do lucro por item
dados_agrupados = dados_vendas.groupby(['Mês', 'Product_Category', 'Customer_Gender']).agg({
    'Revenue': 'sum',
    'Profit': 'sum',
    'Order_Quantity': 'sum',
    'Lucro_por_Item': 'mean'
}).reset_index()

# Criar uma tabela dinâmica (pivot table) com o desempenho das vendas
# por categoria de produto e gênero do cliente
tabela_dinamica = dados_agrupados.pivot_table(
    values=['Revenue', 'Lucro_por_Item'],
    index=['Mês', 'Product_Category'],
    columns='Customer_Gender',
    aggfunc='sum'
)

# Salvar DataFrame como um novo arquivo CSV
tabela_dinamica.to_csv("resultado_vendas_categoria_genero.csv")

tabela_dinamica

### 3.4 - Conclusão

Python é uma linguagem poderosa e versátil para BI&A, com um ecossistema rico e uma comunidade ativa.
A familiaridade com bibliotecas como Pandas, NumPy, Matplotlib e Seaborn é essencial para realizar análises de dados eficientes e eficazes com Python.

A prática constante e a exploração de recursos disponíveis são fundamentais para desenvolver habilidades em Python para BI&A.

# 4 - Análise Exploratória de Dados (EDA) com Python (20 minutos)

### 4.1 - Conceito de EDA e sua importância

A Análise Exploratória de Dados (EDA) é uma abordagem para analisar conjuntos de dados a fim de resumir suas características principais, geralmente com métodos visuais. É uma etapa crucial na análise de dados, pois ajuda a entender a estrutura, as relações e os padrões nos dados antes de aplicar técnicas de modelagem estatística ou aprendizado de máquina. A EDA é fundamental para identificar problemas nos dados, como valores ausentes, outliers e erros, bem como para gerar hipóteses e extrair insights que podem ser úteis no processo de tomada de decisão.

### 4.2 - Técnicas de EDA (estatísticas descritivas, visualizações gráficas, etc.)

As técnicas de EDA podem ser divididas em dois tipos principais: estatísticas descritivas e visualizações gráficas.

Estatísticas descritivas: São medidas numéricas que resumem e descrevem as características dos dados. Incluem medidas de tendência central (média, mediana e moda), medidas de dispersão (amplitude, variância e desvio padrão) e medidas de forma (assimetria e curtose). Essas estatísticas ajudam a entender a distribuição, a dispersão e a forma dos dados.

Visualizações gráficas: São representações visuais dos dados que facilitam a compreensão das relações, padrões e tendências nos dados. Alguns exemplos de gráficos utilizados na EDA são histogramas, gráficos de dispersão, boxplots e gráficos de barras. As visualizações gráficas são complementares às estatísticas descritivas e podem fornecer insights que não são facilmente obtidos apenas com números.

### 4.3 - Demonstração prática de EDA com Python (Pandas, Matplotlib e Seaborn)

Nesta demonstração, vamos explorar a base de dados de vendas já criada, realizando uma análise exploratória de dados completa utilizando as bibliotecas Pandas, Matplotlib e Seaborn.

In [None]:
# Importar bibliotecas e carregar os dados
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

url = "https://raw.githubusercontent.com/ine-rmotr-curriculum/FreeCodeCamp-Pandas-Real-Life-Example/master/data/sales_data.csv"
dados_vendas = pd.read_csv(url, parse_dates=["Date"])


In [None]:
# Verificar informações básicas do conjunto de dados
# Verificar as primeiras linhas
dados_vendas.head()

In [None]:
# Não acho a melhor forma de ver, mas mostra todas as colunas
print(dados_vendas.head())

In [None]:
# Verificar o tamanho do conjunto de dados
print(dados_vendas.shape)

In [None]:
# Verificar os tipos de dados e informações gerais
print(dados_vendas.info())

In [None]:
# Resumo estatístico das colunas numéricas
dados_vendas.describe().T

In [None]:
# Resumo estatístico das colunas textuais
dados_vendas.describe(include = 'O').T

In [None]:
# Calcular a média da receita por categoria de produto
media_receita_categoria = dados_vendas.groupby("Product_Category")["Revenue"].mean()
media_receita_categoria

Este gráfico mostra a distribuição das idades dos clientes no conjunto de dados. Ele permite visualizar a frequência de cada faixa etária e ajuda a entender a demografia dos clientes. Podemos identificar em quais faixas etárias os clientes estão mais concentrados e adaptar nossas estratégias de marketing e vendas de acordo.

In [None]:
# Histograma da coluna 'Customer_Age'
sns.histplot(data=dados_vendas, x='Customer_Age', bins=30, kde=True)
plt.title('Distribuição da Idade dos Clientes')
plt.xlabel('Idade')
plt.ylabel('Frequência')
plt.show()

O gráfico de barras exibe a quantidade de vendas para cada categoria de produto. A partir deste gráfico, podemos identificar quais categorias de produtos são mais populares e vendem mais. Isso pode nos ajudar a ajustar nosso estoque e focar nas categorias com maior demanda.

In [None]:
# Gráfico de barras da quantidade de vendas por categoria de produto
plt.figure(figsize=(10, 5))
sns.countplot(data=dados_vendas, x='Product_Category', order=dados_vendas['Product_Category'].value_counts().index)
plt.title('Quantidade de Vendas por Categoria de Produto')
plt.xlabel('Categoria de Produto')
plt.ylabel('Quantidade')
plt.show()

O gráfico de dispersão mostra a relação entre a quantidade de pedidos e a receita para cada categoria de produto. Ele nos ajuda a identificar possíveis padrões e tendências nas vendas e a analisar a eficiência das diferentes categorias de produtos em termos de geração de receita. Com base nesses insights, podemos ajustar nossas estratégias de vendas e estoque para otimizar o desempenho das categorias.

In [None]:
# Gráfico de dispersão da quantidade de pedidos versus receita
plt.figure(figsize=(10, 5))
sns.scatterplot(data=dados_vendas, x='Order_Quantity', y='Revenue', hue='Product_Category')
plt.title('Quantidade de Pedidos vs. Receita por Categoria de Produto')
plt.xlabel('Quantidade de Pedidos')
plt.ylabel('Receita')
plt.show()

O boxplot apresenta a distribuição da receita por categoria de produto, mostrando a mediana, quartis e possíveis outliers. Ele nos permite comparar rapidamente as categorias em termos de receita e identificar quais delas estão gerando mais lucro. Isso pode nos ajudar a direcionar nossos esforços de marketing e vendas para as categorias mais lucrativas.

In [None]:
# Boxplot da receita por categoria de produto
# Aplicar a função 'clip' para limitar os valores da coluna 'Revenue' entre 0 e 15000
y = dados_vendas['Revenue'].clip(lower=0, upper=5000)

# Configurar o tamanho e o estilo do gráfico (opcional)
plt.figure(figsize=(10, 5))
sns.set_style("whitegrid")

# Criar o boxplot da receita por categoria de produto
sns.boxplot(data=dados_vendas, x='Product_Category', y=y)
plt.title('Distribuição da Receita por Categoria de Produto')
plt.xlabel('Categoria de Produto')
plt.ylabel('Receita')
plt.show()

O gráfico de violino é semelhante ao boxplot, mas também mostra a densidade estimada de probabilidade dos dados em diferentes valores. Isso fornece uma visão mais detalhada da distribuição da receita por categoria de produto.

In [None]:
# Configurar o tamanho e o estilo do gráfico (opcional)
plt.figure(figsize=(10, 5))
sns.set_style("whitegrid")

# Criar o gráfico de violino da receita por categoria de produto
sns.violinplot(data=dados_vendas, x='Product_Category', y='Revenue')
plt.title('Distribuição da Receita por Categoria de Produto')
plt.xlabel('Categoria de Produto')
plt.ylabel('Receita')
plt.show()

O heatmap de correlação exibe a força e a direção das relações entre as variáveis numéricas no conjunto de dados. Ele nos ajuda a identificar quais variáveis estão fortemente relacionadas e quais não estão. Isso pode ser útil para descobrir insights importantes, como a relação entre o custo dos produtos e a receita gerada. Essas informações podem nos ajudar a tomar decisões informadas sobre preços, promoções e outras estratégias de negócios.

In [None]:
# Heatmap de correlação entre as variáveis numéricas
plt.figure(figsize=(10, 5))
sns.heatmap(dados_vendas.corr(), annot=True, cmap='coolwarm', vmin=-1, vmax=1)
plt.title('Correlação entre Variáveis Numéricas')
plt.show()

# 5 - Modelagem e Algoritmos de Analytics

### 5.1 - Tipos de análises (descritiva, preditiva e prescritiva)
* ``Análise Descritiva``: Esta análise busca entender o passado e descrever o que aconteceu nos dados. Envolve o uso de estatísticas descritivas e visualizações gráficas para identificar tendências, padrões e relações nos dados.

* ``Análise Preditiva``: A análise preditiva visa prever eventos futuros com base em dados históricos. Ela utiliza algoritmos de aprendizado de máquina e estatísticas para criar modelos que possam fazer previsões sobre novos dados.

* ``Análise Prescritiva``: A análise prescritiva busca recomendar ações a serem tomadas com base nas análises descritiva e preditiva. Ela utiliza técnicas de otimização e simulação para identificar as melhores decisões a serem tomadas em diferentes cenários.

### 5.2 - Algoritmos de aprendizado de máquina para analytics
Alguns dos algoritmos de aprendizado de máquina comumente usados em analytics incluem:

* `` Regressão Linear``: para prever valores numéricos com base em variáveis independentes.

* ``Regressão Logística``: para prever a probabilidade de um evento binário ocorrer.
* ``Árvores de Decisão e Florestas Aleatórias``: para classificação e regressão.
* ``K-means e K-medianas``: para agrupamento (clustering) de dados.
* ``SVM (Support Vector Machines)``: para classificação e regressão.
* ``Redes Neurais Artificiais``: para classificação, regressão e agrupamento.


### 5.3 - Demonstração prática de implementação de algoritmos com Python (Scikit-learn)
Vamos utilizar a base de dados de exemplo para prever a receita com base nas variáveis disponíveis. Para simplificar, utilizaremos a Regressão Linear. Primeiro, vamos preparar os dados e, em seguida, treinar e avaliar o modelo.

In [None]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import MinMaxScaler
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.callbacks import EarlyStopping
from tensorflow.keras import regularizers
from sklearn.metrics import r2_score, mean_absolute_error, mean_squared_error
import matplotlib.pyplot as plt

Preparar dados para colocar no modelo

In [None]:
url = "https://raw.githubusercontent.com/ine-rmotr-curriculum/FreeCodeCamp-Pandas-Real-Life-Example/master/data/sales_data.csv"

dados_vendas = pd.read_csv(url)

# Selecionar as colunas de interesse
X = dados_vendas[['Customer_Age', 'Order_Quantity', 'Unit_Cost', 'Unit_Price']].values
y = dados_vendas['Revenue'].values

# Escalonamento dos dados
scaler = MinMaxScaler()
X = scaler.fit_transform(X)

# Remodelar y para um array 2D
y = y.reshape(-1, 1)

# Escalonar y usando MinMaxScaler
scaler_y = MinMaxScaler()
y = scaler_y.fit_transform(y)

# Dividir os dados em conjuntos de treinamento e teste - 70% para treinamento
X_train, X_temp, y_train, y_temp = train_test_split(X, y, test_size=0.3, random_state=42)

# Dividir os dados em conjuntos de teste e validação - 15% para cada
X_test, X_val, y_test, y_val = train_test_split(X_temp, y_temp, test_size=0.5, random_state=42)

``input_dim``: Define o número de entradas (número de recursos) na camada de entrada.

``activation``: Define a função de ativação para a camada (exemplos: 'relu', 'sigmoid', 'tanh', 'linear').

``optimizer``: Define o otimizador usado para ajustar os pesos da rede neural durante o treinamento (exemplos: 'Adam', 'SGD', 'RMSprop').

``loss``: Define a função de perda usada para medir o desempenho do modelo durante o treinamento.

``metrics``: Define as métricas adicionais a serem calculadas durante o treinamento.

``Dense``(units, activation, kernel_regularizer): Adiciona uma camada densa (totalmente conectada) à rede neural. O parâmetro units especifica o número de neurônios na camada, activation define a função de ativação a ser usada e kernel_regularizer aplica a regularização L1 e L2 aos pesos da camada.

``Dropout(rate)``: Adiciona uma camada de dropout à rede neural. O parâmetro rate especifica a fração de neurônios a serem desativados durante o treinamento, o que ajuda a evitar o overfitting.

``Adam(learning_rate)``: Define o otimizador Adam com uma taxa de aprendizado (learning_rate) específica. O otimizador Adam é uma variação do método de descida do gradiente estocástico que ajusta adaptativamente a taxa de aprendizado.

``model.compile(loss, optimizer, metrics)``: Compila o modelo, especificando a função de perda (loss) a ser minimizada, o otimizador a ser usado e as métricas adicionais para avaliar o desempenho do modelo.

``EarlyStopping(monitor, patience, restore_best_weights)``: Define o critério de parada antecipada, que interrompe o treinamento se a métrica monitorada (monitor) não melhorar após um determinado número de épocas (patience). Se restore_best_weights for True, os pesos da melhor época do modelo encontrado serão restaurados.



model.fit(X_train, y_train, epochs, batch_size, validation_data, callbacks, verbose) treina o modelo usando os dados de treinamento (X_train, y_train) com os seguintes argumentos:

``epochs``: número de vezes que o modelo irá iterar sobre todo o conjunto de dados de treinamento.

``batch_size``: número de amostras por atualização de gradiente. O padrão é 32.

``validation_data``: uma tupla (X_val, y_val) que contém os dados de validação usados para avaliar a perda e as métricas em cada época. Esses dados não são usados para treinar o modelo.

``callbacks``: lista de funções de retorno de chamada (callbacks) do Keras a serem aplicadas durante o treinamento. Neste exemplo, estamos usando o EarlyStopping para monitorar a perda de validação e parar o treinamento quando ela não melhorar por um determinado número de épocas (definido pela variável patience).

``verbose``: 0, 1 ou 2. Define o modo de exibição do log de treinamento:
* 0: modo silencioso (sem saída)
* 1: modo de progresso (barra de progresso)
* 2: modo de registro por época (uma linha por época)

In [None]:
# Criar o modelo
model = Sequential()

# Adicionar camada densa com 64 neurônios, ativação ReLU e regularização L1 e L2
model.add(Dense(64, input_dim=X_train.shape[1], activation='relu', kernel_regularizer=regularizers.l1_l2(l1=1e-5, l2=1e-4)))

# Adicionar camada densa com 64 neurônios e ativação ReLU
model.add(Dense(64, activation='relu'))
# Adicionar dropout de 20% após a camada
model.add(Dropout(0.2))

# Adicionar camada densa com 128 neurônios e ativação ReLU
model.add(Dense(128, activation='relu'))

# Adicionar camada densa com 64 neurônios e ativação ReLU
model.add(Dense(64, activation='relu'))

# Adicionar camada densa de saída com 1 neurônio e ativação linear
model.add(Dense(1, activation='linear'))

# Configurar o otimizador personalizado
optimizer = Adam(learning_rate=0.001)

# Compilar o modelo
model.compile(loss='mean_squared_error', optimizer=optimizer, metrics=['mae', 'mse'])

# Definir critério de parada antecipada
early_stopping = EarlyStopping(monitor='val_loss', patience=10, restore_best_weights=True)

# Treinar o modelo com parada antecipada
history = model.fit(X_train, y_train, epochs=100, batch_size=32, validation_data=(X_val, y_val), callbacks=[early_stopping], verbose=1)

In [None]:
# Fazer previsões no conjunto de teste
y_pred = model.predict(X_test)

y_test = scaler_y.inverse_transform(y_test)
y_pred = scaler_y.inverse_transform(y_pred)

# Avaliar o modelo usando a métrica RMSE (Root Mean Squared Error)
rmse = mean_squared_error(y_test, y_pred, squared=False)
print(f"RMSE: {rmse}")


# Calcular R²
r2 = r2_score(y_test, y_pred)

# Calcular R² ajustado
n = X_test.shape[0]  # número de observações
p = X_test.shape[1]  # número de preditores (variáveis independentes)
r2_ajustado = 1 - (1 - r2) * (n - 1) / (n - p - 1)

# Calcular MAE (Mean Absolute Error)
mae = mean_absolute_error(y_test, y_pred)

print(f"R²: {r2}")
print(f"R² ajustado: {r2_ajustado}")
print(f"MAE: {mae}")

``R² (Coeficiente de Determinação)``: Esta métrica indica o quanto do comportamento da variável dependente é explicado pela variável independente no modelo. O valor de R² varia entre 0 e 1, sendo que um valor mais alto indica um melhor ajuste do modelo aos dados.

``R² ajustado``: É uma versão modificada do R² que leva em consideração o número de preditores (variáveis independentes) no modelo e o tamanho da amostra. O R² ajustado é útil quando se comparam modelos com diferentes números de preditores, já que ele penaliza modelos mais complexos que não necessariamente melhoram o ajuste.

``MAE (Mean Absolute Error)``: É a média das diferenças absolutas entre as previsões e os valores reais. Essa métrica fornece uma ideia da magnitude dos erros, sem considerar a direção dos erros.

In [None]:
# Recuperar histórico de métricas
history_dict = history.history

# Definir subplots para perda (loss), erro absoluto médio (mae) e erro médio quadrático (mse)
fig, (ax1, ax2, ax3) = plt.subplots(3, 1, figsize=(10, 15))

# Plotar perda (loss) de treinamento e validação
ax1.plot(history_dict['loss'], label='Perda de Treinamento')
ax1.plot(history_dict['val_loss'], label='Perda de Validação')
ax1.set_title('Perda de Treinamento e Validação')
ax1.set_xlabel('Épocas')
ax1.set_ylabel('Perda')
ax1.legend()

# Plotar erro absoluto médio (mae) de treinamento e validação
ax2.plot(history_dict['mae'], label='MAE de Treinamento')
ax2.plot(history_dict['val_mae'], label='MAE de Validação')
ax2.set_title('Erro Absoluto Médio de Treinamento e Validação')
ax2.set_xlabel('Épocas')
ax2.set_ylabel('Erro Absoluto Médio')
ax2.legend()

# Plotar erro médio quadrático (mse) de treinamento e validação
ax3.plot(history_dict['mse'], label='MSE de Treinamento')
ax3.plot(history_dict['val_mse'], label='MSE de Validação')
ax3.set_title('Erro Médio Quadrático de Treinamento e Validação')
ax3.set_xlabel('Épocas')
ax3.set_ylabel('Erro Médio Quadrático')
ax3.legend()

plt.tight_layout()
plt.show()
