In [2]:
pip install tensorflow


Collecting tensorflow
  Obtaining dependency information for tensorflow from https://files.pythonhosted.org/packages/93/21/9b035a4f823d6aee2917c75415be9a95861ff3d73a0a65e48edbf210cec1/tensorflow-2.15.0-cp311-cp311-win_amd64.whl.metadata
  Downloading tensorflow-2.15.0-cp311-cp311-win_amd64.whl.metadata (3.6 kB)
Collecting tensorflow-intel==2.15.0 (from tensorflow)
  Obtaining dependency information for tensorflow-intel==2.15.0 from https://files.pythonhosted.org/packages/4c/48/1a5a15517f18eaa4ff8d598b1c000300b20c1bb0e624539d702117a0c369/tensorflow_intel-2.15.0-cp311-cp311-win_amd64.whl.metadata
  Downloading tensorflow_intel-2.15.0-cp311-cp311-win_amd64.whl.metadata (5.1 kB)
Collecting absl-py>=1.0.0 (from tensorflow-intel==2.15.0->tensorflow)
  Obtaining dependency information for absl-py>=1.0.0 from https://files.pythonhosted.org/packages/01/e4/dc0a1dcc4e74e08d7abedab278c795eef54a224363bb18f5692f416d834f/absl_py-2.0.0-py3-none-any.whl.metadata
  Downloading absl_py-2.0.0-py3-none-any

In [5]:
import pandas as pd
import numpy as np
from keras.models import Sequential
from keras.layers import Dense
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error

# Carregar dados
data = pd.read_csv('concrete_data.csv')

# Separar em preditores e alvo

predictors = data.drop('Strength', axis=1)  # todas as colunas exceto a de resistência
target = data['Strength']  # coluna de resistência


# Função para criar o modelo
def create_model():
    model = Sequential()
    model.add(Dense(10, activation='relu', input_shape=(predictors.shape[1],)))
    model.add(Dense(1))
    model.compile(optimizer='adam', loss='mean_squared_error')
    return model

# Lista para armazenar os MSEs
mse_list = []

# Loop para repetir o experimento 50 vezes
for _ in range(50):
    X_train, X_test, y_train, y_test = train_test_split(predictors, target, test_size=0.3)
    model = create_model()
    model.fit(X_train, y_train, epochs=50, verbose=0)
    y_pred = model.predict(X_test)
    mse = mean_squared_error(y_test, y_pred)
    mse_list.append(mse)

# Cálculo da média e desvio padrão dos MSEs
mse_mean = np.mean(mse_list)
mse_std = np.std(mse_list)

print(f'MSE Mean: {mse_mean}, MSE STD: {mse_std}')





MSE Mean: 390.7275205359135, MSE STD: 577.222729420545


In [6]:
# Dividir os dados em conjuntos de treino e teste
X_train, X_test, y_train, y_test = train_test_split(predictors, target, test_size=0.3, random_state=42)


In [7]:
# Definir a função para criar o modelo de linha de base
def create_baseline_model():
    # Criação do modelo sequencial
    model = Sequential()
    # Adiciona uma camada densa com 10 neurônios e função de ativação ReLU
    model.add(Dense(10, activation='relu', input_shape=(X_train.shape[1],)))
    # Adiciona a camada de saída sem função de ativação (regressão)
    model.add(Dense(1))
    # Compila o modelo com o otimizador Adam e a função de perda de erro quadrático médio
    model.compile(optimizer='adam', loss='mean_squared_error')
    return model

# Criar o modelo
model = create_baseline_model()


In [8]:
# Treinar o modelo
model.fit(X_train, y_train, epochs=50, verbose=1)


Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50


<keras.src.callbacks.History at 0x12385872cd0>

In [9]:
# Avaliar o modelo nos dados de teste
y_pred = model.predict(X_test)
mse = mean_squared_error(y_test, y_pred)
print(f"Erro Quadrático Médio no Teste: {mse}")


Erro Quadrático Médio no Teste: 142.45337569735975


In [10]:
# Inicializar a lista para armazenar os MSEs
mse_scores = []

# Repetir as etapas 1-4 por 50 vezes
for i in range(50):
    # Dividir os dados novamente para obter diferentes divisões cada vez
    X_train, X_test, y_train, y_test = train_test_split(predictors, target, test_size=0.3, random_state=i)
    # Criar e treinar o modelo
    model = create_baseline_model()
    model.fit(X_train, y_train, epochs=50, verbose=0)  # Defina verbose=0 para não imprimir o output do treino
    # Avaliar o modelo nos dados de teste
    y_pred = model.predict(X_test)
    mse = mean_squared_error(y_test, y_pred)
    mse_scores.append(mse)

# Cálculo da média e do desvio padrão dos MSEs
mse_mean = np.mean(mse_scores)
mse_std = np.std(mse_scores)

print(f"MSE Mean: {mse_mean}, MSE STD: {mse_std}")


MSE Mean: 327.9404615227347, MSE STD: 301.2794532863858


In [11]:
# Etapa B: Normalize os Dados
from sklearn.preprocessing import StandardScaler

# Crie um objeto de scaler e ajuste-o aos dados de treino
scaler = StandardScaler()
scaler.fit(X_train)

# Aplique o scaler aos conjuntos de treino e teste
X_train_scaled = scaler.transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Crie e treine o modelo com os dados normalizados
model = create_baseline_model()
model.fit(X_train_scaled, y_train, epochs=50, verbose=0)  # Treino com os dados normalizados

# Avalie o modelo nos dados de teste normalizados
y_pred_scaled = model.predict(X_test_scaled)
mse_scaled = mean_squared_error(y_test, y_pred_scaled)

print(f"MSE com Dados Normalizados: {mse_scaled}")


MSE com Dados Normalizados: 462.92645339444067


In [12]:
# Etapa C: Aumentar o Número de Épocas
model = create_baseline_model()
model.fit(X_train_scaled, y_train, epochs=100, verbose=0)  # Treino com 100 épocas

# Avalie o modelo nos dados de teste normalizados
y_pred_scaled = model.predict(X_test_scaled)
mse_scaled = mean_squared_error(y_test, y_pred_scaled)

print(f"MSE com 100 Épocas: {mse_scaled}")


MSE com 100 Épocas: 141.5728073434857


In [None]:
# Etapa D: Aumentar o Número de Camadas Ocultas
def create_deep_model():
    model = Sequential()
    model.add(Dense(10, activation='relu', input_shape=(X_train_scaled.shape[1],)))
    model.add(Dense(10, activation='relu'))
    model.add(Dense(10, activation='relu'))
    model.add(Dense(1))
    model.compile(optimizer='adam', loss='mean_squared_error')
    return model

mse_deep_list = []

# Repita o processo 50 vezes
for i in range(50):
    deep_model = create_deep_model()
    deep_model.fit(X_train_scaled, y_train, epochs=50, verbose=0)
    y_pred_deep = deep_model.predict(X_test_scaled)
    mse_deep = mean_squared_error(y_test, y_pred_deep)
    mse_deep_list.append(mse_deep)
    print(f"Execução {i+1} - MSE: {mse_deep}")

# Calcule a média e o desvio padrão dos erros médios quadrados
mse_deep_array = np.array(mse_deep_list)
mean_mse_deep = mse_deep_array.mean()
std_mse_deep = mse_deep_array.std()

print(f"Média dos MSEs: {mean_mse_deep}")
print(f"Desvio Padrão dos MSEs: {std_mse_deep}")


Execução 1 - MSE: 134.24157562902155
Execução 2 - MSE: 83.14868225513402
Execução 3 - MSE: 130.94360639811507
Execução 4 - MSE: 141.15026693096823
Execução 5 - MSE: 132.53423894557426
Execução 6 - MSE: 133.8859633420375
Execução 7 - MSE: 134.42207427445848
Execução 8 - MSE: 133.62170088127547
Execução 9 - MSE: 125.93967663786746
Execução 10 - MSE: 103.6782215793544
Execução 11 - MSE: 144.26847666035576
Execução 12 - MSE: 132.9492200612192
Execução 13 - MSE: 140.6477967611511
Execução 14 - MSE: 123.09050785759929
Execução 15 - MSE: 122.23671733553127
Execução 16 - MSE: 127.95950862856843
Execução 17 - MSE: 129.2695231609527
Execução 18 - MSE: 117.88032878941655
Execução 19 - MSE: 142.180211465252
Execução 20 - MSE: 107.85570957223862
Execução 21 - MSE: 116.66097267433464
Execução 22 - MSE: 143.45120115772636
Execução 23 - MSE: 141.03956298214138
Execução 24 - MSE: 113.66545568425309
Execução 25 - MSE: 137.59273957444276
Execução 26 - MSE: 143.71494918860208
Execução 27 - MSE: 144.643456