In [1]:
import pandas as pd
import numpy as np
import tensorflow as tf
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

# Leer el archivo CSV
data = pd.read_csv('/content/DATOS_TRANSPORTE.csv')

# Convertir los valores de las columnas booleanas a 1 o 0 (int)
data['ES_FERIADO'] = data['ES_FERIADO'].map({'SI': 1, 'NO': 0})
data['HAY_EVENTO'] = data['HAY_EVENTO'].map({'SI': 1, 'NO': 0})

# Dividir los datos en características de entrada (X) y etiquetas de salida (y)
X = data.drop('CANTIDAD', axis=1)
y = data['CANTIDAD']

# Convertir las características de entrada a one-hot encoding
X = pd.get_dummies(X)

# Normalizar los datos de entrada
scaler = StandardScaler()
X = scaler.fit_transform(X)

# Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Crear el modelo de red neuronal
model = tf.keras.Sequential([
    tf.keras.layers.Dense(64, activation='relu', input_shape=(X_train.shape[1],), kernel_regularizer=tf.keras.regularizers.l2(0.01)),
    tf.keras.layers.Dense(64, activation='relu', kernel_regularizer=tf.keras.regularizers.l2(0.01)),
    tf.keras.layers.Dense(1)
])

# Compilar el modelo
model.compile(optimizer='adam', loss='mean_squared_error', metrics=['mean_absolute_error'])

# Entrenar el modelo
model.fit(X_train, y_train, epochs=15, batch_size=32, verbose=1)

# Evaluar el modelo en el conjunto de prueba
loss, mean_absolute_error = model.evaluate(X_test, y_test, verbose=0)
print('Pérdida en el conjunto de prueba:', loss)
print('Error absoluto medio en el conjunto de prueba:', mean_absolute_error)


Epoch 1/15
Epoch 2/15
Epoch 3/15
Epoch 4/15
Epoch 5/15
Epoch 6/15
Epoch 7/15
Epoch 8/15
Epoch 9/15
Epoch 10/15
Epoch 11/15
Epoch 12/15
Epoch 13/15
Epoch 14/15
Epoch 15/15
Pérdida en el conjunto de prueba: 1515306112.0
Error absoluto medio en el conjunto de prueba: 1244.6414794921875


In [9]:
resultados = []
y_test_numpy = y_test.to_numpy()
limite = 1000

for indice in range(len(X_test)):

  if indice == limite:
    break

  # Obtener la primera muestra del conjunto de datos
  X_sample = X_test[indice].reshape(1, -1)

  # Realizar la predicción para la muestra
  y_pred_sample = model.predict(X_sample)

  #print('Características de entrada del caso de prueba:')
  #print(X_sample)
  #print('Predicción del modelo para el caso de prueba:', y_pred_sample)
  #print('Valor real:', y_test_numpy[indice])

  # (real, prediccion)
  resultados.append((y_test_numpy[indice], y_pred_sample))



In [10]:
for expected, predicted in resultados:
  print(expected, predicted[0][0])

70476 71356.57
446 755.0223
83 556.912
16 -114.97664
55426 54853.184
524 870.9719
946 870.9719
1192 505.06662
3237 4418.813
11294 10584.506
48043 50729.688
3822 2850.4648
6465 7306.545
2566 2485.8438
2357 2257.0771
31 -35.464333
203 798.8148
39431 32117.268
30 400.73465
19 171.84209
18998 20249.643
11025 11204.845
1542 5202.495
10957 12109.161
35 -35.27253
36517 34578.805
115 219.22055
793 804.82367
1113 962.14685
114430 105386.36
19 -404.85037
832 434.6448
45511 48613.582
21784 20509.19
4237 4422.1196
7518 7244.9604
7127 6566.053
580 71.82875
381 104.29472
1871 1262.6777
156 -102.0056
19925 20774.732
3193 872.463
3659 3519.7712
14968 15558.492
7302 7132.688
1280 923.27527
34181 17315.873
3454 3013.4866
4182 4289.8613
824 858.3779
1661 1149.0089
1501 1624.6825
270 234.98848
1542 430.9431
598 678.3948
32971 31778.086
1296 2375.7683
17794 18453.93
15859 14725.02
1425 1105.5486
95 -132.23541
1183 884.6396
11466 11768.293
352 870.9719
39516 34321.836
8989 8679.691
1097 502.935
389 147.6812