### Preparación de datos (ya visto en el archivo anterior)

In [1]:
import pandas as pd

def from_string_to_int(key, data_set):
    data_set[key],class_names = pd.factorize(data_set[key])
    return class_names

PREDICTORS = ["age", "workclass", "fnlwgt", "education", "education-num", "marital-status", 
                                        "occupation", "relationship", "race", "sex", "capital-gain",
                                        "capital-loss", "hours-per-week", "native-country"]
PREDICTORS_STRING = ["workclass", "education", "marital-status", "occupation", "relationship", "race", "sex", "native-country"]
PREDICTORS_INT = ["age", "fnlwgt", "capital-gain", "capital-loss", "hours-per-week"]
TARGET_VARIABLE = "class"

data = pd.read_csv('adult.data', names=["age", "workclass", "fnlwgt", "education", "education-num", "marital-status", 
                                        "occupation", "relationship", "race", "sex", "capital-gain",
                                        "capital-loss", "hours-per-week", "native-country", "class"])

from_string_to_int(TARGET_VARIABLE, data)

for predictor in PREDICTORS_STRING:
    from_string_to_int(predictor, data)
    
data.drop_duplicates(inplace=True)

### Preparación de arquitecturas

In [2]:
X = data.iloc[:,:-1]
y = data.iloc[:,-1]


def print_5_cases(X, y, predictions):
    for i in range(5):
        print(X.iloc)
        print('%s => %d (expected %d)' % (X.iloc[i].tolist(), predictions[i], y.iloc[i]))

### Arquitectura 1

In [3]:
from numpy import loadtxt
from keras.models import Sequential
from keras.layers import Dense

def build_model1():
    # define the keras model
    model1 = Sequential()
    model1.add(Dense(12, input_dim=14, activation='relu'))
    model1.add(Dense(8, activation='relu'))
    model1.add(Dense(1, activation='sigmoid'))
    # compile the keras model
    model1.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
    return model1

model1 = build_model1()
# fit the keras model on the dataset
model1.fit(X, y, epochs=150, batch_size=10, verbose=0)
# make class predictions with the model
predictions_1 = (model1.predict(X) > 0.5).astype(int)
# summarize the first 5 cases
print_5_cases(X, y, predictions_1)

<pandas.core.indexing._iLocIndexer object at 0x00000270D2E18D60>
[39, 0, 77516, 0, 13, 0, 0, 0, 0, 0, 2174, 0, 40, 0] => 0 (expected 0)
<pandas.core.indexing._iLocIndexer object at 0x00000270D2E18360>
[50, 1, 83311, 0, 13, 1, 1, 1, 0, 0, 0, 0, 13, 0] => 0 (expected 0)
<pandas.core.indexing._iLocIndexer object at 0x00000270D2E18D60>
[38, 2, 215646, 1, 9, 2, 2, 0, 0, 0, 0, 0, 40, 0] => 0 (expected 0)
<pandas.core.indexing._iLocIndexer object at 0x00000270D2E18360>
[53, 2, 234721, 2, 7, 1, 2, 1, 1, 0, 0, 0, 40, 0] => 0 (expected 0)
<pandas.core.indexing._iLocIndexer object at 0x00000270D2E18D60>
[28, 2, 338409, 0, 13, 1, 3, 2, 1, 1, 0, 0, 40, 1] => 0 (expected 0)


### Arquitectura 2

In [4]:
def build_model2():
    model2 = Sequential()
    model2.add(Dense(12, input_dim=14, activation='relu'))
    model2.add(Dense(16, activation="softmax"))
    model2.add(Dense(20, activation="softsign"))
    model2.add(Dense(1, activation='sigmoid'))
    # compile the keras model
    model2.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
    return model2

model2 = build_model2()
# fit the keras model on the dataset
model2.fit(X, y, epochs=150, batch_size=10, verbose=0)
# make class predictions with the model
predictions_2 = (model2.predict(X) > 0.5).astype(int)
# summarize the first 5 cases
print_5_cases(X, y, predictions_2)

<pandas.core.indexing._iLocIndexer object at 0x00000270D1D94DB0>
[39, 0, 77516, 0, 13, 0, 0, 0, 0, 0, 2174, 0, 40, 0] => 0 (expected 0)
<pandas.core.indexing._iLocIndexer object at 0x00000270D1D94DB0>
[50, 1, 83311, 0, 13, 1, 1, 1, 0, 0, 0, 0, 13, 0] => 0 (expected 0)
<pandas.core.indexing._iLocIndexer object at 0x00000270D1D94DB0>
[38, 2, 215646, 1, 9, 2, 2, 0, 0, 0, 0, 0, 40, 0] => 0 (expected 0)
<pandas.core.indexing._iLocIndexer object at 0x00000270D1D94DB0>
[53, 2, 234721, 2, 7, 1, 2, 1, 1, 0, 0, 0, 40, 0] => 0 (expected 0)
<pandas.core.indexing._iLocIndexer object at 0x00000270D1D94DB0>
[28, 2, 338409, 0, 13, 1, 3, 2, 1, 1, 0, 0, 40, 1] => 0 (expected 0)


### Arquitectura 3

In [5]:
def build_model3():
    model3 = Sequential()
    model3.add(Dense(12, input_dim=14, activation='relu'))
    model3.add(Dense(16, activation="softmax"))
    model3.add(Dense(20, activation="softsign"))
    model3.add(Dense(22, activation="tanh"))
    model3.add(Dense(24, activation="selu"))
    model3.add(Dense(1, activation='sigmoid'))
    # compile the keras model
    model3.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
    return model3

model3 = build_model3()

# fit the keras model on the dataset
model3.fit(X, y, epochs=150, batch_size=10, verbose=0)
# make class predictions with the model
predictions_3 = (model3.predict(X) > 0.5).astype(int)
# summarize the first 5 cases

print_5_cases(X, y, predictions_3)

<pandas.core.indexing._iLocIndexer object at 0x00000270CFBC1900>
[39, 0, 77516, 0, 13, 0, 0, 0, 0, 0, 2174, 0, 40, 0] => 0 (expected 0)
<pandas.core.indexing._iLocIndexer object at 0x00000270CFC1F180>
[50, 1, 83311, 0, 13, 1, 1, 1, 0, 0, 0, 0, 13, 0] => 0 (expected 0)
<pandas.core.indexing._iLocIndexer object at 0x00000270CFBC1900>
[38, 2, 215646, 1, 9, 2, 2, 0, 0, 0, 0, 0, 40, 0] => 0 (expected 0)
<pandas.core.indexing._iLocIndexer object at 0x00000270CFC1F180>
[53, 2, 234721, 2, 7, 1, 2, 1, 1, 0, 0, 0, 40, 0] => 0 (expected 0)
<pandas.core.indexing._iLocIndexer object at 0x00000270CFBC1900>
[28, 2, 338409, 0, 13, 1, 3, 2, 1, 1, 0, 0, 40, 1] => 0 (expected 0)


### Evaluaciones cruzadas

Elegí este método de evaluación por su simpleza y facilidad.

Basado en https://machinelearningmastery.com/regression-tutorial-keras-deep-learning-library-python/

In [9]:
!pip install scikeras[tensorflow]
from scikeras.wrappers import KerasClassifier
from sklearn.model_selection import cross_val_score
from sklearn.model_selection import KFold



In [10]:

def evaluate_model(model):
    estimator = KerasClassifier(model=build_model1)
    kfold = KFold()
    results = cross_val_score(estimator, X, y, cv=kfold)
    return results

def print_evaluation(title, results):
    print(title)
    print("Model1: %.2f (%.2f) MSE" % (results.mean(), results.std()))
    
results1 = evaluate_model(model1)
print_evaluation("Arquitectura 1", results1)

results2 = evaluate_model(model2)
print_evaluation("Arquitectura 2", results2)

results3 = evaluate_model(model3)
print_evaluation("Arquitectura 3", results3)

Arquitectura 1
Model1: 0.56 (0.27) MSE
Arquitectura 2
Model1: 0.67 (0.21) MSE
Arquitectura 3
Model1: 0.67 (0.21) MSE


### Interpretación de comparaciones

En este caso, la arquitectura 2 fue la que obtuvo mejor rendimiento. Voy a asumir que fue el mejor resultado porque fue una cantidad media de capas. Ni muy pocas, ni demasiadas. Tratando de razonar un poco, puedo imaginar que si hay pocas capas, no se puede "distribuir" esos datos de buena forma. Por otro lado, al haber tantas capas, más bien puede ocasionar mucho ruido. La conclusión que me deja esto es que no siempre es mejor tener más capas. Es sumamente importante realizar cross-validation para probar distintas alternativas y escoger la que mejor dé resultados.

### Comparación con tarea 2

En términos generales, los modelos tuvieron mejores resultados. Tanto en precisión como en rendimiento, ya que hasta fueron más rápidos. Si tuviese que dar una recomendación en mi organización, diría que primero se puede empezar con Extreme Gradient Boosting, el cual es muy popular y de buen rendimiento. Y apartir de ahí, tantear con los hiperparámetros. Esto lo digo porque es más sencillo que armar una estructura de redes neuronales, ya que esto último puede tomarse un poco más complejo. En términos generales, puede tomar más tiempo y recursos. Por lo que definitivamente recomiendo usar primero algo más sencillo.