### Nivel intermedio:

Hacer con objetivo de preparar entrevista técnica y tener un código reutilizable, útil y funcional.

## 1. 

Crea un programa que pregunte al usuario qué tipo de algoritmo desea utilizar (entre regresión lineal, regresión logística y Knn).

Se presupone que el usuario proporcionará un dataframe con los datos a entrenar, el nombre de la columna target que está en el dataframe.

El programa debe contener, como mínimo, estas tres funciones tal que así:

In [43]:
# Libraries
from sklearn.linear_model import LinearRegression, LogisticRegression
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

In [44]:
def choose_model(option_user, params=None):
    if option_user == 'linear regression':
        model = LinearRegression()
    elif option_user == 'logistic regression':
        model = LogisticRegression()
    elif option_user == 'knn':
        if params:
            model = KNeighborsClassifier(n_neighbors=params['k'])
        else:
             model = KNeighborsClassifier()
    else:
        print('Input should be one of the following strings: \'linear regression\', \'logistic regression\', \'knn\' ')
        raise ValueError('Please check option_user variable syntax')
    return model

In [38]:
param = {'k':3}

In [41]:
choose_model('knn', param)

KNeighborsClassifier(n_neighbors=3)

In [45]:
def train_model(model, df, target_name):
    '''
    df must already be cleaned and organized, all of the columns that are different from the target_name     will be used as the X variable and the target_name column will be used as the y variable
    '''

    # Setting X and y variables
    X = df.drop(target_name, axis=1)
    y = df[target_name]
    # Splitting the data using default test_size 0.2
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
    # Training model
    model_trained = model.fit(X_train, y_train)
    # Predicting test sample
    y_pred = model.predict(X_test)
    # Comparing predictions with real values for accuracy
    accuracy = accuracy_score(y_test, y_pred)
    return model_trained, accuracy

In [46]:
def main():
    '''
    df must already exists and be defined in local variables
    '''
    model = choose_model(input('Introduce algorithm: '))
    model_trained, accuracy = train_model(model, df, target_name)
    print('Accuracy of the model:', accuracy)
    return model_trained

-----------------------------
"choose_model" recibe:

- 'option_user': la opción del usuario. 
- 'params': es un diccionario que puede contener ciertos parámetros necesarios para la creación de los modelos (por ejemplo, el valor k para el algoritmo Knn). Por defecto, su valor es None.

Deberá crear el modelo necesario sin entrenar, retornándolo al final.

----------------

"train_model" recibe:

- 'model': el modelo sin entrenar elegido por el usario
- 'df': el dataframe tratado y limpio que contiene todos los datos del conjunto de entrenamiento y de test, incluyendo el target. 
- 'target_name': el nombre de la columna que representa el target.

Retornará el modelo entrenado con los datos y la precisión del modelo.


----------------

"main": 

Es la función que ha de ser ejecutada cada vez que queremos lanzar el programa. 

Al final, mostrará la precisión del modelo entrenado y retornará el modelo entrenado.

----------------


## 2.


Haz que el programa sea capaz de predecir un nuevo ejemplo del modelo elegido y entrenado con la siguiente función:

In [47]:
def predict_new_data(model_trained, to_pred):
    y_pred = model_trained.predict(to_pred)
    return y_pred

----------------

"predict_new_data" recibe:

- 'model_trained': el modelo entrenado elegido por el usario
- 'to_pred': los datos del nuevo ejemplo a predecir.

Retornará y mostrará por pantalla la predicción.

----------------

Se presupone que el usuario proporcionará los datos del nuevo ejemplo.