# Modelo de cascada

<b>Autor: </b>Andres Felipe Camargo Lastra

## Definición de requisitos

1. Desarrollar un algoritmo que permita predecir la recomendación de campañas para el uso de puntos de tarjeta de credito, basado en un clasificador bayesiano.
2. Desarrollar pruebas unitarias para validar las predicciones del algoritmo.

## Diseño del software y del sistema

Se desea desarrollar un algoritmo para la recomendación de campañas para el uso de puntos de tarjetas de crédito. Para poder realizar el algoritmo hay que basarse en el teorema de Bayes; por tal razon se va utilizar un clasificador bayesiano. 

Se debe leer un dataset del banco de la alegría utilizando la librería pandas y trabajar con las primeras 7 filas. Se le asignará un valor unico númerico a cada elemento de las columnas. Las columnas del dataset son (Tipo de ocupación, Mayor a 30, Volumen de compras, Mayoria de elementos comprados, Campaña), cabe aclarar que lo que se quiere predecir es la columna Campaña.

A continuación se muestran los valores de las columnas con sus respectivos valores númericos: <br>
<ul>
    <li>Tipo de ocupación</li>
    <ul>
        <li><b>Empleado: </b>0</li>
        <li><b>Independiente: </b>1</li>
    </ul>
    <li>Mayor a 30</li>
    <ul>
        <li><b>Si: </b>1</li>
        <li><b>No: </b>0</li>
    </ul>
    <li>Mayor a 30</li>
    <ul>
        <li><b>Si: </b>1</li>
        <li><b>No: </b>0</li>
    </ul>
    <li>Volumen de compras</li>
    <ul>
        <li><b>Alto: </b>0</li>
        <li><b>Medio: </b>2</li>
        <li><b>Bajo: </b>1</li>
    </ul>
    <li>Mayoría de elementos comprados</li>
    <ul>
        <li><b>Ferretería: </b>0</li>
        <li><b>Vestuario: </b>2</li>
        <li><b>Mercado: </b>1</li>
    </ul>
    <li><b>Campaña</b></li>
    <ul>
        <li><b>Salud: </b>1</li>
        <li><b>Hogar: </b>0</li>
        <li><b>Viajes: </b>2</li>
    </ul>
</ul>

## Implementación y pruebas unitarias

Importamos la librería Pandas para leer el conjunto de datos del banco de la alegría.

In [1]:
import pandas as pd

Almacenamos el conjunto de datos en una variable y mostramos las primeras 7 filas.

In [3]:
Datos = pd.read_csv('Datos_Balegria.csv')
Datos.head(7)
#Datos.Campaña.unique()

Unnamed: 0,Tipo de Ocupación,Mayor a 30,Volumen de Compras,Mayoria de elementos comprados,Campaña
0,Empleado,Si,Alto,Ferretería,Salud
1,Independiente,Si,Medio,Vesturario,Hogar
2,Independiente,No,Alto,Vesturario,Viajes
3,Independiente,Si,Alto,Mercado,Hogar
4,Empleado,Si,Bajo,Mercado,Viajes
5,Empleado,Si,Medio,Vesturario,Salud
6,Empleado,No,Alto,Vesturario,Viajes


Ahora se escogen los datos para realizar el entrenamiento de la predicción. 

In [45]:
features_train = Datos.iloc[0:7,0:4]
target_train = Datos.iloc[0:7,4]

El siguiente paso es importar la librería preprocessing de sklearn, esta permite asignarle un valor unico númerico a cada elemento.

In [46]:
#import LabelEncoder
from sklearn import preprocessing

Se procede a realizar la transformación de valores en números para cada columna y se muestra al final los valores de las mismas.

In [47]:
le = preprocessing.LabelEncoder()
f0 = le.fit_transform(features_train.iloc[0:7,0])
f1 = le.fit_transform(features_train.iloc[0:7,1])
f2 = le.fit_transform(features_train.iloc[0:7,2])
f3 = le.fit_transform(features_train.iloc[0:7,3])
label = le.fit_transform(target_train)
features = list(zip(f0,f1,f2,f3))
print(features)
print(label)

[(0, 1, 0, 0), (1, 1, 2, 2), (1, 0, 0, 2), (1, 1, 0, 1), (0, 1, 1, 1), (0, 1, 2, 2), (0, 0, 0, 2)]
[1 0 2 0 2 1 2]


Por ultimo utilizamos un modelo Gaussiano para predecir cual es la campaña que se le va ofrecer al usuario.

In [48]:
from sklearn.naive_bayes import GaussianNB
model1 = GaussianNB()
model1.fit(features, label)
Predicted = model1.predict([[1,1,0,2]])
#Predicted = model1.predict([[0,1,2,1]])
#Predicted = model1.predict([[0,0,2,1]])
Predicted = model1.predict([[0, 1, 0, 0]])
print(Predicted)

[1]


### Pruebas Unitarias

Para realizar pruebas unitarias haremos uso de la libreria unittest. Los datos a Probar son los siguientes:
<br><br>
Tipo de Ocupación 	Mayor a 30 	Volumen de Compras 	Mayoria de elementos comprados 	Campaña<br>
Empleado 	Si 	Medio 	Mercado 	Hogar <br>
Independiente 	Si 	Alto 	Vesturario 	Viajes
<br><br>
En este caso observamos que ninguna de las dos pruebas cumple con las predicciones que se realizaron.

In [49]:
import unittest
from sklearn.naive_bayes import GaussianNB

def bayesiano(a,b,c,d):
    from sklearn.naive_bayes import GaussianNB
    model1 = GaussianNB()
    model1.fit(features, label)
    Predicted = model1.predict([[a,b,c,d]])
    return Predicted

class TestStringMethods(unittest.TestCase):

    def test1_(self):
        predict = bayesiano(0,1,2,1)
        self.assertEqual(0, predict[0])
    def test2_(self):
        predict = bayesiano(1, 1, 0, 2)
        self.assertEqual(2, predict[0])

unittest.main(argv=['ignored', '-v'], exit=False)


test1_ (__main__.TestStringMethods) ... FAIL
test2_ (__main__.TestStringMethods) ... FAIL

FAIL: test1_ (__main__.TestStringMethods)
----------------------------------------------------------------------
Traceback (most recent call last):
  File "<ipython-input-49-ca64c4f1ba9c>", line 15, in test1_
    self.assertEqual(0, predict[0])
AssertionError: 0 != 1

FAIL: test2_ (__main__.TestStringMethods)
----------------------------------------------------------------------
Traceback (most recent call last):
  File "<ipython-input-49-ca64c4f1ba9c>", line 18, in test2_
    self.assertEqual(2, predict[0])
AssertionError: 2 != 0

----------------------------------------------------------------------
Ran 2 tests in 0.015s

FAILED (failures=2)


<unittest.main.TestProgram at 0x7f2a45d7e438>

## Integración y pruebas del sistema

Esta aplicación podría ser integrada con una base datos en MongoDB en la cual se puedan tener millones de registros y luego realizar pruebas para predecir la campaña que se le quiere ofrecer al usuario.

Para lograr la integración con MongoDB haremos uso de la librería PyMongo, la cual permite realizar la conexión a este motor de base de datos. 

## Operación y mantenimiento

Este aplicativo se pondrá en marcha en el banco de la alegría y se le ofrece mantenimiento las 24 horas del día. A medida que el aplicativo este escalando se hace necesario utilizar un servicio cloud como AWS para el almacenamiento y su seguridad.