# Requirements definition
Se require desarollar un recomendador de campañas para el uso de puntos de tarjeta de credito. El usuario podrá consultar la campaña recomendada basado en el uso de puntos consultando una fuente de datos para obtener.
La fuente de datos proporciona unos registros que equivalen al comportamiento de compra de una persona brindando información tal como: tipo de ocupación, si la persona es mayor a 30, el volumen de compras realizado y la mayoria de elementos comprados. 

# System and software design
El algoritmo desarrollado se contruirá en lenguaje python ya que permite el uso de librerias especificas para la funcionalidad de recomendación solicitada.
Se usará como fuente de datos un archivo CSV del cual se extraeran los registros a utilizar. 
Se requiere contar con las librerias pandas, preprocessing, GaussianNB y unittest que debe estar previamente instaladas.
Se aplicarán las pruebas unitarias necesarias para comprobar el correcto funcionamiento de la lógica y código digitado.


# Implementation and unit testing
Instalamos las librerias:
    
    -pandas
    
    -scikit-learn 
    
    -GaussianNB
    
    -unittest
    
Se importa la libreria pandas que es una herramienta de analisis de codigo abierto para el analisis de datos estructurados y lo renombramos para facilitar su uso.

In [54]:
import pandas as pd

Se lee el archivo CSV donde esta almacenada la fuente de datos a través de la función read_csv. Luego obtenemos las primeras 7 filas del archivo.

In [40]:
dDatos = pd.read_csv('Datos_Balegria.csv')
Datos.head(7)

Unnamed: 0,Tipo de Ocupación,Mayor a 30,Volumen de Compras,Mayoria de elementos comprados,Campaña
0,Empleado,Si,Alto,Ferretería,Salud
1,Independiente,Si,Medio,Vesturario,Hogar
2,Independiente,No,Alto,Vesturario,Viajes
3,Independiente,Si,Alto,Mercado,Hogar
4,Empleado,Si,Bajo,Mercado,Viajes
5,Empleado,Si,Medio,Vesturario,Salud
6,Empleado,No,Alto,Vesturario,Viajes


Se obtienen los datos de las filas seleccionadas que equivaldrian a las caracteristicas de la persona de las cuales nos vamos a basar y se obtiene el dato campaña de las filas seleccionadas.

In [41]:
features_train = Datos.iloc[0:7,0:4]
target_train = Datos.iloc[0:7,4]

Luego, se convierteno transforman las caracteristicas obtenidas en valores numericos para ordenarlos y prepararlos para el analisis siguiente. 

In [42]:
from sklearn import preprocessing
le = preprocessing.LabelEncoder()
f0 = le.fit_transform(features_train.iloc[0:7,0])
f1 = le.fit_transform(features_train.iloc[0:7,1])
f2 = le.fit_transform(features_train.iloc[0:7,2])
f3 = le.fit_transform(features_train.iloc[0:7,3])
label = le.fit_transform(target_train)
features = list(zip(f0,f1,f2,f3))
print(features)
print(label)

[(0, 1, 0, 0), (1, 1, 2, 2), (1, 0, 0, 2), (1, 1, 0, 1), (0, 1, 1, 1), (0, 1, 2, 2), (0, 0, 0, 2)]
[1 0 2 0 2 1 2]


A través de la libreria GaussianNB se utiliza el algoritmo de Naive Bayes para determinar la probabilidad en la que se le puede recomendar una campaña a una persona que cumpla con las caracteristicas dadas basado del listado obtenido anteriormente. Mediante la funcion predict() de la libreria GaussianNB que recibe como parametró un array de números equivalente a las caracteristicas se puede obtener un array con el valor equivalente a la campaña a recomendar.

In [43]:
from sklearn.naive_bayes import GaussianNB
model1 = GaussianNB()
model1.fit(features,label)
#Predicted = model1.predict([[1,1,0,2]])
#Predicted = model1.predict([[0,1,2,1]])
Predicted = model1.predict([[0,0,2,1]])
print(Predicted)

[2]


Importamos la libreria unittest que nos permitira realizar las pruebas unitarias necesarias para comprobar el correcto funcionamiento del código

In [44]:
import unittest

Definimos una clase TestUnit que contendrá una función test() con la logica de la prueba. Para este caso de prueba usamos la funcion assertEqual para verificar que el valor pasado como primer parametro sea el que esperamos en el segundo parametro.

In [48]:
class TestUnit(unittest.TestCase):
     def test(self):
            
        self.assertEqual( Predicted[0], 2)


Luego llamamos al main de unittest para ejecutar la prueba. La respuesta esperada para pasar la prueba es OK 

In [49]:
if __name__ == '__main__':
    unittest.main(argv=['ignored', '-v'], exit=False)

test (__main__.TestUnit) ... ok

----------------------------------------------------------------------
Ran 1 test in 0.005s

OK


# Integration and system testing

La integración del sistema desarrollado se podría realizar utilizando una fuente de datos mayor alojada en una herramienta de almacenamiento de datos tal como firebase, postgress o mysql. Además, se podría integrar con una herramienta tal como django que permita una mejor usabilidad permitiendo al usuario seleccionar la fuente de datos a traves de una interfaz grafica y aumentando su alcance ya que django puede proveerse en tecnologias web.

# Operation and maintance

EL sistema requerira un sistema de alojamiento que sea persistente permitiendo la disponibilidad 24/7 si se presenta como servicio web y se debe tener en cuenta que si se desea escalar el sistema, se debe considerar aumentar la capacidad y prestaciones de los equipos y sistemas usados.  