# Sistema de Predición

## Preparación de Datos

In [2]:
# libreria arbol decision y procesamiento data
import pandas as pd
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder
from sklearn.metrics import accuracy_score

#Graficar arbol
from sklearn.tree import export_graphviz
import matplotlib.pyplot as plt
import numpy as np

# Carga del archivo con configuraciones para que funcionen con utf-8
data = pd.read_csv('data.csv', header=0, encoding='unicode_escape')
# Si tuvieran valores nulos
data = data.dropna()
# Asignar a variables valores de columnas especificas del archivo
toc = data.iloc[:, 4].values
animo = data.iloc[:, 5].values
obediencia = data.iloc[:, 6].values
# Borramos columnas que vamos a reemplazar
data.drop([ 'animo', 'obediencia', 'fecha'], axis='columns', inplace=True)
# Instancia de LabelEncoder
LabelEncoder_data = LabelEncoder()
# Escalar volver datos string en numeros
data['animo'] = LabelEncoder_data.fit_transform(animo)
data['obediencia'] = LabelEncoder_data.fit_transform(obediencia)
#castear algunas columnas con el tipo de dato correspondiente
data = data.astype({"id_niño": int, "actividad": int, "categoria_actividad": int, "edad": int, "tiempo_rsp_seg": int})
#filtrar por edades
data = data[(data['edad'] > 4) & (data['edad'] <= 10)]

## Entrenamiento Modelos

In [3]:
##Le asignamos a una nueva variable los datos que vamos a manejar en el modelo
predictors = data[['animo', 'obediencia']]
targets = data['TDAH_TOP_TC']


In [4]:
#Asignamos los labels que va a manejar el arbol
predictors_labels = ['obediencia', 'animo']
target_label = ['si', 'no']

In [5]:
#Obtenemos solo los valores para poder entrenar el arbol
x = data.values
y = data['TDAH_TOP_TC']

In [6]:
#Creamos el train_test_split que "divide" la informacin una de entrenamiento 80% y otra de test 20%
x_entrena, x_test, y_entrena, y_test = train_test_split(predictors,targets,test_size=0.2, random_state=123)

##  Decision Tree Algorithm

In [15]:
#Construimos el arbol con una maxima profundida de 3 
arbol = DecisionTreeClassifier(max_depth=3)

#Entrenamos el arbol con los datos
arbol.fit(x_entrena, y_entrena)

#probamos la prediccion con datos test
arbolpredicc= arbol.predict(x_test)

#Porcentaje de Acierto de la prediccion en datos de test
precision = arbol.score(x_test,y_test)
print("Precisión para Decision Tree Algorithm = " ,precision)

Precisión para Decision Tree Algorithm =  0.5227272727272727


## Naive Bayes

In [14]:
#Importamos libreria y 
from sklearn.naive_bayes import GaussianNB
modelo = GaussianNB()

#Entrenamos el modelo
modelo.fit(x_entrena,y_entrena)

#prediccion con datos test
prediccion = modelo.predict(x_test)

#Porcentaje de Acierto de la prediccion en datos 
precision = accuracy_score(prediccion, y_test)
print("Precisión para Naive Bayes = " ,precision)

Precisión para Naive Bayes =  0.4772727272727273


##  Nearest Neighbors 

In [10]:
from sklearn.neighbors import KNeighborsClassifier
modelo = KNeighborsClassifier(n_neighbors = 5, metric = 'minkowski', p = 2)
modelo.fit(x_entrena, y_entrena)
prediccion = modelo.predict(x_test)

#Porcentaje de Acierto de la prediccion en datos 
precision = accuracy_score(prediccion, y_test)
print("Precisión para Nearest Neighbors = " ,precision)

Precisión para Nearest Neighbors =  0.4318181818181818


## Support Vector Machine

In [11]:
from sklearn.svm import SVC

In [12]:
modelo = SVC(kernel='rbf')

#Entrenamos el modelo
modelo.fit(x_entrena,y_entrena)

#prediccion con datos test
prediccion = modelo.predict(x_test)

#Porcentaje de Acierto de la prediccion en datos 
precision = accuracy_score(prediccion, y_test)
print("Precisión para Support Vector Machine = " ,precision)

Precisión para Support Vector Machine =  0.5


## Random Forest Classification 

In [16]:
from sklearn.ensemble import RandomForestClassifier

In [17]:
modelo = RandomForestClassifier()

#Entrenamos el modelo
modelo.fit(x_entrena,y_entrena)

#prediccion con datos test
prediccion = modelo.predict(x_test)

#Porcentaje de Acierto de la prediccion en datos 
precision = accuracy_score(prediccion, y_test)
print("Precisión para Random Forest Classification = " ,precision)

Precisión para Random Forest Classification =  0.5681818181818182


## Logistic Regression 

In [7]:
from sklearn.linear_model import LogisticRegression

In [9]:
modelo = LogisticRegression()

#Entrenamos el modelo
modelo.fit(x_entrena,y_entrena)

#prediccion con datos test
prediccion = modelo.predict(x_test)

#Porcentaje de Acierto de la prediccion en datos 
precision = accuracy_score(prediccion, y_test)
print("Precisión para Logistic Regression = " ,precision)

Precisión para Logistic Regression =  0.45454545454545453
