## **Práctica 15: Clasificación COVID-19 (Adultos mayores)**

Nombre:

No. Cuenta:

Email:

### **Caso de estudio**

**Objetivo.** Clasificar la mortalidad de adultos mayores contagiados con COVID-19 en la Ciudad de México.

**Emplear los algoritmos:** 

* Árbol de decisión.
* Bosque aleatorio.

**Fuente de datos:**

https://www.gob.mx/salud/documentos/datos-abiertos-bases-historicas-direccion-general-de-epidemiologia

**Variables:**

No.	| Nombre | Descripción | Valores
* ID
* 1	SEXO	Identifica el sexo del paciente.	1-Mujer, 2-Hombre, 99-No Especificado
* 2	TIPO_PACIENTE	Identifica el tipo de atención que recibió el paciente.	1-Ambulatorio, 2-Hospitalizado, 99-No Especificado 
* 3	SITUACION	Identifica la situación (vivo o muerto) del paciente. 	1-Vivo 
2-Muerto
* 4	INTUBADO	Identifica si el paciente requirió de intubación.	1-Sí, 2-No, 97-No aplica, 98-Se ignora, 99-No Especificado
* 5	NEUMONIA	Identifica si el paciente se le diagnosticó con neumonía.	1-Sí, 2-No, 97-No aplica, 98-Se ignora, 99-No Especificado
* 6	EDAD	Identifica la edad del paciente.	Numérico
* 7	DIABETES	Identifica si el paciente tiene un diagnóstico de diabetes.	1-Sí, 2-No, 97-No aplica, 98-Se ignora, 99-No Especificado
* 8	EPOC	Identifica si el paciente tiene un diagnóstico de Enfermedad Pulmonar Obstructiva Crónica (EPOC).	1-Sí, 2-No, 97-No aplica, 98-Se ignora, 99-No Especificado
* 9	ASMA	Identifica si el paciente tiene un diagnóstico de asma.	1-Sí, 2-No, 97-No aplica, 98-Se ignora, 99-No Especificado
* 10	INMUSUPPR	Identifica si el paciente tiene un diagnóstico de inmunosupresión.	1-Sí, 2-No, 97-No aplica, 98-Se ignora, 99-No Especificado
* 11	HIPERTENSION	Identifica si el paciente tiene un diagnóstico de hipertensión.	1-Sí, 2-No, 97-No aplica, 98-Se ignora, 99-No Especificado
* 12	OTRA_COM	Identifica si el paciente tiene diagnóstico de otras enfermedades.	1-Sí, 2-No, 97-No aplica, 98-Se ignora, 99-No Especificado
* 13	CARDIOVASCULAR	Identifica si el paciente tiene un diagnóstico de enfermedades cardiovasculares.	1-Sí, 2-No, 97-No aplica, 98-Se ignora, 99-No Especificado
* 14	OBESIDAD	Identifica si el paciente tiene diagnóstico de obesidad.	1-Sí, 2-No, 97-No aplica, 98-Se ignora, 99-No Especificado
* 15	RENAL_CRONICA	Identifica si el paciente tiene diagnóstico de insuficiencia renal crónica.	1-Sí, 2-No, 97-No aplica, 98-Se ignora, 99-No Especificado
* 16	TABAQUISMO	Identifica si el paciente tiene hábito de tabaquismo.	1-Sí, 2-No, 97-No aplica, 98-Se ignora, 99-No Especificado
* 17	OTRO_CASO	Identifica si el paciente tuvo contacto con algún otro caso diagnosticado con SARS-CoV-2.	1-Sí, 2-No, 97-No aplica, 98-Se ignora, 99-No Especificado
* 18	RESULTADO_ANTIGENO	Identifica el resultado del análisis de la muestra de antígeno para SARS-CoV-2.	1-Positivo SARS-CoV-2, 2-Negativo SARS-CoV-2, 97- No Aplica (Caso sin muestra)
* 19	CLASIFICACION_FINAL	Identifica la clasificación del resultado de la prueba Covid-19: confirmado, inválido, no realizado, sospechoso y negativo.	1-Confirmado por Asociación Clínica Epidemiológica, 2-Confirmado por comité de Dictaminación, 3-Caso confirmado, 4-Inválido por laboratorio, 5-No realizado por laboratorio, 6-Caso sospechoso, 7-Negativo a SARS-CoV-2. 
* 20	UCI	Identifica si el paciente requirió ingresar a una Unidad de Cuidados Intensivos (UCI).	1-Sí, 2-No, 97-No aplica, 98-Se ignora, 99-No Especificado

### **I. Acceso a datos y selección de características**

#### **1) Acceso a los datos**

In [1]:
import pandas as pd               # Para la manipulación y análisis de datos
import numpy as np                # Para crear vectores y matrices n dimensionales
import matplotlib.pyplot as plt   # Para la generación de gráficas a partir de los datos
import seaborn as sns             # Para la visualización de datos basado en matplotlib
%matplotlib inline

In [5]:
Covid = pd.read_csv('Datos/CovidAdultosMayores.csv')
Covid

Unnamed: 0,ID,SEXO,TIPO_PACIENTE,SITUACION,INTUBADO,NEUMONIA,EDAD,DIABETES,EPOC,ASMA,...,HIPERTENSION,OTRA_COM,CARDIOVASCULAR,OBESIDAD,RENAL_CRONICA,TABAQUISMO,OTRO_CASO,RESULTADO_ANTIGENO,CLASIFICACION_FINAL,UCI
0,21,2,1,Vivo,5,2,62,2,2,2,...,1,2,2,2,2,2,2,5,6,5
1,23,1,1,Vivo,5,2,67,1,2,2,...,2,2,2,2,2,2,1,5,3,5
2,31,1,1,Vivo,5,2,62,2,2,2,...,1,2,2,1,2,2,1,1,3,5
3,39,1,1,Vivo,5,2,76,2,2,2,...,2,2,2,2,2,2,2,5,5,5
4,81,1,1,Vivo,5,2,60,2,2,2,...,2,2,2,1,2,2,2,5,7,5
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
591347,15563006,1,1,Vivo,5,2,67,4,4,4,...,4,4,4,4,4,4,1,2,7,5
591348,15563010,2,1,Vivo,5,2,68,4,4,4,...,4,4,4,4,4,4,1,2,7,5
591349,15563012,2,1,Vivo,5,2,69,4,4,4,...,4,4,4,4,4,4,1,2,7,5
591350,15563014,2,1,Vivo,5,2,71,4,4,4,...,4,4,4,4,4,4,1,2,7,5


In [6]:
Covid.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 591352 entries, 0 to 591351
Data columns (total 21 columns):
 #   Column               Non-Null Count   Dtype 
---  ------               --------------   ----- 
 0   ID                   591352 non-null  int64 
 1   SEXO                 591352 non-null  int64 
 2   TIPO_PACIENTE        591352 non-null  int64 
 3   SITUACION            591352 non-null  object
 4   INTUBADO             591352 non-null  int64 
 5   NEUMONIA             591352 non-null  int64 
 6   EDAD                 591352 non-null  int64 
 7   DIABETES             591352 non-null  int64 
 8   EPOC                 591352 non-null  int64 
 9   ASMA                 591352 non-null  int64 
 10  INMUSUPR             591352 non-null  int64 
 11  HIPERTENSION         591352 non-null  int64 
 12  OTRA_COM             591352 non-null  int64 
 13  CARDIOVASCULAR       591352 non-null  int64 
 14  OBESIDAD             591352 non-null  int64 
 15  RENAL_CRONICA        591352 non-nu