# Análisis y visualización de datos con python
# 3. Indexación y selección de dataframes

    - a) Estructura de una tabla 
    - b) Slicing
    - c) Únicos y conteo
    - d) Ordenar
    - e) Subsetting
    - f) Guardar datos

---

## 3.a Estructura de una tabla 

En primer lugar cargaremos las primeras mil lineas del Módulo de Fosas Comunes como vimos en el tutorial anterior. 

Adicionalmente, marcaremos que la columna `ID` es el indice de la tabla usando la opción `index_col`. El indice debé de ser único, es decir, los valores no deben de repetirse. 

Incluiremos un comando de limpieza, los cuales explicaremos en otro momento.


In [1]:
import pandas as pd

file_mfc = 'data_raw/Modulo-de-Fosas-Comunes_actualizacion24nov2022_VD.xlsx'
df = pd.read_excel(file_mfc, #nombre del archivo definido en la variable file_mfc
                   sheet_name="MFC", #nombre de la hoja
                   nrows=1000, #número de filas que se leeran
                   index_col='ID' #nombre de la columna del indice
                  )
df['Edad'] = pd.to_numeric(df['Edad'], errors='coerce') #Limpieza
df

Unnamed: 0_level_0,Estado_origen,Municipio_origen,Panteón_origen,Estatus_FC,Fecha_inhumación,Fecha_defunción,Fecha_exhumación,Restos_tipo,Sexo,Edad,Conocido_Desconocido,Primer apellido,Segundo Apellido,Nombre(s),Nombre completo,Institución_origen,Rdoc,Marca_temporal,Datos alternativos
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1
XX-P001,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-30,2018-03-04 00:00:00,NaT,Restos cremados,Masculino,55.0,Desconocido,,,,,UNIVERSIDAD WESTHILL - FACULTAD DE MEDICINA,Sí,2020-03-23 00:00:00.000,
XX-P002,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-12 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
XX-P003,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-13 00:00:00,NaT,Cadáver,Masculino,,Conocido,Cruz,Lucero,Alberto,Alberto Cruz Lucero,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
XX-P004,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-14 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
XX-P005,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-18 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
XX-P996,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,S/D,NaT,Cadáver,Masculino,42.0,Conocido,Flores,Rosette,Sergio,Sergio Flores Rosette,UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACU...,Sí,2020-04-06 21:19:52.451,
XX-P997,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,2017-10-27 00:00:00,NaT,Cadáver,Masculino,64.0,Conocido,Juárez,Chávez,Juan Carlos,Juan Carlos Juárez Chávez,UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACU...,Sí,2020-04-06 21:22:53.304,
XX-P998,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,2018-08-18 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-04-06 21:30:12.169,
XX-P999,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,2018-05-22 00:00:00,NaT,Cadáver,Femenino,1.0,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-04-06 21:32:30.839,


Una tabla de pandas o dataframe consta de varios elementos:
* Nombres de columnas, las cuales pueden ser vistas como la primera fila en letras negritas. Para verlas usa _.columns_.
* Nombres de filas, las cuales pueden ser vistas como la primera columna, la cual carece de nombre. Para verlas usa _.index_.
* Valores, los datos dentro de la tabla. Para verlas usa _.values_.
* El número de filas y columnas total. Para verla usa _.shape_.
* Tipo de datos de cada columna. Para verla usa _.dtype_.

Con el fin de conocer el nombre de las columnas usaremos la opción _.columns_. Es importante notar que esta opción no tiene paréntesis no corchetes, ya que es un elemento del objeto.

In [2]:
df.columns

Index(['Estado_origen', 'Municipio_origen', 'Panteón_origen', 'Estatus_FC',
       'Fecha_inhumación', 'Fecha_defunción', 'Fecha_exhumación',
       'Restos_tipo', 'Sexo', 'Edad', 'Conocido_Desconocido',
       'Primer apellido', 'Segundo Apellido', 'Nombre(s)', 'Nombre completo',
       'Institución_origen', 'Rdoc', 'Marca_temporal', 'Datos alternativos'],
      dtype='object')

Estas columnas corresponden a las del diccionario de datos que se encuentra en la Hoja 2 del archivo.

### Ejercicio 1

Usa cada una de las opciones mencionadas en esta sección y describe que regresa.
* `df.index`
* `df.values`
* `df.shape`
* `df.dtypes`


In [3]:
df.shape

(1000, 19)

## 3.b Slicing

Muchas veces no queremos trabajar sobre toda la tabla de datos, en su lugar queremos usar unicamente una fracción de ella. Para ello, existen varias formas de selecionar partes de una tabla.

Por ejemplo, la función _.head()_ devuelve las primeras filas de la tabla. Por defecto estos comandos muestran solo cinco filas, pero es posible cambiar el número de filas poniendo un número entre paréntesis.

In [4]:
df.head()

Unnamed: 0_level_0,Estado_origen,Municipio_origen,Panteón_origen,Estatus_FC,Fecha_inhumación,Fecha_defunción,Fecha_exhumación,Restos_tipo,Sexo,Edad,Conocido_Desconocido,Primer apellido,Segundo Apellido,Nombre(s),Nombre completo,Institución_origen,Rdoc,Marca_temporal,Datos alternativos
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1
XX-P001,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-30,2018-03-04 00:00:00,NaT,Restos cremados,Masculino,55.0,Desconocido,,,,,UNIVERSIDAD WESTHILL - FACULTAD DE MEDICINA,Sí,2020-03-23,
XX-P002,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-12 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23,
XX-P003,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-13 00:00:00,NaT,Cadáver,Masculino,,Conocido,Cruz,Lucero,Alberto,Alberto Cruz Lucero,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23,
XX-P004,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-14 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23,
XX-P005,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-18 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23,


Si queremos ver las últimas filas se puede usar el comando _.tail()_. 

En ambos casos se puede específicar el número de filas que se quieren ver

In [5]:
df.tail( 10 )

Unnamed: 0_level_0,Estado_origen,Municipio_origen,Panteón_origen,Estatus_FC,Fecha_inhumación,Fecha_defunción,Fecha_exhumación,Restos_tipo,Sexo,Edad,Conocido_Desconocido,Primer apellido,Segundo Apellido,Nombre(s),Nombre completo,Institución_origen,Rdoc,Marca_temporal,Datos alternativos
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1
XX-P991,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,2017-10-06 00:00:00,NaT,Cadáver,Masculino,55.0,Desconocido,,,,,UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACU...,Sí,2020-04-06 21:01:48.076,
XX-P992,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,2017-10-09 00:00:00,NaT,Cadáver,Masculino,50.0,Desconocido,,,,,UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACU...,Sí,2020-04-06 21:03:54.636,
XX-P993,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,2017-10-16 00:00:00,NaT,Cadáver,Masculino,50.0,Desconocido,,,,,UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACU...,Sí,2020-04-06 21:05:50.156,
XX-P994,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,S/D,NaT,Cadáver,Masculino,65.0,Conocido,Ramirez,,José,José Ramirez,UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACU...,Sí,2020-04-06 21:10:54.850,
XX-P995,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,S/D,NaT,Cadáver,Masculino,31.0,Conocido,,,Luciano,Luciano,UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACU...,Sí,2020-04-06 21:17:19.389,
XX-P996,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,S/D,NaT,Cadáver,Masculino,42.0,Conocido,Flores,Rosette,Sergio,Sergio Flores Rosette,UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACU...,Sí,2020-04-06 21:19:52.451,
XX-P997,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,2017-10-27 00:00:00,NaT,Cadáver,Masculino,64.0,Conocido,Juárez,Chávez,Juan Carlos,Juan Carlos Juárez Chávez,UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACU...,Sí,2020-04-06 21:22:53.304,
XX-P998,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,2018-08-18 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-04-06 21:30:12.169,
XX-P999,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,2018-05-22 00:00:00,NaT,Cadáver,Femenino,1.0,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-04-06 21:32:30.839,
XX-P1000,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,2018-05-29 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-04-06 21:35:23.157,


Para ver una columna específica se pone el nombre del dataframe seguido por corchetes con el nombre de la columna. Una sola columna es del tipo _series_. Por ejemplo, para ver la columna del sexo ponemos su nombre 'Sexo' entre corchetes. Esto es similar a la forma en la que se seleccionan elementos en listas o diccionarios.

In [6]:
df[ 'Sexo' ]

ID
XX-P001     Masculino
XX-P002     Masculino
XX-P003     Masculino
XX-P004     Masculino
XX-P005     Masculino
              ...    
XX-P996     Masculino
XX-P997     Masculino
XX-P998     Masculino
XX-P999      Femenino
XX-P1000    Masculino
Name: Sexo, Length: 1000, dtype: object

Se pueden seleccionar varias columnas a la vez, poniendo sus nombres en una lista dentro de corchetes. Lo anterior significa que para seleccionar varias columnas hay que usar corchetes dobles.

In [7]:
df[  ['Conocido_Desconocido','Sexo']  ]

Unnamed: 0_level_0,Conocido_Desconocido,Sexo
ID,Unnamed: 1_level_1,Unnamed: 2_level_1
XX-P001,Desconocido,Masculino
XX-P002,Desconocido,Masculino
XX-P003,Conocido,Masculino
XX-P004,Desconocido,Masculino
XX-P005,Desconocido,Masculino
...,...,...
XX-P996,Conocido,Masculino
XX-P997,Conocido,Masculino
XX-P998,Desconocido,Masculino
XX-P999,Desconocido,Femenino


La primera columna que podemos observar en la tabla y carece de nombre, es el índice de las filas. 
Por default, pandas asigna números de identificación a cada una de las filas, empezando por el cero . 
Sin embargo, es posible especificar que columna es el indice cómo se vió al principio del tutorial.

Podemos seleccionar las filas por posición o por el nombren el indice.
Con `.iloc` se selecciona el número de posición de la fila, sin olvidar que la numeración empieza en 0. Por ejemplo, seleccionemos la novena fila.

In [8]:
df.iloc[9]

Estado_origen                                            Ciudad de México
Municipio_origen                                           Miguel Hidalgo
Panteón_origen                                   Panteón Civil de Dolores
Estatus_FC                                                     Inhumación
Fecha_inhumación                                      2019-01-26 00:00:00
Fecha_defunción                                       2018-12-18 00:00:00
Fecha_exhumación                                                      NaT
Restos_tipo                                                       Cadáver
Sexo                                                            Masculino
Edad                                                                  NaN
Conocido_Desconocido                                          Desconocido
Primer apellido                                                       NaN
Segundo Apellido                                                      NaN
Nombre(s)                             

De la misma manera, se pueden seleccionar varias filas usando una lista.

In [9]:
df.iloc[  [9, 13, 62, 201]  ]

Unnamed: 0_level_0,Estado_origen,Municipio_origen,Panteón_origen,Estatus_FC,Fecha_inhumación,Fecha_defunción,Fecha_exhumación,Restos_tipo,Sexo,Edad,Conocido_Desconocido,Primer apellido,Segundo Apellido,Nombre(s),Nombre completo,Institución_origen,Rdoc,Marca_temporal,Datos alternativos
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1
XX-P010,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-18 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23,
XX-P014,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-19 00:00:00,NaT,Cadáver,Femenino,,Conocido,Ibarra,García,Wendy,Wendy Ibarra García,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23,
XX-P063,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-12,2018-11-29 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-24,
XX-P202,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-10-20,2018-09-18 00:00:00,NaT,Cadáver,Femenino,,Conocido,Aguirre,Bahena,Delia,Delia Aguirre Bahena,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-24,


O se puede marcar una secuencia de posiciones como si fuera una lista

In [10]:
df.iloc[  5:10  ]

Unnamed: 0_level_0,Estado_origen,Municipio_origen,Panteón_origen,Estatus_FC,Fecha_inhumación,Fecha_defunción,Fecha_exhumación,Restos_tipo,Sexo,Edad,Conocido_Desconocido,Primer apellido,Segundo Apellido,Nombre(s),Nombre completo,Institución_origen,Rdoc,Marca_temporal,Datos alternativos
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1
XX-P006,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-16 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23,
XX-P007,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-16 00:00:00,NaT,Cadáver,Masculino,,Conocido,,,Miguel,Miguel,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23,
XX-P008,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2019-12-17 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23,
XX-P009,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-18 00:00:00,NaT,Cadáver,Masculino,,Conocido,Cordero,,Rolando,Rolando Cordero,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23,
XX-P010,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-18 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23,


Este comando también se puede usar para seleccionar un conjunto de filas y columnas específico usando la posición. Para hacerlo se utiliza el formato: `df.iloc[filas, columnas]`.

In [11]:
df.iloc[ 9:15, [2,5,7] ]

Unnamed: 0_level_0,Panteón_origen,Fecha_defunción,Restos_tipo
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
XX-P010,Panteón Civil de Dolores,2018-12-18 00:00:00,Cadáver
XX-P011,Panteón Civil de Dolores,2018-12-18 00:00:00,Cadáver
XX-P012,Panteón Civil de Dolores,2018-12-30 00:00:00,Cadáver
XX-P013,Panteón Civil de Dolores,2018-12-21 00:00:00,Cadáver
XX-P014,Panteón Civil de Dolores,2018-12-19 00:00:00,Cadáver
XX-P015,Panteón Civil de Dolores,2018-12-23 00:00:00,Cadáver


Con `.loc` (sin la **i**) se selecciona la llave de la fila.

In [12]:
df.loc[ 'XX-P010' ]

Estado_origen                                            Ciudad de México
Municipio_origen                                           Miguel Hidalgo
Panteón_origen                                   Panteón Civil de Dolores
Estatus_FC                                                     Inhumación
Fecha_inhumación                                      2019-01-26 00:00:00
Fecha_defunción                                       2018-12-18 00:00:00
Fecha_exhumación                                                      NaT
Restos_tipo                                                       Cadáver
Sexo                                                            Masculino
Edad                                                                  NaN
Conocido_Desconocido                                          Desconocido
Primer apellido                                                       NaN
Segundo Apellido                                                      NaN
Nombre(s)                             

Este comando también se puede usar para seleccionar un conjunto de filas y columnas específico por la llave o el nombre en el indice y las columnas. Para hacerlo se utiliza el formato: _df.loc[filas, columnas]_

In [13]:
df.loc[  ['XX-P010', 'XX-P013', 'XX-P062', 'XX-P201']  , ['Conocido_Desconocido','Sexo']  ]

Unnamed: 0_level_0,Conocido_Desconocido,Sexo
ID,Unnamed: 1_level_1,Unnamed: 2_level_1
XX-P010,Desconocido,Masculino
XX-P013,Desconocido,Masculino
XX-P062,Conocido,Masculino
XX-P201,Conocido,Masculino


## 3.c Únicos y conteo

Se pueden hacer varias cosas con una columna o `series`. 

Por ejemplo, se pueden determinar los valores únicos de la columna para entender la información contenida en ella.

Por ejemplo, al revisar el profile se puede ver que hay múltiples instituciones de origen, así que obtendremos una lista de estas.

In [14]:
df['Institución_origen'].unique()

array(['UNIVERSIDAD WESTHILL - FACULTAD DE MEDICINA',
       'INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPERIOR DE JUSTICIA DE LA CIUDAD DE MÉXICO',
       'UNIVERSIDAD TOMINAGA NAKAMOTO S.C. ESCUELA DE MEDICINA CIENCIAS BÁSICAS',
       'INSTITUTO POLITÉCNICO NACIONAL - ESCUELA NACIONAL DE MEDICINA Y HOMEOPATÍA',
       'CENTRO CULTURAL UNIVERSITARIO JUSTO SIERRA',
       'UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACULTAD DE MEDICINA',
       'UNIVERSIDAD ANÁHUAC - FACULTAD DE CIENCIAS DE LA SALUD',
       'ESCUELA DE MEDICINA SAINT LUKE',
       'INSTITUCIÓN DE ASISTENCIA PRIVADA - ESCUELA LIBRE DE HOMEOPATÍA DE MÉXICO',
       'SECRETARÍA DE LA DEFENSA NACIONAL - ESCUELA MILITAR DE MEDICINA',
       'THE AMERICAN BRITISH COWDRAY MEDICAL CENTER LA.P.',
       'PROCURADURÍA GENERAL DE LA REPÚBLICA',
       'UNIVERSIDAD POPULAR AUTÓNOMA DEL ESTADO DE PUEBLA'], dtype=object)

Si lo único que nos interesa saber es cuantos datos únicos hay, y no cuales son, se puede usar la función _.nunique()_.

In [15]:
df['Institución_origen'].nunique()

13

También, se puede contabilizar cuántas veces aparece cada uno de estos valores. Esto permite saber cuantas veces aparece cada valor único. El resultado de la función es un dataframe.

In [16]:
df['Institución_origen'].value_counts()

INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPERIOR DE JUSTICIA DE LA CIUDAD DE MÉXICO    533
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACULTAD DE MEDICINA                           331
INSTITUTO POLITÉCNICO NACIONAL - ESCUELA NACIONAL DE MEDICINA Y HOMEOPATÍA                58
CENTRO CULTURAL UNIVERSITARIO JUSTO SIERRA                                                16
UNIVERSIDAD WESTHILL - FACULTAD DE MEDICINA                                               15
UNIVERSIDAD ANÁHUAC - FACULTAD DE CIENCIAS DE LA SALUD                                    13
THE AMERICAN BRITISH COWDRAY MEDICAL CENTER LA.P.                                          9
SECRETARÍA DE LA DEFENSA NACIONAL - ESCUELA MILITAR DE MEDICINA                            7
UNIVERSIDAD POPULAR AUTÓNOMA DEL ESTADO DE PUEBLA                                          7
UNIVERSIDAD TOMINAGA NAKAMOTO S.C. ESCUELA DE MEDICINA CIENCIAS BÁSICAS                    4
ESCUELA DE MEDICINA SAINT LUKE                                        

Para ver estos resultados como porcentaje se puede usar el parámetro _normalize_. 


In [17]:
df['Institución_origen'].value_counts( normalize=True )

INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPERIOR DE JUSTICIA DE LA CIUDAD DE MÉXICO    0.533
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACULTAD DE MEDICINA                           0.331
INSTITUTO POLITÉCNICO NACIONAL - ESCUELA NACIONAL DE MEDICINA Y HOMEOPATÍA               0.058
CENTRO CULTURAL UNIVERSITARIO JUSTO SIERRA                                               0.016
UNIVERSIDAD WESTHILL - FACULTAD DE MEDICINA                                              0.015
UNIVERSIDAD ANÁHUAC - FACULTAD DE CIENCIAS DE LA SALUD                                   0.013
THE AMERICAN BRITISH COWDRAY MEDICAL CENTER LA.P.                                        0.009
SECRETARÍA DE LA DEFENSA NACIONAL - ESCUELA MILITAR DE MEDICINA                          0.007
UNIVERSIDAD POPULAR AUTÓNOMA DEL ESTADO DE PUEBLA                                        0.007
UNIVERSIDAD TOMINAGA NAKAMOTO S.C. ESCUELA DE MEDICINA CIENCIAS BÁSICAS                  0.004
ESCUELA DE MEDICINA SAINT LUKE                    

Es posible usar la función `value_counts` sobre varias columnas a la vez.
Esto regrese un dataframe con un `multi index`.

In [18]:
df[ ['Sexo','Conocido_Desconocido'] ].value_counts()

Sexo           Conocido_Desconocido
Masculino      Conocido                440
               Desconocido             378
Femenino       Conocido                136
               Desconocido              33
Indeterminado  Desconocido              10
               Conocido                  3
dtype: int64

Es posible que en una columna o variable haya filas u observaciones donde no se registro el dato. 
Para incluir los NaN es necesario cambiar los parámetros de la función,usando el parámetro `dropna=False`.
Esto es de suma importancia al normalizar los datos, ya que el porcentaje de cada valor único cambiará dependiendo de si se toman, o no, en cuenta los NaN.

In [19]:
df['Edad'].value_counts(normalize=True ,  dropna=False, )

NaN      0.460
50.0     0.021
60.0     0.020
40.0     0.019
70.0     0.018
         ...  
97.0     0.001
101.0    0.001
6.0      0.001
44.0     0.001
1.0      0.001
Name: Edad, Length: 89, dtype: float64

Como el resultado de la función `value_counts` es un dataframe podemos utilizar funciones propias de dataframe como `head` o slicing.

Por ejemplo, para ver las cinco instituciones que entregan más cadaveres obtendremos el conteo de valores con _.value_counts()_ y después seleccionaremos los cinco primeros usando un slicing de lista.

In [20]:
df['Institución_origen'].value_counts().head(5)

INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPERIOR DE JUSTICIA DE LA CIUDAD DE MÉXICO    533
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACULTAD DE MEDICINA                           331
INSTITUTO POLITÉCNICO NACIONAL - ESCUELA NACIONAL DE MEDICINA Y HOMEOPATÍA                58
CENTRO CULTURAL UNIVERSITARIO JUSTO SIERRA                                                16
UNIVERSIDAD WESTHILL - FACULTAD DE MEDICINA                                               15
Name: Institución_origen, dtype: int64

### Ejercicio 2

* ¿Cuáles son los cinco apellidos más comunes?
* ¿Cuántas veces aparece cada uno?
* ¿Qué porcentaje de la población tiene cada apellido? ¿Es lo mismo si normalizamos?
* ¿Cómo afectan los datos protegidos por razones legales estas cuentas?


## 3.d Ordenar

Además de poder seleccionar los datos muchas veces es muy importante poder ordenarlos. Para eso usaremos _.sort_values()_

Para ordenar una sola columna:

In [21]:
df['Nombre(s)'].sort_values()

ID
XX-P822       Abel
XX-P019      Adela
XX-P130     Adolfo
XX-P478     Adrian
XX-P073     Adrian
             ...  
XX-P992        NaN
XX-P993        NaN
XX-P998        NaN
XX-P999        NaN
XX-P1000       NaN
Name: Nombre(s), Length: 1000, dtype: object

Por default _.sort_values()_ ordena en orden alfábetico o de menor a mayor, en caso de datos númericos. 
Para cambiar esto podemos usar el parámetro _ascending_. Por default los datos con NaN siempre van al final de la tabla.
Es importante destacar que los acentos pueden causar problemas al ordenar alfabeticamente.

In [22]:
df['Nombre(s)'].sort_values( ascending=False )

ID
XX-P896        Ángel
XX-P595       Ándres
XX-P587       Ándres
XX-P641     Zeferino
XX-P426         Yair
              ...   
XX-P992          NaN
XX-P993          NaN
XX-P998          NaN
XX-P999          NaN
XX-P1000         NaN
Name: Nombre(s), Length: 1000, dtype: object

Para ordenar todo el dataframe por una columna es necesario decir explicitamente que columna se va a usar.

Nota como en ambos casos se selecciona primero sobre que se va a trabajar, ya sea el dataframe completo (`df`) o una columna específica (`df[nombre_columna]`), después se dice que se va a hacer con el nombre de la función (`.sort_values()`) y finalmente se dan instrucciones específicas a la función de cómo hacerlo si es necesario poniendo los parametros dentro del parentesis.

In [23]:
df.sort_values( 'Nombre(s)' )

Unnamed: 0_level_0,Estado_origen,Municipio_origen,Panteón_origen,Estatus_FC,Fecha_inhumación,Fecha_defunción,Fecha_exhumación,Restos_tipo,Sexo,Edad,Conocido_Desconocido,Primer apellido,Segundo Apellido,Nombre(s),Nombre completo,Institución_origen,Rdoc,Marca_temporal,Datos alternativos
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1
XX-P822,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-07-07,2015-01-30 00:00:00,NaT,Restos cremados,Masculino,32.0,Conocido,Reyes,Vázquez,Abel,Abel Reyes Vázquez,UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACU...,Sí,2020-04-02 13:45:06.218,
XX-P019,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-18 00:00:00,NaT,Cadáver,Femenino,,Conocido,Martínez,Hernández,Adela,Adela Martínez Hernández,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
XX-P130,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-12-07,2018-03-09 00:00:00,NaT,Cadáver,Masculino,89.0,Conocido,Méndez,Vaca,Adolfo,Adolfo Méndez Vaca,INSTITUTO POLITÉCNICO NACIONAL - ESCUELA NACIO...,Sí,2020-03-24 00:00:00.000,
XX-P478,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-03-30,2016-12-17 00:00:00,NaT,Restos cremados,Masculino,73.0,Conocido,Palafox,Muñoz,Adrian,Adrian Palafox Muñoz,UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACU...,Sí,2020-03-30 12:15:50.000,
XX-P073,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-02,2017-09-20 00:00:00,NaT,Cadáver,Masculino,89.0,Conocido,Ramirez,Molina,Adrian,Adrian Ramirez Molina,INSTITUTO POLITÉCNICO NACIONAL - ESCUELA NACIO...,Sí,2020-03-24 00:00:00.000,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
XX-P992,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,2017-10-09 00:00:00,NaT,Cadáver,Masculino,50.0,Desconocido,,,,,UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACU...,Sí,2020-04-06 21:03:54.636,
XX-P993,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,2017-10-16 00:00:00,NaT,Cadáver,Masculino,50.0,Desconocido,,,,,UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACU...,Sí,2020-04-06 21:05:50.156,
XX-P998,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,2018-08-18 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-04-06 21:30:12.169,
XX-P999,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,2018-05-22 00:00:00,NaT,Cadáver,Femenino,1.0,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-04-06 21:32:30.839,


Es posible ordenar por varias columnas especificando el nombre de las columnas en una lista y la forma de ordenarlas usando _ascending_.

In [24]:
df.sort_values(  ['Sexo', 'Edad', 'Conocido_Desconocido']  ,  ascending=True   )
df

Unnamed: 0_level_0,Estado_origen,Municipio_origen,Panteón_origen,Estatus_FC,Fecha_inhumación,Fecha_defunción,Fecha_exhumación,Restos_tipo,Sexo,Edad,Conocido_Desconocido,Primer apellido,Segundo Apellido,Nombre(s),Nombre completo,Institución_origen,Rdoc,Marca_temporal,Datos alternativos
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1
XX-P001,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-30,2018-03-04 00:00:00,NaT,Restos cremados,Masculino,55.0,Desconocido,,,,,UNIVERSIDAD WESTHILL - FACULTAD DE MEDICINA,Sí,2020-03-23 00:00:00.000,
XX-P002,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-12 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
XX-P003,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-13 00:00:00,NaT,Cadáver,Masculino,,Conocido,Cruz,Lucero,Alberto,Alberto Cruz Lucero,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
XX-P004,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-14 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
XX-P005,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-18 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
XX-P996,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,S/D,NaT,Cadáver,Masculino,42.0,Conocido,Flores,Rosette,Sergio,Sergio Flores Rosette,UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACU...,Sí,2020-04-06 21:19:52.451,
XX-P997,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,2017-10-27 00:00:00,NaT,Cadáver,Masculino,64.0,Conocido,Juárez,Chávez,Juan Carlos,Juan Carlos Juárez Chávez,UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACU...,Sí,2020-04-06 21:22:53.304,
XX-P998,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,2018-08-18 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-04-06 21:30:12.169,
XX-P999,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,2018-05-22 00:00:00,NaT,Cadáver,Femenino,1.0,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-04-06 21:32:30.839,


## 3.e Subsetting

Es posible seleccionar los datos de acuerdo a una (o más) condición. 

Por ejemplo para seleccionar todos los delitos que afectan a mujeres buscamos las filas donde el 'Sexo' es 'Femenino' con la condición:

In [25]:
df['Sexo'] == 'Femenino'

ID
XX-P001     False
XX-P002     False
XX-P003     False
XX-P004     False
XX-P005     False
            ...  
XX-P996     False
XX-P997     False
XX-P998     False
XX-P999      True
XX-P1000    False
Name: Sexo, Length: 1000, dtype: bool

Esta condicion nos dice para cada fila si el valos es 'Femenino', si ponemos esto dentro de _.loc[]_ podemos usarlo para encontrar las filas de víctimas de mujeres.

In [26]:
df.loc[ df['Sexo']=='Femenino' ]

Unnamed: 0_level_0,Estado_origen,Municipio_origen,Panteón_origen,Estatus_FC,Fecha_inhumación,Fecha_defunción,Fecha_exhumación,Restos_tipo,Sexo,Edad,Conocido_Desconocido,Primer apellido,Segundo Apellido,Nombre(s),Nombre completo,Institución_origen,Rdoc,Marca_temporal,Datos alternativos
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1
XX-P014,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-19 00:00:00,NaT,Cadáver,Femenino,,Conocido,Ibarra,García,Wendy,Wendy Ibarra García,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
XX-P019,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-18 00:00:00,NaT,Cadáver,Femenino,,Conocido,Martínez,Hernández,Adela,Adela Martínez Hernández,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
XX-P027,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,S/D,NaT,Miembros,Femenino,35.0,Conocido,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
XX-P034,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-19,2018-12-04 00:00:00,NaT,Cadáver,Femenino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
XX-P037,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-19,2018-12-07 00:00:00,NaT,Cadáver,Femenino,,Conocido,González,Valle,Gloria,Gloria González Valle,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
XX-P953,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-07-14,2017-09-04 00:00:00,NaT,Cadáver,Femenino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-04-06 09:41:05.347,
XX-P956,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-07-14,2018-06-09 00:00:00,NaT,Cadáver,Femenino,,Conocido,Martha Helida,Silva,Morales,Morales Martha Helida Silva,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-04-06 11:09:46.318,
XX-P967,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-07-14,2017-08-08 00:00:00,NaT,Cadáver,Femenino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-04-06 15:14:11.685,
XX-P968,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-07-14,2017-07-21 00:00:00,NaT,Cadáver,Femenino,,Conocido,Gaytan,Ramirez,Marysol,Marysol Gaytan Ramirez,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-04-06 15:17:22.421,


Para seleccionar los delitos que NO afectan a las mujeres buscamos aquellos donde el sexo es diferenente (_!=_) a 'Femenino'

In [27]:
df[  df['Sexo'] != 'Femenino'  ]

Unnamed: 0_level_0,Estado_origen,Municipio_origen,Panteón_origen,Estatus_FC,Fecha_inhumación,Fecha_defunción,Fecha_exhumación,Restos_tipo,Sexo,Edad,Conocido_Desconocido,Primer apellido,Segundo Apellido,Nombre(s),Nombre completo,Institución_origen,Rdoc,Marca_temporal,Datos alternativos
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1
XX-P001,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-30,2018-03-04 00:00:00,NaT,Restos cremados,Masculino,55.0,Desconocido,,,,,UNIVERSIDAD WESTHILL - FACULTAD DE MEDICINA,Sí,2020-03-23 00:00:00.000,
XX-P002,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-12 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
XX-P003,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-13 00:00:00,NaT,Cadáver,Masculino,,Conocido,Cruz,Lucero,Alberto,Alberto Cruz Lucero,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
XX-P004,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-14 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
XX-P005,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-18 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
XX-P995,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,S/D,NaT,Cadáver,Masculino,31.0,Conocido,,,Luciano,Luciano,UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACU...,Sí,2020-04-06 21:17:19.389,
XX-P996,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,S/D,NaT,Cadáver,Masculino,42.0,Conocido,Flores,Rosette,Sergio,Sergio Flores Rosette,UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACU...,Sí,2020-04-06 21:19:52.451,
XX-P997,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,2017-10-27 00:00:00,NaT,Cadáver,Masculino,64.0,Conocido,Juárez,Chávez,Juan Carlos,Juan Carlos Juárez Chávez,UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACU...,Sí,2020-04-06 21:22:53.304,
XX-P998,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,2018-08-18 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-04-06 21:30:12.169,


Si los datos son numéricos es posible usar operaciones como mayor, menor o igual para seleccionar con esas condiciones. Por ejemplo para ver los cadaveres menor de edad podriamos buscar todos las filas donde el valor de la edad es menor que 18.

**Nota** Al cargar los datos en la primera celda de código se limpio la celda para que solo incluyera valores numéricos, lo cuál se explicará en otro tutorial

In [28]:
df[  df['Edad']<18  ]

Unnamed: 0_level_0,Estado_origen,Municipio_origen,Panteón_origen,Estatus_FC,Fecha_inhumación,Fecha_defunción,Fecha_exhumación,Restos_tipo,Sexo,Edad,Conocido_Desconocido,Primer apellido,Segundo Apellido,Nombre(s),Nombre completo,Institución_origen,Rdoc,Marca_temporal,Datos alternativos
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1
XX-P461,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-02-16,S/D,NaT,Restos humanos,Femenino,15.0,Conocido,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-30 11:46:31.000,
XX-P481,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-02-02,S/D,NaT,Miembros,Masculino,13.0,Conocido,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-30 12:19:13.000,
XX-P484,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-05-18,S/D,NaT,Miembros,Femenino,6.0,Conocido,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-30 12:25:05.000,
XX-P586,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-03-16,S/D,NaT,Miembros,Masculino,13.0,Conocido,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-30 16:39:26.000,
XX-P781,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2017-10-14,S/D,NaT,Restos humanos,Masculino,17.0,Conocido,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-02-04 11:04:39.000,
XX-P784,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2017-10-14,S/D,NaT,Restos humanos,Masculino,16.0,Conocido,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-02-04 11:14:33.000,
XX-P876,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-29,S/D,NaT,Miembros,Masculino,11.0,Conocido,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-04-03 13:43:18.417,
XX-P882,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-29,S/D,NaT,Miembros,Masculino,11.0,Conocido,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-04-03 14:46:48.721,
XX-P969,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-07-14,S/D,NaT,Miembros,Masculino,5.0,Conocido,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-04-06 17:53:48.782,
XX-P999,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,2018-05-22 00:00:00,NaT,Cadáver,Femenino,1.0,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-04-06 21:32:30.839,


En varios casos podemos ver que no hay datos sobre el edad del cadaver, lo cual se representa con _NaN_. Para ver las filas con valor _NaN_ se usa la función _isna()_.

Lo anterior puede representar un problema al momento del análisis, ya que significa que los datos son incompletos y generalmente es necesario procesarlos como veremos mas adelante. Es por esto que es importante revisar los faltantes.

In [29]:
df[  df['Edad'].isna()  ]

Unnamed: 0_level_0,Estado_origen,Municipio_origen,Panteón_origen,Estatus_FC,Fecha_inhumación,Fecha_defunción,Fecha_exhumación,Restos_tipo,Sexo,Edad,Conocido_Desconocido,Primer apellido,Segundo Apellido,Nombre(s),Nombre completo,Institución_origen,Rdoc,Marca_temporal,Datos alternativos
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1
XX-P002,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-12 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
XX-P003,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-13 00:00:00,NaT,Cadáver,Masculino,,Conocido,Cruz,Lucero,Alberto,Alberto Cruz Lucero,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
XX-P004,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-14 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
XX-P005,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-18 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
XX-P006,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-16 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
XX-P968,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-07-14,2017-07-21 00:00:00,NaT,Cadáver,Femenino,,Conocido,Gaytan,Ramirez,Marysol,Marysol Gaytan Ramirez,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-04-06 15:17:22.421,
XX-P974,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-07-14,S/D,NaT,Restos humanos,Indeterminado,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-04-06 18:51:06.834,
XX-P978,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-07-17,2018-01-27 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,CENTRO CULTURAL UNIVERSITARIO JUSTO SIERRA,Sí,2020-04-06 19:53:36.113,
XX-P998,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,2018-08-18 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-04-06 21:30:12.169,


Es posible hacer lo contrario a la instrucción de selección agregando una negación al principio del comando de selección. 

Por ejemplo, para seleccionar las observaciones donde SI hay una edad, seleccionamos aquellas que no tienen Edad con isna() y luego las negamos. Recuerda que dos negaciones son una afirmación.

In [30]:
df[ ~ df['Edad'].isna() ]

Unnamed: 0_level_0,Estado_origen,Municipio_origen,Panteón_origen,Estatus_FC,Fecha_inhumación,Fecha_defunción,Fecha_exhumación,Restos_tipo,Sexo,Edad,Conocido_Desconocido,Primer apellido,Segundo Apellido,Nombre(s),Nombre completo,Institución_origen,Rdoc,Marca_temporal,Datos alternativos
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1
XX-P001,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-30,2018-03-04 00:00:00,NaT,Restos cremados,Masculino,55.0,Desconocido,,,,,UNIVERSIDAD WESTHILL - FACULTAD DE MEDICINA,Sí,2020-03-23 00:00:00.000,
XX-P024,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,S/D,NaT,Miembros,Masculino,31.0,Conocido,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
XX-P025,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,S/D,NaT,Miembros,Masculino,18.0,Conocido,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
XX-P026,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,S/D,NaT,Miembros,Masculino,39.0,Conocido,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
XX-P027,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,S/D,NaT,Miembros,Femenino,35.0,Conocido,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
XX-P994,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,S/D,NaT,Cadáver,Masculino,65.0,Conocido,Ramirez,,José,José Ramirez,UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACU...,Sí,2020-04-06 21:10:54.850,
XX-P995,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,S/D,NaT,Cadáver,Masculino,31.0,Conocido,,,Luciano,Luciano,UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACU...,Sí,2020-04-06 21:17:19.389,
XX-P996,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,S/D,NaT,Cadáver,Masculino,42.0,Conocido,Flores,Rosette,Sergio,Sergio Flores Rosette,UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACU...,Sí,2020-04-06 21:19:52.451,
XX-P997,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,2017-10-27 00:00:00,NaT,Cadáver,Masculino,64.0,Conocido,Juárez,Chávez,Juan Carlos,Juan Carlos Juárez Chávez,UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACU...,Sí,2020-04-06 21:22:53.304,


A veces no queremos seleccionar las columnas que tienen un solo valor, sino varios. Por ejemplo, si queremos ver los restos que provienen de instituciones educativas privadas podemos generar una lista llamada 'escuelas_privadas' y despues los buscamos con el comando _.isin()_

In [31]:
escuelas_privadas = ['CENTRO CULTURAL UNIVERSITARIO JUSTO SIERRA', 'UNIVERSIDAD WESTHILL - FACULTAD DE MEDICINA', 
                     'UNIVERSIDAD ANÁHUAC - FACULTAD DE CIENCIAS DE LA SALUD', 'THE AMERICAN BRITISH COWDRAY MEDICAL CENTER LA.P.', 
                     'UNIVERSIDAD POPULAR AUTÓNOMA DEL ESTADO DE PUEBLA', 'UNIVERSIDAD TOMINAGA NAKAMOTO S.C. ESCUELA DE MEDICINA CIENCIAS BÁSICAS', 
                     'ESCUELA DE MEDICINA SAINT LUKE', 'INSTITUCIÓN DE ASISTENCIA PRIVADA - ESCUELA LIBRE DE HOMEOPATÍA DE MÉXICO']
df[ df['Institución_origen'].isin(escuelas_privadas) ]

Unnamed: 0_level_0,Estado_origen,Municipio_origen,Panteón_origen,Estatus_FC,Fecha_inhumación,Fecha_defunción,Fecha_exhumación,Restos_tipo,Sexo,Edad,Conocido_Desconocido,Primer apellido,Segundo Apellido,Nombre(s),Nombre completo,Institución_origen,Rdoc,Marca_temporal,Datos alternativos
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1
XX-P001,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-30,2018-03-04 00:00:00,NaT,Restos cremados,Masculino,55.0,Desconocido,,,,,UNIVERSIDAD WESTHILL - FACULTAD DE MEDICINA,Sí,2020-03-23 00:00:00.000,
XX-P048,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-16,2018-03-03 00:00:00,NaT,Cadáver,Masculino,74.0,Conocido,García,Hernández,Pedro,Pedro García Hernández,UNIVERSIDAD TOMINAGA NAKAMOTO S.C. ESCUELA DE ...,Sí,2020-03-24 00:00:00.000,
XX-P091,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-12-14,2018-02-27 00:00:00,NaT,Cadáver,Masculino,40.0,Desconocido,,,,,CENTRO CULTURAL UNIVERSITARIO JUSTO SIERRA,Sí,2020-03-24 00:00:00.000,
XX-P092,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-12-14,2018-03-22 00:00:00,NaT,Cadáver,Masculino,40.0,Desconocido,,,,,CENTRO CULTURAL UNIVERSITARIO JUSTO SIERRA,Sí,2020-03-24 00:00:00.000,
XX-P093,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-12-14,2018-06-14 00:00:00,NaT,Cadáver,Masculino,40.0,Desconocido,,,,,CENTRO CULTURAL UNIVERSITARIO JUSTO SIERRA,Sí,2020-03-24 00:00:00.000,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
XX-P983,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-07-18,2017-06-29 00:00:00,NaT,Cadáver,Masculino,56.0,Conocido,,,Francisco,Francisco,UNIVERSIDAD WESTHILL - FACULTAD DE MEDICINA,Sí,2020-04-06 20:23:49.600,
XX-P984,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-07-18,2017-09-05 00:00:00,NaT,Cadáver,Masculino,57.0,Conocido,Gómez,Sánchez,Fernando,Fernando Gómez Sánchez,UNIVERSIDAD WESTHILL - FACULTAD DE MEDICINA,Sí,2020-04-06 20:32:11.789,
XX-P985,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-07-18,2017-10-02 00:00:00,NaT,Cadáver,Masculino,38.0,Desconocido,,,,,UNIVERSIDAD WESTHILL - FACULTAD DE MEDICINA,Sí,2020-04-06 20:35:09.565,
XX-P986,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-07-18,2017-10-05 00:00:00,NaT,Cadáver,Masculino,70.0,Desconocido,,,,,UNIVERSIDAD WESTHILL - FACULTAD DE MEDICINA,Sí,2020-04-06 20:37:40.503,


Si queremos los registros que no están en escuelas privadas, es decir aquellos que vienen de instituciones de gobierno o universidades públicas, podemos usar el comando de negación `~` para obtener el conjunto complementario.

In [32]:
df[ ~df['Institución_origen'].isin(escuelas_privadas) ]

Unnamed: 0_level_0,Estado_origen,Municipio_origen,Panteón_origen,Estatus_FC,Fecha_inhumación,Fecha_defunción,Fecha_exhumación,Restos_tipo,Sexo,Edad,Conocido_Desconocido,Primer apellido,Segundo Apellido,Nombre(s),Nombre completo,Institución_origen,Rdoc,Marca_temporal,Datos alternativos
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1
XX-P002,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-12 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
XX-P003,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-13 00:00:00,NaT,Cadáver,Masculino,,Conocido,Cruz,Lucero,Alberto,Alberto Cruz Lucero,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
XX-P004,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-14 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
XX-P005,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-18 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
XX-P006,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-16 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
XX-P996,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,S/D,NaT,Cadáver,Masculino,42.0,Conocido,Flores,Rosette,Sergio,Sergio Flores Rosette,UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACU...,Sí,2020-04-06 21:19:52.451,
XX-P997,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,2017-10-27 00:00:00,NaT,Cadáver,Masculino,64.0,Conocido,Juárez,Chávez,Juan Carlos,Juan Carlos Juárez Chávez,UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACU...,Sí,2020-04-06 21:22:53.304,
XX-P998,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,2018-08-18 00:00:00,NaT,Cadáver,Masculino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-04-06 21:30:12.169,
XX-P999,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-09-01,2018-05-22 00:00:00,NaT,Cadáver,Femenino,1.0,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-04-06 21:32:30.839,


Se pueden usar varias condiciones al mismo tiempo.
Para combinar varias condiciones es necesario poner cada condición entre parentesis.
Las condiciones se unen usando los operadores booleanos:
* _&_ se cumplen ambas condiciones
* _|_ se cumple al menos una de las condiciones
* _~_ negación

Por ejemplo, para seleccionar los restos de mujeres menores de 18 años ponemos cada uno de los selectores de edades antes visto entre paréntesis y los unimos con _&_


In [33]:
# df.loc[ (seleccionar_mujeres) & (seleccionar_menores_de_edad)] 
df.loc[  ( df['Sexo']=='Femenino' ) | ( df['Edad']<18 ) ]

Unnamed: 0_level_0,Estado_origen,Municipio_origen,Panteón_origen,Estatus_FC,Fecha_inhumación,Fecha_defunción,Fecha_exhumación,Restos_tipo,Sexo,Edad,Conocido_Desconocido,Primer apellido,Segundo Apellido,Nombre(s),Nombre completo,Institución_origen,Rdoc,Marca_temporal,Datos alternativos
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1
XX-P014,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-19 00:00:00,NaT,Cadáver,Femenino,,Conocido,Ibarra,García,Wendy,Wendy Ibarra García,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
XX-P019,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,2018-12-18 00:00:00,NaT,Cadáver,Femenino,,Conocido,Martínez,Hernández,Adela,Adela Martínez Hernández,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
XX-P027,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,S/D,NaT,Miembros,Femenino,35.0,Conocido,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
XX-P034,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-19,2018-12-04 00:00:00,NaT,Cadáver,Femenino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
XX-P037,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-19,2018-12-07 00:00:00,NaT,Cadáver,Femenino,,Conocido,González,Valle,Gloria,Gloria González Valle,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
XX-P956,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-07-14,2018-06-09 00:00:00,NaT,Cadáver,Femenino,,Conocido,Martha Helida,Silva,Morales,Morales Martha Helida Silva,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-04-06 11:09:46.318,
XX-P967,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-07-14,2017-08-08 00:00:00,NaT,Cadáver,Femenino,,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-04-06 15:14:11.685,
XX-P968,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-07-14,2017-07-21 00:00:00,NaT,Cadáver,Femenino,,Conocido,Gaytan,Ramirez,Marysol,Marysol Gaytan Ramirez,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-04-06 15:17:22.421,
XX-P969,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-07-14,S/D,NaT,Miembros,Masculino,5.0,Conocido,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-04-06 17:53:48.782,


Es posible hacer combinaciones de selecciones bastante complicadas, sin embargo se recomienda guardarlas en un dataframe específico e ir haciendo las selecciones por pasos.

In [34]:
df_vulnerables = df[ ~df['Edad'].isna() ] #ignorar aquellos que no tienen edad
# seleccionar menores de edad o mujeres, nota como seleccionamos sobre la primera seleccion y no el dataframe en general
df_vulnerables = df_vulnerables[ (df_vulnerables['Edad']<18) | (df_vulnerables['Sexo']=='Femenino') ]
df_vulnerables #ver el resultado


Unnamed: 0_level_0,Estado_origen,Municipio_origen,Panteón_origen,Estatus_FC,Fecha_inhumación,Fecha_defunción,Fecha_exhumación,Restos_tipo,Sexo,Edad,Conocido_Desconocido,Primer apellido,Segundo Apellido,Nombre(s),Nombre completo,Institución_origen,Rdoc,Marca_temporal,Datos alternativos
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1
XX-P027,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,S/D,NaT,Miembros,Femenino,35.0,Conocido,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
XX-P072,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-02,2017-08-16 00:00:00,NaT,Cadáver,Femenino,83.0,Conocido,Luna,Sanchez,Maria Antonia,Maria Antonia Luna Sanchez,INSTITUTO POLITÉCNICO NACIONAL - ESCUELA NACIO...,Sí,2020-03-24 00:00:00.000,
XX-P094,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-12-08,2018-04-05 00:00:00,NaT,Cadáver,Femenino,40.0,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-24 00:00:00.000,
XX-P111,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-12-08,2018-12-11 00:00:00,NaT,Cadáver,Femenino,35.0,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-24 00:00:00.000,
XX-P114,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-12-08,S/D,NaT,Miembros,Femenino,90.0,Conocido,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-24 00:00:00.000,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
XX-P939,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-07-07,2017-01-27 00:00:00,NaT,Restos cremados,Femenino,82.0,Conocido,Torices,Tinoco,Juana,Juana Torices Tinoco,UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACU...,Sí,2020-04-06 02:43:06.361,
XX-P941,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-07-07,2017-02-07 00:00:00,NaT,Restos cremados,Femenino,85.0,Conocido,Domíngues,Vargas,María,María Domíngues Vargas,UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACU...,Sí,2020-04-06 02:46:43.724,
XX-P945,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-07-07,2017-02-21 00:00:00,NaT,Restos cremados,Femenino,83.0,Conocido,Bautista,,Martha Elena,Martha Elena Bautista,UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACU...,Sí,2020-04-06 09:03:36.324,
XX-P969,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-07-14,S/D,NaT,Miembros,Masculino,5.0,Conocido,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-04-06 17:53:48.782,


Nota sobre fechas

Algunos tipos de datos permiten realizar operaciones especializadas. Por ejemplo con las fechas se pueden extraes el mes, día, día de la semana, hora, etc. Veremos esto más adelante pero dejamos un ejemplo de registros inhumados en viernes.

In [35]:
df[ df['Fecha_inhumación'].dt.day_name() == 'Friday' ]

Unnamed: 0_level_0,Estado_origen,Municipio_origen,Panteón_origen,Estatus_FC,Fecha_inhumación,Fecha_defunción,Fecha_exhumación,Restos_tipo,Sexo,Edad,Conocido_Desconocido,Primer apellido,Segundo Apellido,Nombre(s),Nombre completo,Institución_origen,Rdoc,Marca_temporal,Datos alternativos
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1
XX-P091,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-12-14,2018-02-27 00:00:00,NaT,Cadáver,Masculino,40.0,Desconocido,,,,,CENTRO CULTURAL UNIVERSITARIO JUSTO SIERRA,Sí,2020-03-24 00:00:00.000,
XX-P092,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-12-14,2018-03-22 00:00:00,NaT,Cadáver,Masculino,40.0,Desconocido,,,,,CENTRO CULTURAL UNIVERSITARIO JUSTO SIERRA,Sí,2020-03-24 00:00:00.000,
XX-P093,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-12-14,2018-06-14 00:00:00,NaT,Cadáver,Masculino,40.0,Desconocido,,,,,CENTRO CULTURAL UNIVERSITARIO JUSTO SIERRA,Sí,2020-03-24 00:00:00.000,
XX-P116,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-12-07,2017-11-13 00:00:00,NaT,Cadáver,Femenino,76.0,Conocido,Belmont,López,Raquel,Raquel Belmont López,INSTITUTO POLITÉCNICO NACIONAL - ESCUELA NACIO...,Sí,2020-03-24 00:00:00.000,
XX-P117,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-12-07,2017-11-24 00:00:00,NaT,Cadáver,Femenino,84.0,Conocido,Huescas,Delgado,Lucresia,Lucresia Huescas Delgado,INSTITUTO POLITÉCNICO NACIONAL - ESCUELA NACIO...,Sí,2020-03-24 00:00:00.000,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
XX-P818,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2017-10-06,2014-01-28 00:00:00,NaT,Cadáver,Masculino,73.0,Conocido,Alegria,Castillejos,Silvestre,Silvestre Alegria Castillejos,UNIVERSIDAD POPULAR AUTÓNOMA DEL ESTADO DE PUEBLA,Sí,2020-01-04 12:39:31.000,
XX-P819,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2017-10-06,2014-01-30 00:00:00,NaT,Cadáver,Masculino,75.0,Conocido,López,Eladio,Maximo,Maximo López Eladio,UNIVERSIDAD POPULAR AUTÓNOMA DEL ESTADO DE PUEBLA,Sí,2020-01-04 12:44:52.000,
XX-P820,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2017-10-06,2014-02-07 00:00:00,NaT,Cadáver,Femenino,81.0,Conocido,Servin,Valverde,Elvira,Elvira Servin Valverde,UNIVERSIDAD POPULAR AUTÓNOMA DEL ESTADO DE PUEBLA,Sí,2020-01-04 14:23:58.000,
XX-P821,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2017-10-06,2014-02-09 00:00:00,NaT,Cadáver,Masculino,54.0,Conocido,Rodríguez,Zaracai,Efraín,Efraín Rodríguez Zaracai,UNIVERSIDAD POPULAR AUTÓNOMA DEL ESTADO DE PUEBLA,Sí,2020-01-04 14:49:07.000,


### Ejercicio 3

* Escribe tres combinaciones de datos que te interesaria conocer y escribelas. Por ejemplo los restos recibidos en enero.
* Tratá de resolver estas combinaciones de datos usando pandas. En caso de no poder anota que datos u operaciones hacen falta.
* Escribe tres formas en las que te gustaría ordenar los datos.
* Obten las tablas ordenadas, en caso de no poder hacerlo indica que datos te harían falta.

## 3.f Guardar datos

Ya que tienen un subset, es posible guardarlo para utilizarlo mas adelante o abrirlo en otro programa como excel.

La nueva tabla debé de estar en una variable, en este caso usaremos `df_vulnerables`

In [36]:
df_vulnerables

Unnamed: 0_level_0,Estado_origen,Municipio_origen,Panteón_origen,Estatus_FC,Fecha_inhumación,Fecha_defunción,Fecha_exhumación,Restos_tipo,Sexo,Edad,Conocido_Desconocido,Primer apellido,Segundo Apellido,Nombre(s),Nombre completo,Institución_origen,Rdoc,Marca_temporal,Datos alternativos
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1
XX-P027,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-26,S/D,NaT,Miembros,Femenino,35.0,Conocido,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-23 00:00:00.000,
XX-P072,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2019-01-02,2017-08-16 00:00:00,NaT,Cadáver,Femenino,83.0,Conocido,Luna,Sanchez,Maria Antonia,Maria Antonia Luna Sanchez,INSTITUTO POLITÉCNICO NACIONAL - ESCUELA NACIO...,Sí,2020-03-24 00:00:00.000,
XX-P094,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-12-08,2018-04-05 00:00:00,NaT,Cadáver,Femenino,40.0,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-24 00:00:00.000,
XX-P111,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-12-08,2018-12-11 00:00:00,NaT,Cadáver,Femenino,35.0,Desconocido,,,,,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-24 00:00:00.000,
XX-P114,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-12-08,S/D,NaT,Miembros,Femenino,90.0,Conocido,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-03-24 00:00:00.000,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
XX-P939,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-07-07,2017-01-27 00:00:00,NaT,Restos cremados,Femenino,82.0,Conocido,Torices,Tinoco,Juana,Juana Torices Tinoco,UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACU...,Sí,2020-04-06 02:43:06.361,
XX-P941,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-07-07,2017-02-07 00:00:00,NaT,Restos cremados,Femenino,85.0,Conocido,Domíngues,Vargas,María,María Domíngues Vargas,UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACU...,Sí,2020-04-06 02:46:43.724,
XX-P945,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-07-07,2017-02-21 00:00:00,NaT,Restos cremados,Femenino,83.0,Conocido,Bautista,,Martha Elena,Martha Elena Bautista,UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO - FACU...,Sí,2020-04-06 09:03:36.324,
XX-P969,Ciudad de México,Miguel Hidalgo,Panteón Civil de Dolores,Inhumación,2018-07-14,S/D,NaT,Miembros,Masculino,5.0,Conocido,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,Nombre de particular que se encuentra con vida...,INSTITUTO DE CIENCIAS FORENSES - TRIBUNAL SUPE...,Sí,2020-04-06 17:53:48.782,


Después, decidiremos el nombre del archivo y lo guardaremos en una variable con el nombre del archivo de salida.

Finalmente, exportaremos la tabla en formato `.csv` con `.to_csv()`. Esta función tiene varios parametros, los cuales incluyen el nombre del archivo de salida, el incluir o no el indice, etc. Estas pueden ser vistas en la documentación.

In [38]:
out_file = "data_clean/MFC_GruposVulnerables.csv"
df_vulnerables.to_csv(out_file)

**Gracias!**