# **Ejercicios en Python**

In [None]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


# Low-Carb Pandas

In [None]:
import pandas as pd

## The Dataframe

There are two core objects in pandas: the DataFrame and the Series. We'll see what they are and how to read and write those objects.

In [None]:
pd.DataFrame({'Yes': [50, 21], 'No': [131, 2]}) # Dictionary (keys and arrays as columns)

Unnamed: 0,Yes,No
0,50,131
1,21,2


In [None]:
pd.DataFrame({'Bob': ['I liked it.', 'It was awful.'], 'Sue': ['Pretty good.', 'Bland.']})

Unnamed: 0,Bob,Sue
0,I liked it.,Pretty good.
1,It was awful.,Bland.


In [None]:
pd.DataFrame({'Bob': ['I liked it.', 'It was awful.'], 
              'Sue': ['Pretty good.', 'Bland.']},
             index=['Product A', 'Product B']) # custom index 

Unnamed: 0,Bob,Sue
Product A,I liked it.,Pretty good.
Product B,It was awful.,Bland.


In [None]:
df = pd.DataFrame({"a": [4,5,6], 
                   "b": [7,8,9],
                   "c": [10,11,12]},
                    index = pd.MultiIndex.from_tuples(
                        [('d',1),('d',2),('e',3)], names=['n', 'v'])) # multiple indices

In [None]:
df

Unnamed: 0_level_0,Unnamed: 1_level_0,a,b,c
n,v,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
d,1,4,7,10
d,2,5,8,11
e,3,6,9,12


In [None]:
# Create a Serie from 0
pd.Series([1, 2, 3, 4, 5])

0    1
1    2
2    3
3    4
4    5
dtype: int64

In [None]:
pd.Series([30, 35, 40], index=['2015 Sales', '2016 Sales', '2017 Sales'], name='Product A')

2015 Sales    30
2016 Sales    35
2017 Sales    40
Name: Product A, dtype: int64

In [None]:
# read a csv
housing_data = pd.read_csv("/content/sample_data/california_housing_test.csv") # index column is automatically generated

In [None]:
housing_data

Unnamed: 0,longitude,latitude,housing_median_age,total_rooms,total_bedrooms,population,households,median_income,median_house_value
0,-122.05,37.37,27.0,3885.0,661.0,1537.0,606.0,6.6085,344700.0
1,-118.30,34.26,43.0,1510.0,310.0,809.0,277.0,3.5990,176500.0
2,-117.81,33.78,27.0,3589.0,507.0,1484.0,495.0,5.7934,270500.0
3,-118.36,33.82,28.0,67.0,15.0,49.0,11.0,6.1359,330000.0
4,-119.67,36.33,19.0,1241.0,244.0,850.0,237.0,2.9375,81700.0
...,...,...,...,...,...,...,...,...,...
2995,-119.86,34.42,23.0,1450.0,642.0,1258.0,607.0,1.1790,225000.0
2996,-118.14,34.06,27.0,5257.0,1082.0,3496.0,1036.0,3.3906,237200.0
2997,-119.70,36.30,10.0,956.0,201.0,693.0,220.0,2.2895,62000.0
2998,-117.12,34.10,40.0,96.0,14.0,46.0,14.0,3.2708,162500.0


In [None]:
housing_data = pd.read_csv("/content/sample_data/california_housing_test.csv", index_col=0) 

In [None]:
housing_data

Unnamed: 0_level_0,latitude,housing_median_age,total_rooms,total_bedrooms,population,households,median_income,median_house_value
longitude,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
-122.05,37.37,27.0,3885.0,661.0,1537.0,606.0,6.6085,344700.0
-118.30,34.26,43.0,1510.0,310.0,809.0,277.0,3.5990,176500.0
-117.81,33.78,27.0,3589.0,507.0,1484.0,495.0,5.7934,270500.0
-118.36,33.82,28.0,67.0,15.0,49.0,11.0,6.1359,330000.0
-119.67,36.33,19.0,1241.0,244.0,850.0,237.0,2.9375,81700.0
...,...,...,...,...,...,...,...,...
-119.86,34.42,23.0,1450.0,642.0,1258.0,607.0,1.1790,225000.0
-118.14,34.06,27.0,5257.0,1082.0,3496.0,1036.0,3.3906,237200.0
-119.70,36.30,10.0,956.0,201.0,693.0,220.0,2.2895,62000.0
-117.12,34.10,40.0,96.0,14.0,46.0,14.0,3.2708,162500.0


In [None]:
housing_data.set_index("latitude")

Unnamed: 0_level_0,housing_median_age,total_rooms,total_bedrooms,population,households,median_income,median_house_value
latitude,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
37.37,27.0,3885.0,661.0,1537.0,606.0,6.6085,344700.0
34.26,43.0,1510.0,310.0,809.0,277.0,3.5990,176500.0
33.78,27.0,3589.0,507.0,1484.0,495.0,5.7934,270500.0
33.82,28.0,67.0,15.0,49.0,11.0,6.1359,330000.0
36.33,19.0,1241.0,244.0,850.0,237.0,2.9375,81700.0
...,...,...,...,...,...,...,...
34.42,23.0,1450.0,642.0,1258.0,607.0,1.1790,225000.0
34.06,27.0,5257.0,1082.0,3496.0,1036.0,3.3906,237200.0
36.30,10.0,956.0,201.0,693.0,220.0,2.2895,62000.0
34.10,40.0,96.0,14.0,46.0,14.0,3.2708,162500.0


In [None]:
# from media
medals_url = "http://winterolympicsmedals.com/medals.csv"

In [None]:
medals_data = pd.read_csv(medals_url)

In [None]:
medals_data

Unnamed: 0,Year,City,Sport,Discipline,NOC,Event,Event gender,Medal
0,1924,Chamonix,Skating,Figure skating,AUT,individual,M,Silver
1,1924,Chamonix,Skating,Figure skating,AUT,individual,W,Gold
2,1924,Chamonix,Skating,Figure skating,AUT,pairs,X,Gold
3,1924,Chamonix,Bobsleigh,Bobsleigh,BEL,four-man,M,Bronze
4,1924,Chamonix,Ice Hockey,Ice Hockey,CAN,ice hockey,M,Gold
...,...,...,...,...,...,...,...,...
2306,2006,Turin,Skiing,Snowboard,USA,Half-pipe,M,Silver
2307,2006,Turin,Skiing,Snowboard,USA,Half-pipe,W,Gold
2308,2006,Turin,Skiing,Snowboard,USA,Half-pipe,W,Silver
2309,2006,Turin,Skiing,Snowboard,USA,Snowboard Cross,M,Gold


In [None]:
# save it
medals_data.to_csv("/content/sample_data/medals.csv")

In [None]:
mainpath = "/content/sample_data"
filename = "titanic3.xls"

In [None]:
titanic3 = pd.read_excel(mainpath + "/" + filename, "titanic3")

In [None]:
import numpy as np

In [None]:
pd.DataFrame(np.zeros((23,5)))

Unnamed: 0,0,1,2,3,4
0,0.0,0.0,0.0,0.0,0.0
1,0.0,0.0,0.0,0.0,0.0
2,0.0,0.0,0.0,0.0,0.0
3,0.0,0.0,0.0,0.0,0.0
4,0.0,0.0,0.0,0.0,0.0
5,0.0,0.0,0.0,0.0,0.0
6,0.0,0.0,0.0,0.0,0.0
7,0.0,0.0,0.0,0.0,0.0
8,0.0,0.0,0.0,0.0,0.0
9,0.0,0.0,0.0,0.0,0.0


## Indexing

We can select a given column by two ways: as an attribute of the object and as a dictionary.

As attributes of an object:

In [None]:
medals_data.City

0       Chamonix
1       Chamonix
2       Chamonix
3       Chamonix
4       Chamonix
          ...   
2306       Turin
2307       Turin
2308       Turin
2309       Turin
2310       Turin
Name: City, Length: 2311, dtype: object

As a dictionary indexing with `[]`:

In [None]:
medals_data['City']

0       Chamonix
1       Chamonix
2       Chamonix
3       Chamonix
4       Chamonix
          ...   
2306       Turin
2307       Turin
2308       Turin
2309       Turin
2310       Turin
Name: City, Length: 2311, dtype: object

In [None]:
 np.array(medals_data["City"])

array(['Chamonix', 'Chamonix', 'Chamonix', ..., 'Turin', 'Turin', 'Turin'],
      dtype=object)

We can treat a Series as an array.

In [None]:
cities_serie = medals_data['City']
cities_serie[10]

'Chamonix'

In [None]:
medals_data['City'][10]

'Chamonix'

For selecting rows, pandas use two paradigms. index-based selection (numerical position), and label-base selection (label in the index).

`iloc` follows the first paradigm of treating a DF as a matrix.

In [None]:
medals_data.iloc[0] # .City

Year                      1924
City                  Chamonix
Sport                  Skating
Discipline      Figure skating
NOC                        AUT
Event               individual
Event gender                 M
Medal                   Silver
Name: 0, dtype: object

In [None]:
medals_data.iloc[:, 1] # row first, column second

0       Chamonix
1       Chamonix
2       Chamonix
3       Chamonix
4       Chamonix
          ...   
2306       Turin
2307       Turin
2308       Turin
2309       Turin
2310       Turin
Name: City, Length: 2311, dtype: object

In [None]:
medals_data.iloc[:3, 0]

0    1924
1    1924
2    1924
Name: Year, dtype: int64

In [None]:
medals_data.iloc[[0, 1, 2], 0]

0    1924
1    1924
2    1924
Name: Year, dtype: int64

In [None]:
medals_data.iloc[-5]

Year                 2006
City                Turin
Sport              Skiing
Discipline      Snowboard
NOC                   USA
Event           Half-pipe
Event gender            M
Medal              Silver
Name: 2306, dtype: object

The `loc` operator works with the paradigm of label-based selection: it´s the the data index value which maters.

In [None]:
medals_data.loc[0, 'City']

'Chamonix'

In [None]:
medals_data.loc[0:3, ['City', 'Medal']]

Unnamed: 0,City,Medal
0,Chamonix,Silver
1,Chamonix,Gold
2,Chamonix,Gold
3,Chamonix,Bronze


When to use `iloc` or `loc`?

In [None]:
data = pd.read_csv("https://raw.githubusercontent.com/jaime-aguayo/DSK/main/pruebabase.csv")

In [None]:
data

Unnamed: 0,CLUNI,NOMBRE DE LA ORGANIZACION,FIGURA JURIDICA,ENTIDAD FEDERATIVA DOMICILIO,MUNICIPIO DOMICILIO,ESTATUS,ANIO DE INSCRIPCION,FECHA DE CONSTITUCION,ACTIVIDAD 1,ACTIVIDAD 2,...,ACTIVIDAD 13,ACTIVIDAD 14,ACTIVIDAD 15,ACTIVIDAD 16,ACTIVIDAD 17,ACTIVIDAD 18,ACTIVIDAD 19,ENTIDAD FEDERATIVA DOMICILIO.1,ANIO DE CONSTITUCION,Unnamed: 29
0,AJA0808131801C,Alianza Jaguar,Asociación Civil,Nayarit,Bahía de Banderas,INACTIVA,2011.0,,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,Nayarit,1900,
1,CVB14112731PQB,Cooperación y Voluntad para el Bienestar Social,Asociación Civil,Yucatán,Mérida,ACTIVA,2015.0,,SI,SI,...,NO,NO,NO,NO,NO,NO,NO,Yucatán,1900,
2,JAV141120093S3,Juf Activando Valores,Asociación Civil,Distrito Federal,Benito Juárez,INACTIVA,2015.0,,NO,NO,...,SI,NO,NO,NO,NO,NO,NO,Distrito Federal,1900,
3,FHN9707310901B,Fundación Hospital Nuestra Señora de la Luz,Institución de Asistencia Privada,Distrito Federal,Cuauhtémoc,ACTIVA,2011.0,1902-06-19,SI,NO,...,NO,NO,NO,NO,NO,NO,NO,Distrito Federal,1902,
4,FBP05100930018,Fundación de Beneficencia Privada Asilo San Lu...,Asociación Civil,Veracruz,Orizaba,ACTIVA,2009.0,1905-11-01,SI,NO,...,NO,NO,NO,NO,NO,NO,NO,Veracruz,1905,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
32689,IEE14120407JQY,"Instituto para la Enseñanza, Equidad de Género...",Asociación Civil,Chiapas,San Cristóbal de las Casas,ACTIVA,2018.0,2014-12-04,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,Chiapas,2014,
32690,LVO14062314R6W,Letras Para Volar,Asociación Civil,Jalisco,Guadalajara,ACTIVA,2018.0,2014-06-20,NO,NO,...,SI,NO,NO,NO,NO,NO,NO,Jalisco,2014,
32691,TER14110706EKW,TERHFAM,Asociación Civil,Colima,Colima,ACTIVA,2018.0,2014-11-07,NO,NO,...,SI,NO,NO,NO,NO,NO,NO,Colima,2014,
32692,PDS14040209DXM,Proyecto Democrático y Social,Asociación Civil,Distrito Federal,Miguel Hidalgo,ACTIVA,2018.0,2014-04-02,SI,SI,...,NO,NO,NO,NO,NO,NO,SI,Distrito Federal,2014,


In [None]:
data = data.set_index("CLUNI")

In [None]:
data.loc["CVB14112731PQB":"FBP05100930018"]

Unnamed: 0_level_0,NOMBRE DE LA ORGANIZACION,FIGURA JURIDICA,ENTIDAD FEDERATIVA DOMICILIO,MUNICIPIO DOMICILIO,ESTATUS,ANIO DE INSCRIPCION,FECHA DE CONSTITUCION,ACTIVIDAD 1,ACTIVIDAD 2,ACTIVIDAD 3,...,ACTIVIDAD 13,ACTIVIDAD 14,ACTIVIDAD 15,ACTIVIDAD 16,ACTIVIDAD 17,ACTIVIDAD 18,ACTIVIDAD 19,ENTIDAD FEDERATIVA DOMICILIO.1,ANIO DE CONSTITUCION,Unnamed: 29
CLUNI,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
CVB14112731PQB,Cooperación y Voluntad para el Bienestar Social,Asociación Civil,Yucatán,Mérida,ACTIVA,2015.0,,SI,SI,NO,...,NO,NO,NO,NO,NO,NO,NO,Yucatán,1900,
JAV141120093S3,Juf Activando Valores,Asociación Civil,Distrito Federal,Benito Juárez,INACTIVA,2015.0,,NO,NO,SI,...,SI,NO,NO,NO,NO,NO,NO,Distrito Federal,1900,
FHN9707310901B,Fundación Hospital Nuestra Señora de la Luz,Institución de Asistencia Privada,Distrito Federal,Cuauhtémoc,ACTIVA,2011.0,1902-06-19,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,Distrito Federal,1902,
FBP05100930018,Fundación de Beneficencia Privada Asilo San Lu...,Asociación Civil,Veracruz,Orizaba,ACTIVA,2009.0,1905-11-01,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,Veracruz,1905,


## Basic functions

In [None]:
data = pd.read_csv("https://raw.githubusercontent.com/jaime-aguayo/DSK/main/pruebabase.csv")

In [None]:
data

Unnamed: 0,CLUNI,NOMBRE DE LA ORGANIZACION,FIGURA JURIDICA,ENTIDAD FEDERATIVA DOMICILIO,MUNICIPIO DOMICILIO,ESTATUS,ANIO DE INSCRIPCION,FECHA DE CONSTITUCION,ACTIVIDAD 1,ACTIVIDAD 2,...,ACTIVIDAD 13,ACTIVIDAD 14,ACTIVIDAD 15,ACTIVIDAD 16,ACTIVIDAD 17,ACTIVIDAD 18,ACTIVIDAD 19,ENTIDAD FEDERATIVA DOMICILIO.1,ANIO DE CONSTITUCION,Unnamed: 29
0,AJA0808131801C,Alianza Jaguar,Asociación Civil,Nayarit,Bahía de Banderas,INACTIVA,2011.0,,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,Nayarit,1900,
1,CVB14112731PQB,Cooperación y Voluntad para el Bienestar Social,Asociación Civil,Yucatán,Mérida,ACTIVA,2015.0,,SI,SI,...,NO,NO,NO,NO,NO,NO,NO,Yucatán,1900,
2,JAV141120093S3,Juf Activando Valores,Asociación Civil,Distrito Federal,Benito Juárez,INACTIVA,2015.0,,NO,NO,...,SI,NO,NO,NO,NO,NO,NO,Distrito Federal,1900,
3,FHN9707310901B,Fundación Hospital Nuestra Señora de la Luz,Institución de Asistencia Privada,Distrito Federal,Cuauhtémoc,ACTIVA,2011.0,1902-06-19,SI,NO,...,NO,NO,NO,NO,NO,NO,NO,Distrito Federal,1902,
4,FBP05100930018,Fundación de Beneficencia Privada Asilo San Lu...,Asociación Civil,Veracruz,Orizaba,ACTIVA,2009.0,1905-11-01,SI,NO,...,NO,NO,NO,NO,NO,NO,NO,Veracruz,1905,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
32689,IEE14120407JQY,"Instituto para la Enseñanza, Equidad de Género...",Asociación Civil,Chiapas,San Cristóbal de las Casas,ACTIVA,2018.0,2014-12-04,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,Chiapas,2014,
32690,LVO14062314R6W,Letras Para Volar,Asociación Civil,Jalisco,Guadalajara,ACTIVA,2018.0,2014-06-20,NO,NO,...,SI,NO,NO,NO,NO,NO,NO,Jalisco,2014,
32691,TER14110706EKW,TERHFAM,Asociación Civil,Colima,Colima,ACTIVA,2018.0,2014-11-07,NO,NO,...,SI,NO,NO,NO,NO,NO,NO,Colima,2014,
32692,PDS14040209DXM,Proyecto Democrático y Social,Asociación Civil,Distrito Federal,Miguel Hidalgo,ACTIVA,2018.0,2014-04-02,SI,SI,...,NO,NO,NO,NO,NO,NO,SI,Distrito Federal,2014,


In [None]:
data = data.set_index("CLUNI")

To get a sneak peak of the data:

In [None]:
data.head(10)

Unnamed: 0_level_0,NOMBRE DE LA ORGANIZACION,FIGURA JURIDICA,ENTIDAD FEDERATIVA DOMICILIO,MUNICIPIO DOMICILIO,ESTATUS,ANIO DE INSCRIPCION,FECHA DE CONSTITUCION,ACTIVIDAD 1,ACTIVIDAD 2,ACTIVIDAD 3,...,ACTIVIDAD 13,ACTIVIDAD 14,ACTIVIDAD 15,ACTIVIDAD 16,ACTIVIDAD 17,ACTIVIDAD 18,ACTIVIDAD 19,ENTIDAD FEDERATIVA DOMICILIO.1,ANIO DE CONSTITUCION,Unnamed: 29
CLUNI,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
AJA0808131801C,Alianza Jaguar,Asociación Civil,Nayarit,Bahía de Banderas,INACTIVA,2011.0,,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,Nayarit,1900,
CVB14112731PQB,Cooperación y Voluntad para el Bienestar Social,Asociación Civil,Yucatán,Mérida,ACTIVA,2015.0,,SI,SI,NO,...,NO,NO,NO,NO,NO,NO,NO,Yucatán,1900,
JAV141120093S3,Juf Activando Valores,Asociación Civil,Distrito Federal,Benito Juárez,INACTIVA,2015.0,,NO,NO,SI,...,SI,NO,NO,NO,NO,NO,NO,Distrito Federal,1900,
FHN9707310901B,Fundación Hospital Nuestra Señora de la Luz,Institución de Asistencia Privada,Distrito Federal,Cuauhtémoc,ACTIVA,2011.0,1902-06-19,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,Distrito Federal,1902,
FBP05100930018,Fundación de Beneficencia Privada Asilo San Lu...,Asociación Civil,Veracruz,Orizaba,ACTIVA,2009.0,1905-11-01,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,Veracruz,1905,
CJU6211290901J,Colegio Jesús de Urquiaga,Institución de Asistencia Privada,Distrito Federal,Álvaro Obregón,ACTIVA,2014.0,1905-09-01,NO,NO,NO,...,SI,NO,NO,NO,NO,NO,NO,Distrito Federal,1905,
ABC06092431013,Asilo Brunet Celarain,Institución de Beneficiencia Privada (IBP),Yucatán,Mérida,INACTIVA,2005.0,1906-09-24,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,Yucatán,1906,
AIA97031909FH7,Asociación Italiana de Asistencia,Institución de Asistencia Privada,Distrito Federal,Miguel Hidalgo,ACTIVA,2016.0,1908-10-27,SI,SI,NO,...,SI,SI,NO,NO,NO,SI,NO,Distrito Federal,1908,
AMC11122309016,Asociación Mexicana de la Cruz Blanca Neutral,Institución de Asistencia Privada,Distrito Federal,Coyoacán,INACTIVA,2005.0,1911-12-23,SI,SI,SI,...,NO,NO,SI,NO,NO,NO,NO,Distrito Federal,1911,
CHB73052413019,Casa Hogar La Buena Madre,Asociación Civil,Hidalgo,Pachuca de Soto,ACTIVA,2005.0,1913-10-03,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,Hidalgo,1913,


In [None]:
data.tail(8)

Unnamed: 0_level_0,NOMBRE DE LA ORGANIZACION,FIGURA JURIDICA,ENTIDAD FEDERATIVA DOMICILIO,MUNICIPIO DOMICILIO,ESTATUS,ANIO DE INSCRIPCION,FECHA DE CONSTITUCION,ACTIVIDAD 1,ACTIVIDAD 2,ACTIVIDAD 3,...,ACTIVIDAD 13,ACTIVIDAD 14,ACTIVIDAD 15,ACTIVIDAD 16,ACTIVIDAD 17,ACTIVIDAD 18,ACTIVIDAD 19,ENTIDAD FEDERATIVA DOMICILIO.1,ANIO DE CONSTITUCION,Unnamed: 29
CLUNI,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
CGR14013120HQG,Confederación de Grupos Rurales Enseñando a Se...,Asociación Civil,Oaxaca,Oaxaca de Juárez,ACTIVA,2018.0,2014-02-17,NO,SI,NO,...,NO,NO,NO,NO,NO,NO,NO,Oaxaca,2014,
FMT14031316FLC,Fundación Mandela con Todos y para Todos,Asociación Civil,Distrito Federal,Gustavo A. Madero,ACTIVA,2018.0,2014-12-16,NO,NO,NO,...,SI,NO,NO,NO,NO,SI,NO,Distrito Federal,2014,
CRE14110610PWR,Casa de Redención,Asociación Civil,Durango,Durango,ACTIVA,2018.0,2014-11-06,SI,SI,NO,...,SI,NO,NO,NO,NO,NO,NO,Durango,2014,
IEE14120407JQY,"Instituto para la Enseñanza, Equidad de Género...",Asociación Civil,Chiapas,San Cristóbal de las Casas,ACTIVA,2018.0,2014-12-04,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,Chiapas,2014,
LVO14062314R6W,Letras Para Volar,Asociación Civil,Jalisco,Guadalajara,ACTIVA,2018.0,2014-06-20,NO,NO,NO,...,SI,NO,NO,NO,NO,NO,NO,Jalisco,2014,
TER14110706EKW,TERHFAM,Asociación Civil,Colima,Colima,ACTIVA,2018.0,2014-11-07,NO,NO,NO,...,SI,NO,NO,NO,NO,NO,NO,Colima,2014,
PDS14040209DXM,Proyecto Democrático y Social,Asociación Civil,Distrito Federal,Miguel Hidalgo,ACTIVA,2018.0,2014-04-02,SI,SI,NO,...,NO,NO,NO,NO,NO,NO,SI,Distrito Federal,2014,
ELA140206208OR,Enlace Llameloanca,Asociación Civil,Oaxaca,Trinidad Zaachila,ACTIVA,2018.0,2014-02-06,NO,NO,NO,...,SI,NO,NO,NO,NO,NO,NO,Oaxaca,2014,


To know size of our DataFrame:

In [None]:
data.shape

(32694, 29)

Print columns' names:

In [None]:
data.columns.values

array(['NOMBRE DE LA ORGANIZACION', 'FIGURA JURIDICA',
       'ENTIDAD FEDERATIVA DOMICILIO', 'MUNICIPIO DOMICILIO', 'ESTATUS',
       'ANIO DE INSCRIPCION', 'FECHA DE CONSTITUCION', 'ACTIVIDAD 1',
       'ACTIVIDAD 2', 'ACTIVIDAD 3', 'ACTIVIDAD 4', 'ACTIVIDAD 5',
       'ACTIVIDAD 6', 'ACTIVIDAD 7', 'ACTIVIDAD 8', 'ACTIVIDAD 9',
       'ACTIVIDAD 10', 'ACTIVIDAD 11', 'ACTIVIDAD 12', 'ACTIVIDAD 13',
       'ACTIVIDAD 14', 'ACTIVIDAD 15', 'ACTIVIDAD 16', 'ACTIVIDAD 17',
       'ACTIVIDAD 18', 'ACTIVIDAD 19', 'ENTIDAD FEDERATIVA DOMICILIO.1',
       'ANIO DE CONSTITUCION', 'Unnamed: 29'], dtype=object)

In [None]:
data.rename(columns={"NOMBRE DE LA ORGANIZACION" : "Name"})

Unnamed: 0_level_0,Name,FIGURA JURIDICA,ENTIDAD FEDERATIVA DOMICILIO,MUNICIPIO DOMICILIO,ESTATUS,ANIO DE INSCRIPCION,FECHA DE CONSTITUCION,ACTIVIDAD 1,ACTIVIDAD 2,ACTIVIDAD 3,...,ACTIVIDAD 13,ACTIVIDAD 14,ACTIVIDAD 15,ACTIVIDAD 16,ACTIVIDAD 17,ACTIVIDAD 18,ACTIVIDAD 19,ENTIDAD FEDERATIVA DOMICILIO.1,ANIO DE CONSTITUCION,Unnamed: 29
CLUNI,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
AJA0808131801C,Alianza Jaguar,Asociación Civil,Nayarit,Bahía de Banderas,INACTIVA,2011.0,,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,Nayarit,1900,
CVB14112731PQB,Cooperación y Voluntad para el Bienestar Social,Asociación Civil,Yucatán,Mérida,ACTIVA,2015.0,,SI,SI,NO,...,NO,NO,NO,NO,NO,NO,NO,Yucatán,1900,
JAV141120093S3,Juf Activando Valores,Asociación Civil,Distrito Federal,Benito Juárez,INACTIVA,2015.0,,NO,NO,SI,...,SI,NO,NO,NO,NO,NO,NO,Distrito Federal,1900,
FHN9707310901B,Fundación Hospital Nuestra Señora de la Luz,Institución de Asistencia Privada,Distrito Federal,Cuauhtémoc,ACTIVA,2011.0,1902-06-19,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,Distrito Federal,1902,
FBP05100930018,Fundación de Beneficencia Privada Asilo San Lu...,Asociación Civil,Veracruz,Orizaba,ACTIVA,2009.0,1905-11-01,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,Veracruz,1905,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
IEE14120407JQY,"Instituto para la Enseñanza, Equidad de Género...",Asociación Civil,Chiapas,San Cristóbal de las Casas,ACTIVA,2018.0,2014-12-04,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,Chiapas,2014,
LVO14062314R6W,Letras Para Volar,Asociación Civil,Jalisco,Guadalajara,ACTIVA,2018.0,2014-06-20,NO,NO,NO,...,SI,NO,NO,NO,NO,NO,NO,Jalisco,2014,
TER14110706EKW,TERHFAM,Asociación Civil,Colima,Colima,ACTIVA,2018.0,2014-11-07,NO,NO,NO,...,SI,NO,NO,NO,NO,NO,NO,Colima,2014,
PDS14040209DXM,Proyecto Democrático y Social,Asociación Civil,Distrito Federal,Miguel Hidalgo,ACTIVA,2018.0,2014-04-02,SI,SI,NO,...,NO,NO,NO,NO,NO,NO,SI,Distrito Federal,2014,


In [None]:
data # is not modified

Unnamed: 0_level_0,NOMBRE DE LA ORGANIZACION,FIGURA JURIDICA,ENTIDAD FEDERATIVA DOMICILIO,MUNICIPIO DOMICILIO,ESTATUS,ANIO DE INSCRIPCION,FECHA DE CONSTITUCION,ACTIVIDAD 1,ACTIVIDAD 2,ACTIVIDAD 3,...,ACTIVIDAD 13,ACTIVIDAD 14,ACTIVIDAD 15,ACTIVIDAD 16,ACTIVIDAD 17,ACTIVIDAD 18,ACTIVIDAD 19,ENTIDAD FEDERATIVA DOMICILIO.1,ANIO DE CONSTITUCION,Unnamed: 29
CLUNI,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
AJA0808131801C,Alianza Jaguar,Asociación Civil,Nayarit,Bahía de Banderas,INACTIVA,2011.0,,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,Nayarit,1900,
CVB14112731PQB,Cooperación y Voluntad para el Bienestar Social,Asociación Civil,Yucatán,Mérida,ACTIVA,2015.0,,SI,SI,NO,...,NO,NO,NO,NO,NO,NO,NO,Yucatán,1900,
JAV141120093S3,Juf Activando Valores,Asociación Civil,Distrito Federal,Benito Juárez,INACTIVA,2015.0,,NO,NO,SI,...,SI,NO,NO,NO,NO,NO,NO,Distrito Federal,1900,
FHN9707310901B,Fundación Hospital Nuestra Señora de la Luz,Institución de Asistencia Privada,Distrito Federal,Cuauhtémoc,ACTIVA,2011.0,1902-06-19,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,Distrito Federal,1902,
FBP05100930018,Fundación de Beneficencia Privada Asilo San Lu...,Asociación Civil,Veracruz,Orizaba,ACTIVA,2009.0,1905-11-01,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,Veracruz,1905,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
IEE14120407JQY,"Instituto para la Enseñanza, Equidad de Género...",Asociación Civil,Chiapas,San Cristóbal de las Casas,ACTIVA,2018.0,2014-12-04,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,Chiapas,2014,
LVO14062314R6W,Letras Para Volar,Asociación Civil,Jalisco,Guadalajara,ACTIVA,2018.0,2014-06-20,NO,NO,NO,...,SI,NO,NO,NO,NO,NO,NO,Jalisco,2014,
TER14110706EKW,TERHFAM,Asociación Civil,Colima,Colima,ACTIVA,2018.0,2014-11-07,NO,NO,NO,...,SI,NO,NO,NO,NO,NO,NO,Colima,2014,
PDS14040209DXM,Proyecto Democrático y Social,Asociación Civil,Distrito Federal,Miguel Hidalgo,ACTIVA,2018.0,2014-04-02,SI,SI,NO,...,NO,NO,NO,NO,NO,NO,SI,Distrito Federal,2014,


In [None]:
new_data = data.rename(columns={"NOMBRE DE LA ORGANIZACION" : "Name"})

In [None]:
new_data.tail()

Unnamed: 0_level_0,Name,FIGURA JURIDICA,ENTIDAD FEDERATIVA DOMICILIO,MUNICIPIO DOMICILIO,ESTATUS,ANIO DE INSCRIPCION,FECHA DE CONSTITUCION,ACTIVIDAD 1,ACTIVIDAD 2,ACTIVIDAD 3,...,ACTIVIDAD 13,ACTIVIDAD 14,ACTIVIDAD 15,ACTIVIDAD 16,ACTIVIDAD 17,ACTIVIDAD 18,ACTIVIDAD 19,ENTIDAD FEDERATIVA DOMICILIO.1,ANIO DE CONSTITUCION,Unnamed: 29
CLUNI,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
IEE14120407JQY,"Instituto para la Enseñanza, Equidad de Género...",Asociación Civil,Chiapas,San Cristóbal de las Casas,ACTIVA,2018.0,2014-12-04,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,Chiapas,2014,
LVO14062314R6W,Letras Para Volar,Asociación Civil,Jalisco,Guadalajara,ACTIVA,2018.0,2014-06-20,NO,NO,NO,...,SI,NO,NO,NO,NO,NO,NO,Jalisco,2014,
TER14110706EKW,TERHFAM,Asociación Civil,Colima,Colima,ACTIVA,2018.0,2014-11-07,NO,NO,NO,...,SI,NO,NO,NO,NO,NO,NO,Colima,2014,
PDS14040209DXM,Proyecto Democrático y Social,Asociación Civil,Distrito Federal,Miguel Hidalgo,ACTIVA,2018.0,2014-04-02,SI,SI,NO,...,NO,NO,NO,NO,NO,NO,SI,Distrito Federal,2014,
ELA140206208OR,Enlace Llameloanca,Asociación Civil,Oaxaca,Trinidad Zaachila,ACTIVA,2018.0,2014-02-06,NO,NO,NO,...,SI,NO,NO,NO,NO,NO,NO,Oaxaca,2014,


In [None]:
new_data.columns = [name.title() for name in data.columns.values]

In [None]:
new_data.head()

Unnamed: 0_level_0,Nombre De La Organizacion,Figura Juridica,Entidad Federativa Domicilio,Municipio Domicilio,Estatus,Anio De Inscripcion,Fecha De Constitucion,Actividad 1,Actividad 2,Actividad 3,...,Actividad 13,Actividad 14,Actividad 15,Actividad 16,Actividad 17,Actividad 18,Actividad 19,Entidad Federativa Domicilio.1,Anio De Constitucion,Unnamed: 29
CLUNI,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
AJA0808131801C,Alianza Jaguar,Asociación Civil,Nayarit,Bahía de Banderas,INACTIVA,2011.0,,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,Nayarit,1900,
CVB14112731PQB,Cooperación y Voluntad para el Bienestar Social,Asociación Civil,Yucatán,Mérida,ACTIVA,2015.0,,SI,SI,NO,...,NO,NO,NO,NO,NO,NO,NO,Yucatán,1900,
JAV141120093S3,Juf Activando Valores,Asociación Civil,Distrito Federal,Benito Juárez,INACTIVA,2015.0,,NO,NO,SI,...,SI,NO,NO,NO,NO,NO,NO,Distrito Federal,1900,
FHN9707310901B,Fundación Hospital Nuestra Señora de la Luz,Institución de Asistencia Privada,Distrito Federal,Cuauhtémoc,ACTIVA,2011.0,1902-06-19,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,Distrito Federal,1902,
FBP05100930018,Fundación de Beneficencia Privada Asilo San Lu...,Asociación Civil,Veracruz,Orizaba,ACTIVA,2009.0,1905-11-01,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,Veracruz,1905,


Data type of each column

In [None]:
new_data.dtypes

Nombre De La Organizacion          object
Figura Juridica                    object
Entidad Federativa Domicilio       object
Municipio Domicilio                object
Estatus                            object
Anio De Inscripcion               float64
Fecha De Constitucion              object
Actividad 1                        object
Actividad 2                        object
Actividad 3                        object
Actividad 4                        object
Actividad 5                        object
Actividad 6                        object
Actividad 7                        object
Actividad 8                        object
Actividad 9                        object
Actividad 10                       object
Actividad 11                       object
Actividad 12                       object
Actividad 13                       object
Actividad 14                       object
Actividad 15                       object
Actividad 16                       object
Actividad 17                      

In [None]:
housing_data.dtypes

latitude              float64
housing_median_age    float64
total_rooms           float64
total_bedrooms        float64
population            float64
households            float64
median_income         float64
median_house_value    float64
dtype: object

In [None]:
housing_data.describe()

Unnamed: 0,latitude,housing_median_age,total_rooms,total_bedrooms,population,households,median_income,median_house_value
count,3000.0,3000.0,3000.0,3000.0,3000.0,3000.0,3000.0,3000.0
mean,35.63539,28.845333,2599.578667,529.950667,1402.798667,489.912,3.807272,205846.275
std,2.12967,12.555396,2155.593332,415.654368,1030.543012,365.42271,1.854512,113119.68747
min,32.56,1.0,6.0,2.0,5.0,2.0,0.4999,22500.0
25%,33.93,18.0,1401.0,291.0,780.0,273.0,2.544,121200.0
50%,34.27,29.0,2106.0,437.0,1155.0,409.5,3.48715,177650.0
75%,37.69,37.0,3129.0,636.0,1742.75,597.25,4.656475,263975.0
max,41.92,52.0,30450.0,5419.0,11935.0,4930.0,15.0001,500001.0


In [None]:
new_data.describe()

Unnamed: 0,Anio De Inscripcion,Anio De Constitucion,Unnamed: 29
count,32693.0,32694.0,0.0
mean,2010.931453,2007.260354,
std,3.282292,8.149784,
min,2004.0,1900.0,
25%,2008.0,2005.0,
50%,2011.0,2010.0,
75%,2014.0,2012.0,
max,2018.0,2014.0,


Handling missing values:

In [None]:
pd.isnull(new_data["Unnamed: 29"])

CLUNI
AJA0808131801C    True
CVB14112731PQB    True
JAV141120093S3    True
FHN9707310901B    True
FBP05100930018    True
                  ... 
IEE14120407JQY    True
LVO14062314R6W    True
TER14110706EKW    True
PDS14040209DXM    True
ELA140206208OR    True
Name: Unnamed: 29, Length: 32694, dtype: bool

In [None]:
pd.notnull(new_data["Unnamed: 29"])

CLUNI
AJA0808131801C    False
CVB14112731PQB    False
JAV141120093S3    False
FHN9707310901B    False
FBP05100930018    False
                  ...  
IEE14120407JQY    False
LVO14062314R6W    False
TER14110706EKW    False
PDS14040209DXM    False
ELA140206208OR    False
Name: Unnamed: 29, Length: 32694, dtype: bool

In [None]:
pd.isnull(new_data["Unnamed: 29"]).values.sum()

32694

In [None]:
pd.notnull(new_data["Anio De Constitucion"]).values.ravel().sum()

32694

We can handle missing values with `dropna`

In [None]:
new_data = new_data.dropna(axis=1, how="all")
new_data

Unnamed: 0_level_0,Nombre De La Organizacion,Figura Juridica,Entidad Federativa Domicilio,Municipio Domicilio,Estatus,Anio De Inscripcion,Fecha De Constitucion,Actividad 1,Actividad 2,Actividad 3,...,Actividad 12,Actividad 13,Actividad 14,Actividad 15,Actividad 16,Actividad 17,Actividad 18,Actividad 19,Entidad Federativa Domicilio.1,Anio De Constitucion
CLUNI,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
AJA0808131801C,Alianza Jaguar,Asociación Civil,Nayarit,Bahía de Banderas,INACTIVA,2011.0,,NO,NO,NO,...,SI,NO,NO,NO,NO,NO,NO,NO,Nayarit,1900
CVB14112731PQB,Cooperación y Voluntad para el Bienestar Social,Asociación Civil,Yucatán,Mérida,ACTIVA,2015.0,,SI,SI,NO,...,NO,NO,NO,NO,NO,NO,NO,NO,Yucatán,1900
JAV141120093S3,Juf Activando Valores,Asociación Civil,Distrito Federal,Benito Juárez,INACTIVA,2015.0,,NO,NO,SI,...,NO,SI,NO,NO,NO,NO,NO,NO,Distrito Federal,1900
FHN9707310901B,Fundación Hospital Nuestra Señora de la Luz,Institución de Asistencia Privada,Distrito Federal,Cuauhtémoc,ACTIVA,2011.0,1902-06-19,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,NO,Distrito Federal,1902
FBP05100930018,Fundación de Beneficencia Privada Asilo San Lu...,Asociación Civil,Veracruz,Orizaba,ACTIVA,2009.0,1905-11-01,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,NO,Veracruz,1905
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
IEE14120407JQY,"Instituto para la Enseñanza, Equidad de Género...",Asociación Civil,Chiapas,San Cristóbal de las Casas,ACTIVA,2018.0,2014-12-04,NO,NO,NO,...,SI,NO,NO,NO,NO,NO,NO,NO,Chiapas,2014
LVO14062314R6W,Letras Para Volar,Asociación Civil,Jalisco,Guadalajara,ACTIVA,2018.0,2014-06-20,NO,NO,NO,...,NO,SI,NO,NO,NO,NO,NO,NO,Jalisco,2014
TER14110706EKW,TERHFAM,Asociación Civil,Colima,Colima,ACTIVA,2018.0,2014-11-07,NO,NO,NO,...,NO,SI,NO,NO,NO,NO,NO,NO,Colima,2014
PDS14040209DXM,Proyecto Democrático y Social,Asociación Civil,Distrito Federal,Miguel Hidalgo,ACTIVA,2018.0,2014-04-02,SI,SI,NO,...,NO,NO,NO,NO,NO,NO,NO,SI,Distrito Federal,2014


In [None]:
data2 = data

In [None]:
data2.dropna(axis=0, how="any")

Unnamed: 0_level_0,NOMBRE DE LA ORGANIZACION,FIGURA JURIDICA,ENTIDAD FEDERATIVA DOMICILIO,MUNICIPIO DOMICILIO,ESTATUS,ANIO DE INSCRIPCION,FECHA DE CONSTITUCION,ACTIVIDAD 1,ACTIVIDAD 2,ACTIVIDAD 3,...,ACTIVIDAD 13,ACTIVIDAD 14,ACTIVIDAD 15,ACTIVIDAD 16,ACTIVIDAD 17,ACTIVIDAD 18,ACTIVIDAD 19,ENTIDAD FEDERATIVA DOMICILIO.1,ANIO DE CONSTITUCION,Unnamed: 29
CLUNI,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1


In [None]:
data3 = data

In [None]:
data.fillna(0)

Unnamed: 0_level_0,NOMBRE DE LA ORGANIZACION,FIGURA JURIDICA,ENTIDAD FEDERATIVA DOMICILIO,MUNICIPIO DOMICILIO,ESTATUS,ANIO DE INSCRIPCION,FECHA DE CONSTITUCION,ACTIVIDAD 1,ACTIVIDAD 2,ACTIVIDAD 3,...,ACTIVIDAD 13,ACTIVIDAD 14,ACTIVIDAD 15,ACTIVIDAD 16,ACTIVIDAD 17,ACTIVIDAD 18,ACTIVIDAD 19,ENTIDAD FEDERATIVA DOMICILIO.1,ANIO DE CONSTITUCION,Unnamed: 29
CLUNI,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
AJA0808131801C,Alianza Jaguar,Asociación Civil,Nayarit,Bahía de Banderas,INACTIVA,2011.0,0,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,Nayarit,1900,0.0
CVB14112731PQB,Cooperación y Voluntad para el Bienestar Social,Asociación Civil,Yucatán,Mérida,ACTIVA,2015.0,0,SI,SI,NO,...,NO,NO,NO,NO,NO,NO,NO,Yucatán,1900,0.0
JAV141120093S3,Juf Activando Valores,Asociación Civil,Distrito Federal,Benito Juárez,INACTIVA,2015.0,0,NO,NO,SI,...,SI,NO,NO,NO,NO,NO,NO,Distrito Federal,1900,0.0
FHN9707310901B,Fundación Hospital Nuestra Señora de la Luz,Institución de Asistencia Privada,Distrito Federal,Cuauhtémoc,ACTIVA,2011.0,1902-06-19,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,Distrito Federal,1902,0.0
FBP05100930018,Fundación de Beneficencia Privada Asilo San Lu...,Asociación Civil,Veracruz,Orizaba,ACTIVA,2009.0,1905-11-01,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,Veracruz,1905,0.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
IEE14120407JQY,"Instituto para la Enseñanza, Equidad de Género...",Asociación Civil,Chiapas,San Cristóbal de las Casas,ACTIVA,2018.0,2014-12-04,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,Chiapas,2014,0.0
LVO14062314R6W,Letras Para Volar,Asociación Civil,Jalisco,Guadalajara,ACTIVA,2018.0,2014-06-20,NO,NO,NO,...,SI,NO,NO,NO,NO,NO,NO,Jalisco,2014,0.0
TER14110706EKW,TERHFAM,Asociación Civil,Colima,Colima,ACTIVA,2018.0,2014-11-07,NO,NO,NO,...,SI,NO,NO,NO,NO,NO,NO,Colima,2014,0.0
PDS14040209DXM,Proyecto Democrático y Social,Asociación Civil,Distrito Federal,Miguel Hidalgo,ACTIVA,2018.0,2014-04-02,SI,SI,NO,...,NO,NO,NO,NO,NO,NO,SI,Distrito Federal,2014,0.0


In [None]:
data5 = data

In [None]:
data5["Unnamed: 29"] = data5["Unnamed: 29"].fillna('Unknown')

data5.head(5)

Unnamed: 0_level_0,NOMBRE DE LA ORGANIZACION,FIGURA JURIDICA,ENTIDAD FEDERATIVA DOMICILIO,MUNICIPIO DOMICILIO,ESTATUS,ANIO DE INSCRIPCION,FECHA DE CONSTITUCION,ACTIVIDAD 1,ACTIVIDAD 2,ACTIVIDAD 3,...,ACTIVIDAD 13,ACTIVIDAD 14,ACTIVIDAD 15,ACTIVIDAD 16,ACTIVIDAD 17,ACTIVIDAD 18,ACTIVIDAD 19,ENTIDAD FEDERATIVA DOMICILIO.1,ANIO DE CONSTITUCION,Unnamed: 29
CLUNI,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
AJA0808131801C,Alianza Jaguar,Asociación Civil,Nayarit,Bahía de Banderas,INACTIVA,2011.0,,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,Nayarit,1900,Unknown
CVB14112731PQB,Cooperación y Voluntad para el Bienestar Social,Asociación Civil,Yucatán,Mérida,ACTIVA,2015.0,,SI,SI,NO,...,NO,NO,NO,NO,NO,NO,NO,Yucatán,1900,Unknown
JAV141120093S3,Juf Activando Valores,Asociación Civil,Distrito Federal,Benito Juárez,INACTIVA,2015.0,,NO,NO,SI,...,SI,NO,NO,NO,NO,NO,NO,Distrito Federal,1900,Unknown
FHN9707310901B,Fundación Hospital Nuestra Señora de la Luz,Institución de Asistencia Privada,Distrito Federal,Cuauhtémoc,ACTIVA,2011.0,1902-06-19,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,Distrito Federal,1902,Unknown
FBP05100930018,Fundación de Beneficencia Privada Asilo San Lu...,Asociación Civil,Veracruz,Orizaba,ACTIVA,2009.0,1905-11-01,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,NO,Veracruz,1905,Unknown


Create dummy variables

In [None]:
new_data["Estatus"].head(10)

CLUNI
AJA0808131801C    INACTIVA
CVB14112731PQB      ACTIVA
JAV141120093S3    INACTIVA
FHN9707310901B      ACTIVA
FBP05100930018      ACTIVA
CJU6211290901J      ACTIVA
ABC06092431013    INACTIVA
AIA97031909FH7      ACTIVA
AMC11122309016    INACTIVA
CHB73052413019      ACTIVA
Name: Estatus, dtype: object

In [None]:
dummy_status = pd.get_dummies(new_data["Estatus"], prefix="status")

In [None]:
dummy_status.head(10)

Unnamed: 0_level_0,status_ACTIVA,status_INACTIVA
CLUNI,Unnamed: 1_level_1,Unnamed: 2_level_1
AJA0808131801C,0,1
CVB14112731PQB,1,0
JAV141120093S3,0,1
FHN9707310901B,1,0
FBP05100930018,1,0
CJU6211290901J,1,0
ABC06092431013,0,1
AIA97031909FH7,1,0
AMC11122309016,0,1
CHB73052413019,1,0


In [None]:
column_name=new_data.columns.values.tolist()
column_name

['Nombre De La Organizacion',
 'Figura Juridica',
 'Entidad Federativa Domicilio',
 'Municipio Domicilio',
 'Estatus',
 'Anio De Inscripcion',
 'Fecha De Constitucion',
 'Actividad 1',
 'Actividad 2',
 'Actividad 3',
 'Actividad 4',
 'Actividad 5',
 'Actividad 6',
 'Actividad 7',
 'Actividad 8',
 'Actividad 9',
 'Actividad 10',
 'Actividad 11',
 'Actividad 12',
 'Actividad 13',
 'Actividad 14',
 'Actividad 15',
 'Actividad 16',
 'Actividad 17',
 'Actividad 18',
 'Actividad 19',
 'Entidad Federativa Domicilio.1',
 'Anio De Constitucion']

In [None]:
new_data = new_data.drop(["Estatus"], axis = 1)

In [None]:
new_data.columns.values

array(['Nombre De La Organizacion', 'Figura Juridica',
       'Entidad Federativa Domicilio', 'Municipio Domicilio',
       'Anio De Inscripcion', 'Fecha De Constitucion', 'Actividad 1',
       'Actividad 2', 'Actividad 3', 'Actividad 4', 'Actividad 5',
       'Actividad 6', 'Actividad 7', 'Actividad 8', 'Actividad 9',
       'Actividad 10', 'Actividad 11', 'Actividad 12', 'Actividad 13',
       'Actividad 14', 'Actividad 15', 'Actividad 16', 'Actividad 17',
       'Actividad 18', 'Actividad 19', 'Entidad Federativa Domicilio.1',
       'Anio De Constitucion'], dtype=object)

Join two DataFrames in one axis

In [None]:
dummy_status = dummy_status.reset_index()

In [None]:
dummy_status = dummy_status.drop(["CLUNI"], axis=1)

In [None]:
dummy_status

Unnamed: 0,CLUNI,status_ACTIVA,status_INACTIVA
0,AJA0808131801C,0,1
1,CVB14112731PQB,1,0
2,JAV141120093S3,0,1
3,FHN9707310901B,1,0
4,FBP05100930018,1,0
...,...,...,...
32689,IEE14120407JQY,1,0
32690,LVO14062314R6W,1,0
32691,TER14110706EKW,1,0
32692,PDS14040209DXM,1,0


In [None]:
pd.concat([data, dummy_status], axis = 1)

InvalidIndexError: ignored

In [None]:
new_data = pd.concat([new_data, dummy_status], axis = 1)

In [None]:
new_data.head()

Unnamed: 0_level_0,Nombre De La Organizacion,Figura Juridica,Entidad Federativa Domicilio,Municipio Domicilio,Anio De Inscripcion,Fecha De Constitucion,Actividad 1,Actividad 2,Actividad 3,Actividad 4,...,Actividad 14,Actividad 15,Actividad 16,Actividad 17,Actividad 18,Actividad 19,Entidad Federativa Domicilio.1,Anio De Constitucion,status_ACTIVA,status_INACTIVA
CLUNI,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
AJA0808131801C,Alianza Jaguar,Asociación Civil,Nayarit,Bahía de Banderas,2011.0,,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Nayarit,1900,0,1
CVB14112731PQB,Cooperación y Voluntad para el Bienestar Social,Asociación Civil,Yucatán,Mérida,2015.0,,SI,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,Yucatán,1900,1,0
JAV141120093S3,Juf Activando Valores,Asociación Civil,Distrito Federal,Benito Juárez,2015.0,,NO,NO,SI,NO,...,NO,NO,NO,NO,NO,NO,Distrito Federal,1900,0,1
FHN9707310901B,Fundación Hospital Nuestra Señora de la Luz,Institución de Asistencia Privada,Distrito Federal,Cuauhtémoc,2011.0,1902-06-19,SI,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Distrito Federal,1902,1,0
FBP05100930018,Fundación de Beneficencia Privada Asilo San Lu...,Asociación Civil,Veracruz,Orizaba,2009.0,1905-11-01,SI,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Veracruz,1905,1,0


New columns

Creating a column for the adress:

In [None]:
data['DOMICILIO'] = new_data['Municipio Domicilio'] + ", " + new_data['Entidad Federativa Domicilio']

In [None]:
data.head()

Unnamed: 0_level_0,NOMBRE DE LA ORGANIZACION,FIGURA JURIDICA,ENTIDAD FEDERATIVA DOMICILIO,MUNICIPIO DOMICILIO,ESTATUS,ANIO DE INSCRIPCION,FECHA DE CONSTITUCION,ACTIVIDAD 1,ACTIVIDAD 2,ACTIVIDAD 3,...,ACTIVIDAD 14,ACTIVIDAD 15,ACTIVIDAD 16,ACTIVIDAD 17,ACTIVIDAD 18,ACTIVIDAD 19,ENTIDAD FEDERATIVA DOMICILIO.1,ANIO DE CONSTITUCION,Unnamed: 29,DOMICILIO
CLUNI,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
AJA0808131801C,Alianza Jaguar,Asociación Civil,Nayarit,Bahía de Banderas,INACTIVA,2011.0,,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Nayarit,1900,Unknown,"Bahía de Banderas, Nayarit"
CVB14112731PQB,Cooperación y Voluntad para el Bienestar Social,Asociación Civil,Yucatán,Mérida,ACTIVA,2015.0,,SI,SI,NO,...,NO,NO,NO,NO,NO,NO,Yucatán,1900,Unknown,"Mérida, Yucatán"
JAV141120093S3,Juf Activando Valores,Asociación Civil,Distrito Federal,Benito Juárez,INACTIVA,2015.0,,NO,NO,SI,...,NO,NO,NO,NO,NO,NO,Distrito Federal,1900,Unknown,"Benito Juárez, Distrito Federal"
FHN9707310901B,Fundación Hospital Nuestra Señora de la Luz,Institución de Asistencia Privada,Distrito Federal,Cuauhtémoc,ACTIVA,2011.0,1902-06-19,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,Distrito Federal,1902,Unknown,"Cuauhtémoc, Distrito Federal"
FBP05100930018,Fundación de Beneficencia Privada Asilo San Lu...,Asociación Civil,Veracruz,Orizaba,ACTIVA,2009.0,1905-11-01,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,Veracruz,1905,Unknown,"Orizaba, Veracruz"


In [None]:
data.assign(DOMICILIO2 = lambda df: df['MUNICIPIO DOMICILIO'] + ", " + df['ENTIDAD FEDERATIVA DOMICILIO']) # another way of doing that

Unnamed: 0_level_0,NOMBRE DE LA ORGANIZACION,FIGURA JURIDICA,ENTIDAD FEDERATIVA DOMICILIO,MUNICIPIO DOMICILIO,ESTATUS,ANIO DE INSCRIPCION,FECHA DE CONSTITUCION,ACTIVIDAD 1,ACTIVIDAD 2,ACTIVIDAD 3,...,ACTIVIDAD 15,ACTIVIDAD 16,ACTIVIDAD 17,ACTIVIDAD 18,ACTIVIDAD 19,ENTIDAD FEDERATIVA DOMICILIO.1,ANIO DE CONSTITUCION,Unnamed: 29,DOMICILIO,DOMICILIO2
CLUNI,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
AJA0808131801C,Alianza Jaguar,Asociación Civil,Nayarit,Bahía de Banderas,INACTIVA,2011.0,,NO,NO,NO,...,NO,NO,NO,NO,NO,Nayarit,1900,Unknown,"Bahía de Banderas, Nayarit","Bahía de Banderas, Nayarit"
CVB14112731PQB,Cooperación y Voluntad para el Bienestar Social,Asociación Civil,Yucatán,Mérida,ACTIVA,2015.0,,SI,SI,NO,...,NO,NO,NO,NO,NO,Yucatán,1900,Unknown,"Mérida, Yucatán","Mérida, Yucatán"
JAV141120093S3,Juf Activando Valores,Asociación Civil,Distrito Federal,Benito Juárez,INACTIVA,2015.0,,NO,NO,SI,...,NO,NO,NO,NO,NO,Distrito Federal,1900,Unknown,"Benito Juárez, Distrito Federal","Benito Juárez, Distrito Federal"
FHN9707310901B,Fundación Hospital Nuestra Señora de la Luz,Institución de Asistencia Privada,Distrito Federal,Cuauhtémoc,ACTIVA,2011.0,1902-06-19,SI,NO,NO,...,NO,NO,NO,NO,NO,Distrito Federal,1902,Unknown,"Cuauhtémoc, Distrito Federal","Cuauhtémoc, Distrito Federal"
FBP05100930018,Fundación de Beneficencia Privada Asilo San Lu...,Asociación Civil,Veracruz,Orizaba,ACTIVA,2009.0,1905-11-01,SI,NO,NO,...,NO,NO,NO,NO,NO,Veracruz,1905,Unknown,"Orizaba, Veracruz","Orizaba, Veracruz"
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
IEE14120407JQY,"Instituto para la Enseñanza, Equidad de Género...",Asociación Civil,Chiapas,San Cristóbal de las Casas,ACTIVA,2018.0,2014-12-04,NO,NO,NO,...,NO,NO,NO,NO,NO,Chiapas,2014,Unknown,"San Cristóbal de las Casas, Chiapas","San Cristóbal de las Casas, Chiapas"
LVO14062314R6W,Letras Para Volar,Asociación Civil,Jalisco,Guadalajara,ACTIVA,2018.0,2014-06-20,NO,NO,NO,...,NO,NO,NO,NO,NO,Jalisco,2014,Unknown,"Guadalajara, Jalisco","Guadalajara, Jalisco"
TER14110706EKW,TERHFAM,Asociación Civil,Colima,Colima,ACTIVA,2018.0,2014-11-07,NO,NO,NO,...,NO,NO,NO,NO,NO,Colima,2014,Unknown,"Colima, Colima","Colima, Colima"
PDS14040209DXM,Proyecto Democrático y Social,Asociación Civil,Distrito Federal,Miguel Hidalgo,ACTIVA,2018.0,2014-04-02,SI,SI,NO,...,NO,NO,NO,NO,SI,Distrito Federal,2014,Unknown,"Miguel Hidalgo, Distrito Federal","Miguel Hidalgo, Distrito Federal"


Dtypes:

In [None]:
new_data.dtypes

Nombre De La Organizacion          object
Figura Juridica                    object
Entidad Federativa Domicilio       object
Municipio Domicilio                object
Anio De Inscripcion               float64
Fecha De Constitucion              object
Actividad 1                        object
Actividad 2                        object
Actividad 3                        object
Actividad 4                        object
Actividad 5                        object
Actividad 6                        object
Actividad 7                        object
Actividad 8                        object
Actividad 9                        object
Actividad 10                       object
Actividad 11                       object
Actividad 12                       object
Actividad 13                       object
Actividad 14                       object
Actividad 15                       object
Actividad 16                       object
Actividad 17                       object
Actividad 18                      

In [None]:
new_data["Anio De Inscripcion"].astype(int)

IntCastingNaNError: ignored

In [None]:
sum(pd.isna(new_data["Anio De Inscripcion"]))

0

In [None]:
new_data["Anio De Inscripcion"] = new_data["Anio De Inscripcion"].fillna(new_data["Anio De Constitucion"])

In [None]:
new_data["Anio De Inscripcion"] = new_data["Anio De Inscripcion"].astype(int)

In [None]:
new_data.dtypes

Nombre De La Organizacion         object
Figura Juridica                   object
Entidad Federativa Domicilio      object
Municipio Domicilio               object
Anio De Inscripcion                int64
Fecha De Constitucion             object
Actividad 1                       object
Actividad 2                       object
Actividad 3                       object
Actividad 4                       object
Actividad 5                       object
Actividad 6                       object
Actividad 7                       object
Actividad 8                       object
Actividad 9                       object
Actividad 10                      object
Actividad 11                      object
Actividad 12                      object
Actividad 13                      object
Actividad 14                      object
Actividad 15                      object
Actividad 16                      object
Actividad 17                      object
Actividad 18                      object
Actividad 19    

In [None]:
new_data.info()

<class 'pandas.core.frame.DataFrame'>
Index: 32694 entries, AJA0808131801C to ELA140206208OR
Data columns (total 29 columns):
 #   Column                          Non-Null Count  Dtype 
---  ------                          --------------  ----- 
 0   Nombre De La Organizacion       32694 non-null  object
 1   Figura Juridica                 32694 non-null  object
 2   Entidad Federativa Domicilio    32694 non-null  object
 3   Municipio Domicilio             32694 non-null  object
 4   Anio De Inscripcion             32694 non-null  int64 
 5   Fecha De Constitucion           32691 non-null  object
 6   Actividad 1                     32693 non-null  object
 7   Actividad 2                     32693 non-null  object
 8   Actividad 3                     32693 non-null  object
 9   Actividad 4                     32693 non-null  object
 10  Actividad 5                     32693 non-null  object
 11  Actividad 6                     32693 non-null  object
 12  Actividad 7                  

In [None]:
new_data['Fecha De Constitucion'] = new_data['Fecha De Constitucion'].astype('datetime64[ns]')

In [None]:
new_data['Fecha De Constitucion']

CLUNI
AJA0808131801C          NaT
CVB14112731PQB          NaT
JAV141120093S3          NaT
FHN9707310901B   1902-06-19
FBP05100930018   1905-11-01
                    ...    
IEE14120407JQY   2014-12-04
LVO14062314R6W   2014-06-20
TER14110706EKW   2014-11-07
PDS14040209DXM   2014-04-02
ELA140206208OR   2014-02-06
Name: Fecha De Constitucion, Length: 32694, dtype: datetime64[ns]

We can explicitly tell pandas what´s the date format:

In [None]:
some_data = [['200712',50000],['200714',51000],['200716',51500],
            ['200719',53000],['200721',54000],
            ['200724',55000],['200729',57000]]
df = pd.DataFrame(some_data,columns=['Dates','Patients'])

In [None]:
print(df)

    Dates  Patients
0  200712     50000
1  200714     51000
2  200716     51500
3  200719     53000
4  200721     54000
5  200724     55000
6  200729     57000


In [None]:
df.dtypes

Dates       object
Patients     int64
dtype: object

In [None]:
df['Dates'] = pd.to_datetime(df['Dates'], format='%y%m%d')

In [None]:
df.dtypes

Dates       datetime64[ns]
Patients             int64
dtype: object

In [None]:
new_data.assign(Date = lambda df: pd.datetime.strptime(df["Fecha De Constitucion"], "%Y-%m-%d"))

  new_data.assign(Date = lambda df: pd.datetime.strptime(df["Fecha De Constitucion"], "%Y-%m-%d"))


TypeError: ignored

## Filtering

In [None]:
new_data.head()

Unnamed: 0_level_0,Nombre De La Organizacion,Figura Juridica,Entidad Federativa Domicilio,Municipio Domicilio,Anio De Inscripcion,Fecha De Constitucion,Actividad 1,Actividad 2,Actividad 3,Actividad 4,...,Actividad 14,Actividad 15,Actividad 16,Actividad 17,Actividad 18,Actividad 19,Entidad Federativa Domicilio.1,Anio De Constitucion,status_ACTIVA,status_INACTIVA
CLUNI,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
AJA0808131801C,Alianza Jaguar,Asociación Civil,Nayarit,Bahía de Banderas,2011,NaT,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Nayarit,1900,0,1
CVB14112731PQB,Cooperación y Voluntad para el Bienestar Social,Asociación Civil,Yucatán,Mérida,2015,NaT,SI,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,Yucatán,1900,1,0
JAV141120093S3,Juf Activando Valores,Asociación Civil,Distrito Federal,Benito Juárez,2015,NaT,NO,NO,SI,NO,...,NO,NO,NO,NO,NO,NO,Distrito Federal,1900,0,1
FHN9707310901B,Fundación Hospital Nuestra Señora de la Luz,Institución de Asistencia Privada,Distrito Federal,Cuauhtémoc,2011,1902-06-19,SI,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Distrito Federal,1902,1,0
FBP05100930018,Fundación de Beneficencia Privada Asilo San Lu...,Asociación Civil,Veracruz,Orizaba,2009,1905-11-01,SI,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Veracruz,1905,1,0


In [None]:
# CSO of Guanajuato
new_data["Entidad Federativa Domicilio"] == "Guanajuato"

CLUNI
AJA0808131801C    False
CVB14112731PQB    False
JAV141120093S3    False
FHN9707310901B    False
FBP05100930018    False
                  ...  
IEE14120407JQY    False
LVO14062314R6W    False
TER14110706EKW    False
PDS14040209DXM    False
ELA140206208OR    False
Name: Entidad Federativa Domicilio, Length: 32694, dtype: bool

In [None]:
new_data.loc[new_data["Entidad Federativa Domicilio"] == "Guanajuato"] # not iloc

Unnamed: 0_level_0,Nombre De La Organizacion,Figura Juridica,Entidad Federativa Domicilio,Municipio Domicilio,Anio De Inscripcion,Fecha De Constitucion,Actividad 1,Actividad 2,Actividad 3,Actividad 4,...,Actividad 14,Actividad 15,Actividad 16,Actividad 17,Actividad 18,Actividad 19,Entidad Federativa Domicilio.1,Anio De Constitucion,status_ACTIVA,status_INACTIVA
CLUNI,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
CND91042711010,Ciudad del Niño Don Bosco,Asociación Civil,Guanajuato,León,2005,1951-12-31,SI,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Guanajuato,1951,1,0
CRC60062311017,Centro de Rehabilitación Celaya,Asociación Civil,Guanajuato,Celaya,2008,1960-06-23,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Guanajuato,1960,1,0
PAA6106161101A,Patronato de Asistencia a la Ancianidad Desvalida,Asociación Civil,Guanajuato,León,2005,1961-06-16,SI,NO,NO,SI,...,NO,NO,NO,NO,NO,NO,Guanajuato,1961,1,0
DAV6101201101C,Dolores Avellanal,Asociación Civil,Guanajuato,Celaya,2007,1961-01-20,SI,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,Guanajuato,1961,0,1
BPS6207281101F,Biblioteca Pública de San Miguel de Allende,Asociación Civil,Guanajuato,San Miguel de Allende,2011,1962-07-03,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Guanajuato,1962,1,0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
UUV1409191141A,"Unión, Vida y Amor",Asociación Civil,Guanajuato,San Luis de la Paz,2017,2014-09-19,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Guanajuato,2014,1,0
AAG14072311F3I,Ayudar con Acciones Guanajuato,Asociación Civil,Guanajuato,Manuel Doblado,2017,2014-08-07,NO,NO,SI,NO,...,NO,NO,NO,NO,NO,NO,Guanajuato,2014,1,0
CVF14090311DKX,La Catrina Vive Fiestas de Muerte y Color,Asociación Civil,Guanajuato,Guanajuato,2017,2014-09-03,NO,NO,NO,NO,...,NO,SI,NO,NO,NO,NO,Guanajuato,2014,1,0
EPM14032111CFV,Edad Plena y Madurez Temprana,Asociación Civil,Guanajuato,León,2018,2014-03-21,NO,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,Guanajuato,2014,1,0


In [None]:
new_data.loc[(new_data["Entidad Federativa Domicilio"] == "Guanajuato") & (new_data["Anio De Inscripcion"] > 2010)]

Unnamed: 0_level_0,Nombre De La Organizacion,Figura Juridica,Entidad Federativa Domicilio,Municipio Domicilio,Anio De Inscripcion,Fecha De Constitucion,Actividad 1,Actividad 2,Actividad 3,Actividad 4,...,Actividad 14,Actividad 15,Actividad 16,Actividad 17,Actividad 18,Actividad 19,Entidad Federativa Domicilio.1,Anio De Constitucion,status_ACTIVA,status_INACTIVA
CLUNI,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
BPS6207281101F,Biblioteca Pública de San Miguel de Allende,Asociación Civil,Guanajuato,San Miguel de Allende,2011,1962-07-03,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Guanajuato,1962,1,0
CMC67041411QVE,Casa de Maternidad y Cuna,Asociación Civil,Guanajuato,Celaya,2015,1967-04-14,SI,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Guanajuato,1967,1,0
ACI67080911G56,Asociación de Charros Ignacio León Ornelas,Asociación Civil,Guanajuato,Irapuato,2016,1967-08-09,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Guanajuato,1967,1,0
CHD7508301101L,Casa Hogar Don Bosco,Asociación Civil,Guanajuato,San Miguel de Allende,2013,1975-08-30,SI,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,Guanajuato,1975,0,1
CIC78011911013,Colegio de Ingenieros Civiles de Guanajuato,Asociación Civil,Guanajuato,Guanajuato,2011,1978-01-19,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Guanajuato,1978,0,1
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
UUV1409191141A,"Unión, Vida y Amor",Asociación Civil,Guanajuato,San Luis de la Paz,2017,2014-09-19,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Guanajuato,2014,1,0
AAG14072311F3I,Ayudar con Acciones Guanajuato,Asociación Civil,Guanajuato,Manuel Doblado,2017,2014-08-07,NO,NO,SI,NO,...,NO,NO,NO,NO,NO,NO,Guanajuato,2014,1,0
CVF14090311DKX,La Catrina Vive Fiestas de Muerte y Color,Asociación Civil,Guanajuato,Guanajuato,2017,2014-09-03,NO,NO,NO,NO,...,NO,SI,NO,NO,NO,NO,Guanajuato,2014,1,0
EPM14032111CFV,Edad Plena y Madurez Temprana,Asociación Civil,Guanajuato,León,2018,2014-03-21,NO,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,Guanajuato,2014,1,0


In [None]:
import numpy as np

In [None]:
date = '2010-01-01 00:00:00'
date64 = np.datetime64(date)

In [None]:
date

'2010-01-01 00:00:00'

In [None]:
date64

numpy.datetime64('2010-01-01T00:00:00')

In [None]:
new_data.loc[(new_data["Entidad Federativa Domicilio"] == "Guanajuato") & (new_data["Fecha De Constitucion"] >= date64)]

Unnamed: 0_level_0,Nombre De La Organizacion,Figura Juridica,Entidad Federativa Domicilio,Municipio Domicilio,Anio De Inscripcion,Fecha De Constitucion,Actividad 1,Actividad 2,Actividad 3,Actividad 4,...,Actividad 14,Actividad 15,Actividad 16,Actividad 17,Actividad 18,Actividad 19,Entidad Federativa Domicilio.1,Anio De Constitucion,status_ACTIVA,status_INACTIVA
CLUNI,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
FDC1001261101A,Fundación Desarrollo Contigo,Asociación Civil,Guanajuato,Pénjamo,2010,2010-01-26,NO,NO,NO,NO,...,NO,SI,NO,NO,NO,NO,Guanajuato,2010,1,0
CAG10020411010,Comedor de Ancianos Granja de Echeveste,Asociación Civil,Guanajuato,León,2010,2010-02-04,NO,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,Guanajuato,2010,0,1
CEA1003201101F,Consejo Estatal Agropecuario de Guanajuato,Asociación Civil,Guanajuato,Irapuato,2010,2010-03-20,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,SI,Guanajuato,2010,0,1
FJS10030211013,Fundación Jóvenes Sanmiguelenses,Asociación Civil,Guanajuato,San Miguel de Allende,2010,2010-03-02,NO,NO,NO,NO,...,SI,NO,NO,NO,NO,NO,Guanajuato,2010,1,0
BEV10030211017,Bienestar y Esperanza de Vida,Asociación Civil,Guanajuato,León,2010,2010-03-02,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Guanajuato,2010,1,0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
UUV1409191141A,"Unión, Vida y Amor",Asociación Civil,Guanajuato,San Luis de la Paz,2017,2014-09-19,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Guanajuato,2014,1,0
AAG14072311F3I,Ayudar con Acciones Guanajuato,Asociación Civil,Guanajuato,Manuel Doblado,2017,2014-08-07,NO,NO,SI,NO,...,NO,NO,NO,NO,NO,NO,Guanajuato,2014,1,0
CVF14090311DKX,La Catrina Vive Fiestas de Muerte y Color,Asociación Civil,Guanajuato,Guanajuato,2017,2014-09-03,NO,NO,NO,NO,...,NO,SI,NO,NO,NO,NO,Guanajuato,2014,1,0
EPM14032111CFV,Edad Plena y Madurez Temprana,Asociación Civil,Guanajuato,León,2018,2014-03-21,NO,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,Guanajuato,2014,1,0


In [None]:
new_data.loc[(new_data["Anio De Inscripcion"] > 2015) | (new_data["Fecha De Constitucion"] >= date64)] # pipe

Unnamed: 0_level_0,Nombre De La Organizacion,Figura Juridica,Entidad Federativa Domicilio,Municipio Domicilio,Anio De Inscripcion,Fecha De Constitucion,Actividad 1,Actividad 2,Actividad 3,Actividad 4,...,Actividad 14,Actividad 15,Actividad 16,Actividad 17,Actividad 18,Actividad 19,Entidad Federativa Domicilio.1,Anio De Constitucion,status_ACTIVA,status_INACTIVA
CLUNI,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
AIA97031909FH7,Asociación Italiana de Asistencia,Institución de Asistencia Privada,Distrito Federal,Miguel Hidalgo,2016,1908-10-27,SI,SI,NO,NO,...,SI,NO,NO,NO,SI,NO,Distrito Federal,1908,1,0
OMA03092625N5T,Orfanatorio de Mazatlán,Institución de Asistencia Privada,Sinaloa,Mazatlán,2017,1920-12-16,SI,NO,NO,NO,...,SI,NO,NO,NO,NO,NO,Sinaloa,1920,1,0
FBP830926132NT,Fundación de Beneficencia Privada María Domíng...,Asociación Civil,Hidalgo,Pachuca de Soto,2016,1944-06-05,SI,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Hidalgo,1944,1,0
CPC01011626FFI,Comité Particular de Caridad,Institución de Asistencia Privada,Sonora,Cananea,2018,1947-08-09,SI,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,Sonora,1947,1,0
PPR490830229CO,Previsión y Protección,Sociedad Civil,Querétaro,Querétaro,2018,1949-08-30,NO,NO,NO,NO,...,NO,SI,NO,NO,NO,NO,Querétaro,1949,1,0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
IEE14120407JQY,"Instituto para la Enseñanza, Equidad de Género...",Asociación Civil,Chiapas,San Cristóbal de las Casas,2018,2014-12-04,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Chiapas,2014,1,0
LVO14062314R6W,Letras Para Volar,Asociación Civil,Jalisco,Guadalajara,2018,2014-06-20,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Jalisco,2014,1,0
TER14110706EKW,TERHFAM,Asociación Civil,Colima,Colima,2018,2014-11-07,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Colima,2014,1,0
PDS14040209DXM,Proyecto Democrático y Social,Asociación Civil,Distrito Federal,Miguel Hidalgo,2018,2014-04-02,SI,SI,NO,SI,...,NO,NO,NO,NO,NO,SI,Distrito Federal,2014,1,0


In [None]:
new_data['Municipio Domicilio'] in ['Guanajuato', 'León']

ValueError: ignored

In [None]:
new_data.loc[new_data['Municipio Domicilio'].isin(['Guanajuato', 'León'])]

Unnamed: 0_level_0,Nombre De La Organizacion,Figura Juridica,Entidad Federativa Domicilio,Municipio Domicilio,Anio De Inscripcion,Fecha De Constitucion,Actividad 1,Actividad 2,Actividad 3,Actividad 4,...,Actividad 14,Actividad 15,Actividad 16,Actividad 17,Actividad 18,Actividad 19,Entidad Federativa Domicilio.1,Anio De Constitucion,status_ACTIVA,status_INACTIVA
CLUNI,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
CND91042711010,Ciudad del Niño Don Bosco,Asociación Civil,Guanajuato,León,2005,1951-12-31,SI,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Guanajuato,1951,1,0
PAA6106161101A,Patronato de Asistencia a la Ancianidad Desvalida,Asociación Civil,Guanajuato,León,2005,1961-06-16,SI,NO,NO,SI,...,NO,NO,NO,NO,NO,NO,Guanajuato,1961,1,0
IRV63031111011,Instituto Rosa Virginia Pelletier,Asociación Civil,Guanajuato,León,2007,1963-03-11,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Guanajuato,1963,1,0
YPA68012011013,Yermo y Parres,Asociación Civil,Guanajuato,León,2005,1968-05-21,SI,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Guanajuato,1968,0,1
FSE6806081101E,Fray Servando,Asociación Civil,Guanajuato,León,2005,1968-05-21,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Guanajuato,1968,0,1
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
SEC14100311T48,SECULARTE,Asociación Civil,Guanajuato,Guanajuato,2015,2014-10-03,NO,NO,NO,NO,...,NO,NO,NO,NO,SI,SI,Guanajuato,2014,1,0
FCP14062711WET,Fundación Cultural Parlamento Ciudadano,Asociación Civil,Guanajuato,León,2016,2014-06-27,NO,NO,SI,NO,...,SI,NO,NO,NO,NO,NO,Guanajuato,2014,1,0
CVF14090311DKX,La Catrina Vive Fiestas de Muerte y Color,Asociación Civil,Guanajuato,Guanajuato,2017,2014-09-03,NO,NO,NO,NO,...,NO,SI,NO,NO,NO,NO,Guanajuato,2014,1,0
EPM14032111CFV,Edad Plena y Madurez Temprana,Asociación Civil,Guanajuato,León,2018,2014-03-21,NO,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,Guanajuato,2014,1,0


## Sorting

In [None]:
new_data.sort_values(by='Anio De Inscripcion') # .tail()

Unnamed: 0_level_0,Nombre De La Organizacion,Figura Juridica,Entidad Federativa Domicilio,Municipio Domicilio,Anio De Inscripcion,Fecha De Constitucion,Actividad 1,Actividad 2,Actividad 3,Actividad 4,...,Actividad 14,Actividad 15,Actividad 16,Actividad 17,Actividad 18,Actividad 19,Entidad Federativa Domicilio.1,Anio De Constitucion,status_ACTIVA,status_INACTIVA
CLUNI,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
CDH89122209014,Centro de Derechos Humanos Fr. Francisco de Vi...,Asociación Civil,Distrito Federal,Coyoacán,2004,1989-12-13,NO,NO,NO,SI,...,NO,NO,SI,NO,NO,NO,Distrito Federal,1989,1,0
RDS04072609013,Red para el Desarrollo Social y Comunitario,Asociación Civil,Distrito Federal,Benito Juárez,2004,2004-07-26,SI,NO,NO,SI,...,SI,NO,NO,NO,NO,NO,Distrito Federal,2004,1,0
HUC01052109018,Hacia una Cultura Democrática,Asociación Civil,Distrito Federal,Tlalpan,2004,2001-05-15,NO,NO,SI,NO,...,NO,NO,NO,NO,NO,NO,Distrito Federal,2001,1,0
CIN98090220019,Comunicación Indígena,Otra,Oaxaca,Oaxaca de Juárez,2005,1999-01-21,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Oaxaca,1999,0,1
FIO05091410016,Federación Internacional de Organizaciones Mig...,Asociación Civil,Durango,Durango,2005,2005-09-14,SI,SI,SI,SI,...,SI,SI,SI,NO,NO,NO,Durango,2005,0,1
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
FMM00070330SB8,Federación Mexicana de Muay Thai,Asociación Civil,Distrito Federal,Álvaro Obregón,2018,2000-07-03,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Distrito Federal,2000,1,0
UNP00040409QHE,Unión Nacional de Productores de Café Confeder...,Asociación Civil,Distrito Federal,Cuauhtémoc,2018,2000-04-04,NO,NO,NO,NO,...,SI,NO,NO,NO,NO,NO,Distrito Federal,2000,1,0
TSA01101209192,Tecnología Social y Asistencia Comunitaria,Asociación Civil,Puebla,Cuautlancingo,2018,2001-09-28,NO,SI,NO,NO,...,SI,NO,NO,NO,NO,NO,Puebla,2001,1,0
FCS13042407N8D,Fundación Causas SGG,Asociación Civil,Chiapas,Tuxtla Gutiérrez,2018,2013-04-27,NO,NO,NO,NO,...,SI,NO,SI,NO,NO,NO,Chiapas,2013,1,0


In [None]:
new_data.sort_values(by='Fecha De Constitucion', ascending=False)

Unnamed: 0_level_0,Nombre De La Organizacion,Figura Juridica,Entidad Federativa Domicilio,Municipio Domicilio,Anio De Inscripcion,Fecha De Constitucion,Actividad 1,Actividad 2,Actividad 3,Actividad 4,...,Actividad 14,Actividad 15,Actividad 16,Actividad 17,Actividad 18,Actividad 19,Entidad Federativa Domicilio.1,Anio De Constitucion,status_ACTIVA,status_INACTIVA
CLUNI,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
EME15011615VLQ,Earthgonomic México,Asociación Civil,Distrito Federal,Azcapotzalco,2015,2014-12-30,NO,NO,SI,NO,...,NO,NO,NO,NO,NO,NO,Distrito Federal,2014,1,0
PTM14123020L6W,Profesionistas Transformando México,Asociación Civil,Oaxaca,San Jacinto Amilpas,2015,2014-12-30,NO,NO,NO,NO,...,NO,NO,SI,NO,NO,NO,Oaxaca,2014,0,1
OSR14123010ZAB,Organización Social Región Sur,Asociación Civil,Durango,Durango,2015,2014-12-30,NO,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,Durango,2014,0,1
TVH14122930Z07,Trabajando con Valor Humano,Asociación Civil,Veracruz,Xalapa,2015,2014-12-29,NO,NO,NO,SI,...,NO,NO,SI,NO,NO,NO,Veracruz,2014,1,0
ACM141229109EM,Arte y Cultura en Movimiento de la Laguna,Asociación Civil,Durango,Gómez Palacio,2015,2014-12-29,NO,NO,NO,NO,...,NO,NO,NO,NO,SI,NO,Durango,2014,1,0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
CJU6211290901J,Colegio Jesús de Urquiaga,Institución de Asistencia Privada,Distrito Federal,Álvaro Obregón,2014,1905-09-01,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Distrito Federal,1905,1,0
FHN9707310901B,Fundación Hospital Nuestra Señora de la Luz,Institución de Asistencia Privada,Distrito Federal,Cuauhtémoc,2011,1902-06-19,SI,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Distrito Federal,1902,1,0
AJA0808131801C,Alianza Jaguar,Asociación Civil,Nayarit,Bahía de Banderas,2011,NaT,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Nayarit,1900,0,1
CVB14112731PQB,Cooperación y Voluntad para el Bienestar Social,Asociación Civil,Yucatán,Mérida,2015,NaT,SI,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,Yucatán,1900,1,0


In [None]:
new_data.sort_index()

Unnamed: 0_level_0,Nombre De La Organizacion,Figura Juridica,Entidad Federativa Domicilio,Municipio Domicilio,Anio De Inscripcion,Fecha De Constitucion,Actividad 1,Actividad 2,Actividad 3,Actividad 4,...,Actividad 14,Actividad 15,Actividad 16,Actividad 17,Actividad 18,Actividad 19,Entidad Federativa Domicilio.1,Anio De Constitucion,status_ACTIVA,status_INACTIVA
CLUNI,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
AAA05032709017,Arte Audiovisual Alternativo,Asociación Civil,Estado de México,Naucalpan de Juárez,2007,2005-06-27,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Estado de México,2005,1,0
AAA05051809017,Asociación Agrícola Ahuacateca,Asociación Civil,Estado de México,Nezahualcóyotl,2005,2005-05-18,NO,SI,SI,SI,...,SI,NO,NO,NO,NO,NO,Estado de México,2005,0,1
AAA0603172101L,Asociación de Amparo y Amor al Infante,Asociación Civil,Puebla,Tehuacán,2013,2006-03-17,NO,NO,NO,SI,...,NO,NO,NO,NO,NO,NO,Puebla,2006,0,1
AAA0605091501C,"Alternativas de Apoyo a los Asuntos del Menor,...",Asociación Civil,Estado de México,Nezahualcóyotl,2010,2006-05-09,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Estado de México,2006,1,0
AAA06121209016,Asociación Azteca Amigos de la Cultura y las A...,Asociación Civil,Distrito Federal,Álvaro Obregón,2011,2006-12-08,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Distrito Federal,2006,1,0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
ÑJN1404152001X,Ñuu Jaa ´Naa,Asociación Civil,Oaxaca,Heroica Ciudad de Tlaxiaco,2014,2014-04-15,NO,NO,NO,NO,...,SI,NO,NO,NO,NO,NO,Oaxaca,2014,0,1
ÑNC11062809010,ÑU NQUI CHIBI,Asociación Civil,Distrito Federal,Milpa Alta,2012,2011-06-28,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Distrito Federal,2011,0,1
ÑNN1311122002L,"Ñuu Nuvaa Nana Ñuu, Mixteca Madre Tierra",Asociación Civil,Oaxaca,Santa María Yucuhiti,2014,2013-11-27,NO,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,Oaxaca,2013,1,0
ÑTE09012207010,Ñaxañoñla Tyi E´tyel,Asociación Civil,Chiapas,Tumbalá,2010,2009-01-22,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,SI,Chiapas,2009,0,1


In [None]:
new_data.sort_values(by=['Entidad Federativa Domicilio', 'Municipio Domicilio'])

Unnamed: 0_level_0,Nombre De La Organizacion,Figura Juridica,Entidad Federativa Domicilio,Municipio Domicilio,Anio De Inscripcion,Fecha De Constitucion,Actividad 1,Actividad 2,Actividad 3,Actividad 4,...,Actividad 14,Actividad 15,Actividad 16,Actividad 17,Actividad 18,Actividad 19,Entidad Federativa Domicilio.1,Anio De Constitucion,status_ACTIVA,status_INACTIVA
CLUNI,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
CNA6912010101F,Ciudad de los Niños de Aguascalientes,Asociación Civil,Aguascalientes,Aguascalientes,2005,1969-12-01,SI,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Aguascalientes,1969,0,1
IES88123124015,Impulso Educativo y Social,Asociación Civil,Aguascalientes,Aguascalientes,2008,1972-09-07,NO,NO,NO,NO,...,SI,NO,NO,NO,NO,NO,Aguascalientes,1972,1,0
OCA72011401018,Orfanatorio Casimira Arteaga Hogar de la Niña ...,Asociación Civil,Aguascalientes,Aguascalientes,2008,1972-01-14,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Aguascalientes,1972,1,0
PPE80030501012,Patronato Pro Educación de los Adultos,Asociación Civil,Aguascalientes,Aguascalientes,2005,1978-11-08,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Aguascalientes,1978,1,0
CNV85101101015,Casa del Niño Villa de la Asunción,Asociación Civil,Aguascalientes,Aguascalientes,2005,1985-10-11,SI,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Aguascalientes,1985,1,0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
CLA14082932UY2,Cuerpos Libres en el Arte y la Discapacidad,Asociación Civil,Zacatecas,Zacatecas,2015,2014-08-29,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Zacatecas,2014,1,0
PEC14102532UMD,Patronato Estatal de los Centros de Integració...,Asociación Civil,Zacatecas,Zacatecas,2015,2014-10-24,SI,NO,NO,NO,...,NO,NO,NO,NO,SI,NO,Zacatecas,2014,0,1
FMH141002323XW,Fundación Movilidad Humana y Desarrollo Comuni...,Asociación Civil,Zacatecas,Zacatecas,2015,2014-10-02,SI,SI,NO,NO,...,NO,NO,NO,NO,SI,NO,Zacatecas,2014,1,0
RAF14101532LI0,"Rehabilitación, Acondicionamiento y Fortalecim...",Asociación Civil,Zacatecas,Zacatecas,2015,2014-10-15,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Zacatecas,2014,1,0


## Grouping

In [None]:
new_data['Figura Juridica'].value_counts()

Asociación Civil                              30860
Institución de Asistencia Privada              1044
Otra                                            366
Sociedad Civil                                  267
Asociación de Beneficiencia Privada             109
Institución de Beneficiencia Privada (IBP)       43
Institución de Asistencia Social Privada          5
Name: Figura Juridica, dtype: int64

In [None]:
groups = new_data.groupby('Figura Juridica')

In [None]:
type(groups)

pandas.core.groupby.generic.DataFrameGroupBy

In [None]:
for group in groups:
    print(group[0])
    print(group[1]["Anio De Inscripcion"])

Asociación Civil
CLUNI
AJA0808131801C    2011
CVB14112731PQB    2015
JAV141120093S3    2015
FBP05100930018    2009
CHB73052413019    2005
                  ... 
IEE14120407JQY    2018
LVO14062314R6W    2018
TER14110706EKW    2018
PDS14040209DXM    2018
ELA140206208OR    2018
Name: Anio De Inscripcion, Length: 30860, dtype: int64
Asociación de Beneficiencia Privada
CLUNI
FAP3212280901F    2012
CNM70102719018    2006
DSA68080119018    2005
DSV7202191901X    2013
IPS73061919019    2007
                  ... 
VGX1403101901M    2014
TBU1406111901C    2014
ICA14120419IIM    2015
SCA14100619YXB    2015
TEF140213199G4    2015
Name: Anio De Inscripcion, Length: 109, dtype: int64
Institución de Asistencia Privada
CLUNI
FHN9707310901B    2011
CJU6211290901J    2014
AIA97031909FH7    2016
AMC11122309016    2005
FCM1709140901E    2005
                  ... 
IED14030425OTW    2016
ACH14121831DJ1    2016
CIC140109263UZ    2016
SAL14070215LP2    2016
FOI140204099P8    2018
Name: Anio De Inscripcion, L

In [None]:
groups['Figura Juridica'].count()

Figura Juridica
Asociación Civil                              30860
Asociación de Beneficiencia Privada             109
Institución de Asistencia Privada              1044
Institución de Asistencia Social Privada          5
Institución de Beneficiencia Privada (IBP)       43
Otra                                            366
Sociedad Civil                                  267
Name: Figura Juridica, dtype: int64

In [None]:
groups.apply(lambda df: df["Nombre De La Organizacion"].iloc[0])

Figura Juridica
Asociación Civil                                                           Alianza Jaguar
Asociación de Beneficiencia Privada               Fundación Antonio Plancarte y Labastida
Institución de Asistencia Privada             Fundación Hospital Nuestra Señora de la Luz
Institución de Asistencia Social Privada                  Amigos del Estudiante Invidente
Institución de Beneficiencia Privada (IBP)                          Asilo Brunet Celarain
Otra                                            Asilo Particular de Caridad para Ancianos
Sociedad Civil                                                Fundación Esposos Rodriguez
dtype: object

In [None]:
groups = new_data.groupby(['Figura Juridica', 'status_ACTIVA'])

In [None]:
groups.apply(lambda df: df.loc[df["Anio De Inscripcion"].idxmax()])

Unnamed: 0_level_0,Unnamed: 1_level_0,Nombre De La Organizacion,Figura Juridica,Entidad Federativa Domicilio,Municipio Domicilio,Anio De Inscripcion,Fecha De Constitucion,Actividad 1,Actividad 2,Actividad 3,Actividad 4,...,Actividad 14,Actividad 15,Actividad 16,Actividad 17,Actividad 18,Actividad 19,Entidad Federativa Domicilio.1,Anio De Constitucion,status_ACTIVA,status_INACTIVA
Figura Juridica,status_ACTIVA,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1,Unnamed: 22_level_1
Asociación Civil,0,Asociación de Profesionales AFP,Asociación Civil,Distrito Federal,Coyoacán,2018,2013-09-06,SI,NO,NO,NO,...,NO,NO,SI,NO,NO,SI,Distrito Federal,2013,0,1
Asociación Civil,1,Protección de Cultivos Ciencia y Tecnología,Asociación Civil,Distrito Federal,Benito Juárez,2018,1963-07-19,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Distrito Federal,1963,1,0
Asociación de Beneficiencia Privada,0,Brisa de Amor,Asociación de Beneficiencia Privada,Nuevo León,Monterrey,2014,2011-09-29,SI,SI,SI,NO,...,NO,NO,NO,NO,NO,NO,Nuevo León,2011,0,1
Asociación de Beneficiencia Privada,1,Ser México,Asociación de Beneficiencia Privada,Nuevo León,Monterrey,2016,2012-02-07,SI,NO,SI,NO,...,NO,NO,NO,NO,SI,NO,Nuevo León,2012,1,0
Institución de Asistencia Privada,0,Centro Cultural Zuaque,Institución de Asistencia Privada,Sinaloa,Ahome,2016,1996-10-04,NO,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Sinaloa,1996,0,1
Institución de Asistencia Privada,1,Comité Particular de Caridad,Institución de Asistencia Privada,Sonora,Cananea,2018,1947-08-09,SI,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,Sonora,1947,1,0
Institución de Asistencia Social Privada,0,La Gran Familia de Gregory,Institución de Asistencia Social Privada,Chihuahua,Cuauhtémoc,2016,2014-07-11,SI,SI,NO,NO,...,NO,NO,NO,NO,NO,SI,Chihuahua,2014,0,1
Institución de Asistencia Social Privada,1,Amigos del Estudiante Invidente,Institución de Asistencia Social Privada,Distrito Federal,Tlalpan,2015,1986-11-25,SI,NO,NO,NO,...,SI,NO,NO,NO,NO,NO,Distrito Federal,1986,1,0
Institución de Beneficiencia Privada (IBP),0,Hogar Santa Isabel para Ancianos Desamparados,Institución de Beneficiencia Privada (IBP),Veracruz,Orizaba,2013,1962-11-30,NO,SI,NO,NO,...,NO,NO,NO,NO,NO,NO,Veracruz,1962,0,1
Institución de Beneficiencia Privada (IBP),1,Fundación Tamariz Oropeza,Institución de Beneficiencia Privada (IBP),Puebla,Puebla,2016,1962-12-19,SI,NO,NO,NO,...,NO,NO,NO,NO,NO,NO,Puebla,1962,1,0


In [None]:
new_data.groupby(['Figura Juridica', 'status_ACTIVA'])["Fecha De Constitucion"].agg([len, min, max])

Unnamed: 0_level_0,Unnamed: 1_level_0,len,min,max
Figura Juridica,status_ACTIVA,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
Asociación Civil,0,15546,1943-06-30,2014-12-30
Asociación Civil,1,15314,1905-11-01,2014-12-30
Asociación de Beneficiencia Privada,0,48,1932-12-28,2014-06-11
Asociación de Beneficiencia Privada,1,61,1951-07-12,2014-12-04
Institución de Asistencia Privada,0,387,1911-12-23,2014-12-18
Institución de Asistencia Privada,1,657,1902-06-19,2014-12-18
Institución de Asistencia Social Privada,0,1,2014-07-11,2014-07-11
Institución de Asistencia Social Privada,1,4,1986-11-25,2014-07-08
Institución de Beneficiencia Privada (IBP),0,15,1906-09-24,2013-06-26
Institución de Beneficiencia Privada (IBP),1,28,1947-02-15,2010-05-06


## Merging

In [None]:
# create two sample dataframes
df1 = pd.DataFrame({'key': ['A', 'B', 'C', 'D'],
                    'value1': [1, 2, 3, 4]})

df2 = pd.DataFrame({'key': ['B', 'D', 'E', 'F'],
                    'value2': [5, 6, 7, 8]})

# merge the dataframes on the "key" column
merged_df = pd.merge(df1, df2, on='key', how=) # how='inner' by default

# The resulting dataframe will contain only the rows where the value in the "key" column in both dataframes match
print(merged_df)

  key  value1  value2
0   B       2       5
1   D       4       6


## Excersise

1. Change "activity" columns to boolean values
2. Group by activity and report number of CSO for each activity
3. Add a column of the number of activities each organization has
4. Report a brief summary of this last variable by type of organization