**Cleaning data**

We show two data sets.

In the second one, we'll be using a database that shows a list of the **measures that the Government of Mexico City** and Mayor's Offices have implemented to address the health contingency of COVID-19.

*As part of this introduction, to determine when to limit economic activity in the capital, the Mexican government set up a system that takes into account 10 measures of hospitalizations, infections and deaths.*

*The levels of risk were labeled according to the colors of Mexican traffic lights: green meant the numbers were low, orange denoted a higher risk and a few restrictions, and red signaled a widespread outbreak that called for a shutdown of all nonessential businesses.*

*The calculation assigns a certain number of points to each indicator, depending on its severity. When the sum of all points total more than 31, the state, or the capital city, gets a red light — and that prompts a lockdown.*


**Exploring Measures data**

In [1]:
# Dependencies and Setup
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.mlab as mlab
import matplotlib.gridspec as gridspec

# File to Load (Remember to Change These)
file_to_load = "../Resources/inventario-medidas-contingencia-covid19.csv"

# Read Purchasing File and store into Pandas data frame
measures_data = pd.read_csv(file_to_load)
measures_data.head()

Unnamed: 0,id,medida,fecha_anuncio,ente_responsable,categoria,fecha_publicacion_gaceta,enlace_gaceta,enlace_informativo,column_8
0,0,Acuerdo FGJCDMX/01/2021 por el que se declaran...,14/01/2021,Fiscalía General de Justicia,Medidas de Contención,14/01/2021,https://data.consejeria.cdmx.gob.mx/portal_old...,,
1,1,Aviso por el que se da a conocer el Calendario...,30/12/2020,Agencia de Protección Sanitaria,Medidas de Contención,30/12/2020,https://data.consejeria.cdmx.gob.mx/portal_old...,,
2,2,Aviso por el cual se dan a conocer las modific...,23/12/2020,Secretaría de Inclusión y Bienestar Social,Programa/Acción social,23/12/2020,https://data.consejeria.cdmx.gob.mx/portal_old...,,
3,3,Acuerdo por el que se modifica el “Sistema de ...,22/12/2020,Agencia Digital de Innovación Pública,Programa/Acción social,22/12/2020,https://data.consejeria.cdmx.gob.mx/portal_old...,,
4,4,Aviso por el que se da a conocer la designació...,14/12/2020,Secretaría de Desarrollo Urbano y Vivienda,Programa/Acción social,14/12/2020,https://data.consejeria.cdmx.gob.mx/portal_old...,,


In [2]:
# Inspect all columns
measures_data.columns

Index(['id', 'medida', 'fecha_anuncio', 'ente_responsable', 'categoria',
       'fecha_publicacion_gaceta', 'enlace_gaceta', 'enlace_informativo',
       'column_8'],
      dtype='object')

In [3]:
measures_data.dtypes

id                           int64
medida                      object
fecha_anuncio               object
ente_responsable            object
categoria                   object
fecha_publicacion_gaceta    object
enlace_gaceta               object
enlace_informativo          object
column_8                    object
dtype: object

In [4]:
# Extract only columns 
reduced_measures_data = measures_data.loc[:, ['categoria', 'ente_responsable','medida','fecha_anuncio']]
reduced_measures_data = reduced_measures_data.sort_values("fecha_anuncio", ascending=True)
reduced_measures_data['fecha_anuncio'] = pd.to_datetime(reduced_measures_data['fecha_anuncio'],format="%d/%m/%Y")
reduced_measures_data.head(30)


Unnamed: 0,categoria,ente_responsable,medida,fecha_anuncio
198,Medidas de Contención,Jefatura de Gobierno,Aplicación de multas a los negocios no indispe...,2020-04-01
197,Medidas de Contención,Jefatura de Gobierno,"Suspensión inmediata, del 01 al 30 de abril de...",2020-04-01
146,Medidas de Contención,Jefatura de Gobierno,Prótocolo de traslado de personas con Covid-19...,2020-05-01
147,Medidas de Contención,Alcaldía Azcapotzalco,Cierre de 2 mercados y 3 tianguis como parte d...,2020-05-01
301,Medidas de Contención,Jefatura de Gobierno,Se adiciona el numeral primero bis al Quinto a...,2020-06-01
491,Programa/Acción social,Secretaría de Inclusión y Bienestar Social,Nota Aclaratoria sobre Lineamientos Generales ...,2020-06-01
490,Programa/Acción social,Secretaría de Inclusión y Bienestar Social,Nota Aclaratoria sobre Reglas de Operación de ...,2020-06-01
113,Plan,Secretaría de Seguridad Ciudadana,Implementación de plan operativo de seguridad ...,2020-06-01
281,Plan,Alcaldía Tláhuac,Se reanudan términos para la atención de trámi...,2020-07-01
87,Programa/Acción social,Secretaría de Inclusión y Bienestar Social,Nota aclaratoria a las reglas de operación del...,2020-07-01


**filter only measures about traffic lights**

In [5]:
#Extract only rows that cointains'Índice de volumen físico base 2013=100'
filtered_measures = reduced_measures_data.loc[reduced_measures_data['medida'].str.contains('semaforo|semáforo')]
filtered_responsible = filtered_measures.loc[filtered_measures['ente_responsable'].str.contains('Jefatura de Gobierno')]
filtered_responsible['fecha_anuncio'] = pd.to_datetime(filtered_responsible['fecha_anuncio'],format="%d/%m/%Y")
pd.set_option('display.max_colwidth', None)
filtered_responsible

#filtered_red = filtered_responsible.loc[filtered_responsible['medida'].str.contains('rojo')]
#filtered_red

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  filtered_responsible['fecha_anuncio'] = pd.to_datetime(filtered_responsible['fecha_anuncio'],format="%d/%m/%Y")


Unnamed: 0,categoria,ente_responsable,medida,fecha_anuncio
27,Plan,Jefatura de Gobierno,Anuncio del semaforo epidemiologíco de la ciudad en color naranja del 5 al 11 de octubre.,2020-10-02
465,Plan,Jefatura de Gobierno,Aviso por el que se da conocer el color naranja del semaforo epidemiológico de la Ciudad del 6 al 12 de julio.,2020-07-03
43,Plan,Jefatura de Gobierno,Anuncio del semaforo epidemiologíco de la ciudad en color naranja del 7 al 13 de septiembbre.,2020-09-04
108,Medidas de Contención,Jefatura de Gobierno,Aviso por el que se da conocer el color del semaforo epidemiológico de la Ciudad del 8 al 14 de junio 2020 en Rojo,2020-06-05
439,Plan,Jefatura de Gobierno,Se informa del semaforo epidemiologíco de la ciudad en color naranja del 10 al 16 de agosto.,2020-08-07
25,Plan,Jefatura de Gobierno,Anuncio del semaforo epidemiologíco de la ciudad en color naranja del 12 al 18 de octubre.,2020-10-09
41,Plan,Jefatura de Gobierno,Anuncio del semaforo epidemiologíco de la ciudad en color naranja del 14 al 20 de septiembre.,2020-09-11
104,Plan,Jefatura de Gobierno,Segundo Aviso por el que se da conocer el color del semáforo epidemiológico de la Ciudad de México y se establecen modificaciones al Sexto Acuerdo por el que se establecen los Lineamientos para la Ejecución del Plan Gradual hacia la Nueva Normalidad en la Ciudad de México y se crea el Comité de Monitoreo y su Anexo,2020-06-12
53,Plan,Jefatura de Gobierno,"Anuncio de semaforo epidemiologíco de la ciudad en color naranja del 17 al 23 de agosto y campaña de prevención en redes sociales “1, 2, 3, por todas y todos” .",2020-08-14
276,Plan,Jefatura de Gobierno,Decimo aviso por el que se da a conocer el color del semaforo epidemiologico de la Ciudad de México en color naranja del 20 al 26 de julio.,2020-07-17


In [6]:
data_format= pd.to_datetime(filtered_responsible["fecha_anuncio"])
data_format

27    2020-10-02
465   2020-07-03
43    2020-09-04
108   2020-06-05
439   2020-08-07
25    2020-10-09
41    2020-09-11
104   2020-06-12
53    2020-08-14
276   2020-07-17
38    2020-09-18
256   2020-08-21
69    2020-07-24
413   2020-09-25
91    2020-06-26
48    2020-08-28
492   2020-05-31
59    2020-07-31
Name: fecha_anuncio, dtype: datetime64[ns]

In [7]:

data_format = pd.to_datetime(data_format).dt.to_period('Q')


In [8]:
data_format

27     2020Q4
465    2020Q3
43     2020Q3
108    2020Q2
439    2020Q3
25     2020Q4
41     2020Q3
104    2020Q2
53     2020Q3
276    2020Q3
38     2020Q3
256    2020Q3
69     2020Q3
413    2020Q3
91     2020Q2
48     2020Q3
492    2020Q2
59     2020Q3
Name: fecha_anuncio, dtype: period[Q-DEC]

In [9]:
filtered_responsible ["Quarter"] = data_format

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  filtered_responsible ["Quarter"] = data_format


In [10]:
filtered_responsible

Unnamed: 0,categoria,ente_responsable,medida,fecha_anuncio,Quarter
27,Plan,Jefatura de Gobierno,Anuncio del semaforo epidemiologíco de la ciudad en color naranja del 5 al 11 de octubre.,2020-10-02,2020Q4
465,Plan,Jefatura de Gobierno,Aviso por el que se da conocer el color naranja del semaforo epidemiológico de la Ciudad del 6 al 12 de julio.,2020-07-03,2020Q3
43,Plan,Jefatura de Gobierno,Anuncio del semaforo epidemiologíco de la ciudad en color naranja del 7 al 13 de septiembbre.,2020-09-04,2020Q3
108,Medidas de Contención,Jefatura de Gobierno,Aviso por el que se da conocer el color del semaforo epidemiológico de la Ciudad del 8 al 14 de junio 2020 en Rojo,2020-06-05,2020Q2
439,Plan,Jefatura de Gobierno,Se informa del semaforo epidemiologíco de la ciudad en color naranja del 10 al 16 de agosto.,2020-08-07,2020Q3
25,Plan,Jefatura de Gobierno,Anuncio del semaforo epidemiologíco de la ciudad en color naranja del 12 al 18 de octubre.,2020-10-09,2020Q4
41,Plan,Jefatura de Gobierno,Anuncio del semaforo epidemiologíco de la ciudad en color naranja del 14 al 20 de septiembre.,2020-09-11,2020Q3
104,Plan,Jefatura de Gobierno,Segundo Aviso por el que se da conocer el color del semáforo epidemiológico de la Ciudad de México y se establecen modificaciones al Sexto Acuerdo por el que se establecen los Lineamientos para la Ejecución del Plan Gradual hacia la Nueva Normalidad en la Ciudad de México y se crea el Comité de Monitoreo y su Anexo,2020-06-12,2020Q2
53,Plan,Jefatura de Gobierno,"Anuncio de semaforo epidemiologíco de la ciudad en color naranja del 17 al 23 de agosto y campaña de prevención en redes sociales “1, 2, 3, por todas y todos” .",2020-08-14,2020Q3
276,Plan,Jefatura de Gobierno,Decimo aviso por el que se da a conocer el color del semaforo epidemiologico de la Ciudad de México en color naranja del 20 al 26 de julio.,2020-07-17,2020Q3


In [11]:
filtered_responsible.sort_values(by='Quarter', inplace=True)

filtered_responsible

A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  filtered_responsible.sort_values(by='Quarter', inplace=True)


Unnamed: 0,categoria,ente_responsable,medida,fecha_anuncio,Quarter
91,Plan,Jefatura de Gobierno,Se da a conocer el color del semaforo epidemiologico de la ciudad en color naranja para la semana del 29 de junio al 5 de julio de 2020.,2020-06-26,2020Q2
108,Medidas de Contención,Jefatura de Gobierno,Aviso por el que se da conocer el color del semaforo epidemiológico de la Ciudad del 8 al 14 de junio 2020 en Rojo,2020-06-05,2020Q2
104,Plan,Jefatura de Gobierno,Segundo Aviso por el que se da conocer el color del semáforo epidemiológico de la Ciudad de México y se establecen modificaciones al Sexto Acuerdo por el que se establecen los Lineamientos para la Ejecución del Plan Gradual hacia la Nueva Normalidad en la Ciudad de México y se crea el Comité de Monitoreo y su Anexo,2020-06-12,2020Q2
492,Medidas de Contención,Jefatura de Gobierno,Presentación de Lineamientos para industrias que retoman actividades esenciales durante semaforo rojo,2020-05-31,2020Q2
53,Plan,Jefatura de Gobierno,"Anuncio de semaforo epidemiologíco de la ciudad en color naranja del 17 al 23 de agosto y campaña de prevención en redes sociales “1, 2, 3, por todas y todos” .",2020-08-14,2020Q3
48,Plan,Jefatura de Gobierno,Anuncio del semaforo epidemiologíco de la ciudad en color naranja del al 31 de agosto al 6 de septiembre.,2020-08-28,2020Q3
413,Plan,Jefatura de Gobierno,Anuncio del semaforo epidemiologíco de la ciudad en color naranja del 28 de septiembre al 4 de octubre.,2020-09-25,2020Q3
69,Plan,Jefatura de Gobierno,Decimo primer aviso por el que se da a conocer el color del semaforo epidemiologico de la Ciudad de México permanece en naranja del 27 de julio al 2 de agosto.,2020-07-24,2020Q3
256,Plan,Jefatura de Gobierno,Anuncio del semaforo epidemiologíco de la ciudad en color naranja del 24 al 30 de agosto.,2020-08-21,2020Q3
38,Plan,Jefatura de Gobierno,Anuncio del semaforo epidemiologíco de la ciudad en color naranja del 21 al 27 de septiembre.,2020-09-18,2020Q3


In [12]:
filtered_responsible ["Semaforo"] = ["Naranja", "Rojo", "Naranja", "Rojo", "Naranja", "Naranja", "Naranja","Naranja","Naranja","Naranja","Naranja","Naranja","Naranja","Naranja","Naranja","Naranja","Naranja","Naranja"]

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  filtered_responsible ["Semaforo"] = ["Naranja", "Rojo", "Naranja", "Rojo", "Naranja", "Naranja", "Naranja","Naranja","Naranja","Naranja","Naranja","Naranja","Naranja","Naranja","Naranja","Naranja","Naranja","Naranja"]


In [23]:
filtered_responsible

Unnamed: 0,categoria,ente_responsable,medida,fecha_anuncio,Quarter,Semaforo
91,Plan,Jefatura de Gobierno,Se da a conocer el color del semaforo epidemiologico de la ciudad en color naranja para la semana del 29 de junio al 5 de julio de 2020.,2020-06-26,2020Q2,Naranja
108,Medidas de Contención,Jefatura de Gobierno,Aviso por el que se da conocer el color del semaforo epidemiológico de la Ciudad del 8 al 14 de junio 2020 en Rojo,2020-06-05,2020Q2,Rojo
104,Plan,Jefatura de Gobierno,Segundo Aviso por el que se da conocer el color del semáforo epidemiológico de la Ciudad de México y se establecen modificaciones al Sexto Acuerdo por el que se establecen los Lineamientos para la Ejecución del Plan Gradual hacia la Nueva Normalidad en la Ciudad de México y se crea el Comité de Monitoreo y su Anexo,2020-06-12,2020Q2,Naranja
492,Medidas de Contención,Jefatura de Gobierno,Presentación de Lineamientos para industrias que retoman actividades esenciales durante semaforo rojo,2020-05-31,2020Q2,Rojo
53,Plan,Jefatura de Gobierno,"Anuncio de semaforo epidemiologíco de la ciudad en color naranja del 17 al 23 de agosto y campaña de prevención en redes sociales “1, 2, 3, por todas y todos” .",2020-08-14,2020Q3,Naranja
48,Plan,Jefatura de Gobierno,Anuncio del semaforo epidemiologíco de la ciudad en color naranja del al 31 de agosto al 6 de septiembre.,2020-08-28,2020Q3,Naranja
413,Plan,Jefatura de Gobierno,Anuncio del semaforo epidemiologíco de la ciudad en color naranja del 28 de septiembre al 4 de octubre.,2020-09-25,2020Q3,Naranja
69,Plan,Jefatura de Gobierno,Decimo primer aviso por el que se da a conocer el color del semaforo epidemiologico de la Ciudad de México permanece en naranja del 27 de julio al 2 de agosto.,2020-07-24,2020Q3,Naranja
256,Plan,Jefatura de Gobierno,Anuncio del semaforo epidemiologíco de la ciudad en color naranja del 24 al 30 de agosto.,2020-08-21,2020Q3,Naranja
38,Plan,Jefatura de Gobierno,Anuncio del semaforo epidemiologíco de la ciudad en color naranja del 21 al 27 de septiembre.,2020-09-18,2020Q3,Naranja


In [30]:
grouped_quarter = filtered_responsible.groupby(["Quarter", "Semaforo"]).count()
grouped_quarter

Unnamed: 0_level_0,Unnamed: 1_level_0,categoria,ente_responsable,medida,fecha_anuncio
Quarter,Semaforo,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
2020Q2,Naranja,2,2,2,2
2020Q2,Rojo,2,2,2,2
2020Q3,Naranja,12,12,12,12
2020Q4,Naranja,2,2,2,2
