### Proyecto final - Data Analyst - GreenShark

#### Erick Macías

1. **El problema**: actualmente es costoso y poco accesible encontrar información de ventas a nivel de establecimientos en una zona geográfica dada. Dicha información permite entender la dinámica de un sector en específico a nivel de establecimientos, y permite oprimizar la toma de decisiones que comunmente se busca con un estudio de mercado, los cuales sulen ser costos y tardados. 

2. **El objetivo**: estimar las ventas de los establecimientos dedicados a drindar el servicio de acondicionamiento físico (gimnasios)  en la Benito Juárez. Se toma este caso particular, suponiendo que el uso del análisis, en este caso, será para evaluar la viabilidad de abrir un gimnasio en en esta delegación, tomando como principal indicador la magnitud de sus ingresos. Si es posible lograr este objetivo, este análisis puede ser herramienta útil para replicarse a cualquier industria que se quiere investigar y tomar decisiones optimas de manera más rápida y eficiente.

#### En este notbook vamos a  preparar las diferentes bases que combinaremos para hacer la estimación de las ventas para los establecimientos del sector elegido.

*Primero.* Se utilizará la **API del INEGI - DENUE** para extraer los datos de los establecimientos dedicados a brindar el servicio de GYM. La API regresa los datos en formato json por lo que hay que estructurar dicha data.

In [10]:
import requests
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline

In [12]:
#Vamos a guardar el token en una variable

token_inegi = 'a3b8464e-1fd8-449c-a5f8-4410c02ec510'

In [13]:
#En esta variable podemos nombrar el nombre del sector que se quiere analizar segun el scian, en nuestro caso es el:
#713943 Centros de acondicionamiento físico del sector privado
#Se puede consultar todo el catalogo de clasificación de establecimientos en http://www.beta.inegi.org.mx/app/scian/

scian_nombre = '"Centros de acondicionamiento físico del sector privado"'
num_entidad = '09' #Corresponde a la CDMX 

In [14]:
url_api_gym = 'http://www3.inegi.org.mx/sistemas/api/denue/v1/consulta/buscarEntidad/'+scian_nombre+'/'+num_entidad+'/1/11000/'+token_inegi

In [15]:
url_api_gym

'http://www3.inegi.org.mx/sistemas/api/denue/v1/consulta/buscarEntidad/"Centros de acondicionamiento físico del sector privado"/09/1/11000/a3b8464e-1fd8-449c-a5f8-4410c02ec510'

In [5]:
#Se aplica el método get a la API del DENUE y se lee el archivo json que regresa.
r = requests.get(url_api_gym)
x = r.json()

In [6]:
#Vemos como se ve el json del DENUE
x

[{'CP': '11550',
  'Calle': 'ANATOLE FRANCE',
  'Clase_actividad': 'Centros de acondicionamiento físico del sector privado',
  'Colonia': 'POLANCO REFORMA',
  'Correo_e': 'INFO@EVOLUTIONPILATES.COM.MX',
  'Estrato': '11 a 30 personas',
  'Id': '689998',
  'Latitud': '19.43242053',
  'Longitud': '-99.19751597',
  'Nombre': '+EVOLUTION PILATES FITNNESS',
  'Num_Exterior': '129',
  'Num_Interior': '',
  'Razon_social': '',
  'Sitio_internet': 'WWW.EVOLUTIONPILATES.COM.MX',
  'Telefono': '5552818011',
  'Tipo': 'Fijo',
  'Tipo_vialidad': 'CALLE',
  'Ubicacion': 'MIGUEL HIDALGO, Miguel Hidalgo, CIUDAD DE MÉXICO'},
 {'CP': '07080',
  'Calle': 'CABO VERDE',
  'Clase_actividad': 'Centros de acondicionamiento físico del sector privado',
  'Colonia': 'GABRIEL HERNANDEZ',
  'Correo_e': '',
  'Estrato': '6 a 10 personas',
  'Id': '752673',
  'Latitud': '19.49710213',
  'Longitud': '-99.09947190',
  'Nombre': '4LMENTS',
  'Num_Exterior': '18',
  'Num_Interior': '',
  'Razon_social': '',
  'Sitio_in

In [7]:
#Leemos el json como un DataFrame
gyms_cdmx = pd.DataFrame(x)
gyms_cdmx.head()

Unnamed: 0,CP,Calle,Clase_actividad,Colonia,Correo_e,Estrato,Id,Latitud,Longitud,Nombre,Num_Exterior,Num_Interior,Razon_social,Sitio_internet,Telefono,Tipo,Tipo_vialidad,Ubicacion
0,11550,ANATOLE FRANCE,Centros de acondicionamiento físico del sector...,POLANCO REFORMA,INFO@EVOLUTIONPILATES.COM.MX,11 a 30 personas,689998,19.43242053,-99.19751597,+EVOLUTION PILATES FITNNESS,129,,,WWW.EVOLUTIONPILATES.COM.MX,5552818011.0,Fijo,CALLE,"MIGUEL HIDALGO, Miguel Hidalgo, CIUDAD DE MÉXICO"
1,7080,CABO VERDE,Centros de acondicionamiento físico del sector...,GABRIEL HERNANDEZ,,6 a 10 personas,752673,19.49710213,-99.0994719,4LMENTS,18,,,,,Fijo,CALLE,"GUSTAVO A. MADERO, Gustavo A. Madero, CIUDAD D..."
2,6170,ALFONSO REYES,Centros de acondicionamiento físico del sector...,HIPÓDROMO CONDESA,,6 a 10 personas,867230,19.41105369,-99.18176246,4U GYM,0,,,4UGYM.COM.MX,5552712042.0,Fijo,CALLE,"CUAUHTÉMOC, Cuauhtémoc, CIUDAD DE MÉXICO"
3,3910,INSURGENTES SUR,Centros de acondicionamiento físico del sector...,SAN JOSÉ INSURGENTES,,6 a 10 personas,6785444,19.36301818,-99.18258457,8W BARRANCA DEL MUERTO,1647,,OCHO SEMANAS I SAPI SA DE CV,,,Fijo,AVENIDA,"BENITO JUÁREZ, Benito Juárez, CIUDAD DE MÉXICO"
4,6100,3 SUR (AVENIDA BAJA CALIFORNIA),Centros de acondicionamiento físico del sector...,HIPÓDROMO,,6 a 10 personas,6734479,19.40587201,-99.17085291,8W CONDESA,261,,OCHO SEMANAS I SAPI SA DE CV,,,Fijo,EJE VIAL,"CUAUHTÉMOC, Cuauhtémoc, CIUDAD DE MÉXICO"


In [8]:
#Agregamos una columna de Entidad y Municipio, la cual va ser clave para el análisis posterior.
gyms_cdmx['Entidad'] =  ( 
                         gyms_cdmx['Ubicacion']
                         .str.split(',')
                         .str[2]
                         .str.replace('É', 'E')
                         )  

In [9]:
#Agregamos una columna de Municipio
gyms_cdmx['Municipio'] =  ( 
                             gyms_cdmx['Ubicacion']
                             .str.split(',')
                             .str[0]
                             .str.replace('Á', 'A')
                             .str.replace('É', 'E')
                             .str.replace('Í', 'I')
                             .str.replace('Ó', 'O')
                             .str.replace('Ú', 'U')
                           )   

*Segundo.* Ahora toca extraer la data de los **Censos Económicos 2014**, de forma tal que nos permita estimar el valor de las ventas en la CDMX del sector con SCIAN 713943. Para el análisis debemos tomar en cuenta tres puntos

> -El objetivo es distribuir el valor total del indicador de ingresos de dicho sector para cada delegación, y posteriormente para cada establecimiento en función de su tamaño, medido por el estrato de personal ocupado.

> -Para lograr lo anterior, debemos tomar 2 bases de datos de los CE, pero con información a difertente nivel de desagregación y estimar a partir de indices las proporciones para distribuir los valores de venta para cada establecimiento.

> -Este modelo permiitrá visualizar la magnitud de las ventas de los establecimientos en función de su tamaño, no pretende ser un modelo que permita estimar ventas reales de un establecimiento en especifico. Toda vez que el objetivo específico del modelo es  dar un valor de referencia que facilite la toma de decisiones. Y así contar con una herramienta que permita reducir los costos asociados al trabajo de campo o sondeo que tradicionalmente hacen las grandes empresas para medir magnitudes de mercado a nivel de unidad económica. De esta forma hacemos accesible y al alcance de cualquier negocio  información económica a nivel geográfico y de establecimiento que optimice su toma de decisiones.


In [16]:
#La primera base de datos incluye infromación de los indicadores del censo a nivel de entidad y municipio.
#La base de datos se consulto en https://datos.gob.mx/busca/dataset/censos-economicos-2004-2014

ce_cdmx_mpio = (pd.read_csv(r'C:\Users\Erick\Documents\Mis Docs Erick\12_DATA ANALYS_GREENSHARK\Data_Analyst_Abril_2018\Proyecto final\data_input\ce_inegi_cdmx_mpio.csv',
                           low_memory=False))
ce_cdmx_mpio.head()

Unnamed: 0,clave_entidad,entidad_federativa,clave_municipio,municipio,clave_actividad_economica,actividad_economica,anio_censal,UE,A111A,A121A,...,P100B,Q000A,Q000B,Q000C,Q000D,Q010A,Q020A,Q030A,Q400A,Q900A
0,9,Ciudad de México,,,,Total Estatal,2004,342475,1561323.953,602503.471,...,52875.194,662462.535,60139.991,58660.153,9307.466,312569.605,224590.87,30504.568,34139.866,60657.626
1,9,Ciudad de México,,,,Total Estatal,2009,382056,2340771.99,1007843.006,...,74680.602,1033824.414,108487.327,124965.327,18492.674,324698.716,520298.931,41805.795,52331.476,94689.496
2,9,Ciudad de México,,,,Total Estatal,2014,415481,2943782.839,1408762.132,...,76848.574,2863865.216,148863.12,121574.916,28071.332,1012005.945,1449208.9,162720.035,65235.691,174694.645
3,9,Ciudad de México,,,11,"Agricultura, cría y explotación de animales, a...",2014,17,35.674,14.208,...,0.0,16.804,1.498,0.096,0.0,3.273,9.3,1.12,0.389,2.722
4,9,Ciudad de México,,,11C,Subsectores agrupados por el principio de conf...,2014,17,35.674,14.208,...,0.0,16.804,1.498,0.096,0.0,3.273,9.3,1.12,0.389,2.722


In [18]:
#Me quedo solo con los campos de interés

ce_cdmx_mpio = ce_cdmx_mpio[['anio_censal',
                             'clave_entidad',
                             'entidad_federativa',
                             'clave_municipio',
                             'municipio',
                             'clave_actividad_economica',
                             'actividad_economica',
                             'UE',
                             'H001A',#personal_ocupado_total
                             'H001B',#personal_ocupado_hom
                             'H001C',#personal_ocupado_muj
                             'K000A',#Total_ingreso
                             'A700A',#Ingresos_bys
                             'J000A',#Remuneraciones/salario
                             'M000A',#Gasto_ingreso
                             'A800A']]#Gasto_bys
ce_cdmx_mpio.head(5)

Unnamed: 0,anio_censal,clave_entidad,entidad_federativa,clave_municipio,municipio,clave_actividad_economica,actividad_economica,UE,H001A,H001B,H001C,K000A,A700A,J000A,M000A,A800A
0,2004,9,Ciudad de México,,,,Total Estatal,342475,2842874,1762761,1080113,1113201.409,1700873.545,246760.939,1573471.093,2514844.957
1,2009,9,Ciudad de México,,,,Total Estatal,382056,3299325,1969647,1329678,2253628.476,4017057.643,277277.237,2732374.045,4122882.015
2,2014,9,Ciudad de México,,,,Total Estatal,415481,3603572,2105450,1498122,2049042.824,3088556.059,380314.987,2828079.281,4215502.308
3,2014,9,Ciudad de México,,,11,"Agricultura, cría y explotación de animales, a...",17,125,83,42,14.208,14.558,6.622,35.592,36.116
4,2014,9,Ciudad de México,,,11C,Subsectores agrupados por el principio de conf...,17,125,83,42,14.208,14.558,6.622,35.592,36.116


In [19]:
#Vamos a filtrar solo el sector que nos interesa estudiar y lo guardamos en un nuevo data frame

scian_sector = '713943'

ce_cdmx_mpio_gym = ce_cdmx_mpio[ce_cdmx_mpio['clave_actividad_economica'] == scian_sector]

In [13]:
#Cargamos el diccionario de datos para poder nombrar las columnas de los indicadores
ce_cdmx_mpio_dict = (pd.read_csv(r'C:\Users\Erick\Documents\Mis Docs Erick\12_DATA ANALYS_GREENSHARK\Data_Analyst_Abril_2018\Proyecto final\data_input\ce_inegi_cdmx_mpio_dict.csv',
                           low_memory=False))


In [14]:
#vamos a quedarnos solo con los campos que nos importan.
#primero agregamos una columna que solo contenga el nombre del indicador del CE.

ce_cdmx_mpio_dict['Indicador'] =  ( 
                                     ce_cdmx_mpio_dict['Definición']
                                     .str.split('.')
                                     .str[0]
                                     .str.replace('Á', 'A')
                                     .str.replace('É', 'E')
                                     .str.replace('Í', 'I')
                                     .str.replace('Ó', 'O')
                                     .str.replace('Ú', 'U')
                                     .str.replace('á', 'a')
                                     .str.replace('é', 'e')
                                     .str.replace('í', 'i')
                                     .str.replace('ó', 'o')
                                     .str.replace('ú', 'u')
                                   )

In [15]:
#Modificamos el nombre de los campos de interes del diccionario

ce_cdmx_mpio_dict = ce_cdmx_mpio_dict.rename(columns = {
                                    'Nombre del Atributo en CSV' : 'nombre_campo',
                                    'Tipo de dato' : 'tipo_dato',
                                    'Longitud' : 'longitud',
                                    'Indicador' : 'nombre_indicador'
                                    })

In [20]:
ce_cdmx_mpio_dict = ce_cdmx_mpio_dict[[ 'nombre_campo',
                                        'nombre_indicador',
                                        'tipo_dato',
                                        'longitud']] 

ce_cdmx_mpio_dict.head()

Unnamed: 0,nombre_campo,nombre_indicador,tipo_dato,longitud
0,clave_entidad,Clave de entidad,alfanumérico,2
1,entidad_federativa,Entidad federativa,alfanumérico,60
2,clave_municipio,Clave municipio,alfanumérico,5
3,municipio,Municipio,alfanumérico,100
4,clave_actividad_economica,Clave actividad economica,alfanumérico,25


In [21]:
#Dejo el diccionario de datos en formato de diccionario, en este formato ya es sencillo asignar el nombre a los campos 
#codificados.
dict_ce = dict(zip(ce_cdmx_mpio_dict['nombre_campo'], ce_cdmx_mpio_dict['nombre_indicador']))


La seunda base de datos que vamos a necesitar es igualmente del CE 2014, pero con diferente desagregación.
Dicha BD contiene información a nivel de entidad federativa y estrato de personal ocupado. Desafortunadamente, 
por temas de confidencialidad no se encontrará data disponible a este nivel pero con rango de personal ocupado, de lo contrario este ejercicio no sería necesario. 

In [22]:
#Aquí se puede enconrar la data por tamaño de la UE http://www.beta.inegi.org.mx/app/descarga/?p=1664&ag=00&da=1
#Aquí se puede descargar la data por estrato, que es la más útil, para estimar el estrato a nivel de municipio http://www.beta.inegi.org.mx/proyectos/ce/2014/

ce_cdmx_espo = (pd.read_excel(r'C:\Users\Erick\Documents\Mis Docs Erick\12_DATA ANALYS_GREENSHARK\Data_Analyst_Abril_2018\Proyecto final\data_input\ce_inegi_cdmx_espo.xlsx',
                             sheet_name = 'Cuadro gedfce14_02',
                             header = 9))


In [23]:
ce_cdmx_espo.head()

Unnamed: 0,ENTIDAD FEDERATIVA,SECTOR,SUBSECTOR,RAMA,CLASE,TAMAÑO DE LA UNIDAD ECONÓMICA,DENOMINACIÓN,UNIDADES ECONÓMICAS,TOTAL-PERSONAL OCUPADO,TOTAL-PERSONAL OCUPADO DEPENDIENTE DE LA RAZÓN SOCIAL,...,REMUNERACIONES,GASTOS POR CONSUMO DE BIENES Y SERVICIOS,INGRESOS POR SUMINISTRO DE BIENES Y SERVICIOS,PRODUCCIÓN BRUTA TOTAL,CONSUMO INTERMEDIO,VALOR AGREGADO CENSAL BRUTO,FORMACIÓN BRUTA DE CAPITAL FIJO,VARIACIÓN TOTAL DE EXISTENCIAS,ACTIVOS FIJOS,DEPRECIACIÓN DE ACTIVOS FIJOS
0,09 DF,,,,,,Distrito Federal,415481,3603572.0,2805367.0,...,380314.987,2049042.824,2828079.281,2943782.839,1408762.132,1535020.707,93503.584,11074.824,2863865.216,148863.11988
1,09 DF,,,,,01) Hasta 2,Hasta 2 personas,279226,397831.0,391452.0,...,2920.973,75874.439,93214.93,148605.383,41260.866,107344.517,1080.741,371.928,29560.585,2513.13957
2,09 DF,,,,,02) De 3 a 5,De 3 a 5 personas,82863,298272.0,280702.0,...,7086.084,76811.51,99756.358,95394.465,40720.893,54673.572,883.729,219.35,22768.164,2037.73923
3,09 DF,,,,,03) De 6 a 10,De 6 a 10 personas,25459,189562.0,162418.0,...,8465.697,80104.963,122964.529,80408.738,33928.979,46479.759,1170.775,448.859,25729.248,2604.59051
4,09 DF,,,,,04) De 11 a 15,De 11 a 15 personas,8202,105704.0,84937.0,...,5425.57,56826.794,75089.182,64676.069,23252.103,41423.966,948.358,286.096,15411.253,1510.04847


In [28]:
#Renombramos columnas, ya que contienen muchos saltos de linea
ce_cdmx_espo = ce_cdmx_espo.rename(columns = {
                                              'ENTIDAD FEDERATIVA\n' : 'entidad_federativa0',
                                              'SECTOR' : 'sector',                                                    
                                              'SUBSECTOR' : 'subsector',
                                              'RAMA' : 'rama',
                                              'CLASE' : 'clase',
                                              'DENOMINACIÓN' : 'estrato',
                                              'TAMAÑO DE LA \nUNIDAD ECONÓMICA' : 'tamanio_ue',
                                              'UNIDADES ECONÓMICAS' : 'UE',
                                              'TOTAL-PERSONAL OCUPADO' : 'H001A',
                                              'TOTAL-PERSONAL OCUPADO DEPENDIENTE DE LA RAZÓN SOCIAL' : 'H000A',
                                              'PERSONAL \nOCUPADO REMUNERADO' : 'H010A',
                                              'PERSONAL OCUPADO-PROPIETARIOS, FAMILIARES Y OTROS TRABAJADORES NO REMUNERADOS' : 'H020A',
                                              'PERSONAL OCUPADO-NO DEPENDIENTE \nDE LA RAZÓN SOCIAL' : 'I000A',
                                              'REMUNERACIONES' : 'J000A',
                                              'GASTOS \nPOR CONSUMO \nDE BIENES\nY SERVICIOS' : 'K000A',
                                              'PRODUCCIÓN \nBRUTA TOTAL' : 'A111A',
                                              'CONSUMO INTERMEDIO' : 'A121A',
                                              'VALOR AGREGADO CENSAL BRUTO              ' : 'A131A',
                                              'FORMACIÓN BRUTA \nDE CAPITAL FIJO' : 'A221A',
                                              'VARIACIÓN TOTAL\nDE EXISTENCIAS' : 'P000C',
                                              'ACTIVOS FIJOS' : 'O020A',
                                              'DEPRECIACIÓN \nDE ACTIVOS FIJOS' : 'Q000B',
                                              'INGRESOS \nPOR SUMINISTRO \nDE BIENES \nY SERVICIOS': 'M000A' 
                                             })
ce_cdmx_espo.head(50)

Unnamed: 0,entidad_federativa0,sector,subsector,rama,clase,tamanio_ue,estrato,UE,H001A,H000A,...,J000A,K000A,M000A,A111A,A121A,A131A,A221A,P000C,O020A,Q000B
0,09 DF,,,,,,Distrito Federal,415481,3603572.0,2805367.0,...,380314.987,2049042.824,2828079.281,2943782.839,1408762.132,1535020.707,93503.584,11074.824,2863865.216,148863.11988
1,09 DF,,,,,01) Hasta 2,Hasta 2 personas,279226,397831.0,391452.0,...,2920.973,75874.439,93214.93,148605.383,41260.866,107344.517,1080.741,371.928,29560.585,2513.13957
2,09 DF,,,,,02) De 3 a 5,De 3 a 5 personas,82863,298272.0,280702.0,...,7086.084,76811.51,99756.358,95394.465,40720.893,54673.572,883.729,219.35,22768.164,2037.73923
3,09 DF,,,,,03) De 6 a 10,De 6 a 10 personas,25459,189562.0,162418.0,...,8465.697,80104.963,122964.529,80408.738,33928.979,46479.759,1170.775,448.859,25729.248,2604.59051
4,09 DF,,,,,04) De 11 a 15,De 11 a 15 personas,8202,105704.0,84937.0,...,5425.57,56826.794,75089.182,64676.069,23252.103,41423.966,948.358,286.096,15411.253,1510.04847
5,09 DF,,,,,05) De 16 a 20,De 16 a 20 personas,4381,79471.0,63099.0,...,4430.143,43735.347,59617.06,32467.716,17684.057,14783.659,488.231,-70.697,13015.139,1482.79905
6,09 DF,,,,,06) De 21 a 30,De 21 a 30 personas,4618,116343.0,92083.0,...,6943.789,78953.052,92557.529,52318.736,37957.294,14361.442,1271.713,-49.427,27018.197,3364.04799
7,09 DF,,,,,07) De 31 a 50,De 31 a 50 personas,4366,173915.0,131136.0,...,11611.492,124448.312,177489.214,116954.906,61875.786,55079.12,3469.469,34.724,64436.659,6838.97955
8,09 DF,,,,,08) De 51 a 100,De 51 a 100 personas,2922,207243.0,133891.0,...,15789.495,199187.453,261959.993,168313.062,98295.68,70017.382,4646.195,-252.577,98966.196,6052.78576
9,09 DF,,,,,09) De 101 a 250,De 101 a 250 personas,2143,331670.0,211073.0,...,28873.523,278617.217,352925.602,231107.408,135177.5,95929.908,4095.021,-568.487,81448.423,6649.7784


In [29]:
#Se tiene que agregar las columnas: anio_censal, clave_entidad, entidad_federativa, 
#clave_actividad_economica, actividad_economica. Para poder realizar los cruces pertinentes.

ce_cdmx_espo['anio_censal'] =  2014

ce_cdmx_espo['clave_entidad'] =  ( 
                                     ce_cdmx_espo['entidad_federativa0']
                                     .str.split('\s')
                                     .str[0]
                                   )

ce_cdmx_espo['entidad_federativa'] =  ( 
                                         ce_cdmx_espo['entidad_federativa0']
                                         .str.split('\s')
                                         .str[1]
                                       )


ce_cdmx_espo.head(2)

Unnamed: 0,entidad_federativa0,sector,subsector,rama,clase,tamanio_ue,estrato,UE,H001A,H000A,...,A111A,A121A,A131A,A221A,P000C,O020A,Q000B,anio_censal,clave_entidad,entidad_federativa
0,09 DF,,,,,,Distrito Federal,415481,3603572.0,2805367.0,...,2943782.839,1408762.132,1535020.707,93503.584,11074.824,2863865.216,148863.11988,2014,9,DF
1,09 DF,,,,,01) Hasta 2,Hasta 2 personas,279226,397831.0,391452.0,...,148605.383,41260.866,107344.517,1080.741,371.928,29560.585,2513.13957,2014,9,DF


#### Importando los datos a MySql

Una vez explicado y preparados todos los insumos de data para el modelo, es hora de indexar cada fuente de datos en MySQL.
En donde haremos un poco más de limpieza de datos para que sean consumidas por el modelo de manera eficiente.

In [21]:
import MySQLdb

In [22]:
#Conexion a la base de datos de mysql proyecto_final

mysql_conexion =  MySQLdb.connect(host = 'localhost',
                                 port = 3306,
                                 user = 'root',
                                 passwd = 'Adriff22',
                                 db = 'proyecto_final')

In [23]:
from sqlalchemy import create_engine
engine = create_engine("mysql+mysqldb://root:"+'Adriff22'+"@localhost/proyecto_final")

Ahora vamos a importar a mysql los siguientes data frames: 
> -DENUE con iformación de los establecimientos en la CDMX del sector de gimnasios: **'gyms_cdmx'**

> -Censos Económicos 2014, con datos a nivel de municipio en la CDMX y del sector 713943 : **'ce_cdmx_mpio_gym'**

> -Diccionario de datos de los Censos Económicos 2014: **'ce_cdmx_mpio_dict'**

> -Censos Económicos 2014, con datos a nivel de estrato de personal ocupado en la CDMX: **'ce_cdmx_espo'**

In [33]:
gyms_cdmx.to_sql("dnue_cdmx_713943", con = engine, if_exists = 'replace', index = True)

  cursor.execute(statement, parameters)
  cursor.execute(statement, parameters)


In [24]:
ce_cdmx_mpio_gym.to_sql("ce_cdmx_mpio_713943", con = engine, if_exists = 'replace', index = True)

  cursor.execute(statement, parameters)
  cursor.execute(statement, parameters)


In [35]:
ce_cdmx_mpio_dict.to_sql("ce_cdmx_mpio_dict", con = engine, if_exists = 'replace', index = True)

In [36]:
ce_cdmx_espo.to_sql("ce_cdmx_espo", con = engine, if_exists = 'replace', index = True)