# ANALISIS DE INFORMACION DEL DENUE 2019 vs 2020
## Directorio Estadístico Nacional de Unidades Económicas

## Alcance.
Actividad económica "COMERCIO AL POR MENOR" en los períodos:
- 11/2020, 
- 04/2020, 
- 11/2019, y 
- 04/2019.


## 1. Introducción.
DENUE Contiene información en línea de millones de establecimientos en México. Con la pandemia del COVID-19, es importante identificar que unidades de negocio se vieron afectados o florecieron sobre la misma.

## 2. Procedimiento

### 2.1. Importación de paquetes

In [1]:
# Import from basic libraries

import os
import io
import zipfile

# Import from third party libraries

import numpy as np
import pandas as pd

import matplotlib.pyplot as plt
import seaborn as sns
import warnings as ws

ws.filterwarnings('ignore')

import requests

### 2.2. Configuración de Pandas.

In [2]:
# No muestre columnas maximas 
pd.set_option('display.max_columns', None)

### 2.3. Creacción de carpeta de trabajo, donde se descargaran los archivos de trabajo de DENUE.

In [94]:
container_folder =  'data/'

print(os.path.exists(container_folder))

if not (os.path.exists(container_folder)):
    print('--------------------------------')
    print('MSG: Dataset container folder does not exists')
    os.makedirs(container_folder)
    print(f'MSG: Dataset container folder is created with name: {container_folder}')
    print('--------------------------------')

print(os.path.realpath(container_folder))
mode = 0o777
unzipped_folder = 'data/unzippedDD'

print(os.path.exists(unzipped_folder))

if not (os.path.exists(unzipped_folder)):
    print('--------------------------------')
    print('MSG: Dataset container folder does not exists')
    os.makedirs(unzipped_folder, mode)
    print(f'MSG: Dataset container folder is created with name: {unzipped_folder}')
    print('--------------------------------')

print(os.path.realpath(unzipped_folder))

True
C:\fabiola\bedu\Curso3-Procesamiento de datos con Python\proyectos\denue_info\data
False
--------------------------------
MSG: Dataset container folder does not exists
MSG: Dataset container folder is created with name: data/unzippedDD
--------------------------------
C:\fabiola\bedu\Curso3-Procesamiento de datos con Python\proyectos\denue_info\data\unzippedDD


### 2.4. Descarga de archivos ZIP desde el sitio de INEGI y extracción de archivos CVS en ambiente local.
Los archivos CVS corresponden a la actividad económica "COMERCIO AL POR MENOR" en los períodos:
- 11/2020, 
- 04/2020, 
- 11/2019, y 
- 04/2019.


* CONSIDERACIONES:
    * Los archivos CVS se descargan comprimidos.
    * Cada período tiene su liga correspondiente, es decir, son cuatro url's a definir.
    * La información de la actividad económica "COMERCIO AL POR MENOR" contiene gran volumen por lo que está fragmentado en 4 archivos.

#### Configuración de variables a utilizar en los procesos:
* Descarga de archivos ZIP y 
* Descomprensión de archivos con información a utilizar.

In [10]:
# Definición de de URLs base
URL_BASE = 'https://www.inegi.org.mx/contenidos/masiva/denue/'
# URL_BASE_PERIODO_2020_04 = 'https://www.inegi.org.mx/contenidos/masiva/denue/2020_04/'
# Definición de períodos a
PERIODOS = ['2020_11', '2020_04', '2019_11', '2019_04']

# Definición de archivos DENUE
# PERIODO 11_2020
FILES_DENUE = {1:'denue_00_46111_csv',
2:'denue_00_46112-46311_csv',
3:'denue_00_46321-46531_csv',
4:'denue_00_46591-46911_csv',
# PERIODO_04_2020
5:'denue_00_46111_0420_csv',
6:'denue_00_46112-46311_0420_csv',
7:'denue_00_46321-46531_0420_csv',
8:'denue_00_46591-46911_0420_csv',
# PERIODO_11_2019
9:'denue_00_46111_1119_csv',
10:'denue_00_46112-46311_1119_csv',
11:'denue_00_46321-46531_1119_csv',
12:'denue_00_46591-46911_1119_csv',
# PERIODO_04_2019
13:'denue_00_46111_0419_csv',
14:'denue_00_46112-46311_0419_csv',
15:'denue_00_46321-46531_0419_csv',
16:'denue_00_46591-46911_0419_csv'}
print(len(FILES_DENUE))

16


#### Descarga de archivos ZIP en carpeta '.\data\'

In [16]:
# print ("Identificador del diccionario : {}\n".format(id(FILES_DENUE)))
# for k, v in FILES_DENUE.items():
#    print ("{} --> {}".format(k,v))

zips_file = []

for key in FILES_DENUE:
    URL_ONLINE_DATASET = URL_BASE 

    if key in {1,2,3,4}:
        filename = PERIODOS[0] + '_' + FILES_DENUE[key] + '.zip'
    if key in {5,6,7,8}:
        URL_ONLINE_DATASET += (PERIODOS[1] + '/' )
        filename = PERIODOS[1]  + '_' + FILES_DENUE[key] + '.zip'
    if key in {9,10,11,12}:
        URL_ONLINE_DATASET += (PERIODOS[2] + '/' )
        filename = PERIODOS[2]  + '_' + FILES_DENUE[key] + '.zip'
    if key in {13,14,15,16}:
        URL_ONLINE_DATASET += (PERIODOS[3] + '/' )
        filename = PERIODOS[3]  + '_' + FILES_DENUE[key] + '.zip'

    zips_file.append(filename)
    URL_ONLINE_DATASET +=  FILES_DENUE[key] 
    URL_ONLINE_DATASET_zip = ( URL_ONLINE_DATASET + '.zip' )
        
    #print(URL_ONLINE_DATASET)
    print(f'Get {URL_ONLINE_DATASET_zip}')
    # print(filename)
    
    print(f'Download File Number: {key} of {len(FILES_DENUE)}. Wait please...')
    response = requests.get(URL_ONLINE_DATASET_zip)
    print(f'Estatus: {response.status_code}')
    response.raise_for_status()
    with open( container_folder + filename, 'wb') as zip_file:
        zip_file.write(response.content)
    print(f'File downloaded Number: {key} of {len(FILES_DENUE)}')
    print('------------------------------------------------------------------')

print(zips_file)

Get https://www.inegi.org.mx/contenidos/masiva/denue/denue_00_46111_csv.zip
Download File Number: 1 of 16. Wait please...
200
File downloaded Number: 1 of 16
------------------------------------------------------------------
Get https://www.inegi.org.mx/contenidos/masiva/denue/denue_00_46112-46311_csv.zip
Download File Number: 2 of 16. Wait please...
200
File downloaded Number: 2 of 16
------------------------------------------------------------------
Get https://www.inegi.org.mx/contenidos/masiva/denue/denue_00_46321-46531_csv.zip
Download File Number: 3 of 16. Wait please...
200
File downloaded Number: 3 of 16
------------------------------------------------------------------
Get https://www.inegi.org.mx/contenidos/masiva/denue/denue_00_46591-46911_csv.zip
Download File Number: 4 of 16. Wait please...
200
File downloaded Number: 4 of 16
------------------------------------------------------------------
Get https://www.inegi.org.mx/contenidos/masiva/denue/2020_04/denue_00_46111_0420_c

#### Extracción de archivos en carpeta '.\data\unzippedDD'

In [109]:
# print(zips_file)
ruta = os.path.realpath(container_folder) + '\\' 

carpeta = 'conjunto_de_datos'
cvs = '.csv'

print('..............................................................................')
list_files_with_path = []
list_only_files = []
for element in range(len(zips_file)):
    path_file_zip = ''
    archivoCVS = ''
    zf = zipfile.ZipFile(ruta + zips_file[element], 'r')
    prefijo = zips_file[element] 
    prefijo = prefijo[0:8]
    for info in zf.infolist():
        name = info.filename        
        if name.find(carpeta) >= 0:
            if name.find(cvs)  >= 0:
                print(info.filename)
                str_split = name.split('/')
                archivoCVS = str_split[len(str_split)-1]
                path_file_zip = info.filename
    
    unzipped = zipfile.ZipFile(ruta + zips_file[element])
    target_name = os.path.realpath(unzipped_folder) + '\\' + prefijo + archivoCVS
    list_files_with_path.append(target_name)
    list_only_files.append(prefijo + archivoCVS)
    with open(target_name, "wb") as f:  # open the output path for writing
        f.write(unzipped.read(path_file_zip))  # save the contents of the file in path_file_zip
    unzipped.close()
    print(f'File extracted Number: {element+1} of {len(zips_file)}')
    print('..............................................................................')

print('Successfull Extraction!!!')

..............................................................................
conjunto_de_datos/denue_inegi_46111_.csv
File extracted Number: 1 of 16
..............................................................................
conjunto_de_datos/denue_inegi_46112-46311_.csv
File extracted Number: 2 of 16
..............................................................................
conjunto_de_datos/denue_inegi_46321-46531_.csv
File extracted Number: 3 of 16
..............................................................................
conjunto_de_datos/denue_inegi_46591-46911_.csv
File extracted Number: 4 of 16
..............................................................................
conjunto_de_datos/denue_inegi_46111_.csv
File extracted Number: 5 of 16
..............................................................................
conjunto_de_datos/denue_inegi_46112-46311_.csv
File extracted Number: 6 of 16
......................................................................

### 2.5. Consolidación de archivos CVS 

In [110]:
list_files_with_path

['C:\\fabiola\\bedu\\Curso3-Procesamiento de datos con Python\\proyectos\\denue_info\\data\\unzippedDD\\2020_11_denue_inegi_46111_.csv',
 'C:\\fabiola\\bedu\\Curso3-Procesamiento de datos con Python\\proyectos\\denue_info\\data\\unzippedDD\\2020_11_denue_inegi_46112-46311_.csv',
 'C:\\fabiola\\bedu\\Curso3-Procesamiento de datos con Python\\proyectos\\denue_info\\data\\unzippedDD\\2020_11_denue_inegi_46321-46531_.csv',
 'C:\\fabiola\\bedu\\Curso3-Procesamiento de datos con Python\\proyectos\\denue_info\\data\\unzippedDD\\2020_11_denue_inegi_46591-46911_.csv',
 'C:\\fabiola\\bedu\\Curso3-Procesamiento de datos con Python\\proyectos\\denue_info\\data\\unzippedDD\\2020_04_denue_inegi_46111_.csv',
 'C:\\fabiola\\bedu\\Curso3-Procesamiento de datos con Python\\proyectos\\denue_info\\data\\unzippedDD\\2020_04_denue_inegi_46112-46311_.csv',
 'C:\\fabiola\\bedu\\Curso3-Procesamiento de datos con Python\\proyectos\\denue_info\\data\\unzippedDD\\2020_04_denue_inegi_46321-46531_.csv',
 'C:\\fabio

In [111]:
list_only_files

['2020_11_denue_inegi_46111_.csv',
 '2020_11_denue_inegi_46112-46311_.csv',
 '2020_11_denue_inegi_46321-46531_.csv',
 '2020_11_denue_inegi_46591-46911_.csv',
 '2020_04_denue_inegi_46111_.csv',
 '2020_04_denue_inegi_46112-46311_.csv',
 '2020_04_denue_inegi_46321-46531_.csv',
 '2020_04_denue_inegi_46591-46911_.csv',
 '2019_11_denue_inegi_46111_.csv',
 '2019_11_denue_inegi_46112-46311_.csv',
 '2019_11_denue_inegi_46321-46531_.csv',
 '2019_11_denue_inegi_46591-46911_.csv',
 '2019_04_denue_inegi_46111_.csv',
 '2019_04_denue_inegi_46112-46311_.csv',
 '2019_04_denue_inegi_46321-46531_.csv',
 '2019_04_denue_inegi_46591-46911_.csv']

### 2.6. Reading dataset from folder/file


In [None]:
nu_rows = 0
tt_nat = 'denue_inegi_46321-46531_.csv'
t_naturista = { 4 : '2020_11_denue_inegi_46321-46531_.csv', 
                7 : '2020_04_de
               tnue_inegi_46321-46531_.csv', 
               11 : '2019_11_denue_inegi_46321-46531_.csv', 
               15 : '2019_04_denue_inegi_46321-46531_.csv' }
ramo_naturismo = [4, 7, 11, 15]
print('Wait, please...')
frames = []
print('Upload in DataFrame...')
for element in range(len(list_only_files)):
    if (element+1) in {4, 7, 11, 15}:
        print('***********************************************************************************')    
        print(f'Reading file CVS: {list_only_files[element]}. Wait, please...')
        df = pd.read_csv(list_files_with_path[element])
        periodo = list_only_files[element][0:7]
        print(periodo)
        # df['periodo'] = periodo

        df.insert(0, 'periodo', periodo)
        frames.append(df)

        total_rows = df.count() + 1
        nu_rows += total_rows
        print(f'Número de renglones para {list_only_files[element]}: {nu_rows}')
        print(f'Numero de renglones acumulado: {nu_rows}')
        print('***********************************************************************************')

result = pd.concat(frames)
result.shape


In [127]:
result.shape


Unnamed: 0,periodo,id,nom_estab,raz_social,codigo_act,nombre_act,per_ocu,tipo_vial,nom_vial,tipo_v_e_1,nom_v_e_1,tipo_v_e_2,nom_v_e_2,tipo_v_e_3,nom_v_e_3,numero_ext,letra_ext,edificio,edificio_e,numero_int,letra_int,tipo_asent,nomb_asent,tipoCenCom,nom_CenCom,num_local,cod_postal,cve_ent,entidad,cve_mun,municipio,cve_loc,localidad,ageb,manzana,telefono,correoelec,www,tipoUniEco,latitud,longitud,fecha_alta
0,2020_11,45602,AABARROTES LOS PINOS,,461110,"Comercio al por menor en tiendas de abarrotes,...",0 a 5 personas,CALLE,SIERRA DE LA GAVIA,CALLE,SIERRA DE TLAXCO,CALLE,SIERRA DE LA GLORIA,CALLE,SIERRA DEL MAGUEY,221.0,,,,,,FRACCIONAMIENTO,LAS CUMBRES,,,,20175.0,1,AGUASCALIENTES,1,Aguascalientes,1,Aguascalientes,2352,27,,,,Fijo,21.911178,-102.256462,2014-12
1,2020_11,35543,ABAROTES MARCOS,,461110,"Comercio al por menor en tiendas de abarrotes,...",0 a 5 personas,CALLE,SARGENTO LIBERATO SANTA CRUZ,CALLE,DOLORES,CALLE,GENERAL ENRIQUE ESTRADA,CALLE,MELQU�ADES MORENO,604.0,,,,,,COLONIA,GREMIAL,,,,20030.0,1,AGUASCALIENTES,1,Aguascalientes,1,Aguascalientes,052A,17,,,,Fijo,21.893444,-102.291618,2014-12
2,2020_11,20536,ABAROTES MORALES,,461110,"Comercio al por menor en tiendas de abarrotes,...",0 a 5 personas,CALLE,COSIO SUR,CALLE,JUAN DE MONTORO,CALLE,FRANCISCO G. HORNEDO,CALLE,JOSEFA ORTIZ DE DOM�NGUEZ,117.0,,,,0.0,,COLONIA,ZONA CENTRO,,,,20000.0,1,AGUASCALIENTES,1,Aguascalientes,1,Aguascalientes,0712,9,4499154508.0,,,Fijo,21.881855,-102.286655,2010-07
3,2020_11,8797198,ABAROTES ROQUE CORDOVA,,461110,"Comercio al por menor en tiendas de abarrotes,...",0 a 5 personas,CALLE,PI�A,PRIVADA,UVA,CALLE,GUAYABA,CALLE,NOGAL,106.0,1.0,,,,,LOCALIDAD,CANADA GRANDE DE COTORINA,,,,20394.0,1,AGUASCALIENTES,1,Aguascalientes,125,Ca�ada Grande de Cotorina,1763,3,,,,Fijo,21.782423,-102.237041,2019-11
4,2020_11,8500037,ABAROTES WILLIE,,461110,"Comercio al por menor en tiendas de abarrotes,...",0 a 5 personas,AVENIDA,CONSTITUCION,CALLE,ART�CULO CUARTO,CALLE,ARTICULO TERCERO,AVENIDA,CONSTITUCI�N,314.0,,,,0.0,,COLONIA,CONSTITUCION,,,,20126.0,1,AGUASCALIENTES,1,Aguascalientes,1,Aguascalientes,3153,21,,,,Fijo,21.918689,-102.286027,2019-11


In [None]:
result.head(5)

In [128]:
result.tail(5)

Unnamed: 0,periodo,id,nom_estab,raz_social,codigo_act,nombre_act,per_ocu,tipo_vial,nom_vial,tipo_v_e_1,nom_v_e_1,tipo_v_e_2,nom_v_e_2,tipo_v_e_3,nom_v_e_3,numero_ext,letra_ext,edificio,edificio_e,numero_int,letra_int,tipo_asent,nomb_asent,tipoCenCom,nom_CenCom,num_local,cod_postal,cve_ent,entidad,cve_mun,municipio,cve_loc,localidad,ageb,manzana,telefono,correoelec,www,tipoUniEco,latitud,longitud,fecha_alta
553185,2020_11,8395778,WATHERLARA,,461213,Comercio al por menor de bebidas no alcoh�lica...,0 a 5 personas,AVENIDA,GENERAL PANFILO NATERA,CALLE,SANTOS BA�UELOS,CALLE,MATIAS RAMOS,CALLE,MELIT�N ORTEGA,505.0,B,,,,,COLONIA,PANFILO NATERA,,,,98070.0,32,ZACATECAS,56,Zacatecas,1,Zacatecas,0152,9,,,,Fijo,22.765528,-102.572343,2019-11
553186,2020_11,8462971,XOCHIPILLI APIARIOS,,461190,Comercio al por menor de otros alimentos,0 a 5 personas,CALLE,RAMON CORONA,CALLE,IGNACIO DE LA LLAVE,CALLE,SANTOS DEGOLLADO,CALLE,SANTOS DEGOLLADO,402.0,A,,,,,COLONIA,BELLAVISTA,,,,98080.0,32,ZACATECAS,56,Zacatecas,1,Zacatecas,074A,13,,,,Fijo,22.762124,-102.589629,2019-11
553187,2020_11,7453790,ZACATECANA VENTA DE VINOS,,461211,Comercio al por menor de vinos y licores,0 a 5 personas,CALLE,CONSTITUCION,CALLE,GUANAJUATO,CALLE,ROSAS MORENO,CALLE,20 DE NOVIEMBRE,219.0,,,,,,COLONIA,CENTRO,,,,99000.0,32,ZACATECAS,10,Fresnillo,1,Fresnillo,051A,28,,,,Fijo,23.177115,-102.870263,2019-11
553188,2020_11,6417317,ZACATECAS,COLCHAS MEXICO SA DE CV,463112,Comercio al por menor de blancos,0 a 5 personas,AVENIDA,GONZALEZ ORTEGA,AVENIDA,GENERAL ENRIQUEZ ESTRADA,CALLE,JUAREZ,CALLE,JOSEFA ORTIZ DE DOMINGUEZ,178.0,,,,2.0,,COLONIA,CENTRO,,,,98000.0,32,ZACATECAS,56,Zacatecas,1,Zacatecas,010A,36,,IHERNANDEZ@COLCHASCONCORD.COM,,Fijo,22.770229,-102.575697,2010-07
553189,2020_11,7080462,ZANAHORIAS EL REGIN,ZANAHORIAS EL REGIN,461130,Comercio al por menor de frutas y verduras fre...,0 a 5 personas,CALLE,TOMAS ALVA EDISON,CALLE,BENJAMIN FRANKLIN,CALLE,NINGUNO,CALLE,MERCADO DE ABASTOS,2.0,,,,0.0,,MANZANA,MERCADO DE ABASTOS,,,,98056.0,32,ZACATECAS,56,Zacatecas,1,Zacatecas,0627,34,,,,Fijo,22.77204,-102.597781,2019-11
