En este notebook se muestra el análisis descriptivo de los vectores económicos que incluyen tablas de clasificación y obtención de medidas de tendencia central y disperción muestrales

In [4]:
import os
import glob
import pandas as pd
from warnings import filterwarnings

filterwarnings('ignore')

# Vectores económicos

Exportamos todos los vectores económicos obtenidos en el notebook 1

In [5]:
paises_region = ['Argentina', 'Bolivia', 'Brasil', 'Chile', 'Colombia', 'Ecuador',\
          'Paraguay', 'Peru', 'Sudamerica', 'Uruguay', 'Venezuela']

In [None]:
#Introduzca la dirreción donde estén alojadas las carpetas
dir_vec_eco=sorted(
    glob.glob('... Introduzca Dirección local... /01 - Datos y limpieza/02 - Vectores economicos/*.csv'))

In [7]:
vec_economicos = dict((pais, df) for pais, df in zip(paises_region, map(pd.read_csv, dir_vec_eco)))

#### Ejemplo con el pais de Venezuela

In [5]:
vec_economicos['Venezuela']

Unnamed: 0,Sector,Demanda Intermedia,Demanda Final,Producción Final,Importaciones,Exportaciones,Valor Agregado
0,Agricultura y forestal,5338.946332,3884.490879,9223.437211,375.534505,41.282944,4814.523766
1,Caza y pesca,195.986202,369.581736,565.567938,14.783803,12.727997,444.297439
2,Minería (energía),11197.867163,36809.836803,48007.703966,646.725654,35968.229247,41689.621292
3,Minería (no energía),706.258927,785.658126,1491.917053,113.963853,380.40924,902.427643
4,Carne y derivados,1332.279013,3164.970298,4497.249311,223.652125,1.497244,894.147888
5,"Molinería, panadería y pastas",1246.613302,3926.396143,5173.009445,382.779978,51.05509,2134.348618
6,Azúcar y productos de confitería,379.255681,184.581708,563.837389,61.15814,6.853918,216.913713
7,Otros productos alimenticios,2191.704094,1911.448537,4103.152631,631.605708,121.166399,1315.244789
8,Bebidas,1192.821902,1083.803015,2276.624917,264.164431,84.50534,1080.082428
9,Productos de tabaco,21.435093,262.524417,283.95951,38.203455,116.784393,144.155281


---

# Clasificación de Demanda Intermedia y Producción Final por país

Se clasificó la demanda intermedia y producción total de cada país y la regional

Para ello se sumó la demanda intermedia y la producción final de todos los sectores

In [8]:
demandas_inter  =  [vec_economicos[pais]['Demanda Intermedia'].sum() for pais in paises_region]
producs_finales =  [vec_economicos[pais]['Producción Final'].sum() for pais in paises_region]

dfs = []


clasificacion_dem = pd.DataFrame({'Pais': paises_region, 
                                  'Demanda Intermedia': demandas_inter})
clasificacion_dem= clasificacion_dem.sort_values(by='Demanda Intermedia', ascending= False).reset_index(drop=True)
clasificacion_dem.index+=1
dfs.append(clasificacion_dem)


clasificacion_produ =  pd.DataFrame({'Pais': paises_region, 
                                  'Producción Final': producs_finales})
clasificacion_produ= clasificacion_produ.sort_values(by='Producción Final',
                                                     ascending= False).reset_index(drop=True)
clasificacion_produ.index+=1
dfs.append(clasificacion_produ)


clasificacion_dem_produ =  pd.concat(dfs, keys=['Demanda Intermedia', 'Producción Final'], axis=1)

clasificacion_dem_produ.round(3)

Unnamed: 0_level_0,Demanda Intermedia,Demanda Intermedia,Producción Final,Producción Final
Unnamed: 0_level_1,Pais,Demanda Intermedia,Pais,Producción Final
1,Sudamerica,1233826.777,Sudamerica,2904780.721
2,Brasil,669717.786,Brasil,1556124.958
3,Argentina,144646.22,Argentina,333735.664
4,Chile,114030.22,Chile,271019.21
5,Colombia,99273.232,Colombia,254383.225
6,Venezuela,68325.173,Venezuela,221491.335
7,Peru,50278.91,Peru,131844.109
8,Ecuador,27333.303,Ecuador,73360.944
9,Uruguay,9489.012,Uruguay,27717.88
10,Paraguay,6032.608,Paraguay,18151.567


# Clasificación de vectores económicos

Una vez obtenidos los vectores económicos, procedemos a clasificar por país qué sector son los más influyentes

###### Función ranking

In [10]:
def ranking(data_file, pais=None):
    
    '''
    Calcula un dataframe con las clasificaciones de cada una de 
    las columnas de otro dataframe dado previamente en el 
    parámetro 'data_file'
    
    
    Parámetros
    ----------
    data_file : Un diccionario o un DataFrame de la librería pandas
      El archivo que contiene los datos.

    pais : string, opcional (default=None)
      Si el argumento 'data_file' es un diccionario, este parámetro es necesario,
      ya que actuará como una clave del diccionario
      
    Resultados
    -------
    ranked_dataframe : Dataframe de la libreria Pandas
      Un dataframe de pandas con la información rankeada
    
    '''
    
    #Checa si tengo un data frame
    if isinstance(data_file, pd.core.frame.DataFrame):
        dataframe = data_file
    
    #Si no, entonces obtenemos del diccionario el dataframe
    else:
        dataframe = data_file[pais]
    
    #Estas seran las columnas del dataframe
    columns = dataframe.columns[1:]
    sort_dfs=[]
    
    for vector in list(columns):
        #Para cada variable economica, creamos un dataframe donde se ordenan los sectores
        df= pd.DataFrame({'Sector' : list(dataframe['Sector']),
                          vector     : list(dataframe[vector]) })
        df= df.sort_values(by=vector, ascending= False).reset_index(drop=True)
        df.index+=1
        sort_dfs.append(df)
        
    #Finalmente se juntan todos en uno con columnas jerárquicas
    return pd.concat(sort_dfs, keys=columns, axis=1)

#### Ejemplo del top 10 de sectores de Argentina

In [11]:
ranking(vec_economicos['Argentina']).head(10)

Unnamed: 0_level_0,Demanda Intermedia,Demanda Intermedia,Demanda Final,Demanda Final,Producción Final,Producción Final,Importaciones,Importaciones,Exportaciones,Exportaciones,Valor Agregado,Valor Agregado
Unnamed: 0_level_1,Sector,Demanda Intermedia,Sector,Demanda Final,Sector,Producción Final,Sector,Importaciones,Sector,Exportaciones,Sector,Valor Agregado
1,Otros servicios,29837.554635,Otros servicios,66032.075,Otros servicios,95869.629636,Construcción,2814.311161,Otros productos alimenticios,10301.203316,Otros servicios,63321.4776
2,Agricultura y forestal,17388.074545,Construcción,22872.520188,Construcción,28617.79936,Otros servicios,2038.019269,Agricultura y forestal,5409.572383,Agricultura y forestal,14753.598812
3,Transporte,13020.684654,Otros productos alimenticios,14588.990808,Agricultura y forestal,24128.583711,"Vehículos de motor, remolques y semirremolques",1099.951032,"Coque, petróleo refinado y combustible nuclear",4379.745849,Construcción,10937.639893
4,Servicios a empresas de todo tipo,8517.345235,Transporte,9396.370376,Transporte,22417.055031,Productos químicos básicos,1035.060925,"Vehículos de motor, remolques y semirremolques",2844.772117,Transporte,10198.011141
5,Minería (energía),7437.855006,Agricultura y forestal,6740.509166,Otros productos alimenticios,16768.222665,"Pulpa de madera, papel, imprentas y editoriales",1034.876144,Productos químicos básicos,1513.272257,Minería (energía),7983.45019
6,Construcción,5745.279172,"Coque, petróleo refinado y combustible nuclear",6091.310217,Minería (energía),10999.760305,Otros productos químicos (excluye farmacéuticos),1022.934057,Carne y derivados,1490.044323,Servicios a empresas de todo tipo,6302.165545
7,Hierro y acero,5219.984894,"Vehículos de motor, remolques y semirremolques",5928.222064,Servicios a empresas de todo tipo,9790.86288,Agricultura y forestal,911.014438,Hierro y acero,1387.500462,Otros productos alimenticios,4861.686707
8,Finanzas y seguros,4481.025807,Carne y derivados,4954.636596,"Coque, petróleo refinado y combustible nuclear",9764.108044,Transporte,906.072673,Otros productos químicos (excluye farmacéuticos),1308.354489,"Vehículos de motor, remolques y semirremolques",4230.878433
9,"Pulpa de madera, papel, imprentas y editoriales",4405.880208,Otros productos químicos (excluye farmacéuticos),3844.169505,"Vehículos de motor, remolques y semirremolques",8540.98846,Hierro y acero,897.179718,Minería (no energía),1255.325033,Correo y telecomunicaciones,4182.312507
10,Correo y telecomunicaciones,4340.539833,Correo y telecomunicaciones,3749.58239,Correo y telecomunicaciones,8090.122224,Maquinarias y equipos (excluye maquinaria eléc...,885.850863,Minería (energía),1245.174749,Finanzas y seguros,3875.523267


#### Ejemplo del top 10 de sectores en la región

In [12]:
ranking(vec_economicos['Sudamerica']).head(10)

Unnamed: 0_level_0,Demanda Intermedia,Demanda Intermedia,Demanda Final,Demanda Final,Producción Final,Producción Final,Importaciones,Importaciones,Exportaciones,Exportaciones,Valor Agregado,Valor Agregado
Unnamed: 0_level_1,Sector,Demanda Intermedia,Sector,Demanda Final,Sector,Producción Final,Sector,Importaciones,Sector,Exportaciones,Sector,Valor Agregado
1,Servicios a empresas de todo tipo,172255.755854,Otros servicios,588853.531754,Otros servicios,727883.172299,Otros servicios,12973.017577,Minería (energía),51396.506762,Otros servicios,495912.227097
2,Otros servicios,139029.640546,Construcción,142298.81517,Servicios a empresas de todo tipo,309699.101992,"Coque, petróleo refinado y combustible nuclear",11326.175008,Minería (no energía),35458.774291,Servicios a empresas de todo tipo,212627.98106
3,Agricultura y forestal,101350.332578,Servicios a empresas de todo tipo,137443.346137,Construcción,166500.598746,"Vehículos de motor, remolques y semirremolques",8622.742947,Otros productos alimenticios,22993.941513,Agricultura y forestal,88322.826013
4,Transporte,87956.134305,Otros productos alimenticios,74231.434121,Transporte,154893.801413,Productos químicos básicos,6568.840127,"Coque, petróleo refinado y combustible nuclear",20913.207699,Construcción,85373.412427
5,Finanzas y seguros,68340.616834,Transporte,66937.667108,Agricultura y forestal,151269.532467,Transporte,6239.970595,Agricultura y forestal,17262.899672,Finanzas y seguros,78802.295813
6,Minería (energía),59984.266165,Minería (energía),58823.921495,Finanzas y seguros,120272.897267,Minería (energía),6086.636626,Hierro y acero,12983.846099,Minería (energía),78145.682735
7,Electricidad y gas,57035.651324,Finanzas y seguros,51932.280433,Minería (energía),118808.18766,Servicios a empresas de todo tipo,5954.521355,Servicios a empresas de todo tipo,12075.562851,Transporte,76505.533268
8,"Coque, petróleo refinado y combustible nuclear",53252.756716,Agricultura y forestal,49919.199888,Otros productos alimenticios,109658.974791,Construcción,5738.586137,"Vehículos de motor, remolques y semirremolques",9683.688509,Electricidad y gas,40569.532852
9,Productos químicos básicos,42059.719233,"Vehículos de motor, remolques y semirremolques",46272.496567,"Coque, petróleo refinado y combustible nuclear",92930.904481,Otros productos químicos (excluye farmacéuticos),5238.727563,Metales no ferrosos,9355.645608,Minería (no energía),37763.667021
10,Hierro y acero,37478.829793,"Coque, petróleo refinado y combustible nuclear",39678.147765,Electricidad y gas,77902.934078,Hierro y acero,4504.724836,Carne y derivados,9277.933881,Otros productos alimenticios,28347.508919


#### Exportamos todas las tablas de los rankings para todos los paises, así como para la region

In [13]:
try:
    os.mkdir('01 - Tablas vectores economicos clasificados')
    
except:
    print('La carpeta y los documentos ya fueron creados')
    
for pais in paises_region:      
        ranking(vec_economicos, pais).to_csv(
        r'01 - Tablas vectores economicos clasificados/'+pais+'_VectoresEconomicosRanking.csv'\
                                             ,index = False)

##### Exportaciones de los vectores clasificados con numeros

In [14]:
nombres_a_numeros = {'Agricultura y forestal' : 1,
'Caza y pesca' : 2,
'Minería (energía)' : 3,
'Minería (no energía)' : 4,
'Carne y derivados' : 5,
'Molinería, panadería y pastas' : 6,
'Azúcar y productos de confitería' : 7,
'Otros productos alimenticios' : 8,
'Bebidas' : 9,
'Productos de tabaco' : 10,
'Textiles' : 11,
'Confecciones' : 12,
'Calzado' : 13,
'Madera y productos de madera y corcho' : 14,
'Pulpa de madera, papel, imprentas y editoriales' : 15,
'Coque, petróleo refinado y combustible nuclear' : 16,
'Productos químicos básicos' : 17,
'Otros productos químicos (excluye farmacéuticos)' : 18,
'Productos farmacéuticos' : 19,
'Productos de caucho y plástico' : 20,
'Productos minerales no metálicos' : 21,
'Hierro y acero' : 22,
'Metales no ferrosos' : 23,
'Productos fabricados de metal (excepto maquinarias y equipos)' : 24,
'Maquinarias y equipos (excluye maquinaria eléctrica)' : 25,
'Equipos de oficina (incluye equipo computacional)' : 26,
'Maquinarias y aparatos eléctricos' : 27,
'Radio, televisión y equipos de telecomunicaciones' : 28,
'Equipo médico e instrumentos ópticos y de precisión' : 29,
'Vehículos de motor, remolques y semirremolques' : 30,
'Aeronaves y naves espaciales' : 31,
'Otro equipo de transporte' : 32,
'Otras industrias manufactureras n.c.p.; reciclaje (incluye muebles)' : 33,
'Electricidad y gas' : 34,
'Construcción' : 35,
'Transporte' : 36,
'Correo y telecomunicaciones' : 37,
'Finanzas y seguros' : 38,
'Servicios a empresas de todo tipo' : 39,
'Otros servicios' : 40}

In [15]:
vec_economicos_numeros = vec_economicos.copy()


for df in vec_economicos_numeros.values():
    df.replace(nombres_a_numeros, inplace=True)
    
try:
    os.mkdir('02 - Tablas vectores economicos clasificados con numeros')
    
except:
    print('La carpeta y los documentos ya fueron creados')
    
for pais in paises_region:      
        ranking(vec_economicos_numeros, pais).to_csv(
        r'02 - Tablas vectores economicos clasificados con numeros/'+pais+'_VectoresEconomicosRankingNumeros.csv'\
            ,index = False)

## Posición del sector de Finanzas y Seguros dentro de los vectores económicos

También se obtuvo la posición del sector Finanzas y seguros dentro de la clasificación de los vectores económicos

El sector Finanzas y seguros tiene el número 37

In [11]:
nombre_vectores = ['Demanda Intermedia', 'Demanda Final', 'Producción Final',
       'Importaciones', 'Exportaciones', 'Valor Agregado']

In [12]:
pos_finanzas = dict(
    (pais,[list(vec_economicos[pais][i].sort_values(ascending=False).index).index(37)+1 
           for i in nombre_vectores]) for i in nombre_vectores for pais in paises_region)


pos_finanzas_df = pd.DataFrame(pos_finanzas, index=nombre_vectores)
pos_finanzas_df

Unnamed: 0,Argentina,Bolivia,Brasil,Chile,Colombia,Ecuador,Paraguay,Peru,Sudamerica,Uruguay,Venezuela
Demanda Intermedia,8,13,5,5,5,7,7,7,5,4,6
Demanda Final,14,9,4,18,8,13,30,15,7,7,16
Producción Final,11,11,3,10,7,10,17,10,6,6,10
Importaciones,37,10,13,9,13,34,29,16,15,15,10
Exportaciones,34,11,31,22,36,28,29,15,32,9,31
Valor Agregado,10,6,3,6,7,8,15,8,5,4,9


---

# Medidas de tendencia central y dispersión muestrales

Para una descripción más completa de los vectores económicos, se obtuvieron medidas como: media, mediana, varianza, desviación estándar, asimetría y curtosis

###### Función medidas_dispersion_muestral

In [13]:
def medidf_asimetría.indedas_dispersion_muestral(data_file, pais=None):
    
    '''
    Compute a dataframe with the sample measures of central tendency and dispersion  
    from each of the columns of another previously given dataframe in the 'data_file'
    parameter
    
    Esta función obtiene un dataframe con las medidas muestrales de tendencia central y dispersión
    de cada una de las columnas de otro dataframe dado previamente en el  parámetro 'data_file'
    
    
    Parámetros
    ----------
    data_file : Un diccionario o un dataframe de pandas
      El archivo que contiene los datos
      
    pais : string, opcional (default=None)
      Si el parámetro 'data file' es un diccionario, entonces este parámetro  se usará
      como llave para del diccionario

      
    Resultados
    -------
    dataframe : Un dataframde  la libreria pandas
      Un dataframe de pandas con las tendencias centrales y la dispersión.
      
    Notas
    -------
    Las medidas centrales y de dispersión utilizadas en esta función son: 
    media, mediana, varianza, desviación estándar, asimetría, curtosis

    '''
    
    if isinstance(data_file, pd.core.frame.DataFrame):
        dataframe = data_file
    
    else:
        dataframe = data_file[pais]
    
    
    df = pd.DataFrame(columns=['Datos','Media','Mediana', 'Varianza', 'Desviacion estandar', 
                               'Asimetria', 'Curtosis'])

    nombres_lista= list(dataframe.columns)
    nombres_lista.remove('Sector')
    
    for i in range(len(nombres_lista)):
        medidas=[dataframe[nombres_lista[i]].mean() , dataframe[nombres_lista[i]].median(), 
                            dataframe[nombres_lista[i]].var()  , dataframe[nombres_lista[i]].std(), 
                            dataframe[nombres_lista[i]].skew() , dataframe[nombres_lista[i]].kurt()]
        
        df.loc[i] = [nombres_lista[i]] + medidas

    return df

#### Ejemplo para Colombia

In [14]:
medidas_dispersion_muestral(vec_economicos['Colombia'])

Unnamed: 0,Datos,Media,Mediana,Varianza,Desviacion estandar,Asimetria,Curtosis
0,Demanda Intermedia,2481.830793,926.011417,14215370.0,3770.327214,2.993698,10.457611
1,Demanda Final,3877.749824,1159.802994,118645600.0,10892.455583,5.638202,33.631769
2,Producción Final,6359.580617,2481.232388,195699500.0,13989.265425,5.328765,31.132878
3,Importaciones,344.282052,225.235994,219936.1,468.973491,3.39015,14.602502
4,Exportaciones,551.373382,254.062048,1161572.0,1077.762505,4.567044,24.154175
5,Valor Agregado,3385.689964,694.388809,79532030.0,8918.073421,5.399323,31.705858


#### Ejemplo Regional

In [15]:
medidas_dispersion_muestral(vec_economicos['Sudamerica'])

Unnamed: 0,Datos,Media,Mediana,Varianza,Desviacion estandar,Asimetria,Curtosis
0,Demanda Intermedia,30845.669434,17349.582978,1434434000.0,37873.915971,2.200904,5.23967
1,Demanda Final,41773.848582,16788.280973,8886462000.0,94268.030505,5.311652,30.762428
2,Producción Final,72619.518016,36036.585816,14865100000.0,121922.50811,4.36644,22.186583
3,Importaciones,3047.361803,1944.359276,8996351.0,2999.391794,1.667247,2.807021
4,Exportaciones,6930.449389,2792.976383,106480200.0,10318.922986,2.836337,9.189528
5,Valor Agregado,37588.590049,10684.557646,7058826000.0,84016.817543,4.611333,23.829993


#### Exportamos los archivos de todos los paises y de la region

In [16]:
try:
    os.mkdir('03 - Medidas de tendencia central y dispersión')

    for pais in paises_region:      
        medidas_dispersion_muestral(vec_economicos[pais]).to_csv(\
        r'03 - Medidas de tendencia central y dispersión/'+pais+\
        '_MedidasCentralDispersion.csv' , index = False)
except:
    print('La carpeta y los datos ya fueron creados')

## Asimetrías

En especial, nos enfocamos en mostrar las asimetrías de todos los países y los vectores económicos

In [18]:
df_asimetria = pd.DataFrame(dict((pais, medidas_dispersion_muestral(vec_economicos[pais])['Asimetria'].to_list())
                                 for pais in paises_region), index= nombre_vectores)

df_asimetria

Unnamed: 0,Argentina,Bolivia,Brasil,Chile,Colombia,Ecuador,Paraguay,Peru,Sudamerica,Uruguay,Venezuela
Demanda Intermedia,3.331831,2.78169,2.717722,2.972952,2.993698,2.419346,3.6137,3.204898,2.200904,2.687314,2.572403
Demanda Final,5.02729,5.187666,4.962023,3.749224,5.638202,4.619629,3.663026,4.47919,5.311652,5.690096,3.58263
Producción Final,4.793172,4.077085,3.947881,2.529232,5.328765,4.314286,3.835216,4.467873,4.36644,5.173055,3.509769
Importaciones,2.298425,3.110813,1.770949,3.211629,3.39015,2.491077,4.167899,3.322235,1.667247,3.660902,2.176708
Exportaciones,3.733431,3.844553,1.126786,5.470812,4.567044,4.987744,2.822264,4.443882,2.836337,2.30197,5.558245
Valor Agregado,5.38982,4.533005,4.124288,4.117446,5.399323,4.830689,3.936884,4.754091,4.611333,5.580248,3.978703


---

# Información del notebook

In [19]:
import session_info
session_info.show(cpu=True, html=False)

-----
pandas              1.3.3
session_info        1.0.0
-----
IPython             7.20.0
jupyter_client      6.1.11
jupyter_core        4.7.1
notebook            6.2.0
-----
Python 3.8.10 (default, Mar 13 2023, 10:26:41) [GCC 9.4.0]
Linux-5.15.0-67-generic-x86_64-with-glibc2.29
4 logical CPU cores, x86_64
-----
Session information updated at 2023-03-27 14:34
