## Análisis de las importaciones peruanas (2005 -2023)

### Antecendentes

Se analiza las [importaciones peruanas](https://www.sunat.gob.pe/estadisticasestudios/nota_tributaria/cdro_F4.xlsx) segun continente y pais de origen desde el año 2005 al 2023, la informacion se obtuvo de la SUNAT (Superintendencia Nacional de Aduanas y de Administración Tributaria).
El análisis cubre la recuperacion de datos de una base datos, la manipulacion, el cálculo, la visualizacion de datos asi como la respuesta a preguntas comerciales.

El análisis se basa principalmente en Python con un poco de SQL

Se utiliza **pandas** para la manipulacion de datos, **sqlite3** para acceder a la base de datos y **plotly con dash** para la visualizacion.

In [1]:
# importamos las librerias necesarias
import pandas as pd
import sqlite3
import plotly.express as px
import dash
from dash import Dash, html, dcc

### Recuperando los datos y explorando la base de datos

Los datos se almacenan en una base de datos SQLite 'database.db'. Exploremos la base de datos para ver qué tablas están disponibles.

In [3]:
# Conexión a la base de datos
conn = sqlite3.connect('database.db')
pd.read_sql('SELECT name FROM sqlite_master',conn)

Unnamed: 0,name
0,importaciones_pe


Tenemos una tabla 'importaciones_pe'. Ahora veamos que columnas contiene esta tabla

In [4]:
pd.read_sql('PRAGMA table_info(importaciones_pe)',conn)

Unnamed: 0,cid,name,type,notnull,dflt_value,pk
0,0,CONTINENTE,TEXT,0,,0
1,1,PAÍS DE ORIGEN,TEXT,0,,0
2,2,2005,REAL,0,,0
3,3,2006,REAL,0,,0
4,4,2007,REAL,0,,0
5,5,2008,REAL,0,,0
6,6,2009,REAL,0,,0
7,7,2010,REAL,0,,0
8,8,2011,REAL,0,,0
9,9,2012,REAL,0,,0


La tabla se encuentra organizada en un formato ancho, las columnas 'continente' y 'país de origen' tienen variables categóricas y las columnas del '2005 al 2023' variables numericas o continuas.

Necesitaremos todas las columnas de la tabla

In [5]:
# Consulta a la base de datos
query = "SELECT * FROM importaciones_pe"
importaciones_peru = pd.read_sql_query(query, conn)

# Cierre de la conexión a la base de datos
conn.close()
importaciones_peru.head()

Unnamed: 0,CONTINENTE,PAÍS DE ORIGEN,2005,2006,2007,2008,2009,2010,2011,2012,...,2014,2015,2016,2017,2018,2019,2020,2021,2022,2023
0,AFRICA,BENIN,250039.142,436263.164,863989.675,180912.768,736770.816,219417.321,207595.093,0.0,...,0.0,0.0,0.0,0.0,0.0,25.073,0.0,72351.066,290945.925,653301.33
1,AFRICA,BURKINA FASO,996912.905,1839607.587,5403647.574,2589595.658,169829.07,0.0,6569.17,62917.316,...,816.405,62531.582,116464.63,0.0,52.44,1035.717,403.372,7351.635,1049.864,256.107
2,AFRICA,CABO VERDE,3.487,0.0,286.182,40.904,2325.001,18276.205,0.0,41.324,...,773362.166,55841.621,5890.714,761.232,433549.146,639.529,7226.076,1595.359,39093.703,27626.068
3,AFRICA,COSTA DE MARFIL,257252.547,115247.187,852800.76,91206.047,432972.568,367385.22,500534.62,886764.98,...,416772.21,926393.94,2195008.098,2845548.413,3471450.571,0.0,0.0,0.0,0.0,0.0
4,AFRICA,COTE D'IVOIRE,0.0,187308.715,283524.801,519057.639,40448.493,695849.835,922315.195,423414.485,...,408969.733,0.0,0.0,0.0,0.0,490470.306,399368.084,842048.849,2241570.094,3192671.506


La tabla tiene un formato ancho. Convertimos la tabla en un formato largo y los valores de importacion de la tabla las dividimos por un millon para expresarlo en millones de U$$

In [7]:
importacion_peru = pd.melt(importaciones_peru, id_vars=['CONTINENTE', 'PAÍS DE ORIGEN'], var_name='AÑO',
                           value_name='IMPORTACION (millones de US$)')
importacion_peru['IMPORTACION (millones de US$)'] = importacion_peru['IMPORTACION (millones de US$)'] / 1e6

importacion_peru.head()

Unnamed: 0,CONTINENTE,PAÍS DE ORIGEN,AÑO,IMPORTACION (millones de US$)
0,AFRICA,BENIN,2005,0.250039
1,AFRICA,BURKINA FASO,2005,0.996913
2,AFRICA,CABO VERDE,2005,3e-06
3,AFRICA,COSTA DE MARFIL,2005,0.257253
4,AFRICA,COTE D'IVOIRE,2005,0.0


### ¿Cual ha sido la evolucion de las importaciones peruanas?

**La evolución de las importaciones en Perú ha mostrado un aumento constante en general, el año 2005 las importaciones sumaban 12 mil millones de dolares y en el 2023 suman 52 mil millones de dolares, con tres caídas significativas en los años 2009, 2020 y 2023.**

Agrupamos los datos por año e importacion

In [8]:
importacion_peru_evol = importacion_peru.groupby('AÑO')['IMPORTACION (millones de US$)'].sum().reset_index()

In [14]:
# Aplicación Dash para el Gráfico 1
app_graph1 = Dash(__name__)
server_graph1 = app_graph1.server

app_graph1.layout = html.Div([
    dcc.Graph(
        id='graph1',
        figure=px.line(
            data_frame=importacion_peru_evol,
            x='AÑO',
            y='IMPORTACION (millones de US$)',
            title='Gráfico 1 - Evolución de las importaciones Peruanas (2005-2023)'
        ).update_layout(
            xaxis_title='Año',
            yaxis_title='Importación (millones de US$)',
            title_font=dict(size=24, family='Arial', color='black'),
            xaxis=dict(title_font=dict(size=18), tickangle=-45),
            yaxis=dict(title_font=dict(size=18)),
            plot_bgcolor='white',
            paper_bgcolor='white',
            margin=dict(l=50, r=50, t=50, b=50)
        ).update_traces(mode='markers+lines', marker=dict(size=7, color='blue'))
    )
])

if __name__ == '__main__':
    app_graph1.run_server(debug=True, port=8050)

### ¿Cuáles son los principales países de origen de las importaciones en Perú?

- Agrupamos los datos por continente y país de origen
- Sumamos las importaciones anuales por país
- Ordenamos la tabla segun las importaciónes en orden descendente

In [10]:
importacion_pais = importacion_peru.groupby(['CONTINENTE','PAÍS DE ORIGEN'])\
                                            ['IMPORTACION (millones de US$)'].sum().reset_index()
importacion_pais = importacion_pais.sort_values('IMPORTACION (millones de US$)', ascending=False)
importacion_pais.head(10)

Unnamed: 0,CONTINENTE,PAÍS DE ORIGEN,IMPORTACION (millones de US$)
127,ASIA,CHINA,149339.42757
81,AMÉRICA,ESTADOS UNIDOS,138991.047799
70,AMÉRICA,BRASIL,44736.971794
62,AMÉRICA,ARGENTINA,28440.432588
93,AMÉRICA,MEXICO,27571.935239
79,AMÉRICA,ECUADOR,25511.549875
74,AMÉRICA,COLOMBIA,23533.346009
73,AMÉRICA,CHILE,22380.658311
139,ASIA,JAPON,19916.563509
174,EUROPA,ALEMANIA,19391.154499


**Perú importa principalmente de China y Estados Unidos, con una notable diferencia respecto a los demás países.**

In [16]:
# Aplicación Dash para el Gráfico 2
app_graph2 = Dash(__name__)
server_graph2 = app_graph2.server

app_graph2.layout = html.Div([
    dcc.Graph(
        id='graph2',
        figure=px.scatter(
            data_frame=importacion_pais,
            x='CONTINENTE',
            y='IMPORTACION (millones de US$)',
            title='Gráfico 2 - Importaciones por continente de origen (2005-2023)'
        ).update_layout(
            xaxis_title='Continente',
            yaxis_title='Importación (millones de US$)',
            title_font=dict(size=24, family='Arial', color='black'),
            xaxis=dict(title_font=dict(size=18)),
            yaxis=dict(title_font=dict(size=18)),
            plot_bgcolor='white',
            paper_bgcolor='white',
            margin=dict(l=50, r=50, t=50, b=50)
        ).add_annotation(
            x='ASIA',
            y=149339,
            text='China',
            showarrow=False,
            font=dict(size=12, color='black'),
            xshift=0,
            yshift=10,
            align='center'
        ).add_annotation(
            x='AMÉRICA',
            y=138991,
            text='Estados Unidos',
            showarrow=False,
            font=dict(size=12, color='black'),
            xshift=0,
            yshift=10,
            align='center'
        )
    )
])

if __name__ == '__main__':
    app_graph2.run_server(debug=True, port=8051)

**Despues de China y EEUU le siguen en importancia: Brasil, Argentina, Mexico, Ecuador, Colombia, Chile, Japon y Alemania**

In [17]:
importacion_pais_top_10 = importacion_pais.head(10)

In [18]:
# Aplicación Dash para el Gráfico 3
app_graph3 = Dash(__name__)
server_graph3 = app_graph3.server

app_graph3.layout = html.Div([
    dcc.Graph(
        id='graph3',
        figure=px.bar(
            data_frame=importacion_pais_top_10,
            x='PAÍS DE ORIGEN',
            y='IMPORTACION (millones de US$)',
            title='Gráfico 3 - Importación de los 10 principales países a Perú (2005-2023)',
            color='CONTINENTE'
        ).update_layout(
            xaxis_title='País de Origen',
            yaxis_title='Importación (millones de US$)',
            title_font=dict(size=24, family='Arial', color='black'),
            xaxis=dict(title_font=dict(size=18)),
            yaxis=dict(title_font=dict(size=18)),
            plot_bgcolor='white',
            paper_bgcolor='white',
            margin=dict(l=50, r=50, t=50, b=50),
            xaxis_categoryorder='total descending'
        )
    )
])

if __name__ == '__main__':
    app_graph3.run_server(debug=True, port=8052)

### ¿Cuál ha sido la evolución de las importaciones peruanas provenientes de China y Estados Unidos? 

**En términos generales, ambas han experimentado un crecimiento. Hasta el año 2013, las importaciones peruanas desde Estados Unidos superaban a las provenientes de China. Sin embargo, a partir de 2014, la tendencia se invirtió, y las importaciones peruanas desde China han superado consistentemente a las importaciones desde Estados Unidos.**

Seleccionamos las filas correspondientes a los paises de China y Estados Unidos

In [19]:
importaciones_china_eeuu = importacion_peru[importacion_peru['PAÍS DE ORIGEN'].isin(['CHINA','ESTADOS UNIDOS'])]

In [20]:
# Aplicación Dash para el Gráfico 4
app_graph4 = Dash(__name__)
server_graph4 = app_graph4.server

app_graph4.layout = html.Div([
    dcc.Graph(
        id='graph4',
        figure=px.line(
            data_frame=importaciones_china_eeuu,
            x='AÑO',
            y='IMPORTACION (millones de US$)',
            color='PAÍS DE ORIGEN',
            title='Gráfico 4 - Importaciones de China y EE.UU. a Perú (2005-2023)'
        ).update_layout(
            xaxis_title='Año',
            yaxis_title='Importación (millones de US$)',
            title_font=dict(size=24, family='Arial', color='black'),
            xaxis=dict(title_font=dict(size=18), tickangle=-45),
            yaxis=dict(title_font=dict(size=18)),
            legend_title='PAÍS',
            plot_bgcolor='white',
            paper_bgcolor='white',
            margin=dict(l=50, r=50, t=50, b=50)
        ).update_traces(mode='markers+lines', marker=dict(size=5))
    )
])

if __name__ == '__main__':
    app_graph4.run_server(debug=True, port=8053)