![image.png](attachment:image.png)

# ¿Qué efecto ha tenido sobre las importaciones/exportaciones de F&H?¿Ha tenido algún efecto especial el periodo de excepción (Marzo, abril y mayo)?

Fuentes de datos:
    Dataset4.- Comercio Exterior de España (eurostat)
    
*Puede ver el análisis detallado en el siguiente enlace: https://datacrop.es/reto-analisis-3/*

In [1]:
import pandas as pd
import numpy as np
import glob
from IPython.display import IFrame
import matplotlib.pyplot as plt
import seaborn as sns
import datetime as dt
import locale
import warnings
# Cleaning warnings
warnings.simplefilter(action='ignore', category=FutureWarning)
locale.setlocale(locale.LC_TIME, 'es_ES.UTF-8')
pd.options.mode.chained_assignment = None  # default='warn'
pd.options.display.float_format = '{:,.2f}'.format

    
df_comercioEXT = pd.read_csv('Dataset4.- Comercio Exterior de España.txt',encoding='utf-8-sig',sep="|")

In [2]:
#Limpieza de datos, acortamos las etiquetas
df_comercioEXT['REPORTER'] = df_comercioEXT['REPORTER'].replace('European Union - 27 countries (AT, BE, BG, CY, CZ, DE, DK, EE, ES, FI, FR, GR, HR, HU, IE, IT, LT, LU, LV, MT, NL, PL, PT, RO, SE, SI, SK)','EU27')
df_comercioEXT['REPORTER'] = df_comercioEXT['REPORTER'].replace("France (incl. Saint Barthélemy 'BL' -> 2012| incl. French Guiana 'GF', Guadeloupe 'GP', Martinique 'MQ', Réunion 'RE' from 1997| incl. Mayotte 'YT' from 2014)",'France')
df_comercioEXT['REPORTER'] = df_comercioEXT['REPORTER'].replace("Spain (incl. Canary Islands 'XB' from 1997)",'Spain')
df_comercioEXT['REPORTER'] = df_comercioEXT['REPORTER'].replace("Italy (incl. San Marino 'SM' -> 1993)",'Italy')
df_comercioEXT['REPORTER'] = df_comercioEXT['REPORTER'].replace("Germany (incl. German Democratic Republic 'DD' from 1991)",'Germany')
df_comercioEXT['REPORTER'] = df_comercioEXT['REPORTER'].replace("Belgium (incl. Luxembourg 'LU' -> 1998)",'Belgium')

In [3]:
importaciones = df_comercioEXT[df_comercioEXT['FLOW']=='IMPORT']

importaciones = importaciones[importaciones['Value'] != ':']
#Nos quedamos con los tres meses a comparar de 2020vs2019 ya que es el periodo del primer confinamiento

lista = ['Mar. 2019', 'Apr. 2019', 'May. 2019','Mar. 2020', 'Apr. 2020', 'May. 2020']
importaciones = importaciones[importaciones['PERIOD'].isin(lista)]
importaciones['Value'] = importaciones['Value'].str.replace(' ', '')
importaciones['Value'] = importaciones['Value'].astype(float)
importaciones['PERIOD'] = importaciones['PERIOD'].str.replace('. ', '-')

importaciones['PERIOD'] = pd.to_datetime(importaciones['PERIOD']).dt.strftime('%m-%Y')

In [4]:
importaciones

Unnamed: 0,PERIOD,REPORTER,PARTNER,PRODUCT,FLOW,INDICATORS,Value
356,03-2019,Austria,ES,"Cucumbers, fresh or chilled(1998-2500)",IMPORT,VALUE_IN_EUROS,999397.00
357,03-2019,Austria,ES,"Cucumbers, fresh or chilled(1998-2500)",IMPORT,QUANTITY_IN_100KG,7893.00
360,04-2019,Austria,ES,"Cucumbers, fresh or chilled(1998-2500)",IMPORT,VALUE_IN_EUROS,463469.00
361,04-2019,Austria,ES,"Cucumbers, fresh or chilled(1998-2500)",IMPORT,QUANTITY_IN_100KG,2676.00
364,05-2019,Austria,ES,"Cucumbers, fresh or chilled(1998-2500)",IMPORT,VALUE_IN_EUROS,331758.00
...,...,...,...,...,...,...,...
360793,03-2020,Sweden,ES,"Tomatoes, fresh or chilled(1998-2500)",IMPORT,QUANTITY_IN_100KG,19823.00
360796,04-2020,Sweden,ES,"Tomatoes, fresh or chilled(1998-2500)",IMPORT,VALUE_IN_EUROS,3543048.00
360797,04-2020,Sweden,ES,"Tomatoes, fresh or chilled(1998-2500)",IMPORT,QUANTITY_IN_100KG,17754.00
360800,05-2020,Sweden,ES,"Tomatoes, fresh or chilled(1998-2500)",IMPORT,VALUE_IN_EUROS,1980950.00


In [5]:
comparacion_covid = pd.DataFrame(importaciones.groupby(['PERIOD','REPORTER','PARTNER','FLOW'], as_index=False)['Value'].sum())

In [6]:
comparacion_covid

Unnamed: 0,PERIOD,REPORTER,PARTNER,FLOW,Value
0,03-2019,Austria,ES,IMPORT,17204189.00
1,03-2019,Belgium,ES,IMPORT,38382606.00
2,03-2019,Bulgaria,ES,IMPORT,544347.00
3,03-2019,Croatia,ES,IMPORT,3864175.00
4,03-2019,Cyprus,ES,IMPORT,138272.00
...,...,...,...,...,...
157,05-2020,Portugal,ES,IMPORT,48292613.00
158,05-2020,Romania,ES,IMPORT,9492980.00
159,05-2020,Slovakia,ES,IMPORT,9374262.00
160,05-2020,Slovenia,ES,IMPORT,1963595.00


In [7]:
#Se separa las importaciones de 2020 y 2019 en dataframes diferentes y se calcula la variación
importaciones_2019 = comparacion_covid[comparacion_covid['PERIOD'].str.contains('2019')]
importaciones_2020 = comparacion_covid[comparacion_covid['PERIOD'].str.contains('2020')]
importaciones_2020['Variacion % respecto 2019'] = np.round((importaciones_2020['Value'].values - importaciones_2019['Value'].values) / importaciones_2019['Value'].values * 100,2)
importaciones_2020.to_csv('importacionesFinal_UE.csv',sep=',',encoding='utf-8-sig',index=False,decimal=',')

In [8]:
importaciones_2020

Unnamed: 0,PERIOD,REPORTER,PARTNER,FLOW,Value,Variacion % respecto 2019
27,03-2020,Austria,ES,IMPORT,22830594.00,32.70
28,03-2020,Belgium,ES,IMPORT,44601294.00,16.20
29,03-2020,Bulgaria,ES,IMPORT,861423.00,58.25
30,03-2020,Croatia,ES,IMPORT,4172339.00,7.97
31,03-2020,Cyprus,ES,IMPORT,116893.00,-15.46
...,...,...,...,...,...,...
157,05-2020,Portugal,ES,IMPORT,48292613.00,0.37
158,05-2020,Romania,ES,IMPORT,9492980.00,1.74
159,05-2020,Slovakia,ES,IMPORT,9374262.00,21.03
160,05-2020,Slovenia,ES,IMPORT,1963595.00,-9.04


In [9]:
IFrame("https://app.powerbi.com/view?r=eyJrIjoiODRhNzg2MTktMzE4MC00N2M5LTk2ZmYtMWEyYzg3OTc1NjNiIiwidCI6IjZhZmVhODVkLWMzMjMtNDI3MC1iNjlkLWE0ZmIzOTI3YzI1NCIsImMiOjl9",height = 650, width=980)

In [10]:
#Realizamos lo mismo para las exportaciones, Nos quedamos con el trimestre del covid 19 con respecto al mismo del año anterior
lista = ['Mar. 2019', 'Apr. 2019', 'May. 2019','Mar. 2020', 'Apr. 2020', 'May. 2020']
exportaciones = df_comercioEXT[df_comercioEXT['FLOW']=='EXPORT']
exportaciones = exportaciones[exportaciones['Value'] != ':']
exportaciones = exportaciones[exportaciones['PERIOD'].isin(lista)]
exportaciones['Value'] = exportaciones['Value'].str.replace(' ', '')
exportaciones['Value'] = exportaciones['Value'].astype(float)
exportaciones['PERIOD'] = exportaciones['PERIOD'].str.replace('. ', '-')
exportaciones['PERIOD'] = pd.to_datetime(exportaciones['PERIOD']).dt.strftime('%m-%Y')
comparacion_covid_exportaciones = pd.DataFrame(exportaciones.groupby(['PERIOD','REPORTER','PARTNER','FLOW'], as_index=False)['Value'].sum())

In [11]:
#Separamos en dos dataframes diferentes 
exportaciones_2019 = comparacion_covid_exportaciones[comparacion_covid_exportaciones['PERIOD'].str.contains('2019')]
exportaciones_2020 = comparacion_covid_exportaciones[comparacion_covid_exportaciones['PERIOD'].str.contains('2020')]
#generamos una columna mes para hacer despues un merge de tipo inner debido a que la longitud de cada dataset es diferente
exportaciones_2020['MES'] = pd.to_datetime(exportaciones_2020['PERIOD']).dt.month
exportaciones_2019['MES'] = pd.to_datetime(exportaciones_2019['PERIOD']).dt.month

In [12]:
#Realizamos el merge para las exportaciones, calculamos la columna de la variación y guardamos el dataset en CSV para continuar el
#analisis con un informe de PowerBI
df = exportaciones_2020.merge(exportaciones_2019, left_on=['REPORTER','MES'],right_on=['REPORTER','MES'],how='inner')
df['Variacion % respecto 2019'] = np.round((df['Value_x'].values - df['Value_y'].values) / df['Value_y'].values * 100,2)
df.drop(columns=['MES','PERIOD_y', 'PARTNER_y', 'FLOW_y', 'Value_y'],inplace=True)
df.columns = ['PERIOD','REPORT','PARTNER','FLOW','VALUE','Variación % respecto 2019']
df.to_csv('exportacionesFinal_UE.csv',sep=',',encoding='utf-8-sig',index=False,decimal=',')

In [13]:
df.head(10)

Unnamed: 0,PERIOD,REPORT,PARTNER,FLOW,VALUE,Variación % respecto 2019
0,03-2020,Austria,ES,EXPORT,541784.0,-18.32
1,03-2020,Belgium,ES,EXPORT,7496798.0,7.35
2,03-2020,Bulgaria,ES,EXPORT,119451.0,156.43
3,03-2020,Czechia,ES,EXPORT,22951.0,385.32
4,03-2020,Denmark,ES,EXPORT,113377.0,65.14
5,03-2020,EU27,ES,EXPORT,127022724.0,2.71
6,03-2020,France,ES,EXPORT,50334825.0,-2.35
7,03-2020,Germany,ES,EXPORT,2501535.0,190.18
8,03-2020,Greece,ES,EXPORT,5105600.0,137.96
9,03-2020,Hungary,ES,EXPORT,719801.0,8441.6


In [14]:
IFrame('https://app.powerbi.com/view?r=eyJrIjoiZmIxNTM4N2EtZGQ3NS00ZmYyLWIxNTctYjEwMjRhNGE0ODEzIiwidCI6IjZhZmVhODVkLWMzMjMtNDI3MC1iNjlkLWE0ZmIzOTI3YzI1NCIsImMiOjl9',height= 650, width = 980)

*En este análisis se ha enriquecido los datos del 2020 haciendo una variación con respecto el 2019 para las importaciones y exportaciones para después poder representarlo en un PowerBI y hacer un análisis en detalle de los datos obtenidos.*

### Puede ver el análisis detallado en el siguiente enlace: https://datacrop.es/reto-analisis-3/