# Análisis Exploratorio de datos del Café en Colombia

Instalando Librerías

In [1]:
#!pip install openpyxl
#!pip install pandas
#!pip install plotly
#!pip install --upgrade nbformat

## Total Exportaciones

In [2]:
#importando librerías
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go

px.defaults.template = "seaborn"

### Total exportaciones en Kg 2016 - 2024

In [3]:
s1 = pd.read_excel("exportaciones_coffee.xlsx", sheet_name=0)
s1.head()

Unnamed: 0,MES,Total Exportaciones
0,1958-01-01,337.0
1,1958-02-01,450.0
2,1958-03-01,383.0
3,1958-04-01,334.0
4,1958-05-01,331.0


In [4]:
s1.columns

Index(['MES', 'Total Exportaciones'], dtype='object')

In [5]:
s1 = s1.rename(columns={'MES': 'fecha', 'Total Exportaciones': 'total_export'})
s1['total_kg'] = s1['total_export']*60
s1_2016 = s1.loc[s1['fecha']>'2016-12-31']
s1_2016.head()

Unnamed: 0,fecha,total_export,total_kg
708,2017-01-01,1137.74,68264.4
709,2017-02-01,1182.256,70935.36
710,2017-03-01,1160.0,69600.0
711,2017-04-01,898.0,53880.0
712,2017-05-01,833.873,50032.38


In [6]:
s1_2016['año'] = pd.to_datetime(s1_2016['fecha']).dt.year

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  s1_2016['año'] = pd.to_datetime(s1_2016['fecha']).dt.year


In [7]:
years = s1_2016['año'].unique()
print(years)

[2017 2018 2019 2020 2021 2022 2023 2024]


In [8]:
s1_2016.to_csv('s1.csv', index=False)

In [8]:

fig = px.line(s1_2016, x="fecha", y="total_kg")
fig.update_layout(xaxis_title="Fecha", yaxis_title="Total de Kgs", title="Exportaciones de CAFE en Colombia", width=800, height=400)
fig.show()

In [9]:
s1_2016['año'] = pd.to_datetime(s1_2016['fecha']).dt.year
s1_gp_year = s1_2016.groupby(['año'])['total_kg'].sum().reset_index()
s1_gp_year.head()



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



Unnamed: 0,año,total_kg
0,2016,770689.98
1,2017,778939.14
2,2018,765054.6
3,2019,820057.92
4,2020,751618.68


In [10]:
fig = px.bar(s1_gp_year, x="año", y="total_kg", color='año')
fig.update_layout(xaxis_title="Año", yaxis_title="Total de Kgs", title="Exportaciones de CAFE en Colombia por Año hasta Julio 2024", xaxis_dtick=1, width=800, height=400)
fig.show()

In [11]:
s1_2016_08 = s1_2016
s1_2016_08['año'] = s1_2016_08['fecha'].dt.year
s1_2016_08['mes'] = s1_2016_08['fecha'].dt.strftime('%m')
s1_2016_08.head()



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



Unnamed: 0,fecha,total_export,total_kg,año,mes
696,2016-01-01,1098.4,65904.0,2016,1
697,2016-02-01,1112.754,66765.24,2016,2
698,2016-03-01,1091.86,65511.6,2016,3
699,2016-04-01,930.895,55853.7,2016,4
700,2016-05-01,891.197,53471.82,2016,5


In [12]:
fig = px.line(s1_2016_08, 
              x='mes', 
              y='total_kg', 
              color='año',  # Diferente color por año
              labels={'mes_dia': 'Mes', 'total_kg': 'Total KG'}, 
              title='Total KG por Año',
              width=800, height=400)

# Mostrar el gráfico interactivo
fig.show()

### Total Exportaciones en Valor Nominal

In [13]:
s2 = pd.read_excel("exportaciones_coffee.xlsx", sheet_name=1)
s2.head()

Unnamed: 0,Mes,Valor Nominal*
0,1958-01-01,28.9
1,1958-02-01,38.6
2,1958-03-01,32.7
3,1958-04-01,24.7
4,1958-05-01,24.1


In [14]:
s2.columns

Index(['Mes', 'Valor Nominal*'], dtype='object')

In [15]:
s2 = s2.rename(columns={'Mes': 'fecha', 'Valor Nominal*': 'nominal'})
s2_2016 = s2.loc[s2['fecha']>'2016-12-31']
s2_2016['fecha'] = pd.to_datetime(s2_2016['fecha']).dt.date
s2_2016.style.format({'nominal':'${:.2f}'})
s2_2016.head()



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



Unnamed: 0,fecha,nominal
696,2016-01-01,211.365552
697,2016-02-01,214.702501
698,2016-03-01,210.915662
699,2016-04-01,182.220948
700,2016-05-01,177.041874


In [None]:
s2_2016.to_csv('s2.csv', index=False)

In [16]:
fig = px.line(s2_2016, x="fecha", y="nominal")
fig.update_layout(xaxis_title="Fecha", yaxis_title="Valor en Miles de US", title="Valor Nominal de Exportaciones de CAFE en Colombia", width=800, height=400)
fig.show()

### Exportaciones Según tipo de Café

In [17]:
s3 = pd.read_excel("exportaciones_coffee.xlsx", sheet_name=2)
s3.head()

Unnamed: 0,Año,Verde,Verde descafeinado,Tostado en grano,Tostado y molido,Extracto y soluble,Producto de Colombia (verde + industrializado),Total
0,2000,8568.0,6.0,1.0,4.0,628.0,,9207.0
1,2001,9271.0,71.0,1.0,5.0,627.0,,9975.0
2,2002,9522.0,137.0,0.0,5.0,610.0,,10274.0
3,2003,9589.0,96.0,2.0,10.0,593.0,,10290.0
4,2004,9476.0,124.0,3.0,13.0,646.0,,10262.0


In [18]:
s3_2016 = s3.loc[s3['Año']>=2016]
s3_2016

Unnamed: 0,Año,Verde,Verde descafeinado,Tostado en grano,Tostado y molido,Extracto y soluble,Producto de Colombia (verde + industrializado),Total
16,2016,11034.453,9.29,40.02,51.905,707.768,1001.397,12844.833
17,2017,11384.799,14.795,32.792,74.117,755.646,720.965,12983.114
18,2018,11316.308,16.836,37.701,59.364,778.874,542.257,12751.34
19,2019,11970.289,16.265,40.954,81.462,808.998,749.664,13667.632
20,2020,10683.853,13.217,44.111,89.641,879.905,816.709,12527.436
21,2021,10664.38,32.901,61.674,96.159,787.441,796.234,12438.789
22,2022,9495.41,46.157,65.881,95.032,799.091,906.67,11408.241
23,2023,9012.318,54.934,49.416,94.56,653.666,714.408,10579.302


In [19]:
# Convertir el DataFrame a formato largo
s3_long = s3_2016.melt(id_vars='Año', value_vars=['Verde', 'Verde descafeinado', 'Tostado en grano', 
                                                    'Tostado y molido', 'Extracto y soluble', 
                                                    'Producto de Colombia (verde + industrializado)'],
                        var_name='Categoría', value_name='Valor')
s3_long

Unnamed: 0,Año,Categoría,Valor
0,2016,Verde,11034.453
1,2017,Verde,11384.799
2,2018,Verde,11316.308
3,2019,Verde,11970.289
4,2020,Verde,10683.853
5,2021,Verde,10664.38
6,2022,Verde,9495.41
7,2023,Verde,9012.318
8,2016,Verde descafeinado,9.29
9,2017,Verde descafeinado,14.795


In [20]:
fig = px.scatter(s3_long, 
                 x='Valor', 
                 y='Año', 
                 size='Valor', 
                 color='Categoría', 
                 hover_name='Categoría', 
                 title='Exportaciones por Tipo de Café Total en Kgs por Año (2016 - 2023)',
                 labels={'Valor': 'Valor por Categoría', 'Año': 'Año'},
                 log_x=True, size_max=60,
                 width=800, height=400)

# Mostrar el gráfico
fig.show()

In [21]:
s3_2016_gp = s3_long.groupby('Categoría')['Valor'].sum().reset_index()
s3_2016_gp

Unnamed: 0,Categoría,Valor
0,Extracto y soluble,6171.389
1,Producto de Colombia (verde + industrializado),6248.304
2,Tostado en grano,372.549
3,Tostado y molido,642.24
4,Verde,85561.81
5,Verde descafeinado,204.395


In [22]:
fig = px.pie(s3_2016_gp, values='Valor', names='Categoría', 
             title='Exportaciones por Tipo de CAFE Total en Kgs por Año (2016 - 2023)', 
             color_discrete_sequence=px.colors.sequential.GnBu_r,
             width=800, height=400)
fig.show()

### Exportaciones por Embarque

In [23]:
s4 = pd.read_excel("exportaciones_coffee.xlsx", sheet_name=3)
s4.head()

Unnamed: 0,Puerto de Embarque,2000,2001,2002,2003,2004,2005,2006,2007,2008,...,2014,2015,2016,2017,2018,2019,2020,2021,2022,2023
0,Aerp. El Dorado,309.0,770.0,1923.0,1442.0,2418.0,2111.0,3355.0,3804.0,4910.0,...,3153.0,4544.0,11500.0,7849.0,7129.0,6790.0,2817.0,1551.0,177.0,7379.0
1,Aerp. José M.Cordoba,364.0,2762.0,477.0,1193.0,117.0,,161.0,265.0,1324.0,...,6037.0,4757.0,3995.0,3183.0,3095.0,4567.0,3400.0,,,616.0
2,Aerp. Alfonso Bonilla,55.0,28.0,6.0,0.0,197.0,0.0,261.0,22.0,665.0,...,40.0,15.0,205.0,56.0,43.0,95.0,24.0,2.0,,66.0
3,Aerp. Matecaña,,,,,,,,,,...,,,,36.0,103.0,94.0,43.0,,,
4,Insp. Barranquilla,42017.0,63635.0,202755.0,107631.0,47545.0,28659.0,48602.0,13503.0,3333.0,...,,,,,86.0,725.0,2786.0,2509.0,3733.0,3880.0


In [24]:
# Eliminando filas con valores NaN
s4.dropna(inplace=True)
print(s4.shape)
s4.reset_index(inplace=True, drop=True)
s4.tail()

(9, 25)


Unnamed: 0,Puerto de Embarque,2000,2001,2002,2003,2004,2005,2006,2007,2008,...,2014,2015,2016,2017,2018,2019,2020,2021,2022,2023
4,Ipiales,22224.0,18473.0,10823.0,3221.0,42178.0,7849.0,29074.0,28145.0,26385.0,...,15931.0,27711.0,14297.0,22953.0,25508.0,24004.0,27653.0,16772.0,20366.0,29568.0
5,Total Aeropuertos,728.0,3560.0,2406.0,2635.0,2732.0,2111.0,3777.0,4091.0,6899.0,...,9230.0,9316.0,15700.0,11124.0,10370.0,11572.0,6284.0,1553.0,182.0,8077.0
6,Total Puertos Marítimos,9182032.0,9951496.0,10273971.0,10270789.0,10204931.0,10861101.0,10898043.0,11250159.0,11038120.0,...,10923780.0,12672203.0,12814390.0,12948331.0,12714210.0,13628943.0,12489261.0,12420107.0,11387693.0,10541542.0
7,Total Frontera terrestre y ZF,29573.0,29618.0,19351.0,16002.0,55124.0,8144.0,43409.0,46418.0,40582.0,...,23814.0,32148.0,14743.0,23659.0,26760.0,27117.0,31891.0,17129.0,20366.0,29683.0
8,Total general,9212333.0,9984674.0,10295728.0,10289426.0,10262787.0,10871356.0,10945229.0,11300668.0,11085601.0,...,10956824.0,12713667.0,12844833.0,12983114.0,12751340.0,13667632.0,12527436.0,12438789.0,11408241.0,10579302.0


In [25]:
s4_melted = s4.melt(id_vars=['Puerto de Embarque'], var_name='Año', value_name='Sacos de 60kg')
s4_melted.head()

Unnamed: 0,Puerto de Embarque,Año,Sacos de 60kg
0,Aerp. El Dorado,2000,309.0
1,Insp. Buenaventura,2000,6253228.0
2,Insp. Cartagena,2000,2133706.0
3,Insp. Santa Marta,2000,753081.0
4,Ipiales,2000,22224.0


In [26]:
s4_melted['total_kg'] = s4_melted['Sacos de 60kg'] * 60
s4_melted.head()

Unnamed: 0,Puerto de Embarque,Año,Sacos de 60kg,total_kg
0,Aerp. El Dorado,2000,309.0,18540.0
1,Insp. Buenaventura,2000,6253228.0,375193680.0
2,Insp. Cartagena,2000,2133706.0,128022360.0
3,Insp. Santa Marta,2000,753081.0,45184860.0
4,Ipiales,2000,22224.0,1333440.0


In [27]:
# Filtrar los puertos sin incluir 'Total'
s4_puertos = s4_melted[~s4_melted['Puerto de Embarque'].str.contains('Total')]

# Filtrar filas que contienen 'Total general'
s4_total = s4_melted[s4_melted['Puerto de Embarque'].str.contains('Total general')]

# Filtrar filas que contienen 'Total' pero no 'Total general'
s4_total_embarque = s4_melted[s4_melted['Puerto de Embarque'].str.contains('Total') & 
                              ~s4_melted['Puerto de Embarque'].str.contains('Total general')]

In [28]:
s4_puertos.head()

Unnamed: 0,Puerto de Embarque,Año,Sacos de 60kg,total_kg
0,Aerp. El Dorado,2000,309.0,18540.0
1,Insp. Buenaventura,2000,6253228.0,375193680.0
2,Insp. Cartagena,2000,2133706.0,128022360.0
3,Insp. Santa Marta,2000,753081.0,45184860.0
4,Ipiales,2000,22224.0,1333440.0


In [29]:
fig = px.bar(s4_puertos,
              x='Año',
              y='total_kg',
              color='Puerto de Embarque',
              labels={'total_kg': 'Total Kg'},
              width=800, height=400)

# Mostrar el gráfico interactivo
fig.show()

In [30]:
fig = px.line(s4_total,     
              x='Año', 
              y='total_kg', 
              labels={'total_kg': 'Total KG'}, 
              title='Tendencia Anual del Peso Total (KG) Transportado',
              width=800, height=400)

# Mostrar el gráfico interactivo
fig.show()


In [31]:
s5 = pd.read_excel("exportaciones_coffee.xlsx", sheet_name=4)
s5.head()

Unnamed: 0,Año,Mes,Puerto de embarque,Tipo de café,Sacos de 70 kg. equivalente real Exportados,Sacos de 60 Kg. Exportados,Valor provisional de la Exportación (USD) *
0,2017,1,Aerp. El Dorado,Café Verde,74,84,60776.73
1,2017,1,Aerp. El Dorado,Extractos,27,32,25210.08
2,2017,1,Aerp. El Dorado,Soluble,21,26,12050.33
3,2017,1,Aerp. El Dorado,Tostados,257,300,173076.67
4,2017,1,Aerp. José M.Cordoba,Café Verde,29,33,15400.0


In [32]:
# Combina 'Año' y 'Mes' para formar una columna 'Fecha'
s5['Fecha'] = s5['Año'].astype(str) + '-' + s5['Mes'].astype(str)

# Convierte 'Fecha' en un objeto datetime
s5['Fecha'] = pd.to_datetime(s5['Fecha'], format='%Y-%m')



s5.rename(columns={'Sacos de 70 kg. equivalente real Exportados': 'Sacos de 70kg', 
                 'Sacos de 60 Kg. Exportados': 'Sacos de 60kg', 
                 'Valor provisional de la Exportación (USD) *	': 'Valor en USD'}, inplace=True)

# Verifica los resultados
s5.head()

Unnamed: 0,Año,Mes,Puerto de embarque,Tipo de café,Sacos de 70kg,Sacos de 60kg,Valor provisional de la Exportación (USD) *,Fecha
0,2017,1,Aerp. El Dorado,Café Verde,74,84,60776.73,2017-01-01
1,2017,1,Aerp. El Dorado,Extractos,27,32,25210.08,2017-01-01
2,2017,1,Aerp. El Dorado,Soluble,21,26,12050.33,2017-01-01
3,2017,1,Aerp. El Dorado,Tostados,257,300,173076.67,2017-01-01
4,2017,1,Aerp. José M.Cordoba,Café Verde,29,33,15400.0,2017-01-01


In [33]:
s5_70kg = s5[['Fecha','Sacos de 70kg']].groupby('Fecha').sum().reset_index()
fig = px.line(data_frame=s5_70kg, 
             x='Fecha', 
             y='Sacos de 70kg', 
             labels={'value': 'Sacos Exportados'}, 
             title='Exportaciones de Sacos de Café (70 kg) por Mes',
             width=800, height=400)

fig.show()

In [34]:
s5_60kg = s5[['Fecha','Sacos de 60kg']].groupby('Fecha').sum().reset_index()
fig = px.line(data_frame=s5_60kg, 
             x='Fecha', 
             y='Sacos de 60kg', 
             labels={'value': 'Sacos Exportados'}, 
             title='Exportaciones de Sacos de Café (60 kg) por Mes',
             width=800, height=400)

fig.show()

### Exportaciones por País

In [35]:
s6 = pd.read_excel("exportaciones_coffee.xlsx", sheet_name=5)
s6.head()

Unnamed: 0,PAISES,2000,2001,2002,2003,2004,2005,2006,2007,2008,...,2014,2015,2016,2017,2018,2019,2020,2021,2022,2023
0,Estados Unidos,2955.712,3061.126,3441.28,3622.943,3560.245,3974.368,3792.605,3863.929,4163.0,...,4595.453,5298.272,5293.545,5702.598,5722.489,5895.031,5105.442,5207.213,5006.789,4370.746
1,Canadá,431.893,531.46,532.842,513.165,592.521,645.301,589.756,554.887,576.0,...,733.604,791.682,837.131,867.752,928.591,993.511,875.581,950.577,821.07,679.58
2,Argentina,27.546,26.746,6.54,11.095,10.242,6.918,7.294,8.213,8.0,...,8.368,8.042,8.98,19.279,12.006,14.24,14.495,21.749,22.525,23.699
3,Alemania,1727.101,1860.313,1767.092,1642.436,1383.103,1420.386,1456.705,1549.541,1136.0,...,972.17,1109.113,1246.341,1025.232,1023.094,1196.216,1082.145,968.502,778.546,755.55
4,Bélgica,485.418,740.629,486.465,531.059,542.688,664.117,614.645,775.678,710.0,...,837.828,918.626,719.465,616.671,599.21,660.163,854.399,889.259,768.832,691.201


In [36]:
s6.columns

Index(['PAISES',     2000,     2001,     2002,     2003,     2004,     2005,
           2006,     2007,     2008,     2009,     2010,     2011,     2012,
           2013,     2014,     2015,     2016,     2017,     2018,     2019,
           2020,     2021,     2022,     2023],
      dtype='object')

In [37]:
# Filtrar las filas donde 'PAISES' no contiene 'Total'
s6_filtered = s6[~s6['PAISES'].str.contains('TOTAL')].reset_index(drop=True)

# Verifica las dimensiones del DataFrame filtrado
s6_filtered.shape

(23, 25)

In [38]:
# Transforma el DataFrame para tener 'PAISES' como variable y los años como observaciones
df_melted = s6_filtered.melt(id_vars='PAISES', var_name='Año', value_name='Valor')

# Gráfico de líneas
fig = px.line(df_melted, x='Año', y='Valor', color='PAISES',
              labels={'Valor': 'Valor', 'Año': 'Año'},
              title='Exportaciones de Café por País de 2000 a 2023')
fig.show()


In [39]:
fig = px.area(df_melted, x='Año', y='Valor', color='PAISES',
              labels={'Valor': 'Valor', 'Año': 'Año'},
              title='Evolución de Valores por País (Área Apilada)')
fig.show()

In [40]:
# Crear el gráfico de calor
fig = go.Figure(data=go.Heatmap(
                   z=s6_filtered.set_index('PAISES').values,
                   x=s6_filtered.columns[1:],  # Años
                   y=s6_filtered['PAISES'],     # Países
                   colorscale='Viridis'))

# Actualizar el layout del gráfico para que sea más cuadrado
fig.update_layout(
    title='Mapa de Calor de Valores por País y Año',
    xaxis_title='Año',
    yaxis_title='Países',
    width=600,  # Ajusta el ancho
    height=600,  # Ajusta la altura
    margin=dict(l=50, r=50, t=50, b=50)  # Márgenes
)

# Mostrar el gráfico
fig.show()

In [41]:
fig = px.bar(df_melted, x='Año', y='Valor', color='PAISES', 
             labels={'Valor': 'Valor', 'Año': 'Año'},
             title='Distribución de Valores por País a lo largo de los Años', 
             barmode='stack')
fig.show()

In [42]:
s7 = pd.read_excel("exportaciones_coffee.xlsx", sheet_name=6)
s7.head()

Unnamed: 0,Año,Mes,País de destino,Tipo de café,Sacos de 70 kg. equivalente real Exportados,Sacos de 60 Kg. Exportados,Valor provisional de la Exportación (USD) *
0,2017,1,Alemania,Café Verde,64522,75275,15035992.52
1,2017,1,Alemania,Extractos,1,1,2475.0
2,2017,1,Alemania,Soluble,9132,10650,2499024.0
3,2017,1,Alemania,Tostados,3,3,1252.6
4,2017,1,Argentina,Café Verde,1415,1650,396701.04


In [43]:
s7_grouped = s7.groupby(['País de destino', 'Tipo de café'])['Valor provisional de la Exportación (USD) *'].sum().reset_index()
s7_grouped = s7_grouped.sort_values(by=['Valor provisional de la Exportación (USD) *', 'Tipo de café'], ascending=False).reset_index(drop=True)
s7_grouped = s7_grouped.head(30)

In [44]:
fig_grouped_bar = px.bar(s7_grouped, 
             x='País de destino', 
             y='Valor provisional de la Exportación (USD) *', 
             color='Tipo de café', 
             barmode='group',
             title='Comparación de Valor de Exportación por Tipo de Café y País (2017 - 2024)',
             labels={
                 'Valor provisional de la Exportación (USD) *': 'Valor de Exportación (USD)', 
                 'País de destino': 'País de Destino',
                 'Tipo de café': 'Tipo de Café'
             })

# Mostrar el gráfico
fig_grouped_bar.show()

In [45]:
s8 = pd.read_excel("exportaciones_coffee.xlsx", sheet_name=7)
s8.head()

Unnamed: 0,Año,Federación Nacional de Cafeteros,Particulares,Total
0,2000,3325.705,5886.628,9212.333
1,2001,3619.803,6364.871,9984.674
2,2002,2777.047,7518.681,10295.728
3,2003,2717.982,7571.453,10289.435
4,2004,2754.187,7508.6,10262.787


In [46]:
s8_melted = s8.melt(id_vars=['Año'], value_vars=['Federación Nacional de Cafeteros', 'Particulares'],
                    var_name='Exportador', value_name='Valor Exportado (sacos 60kg)')
s8_melted.sort_values(by=['Año', 'Exportador'], inplace=True, ascending=True)
s8_melted.reset_index(drop=True, inplace=True)
s8_melted['Total kilogramos'] = s8_melted['Valor Exportado (sacos 60kg)'] * 60
s8_melted.head()

Unnamed: 0,Año,Exportador,Valor Exportado (sacos 60kg),Total kilogramos
0,2000,Federación Nacional de Cafeteros,3325.705,199542.3
1,2000,Particulares,5886.628,353197.68
2,2001,Federación Nacional de Cafeteros,3619.803,217188.18
3,2001,Particulares,6364.871,381892.26
4,2002,Federación Nacional de Cafeteros,2777.047,166622.82


In [47]:
fig = px.line(
    s8_melted, 
    x='Año', 
    y='Total kilogramos', 
    color='Exportador', 
    labels={'Total kilogramos': 'Total de Kgs', 'Año': 'Año'},
    title='Exportaciones de CAFE en Colombia', 
    width=800,
    height=400, 
)
fig.show()

In [48]:
s9 = pd.read_excel("exportaciones_coffee.xlsx", sheet_name=8)
s9.head()

Unnamed: 0,Año,Mes,Federación Nacional de Cafeteros,Particulares,Total
0,2000,enero,25.8,58.6,84.4
1,2000,febrero,34.5,67.7,102.2
2,2000,marzo,22.5,37.8,60.3
3,2000,abril,35.0,73.3,108.3
4,2000,mayo,31.3,54.3,85.6


In [49]:
s10 = pd.read_excel("exportaciones_coffee.xlsx", sheet_name=9)
s10.head()

Unnamed: 0,Año,Mes,País destino,Nombre exportador,Sacos de 70 kg. equivalente real Exportados,Sacos de 60 Kg. Exportados,Valor Factura (USD)*
0,2017,1,Alemania,A LAUMAYER Y COMPAÑIA EXPORTADORES,4691,5471,1133799.64
1,2017,1,Alemania,ALTAMIRA SUPREMO S.A.S.,825,962,150000.0
2,2017,1,Alemania,BANCA EXPORTADORA S.A BANEXPORT,275,321,80000.0
3,2017,1,Alemania,C. I. KYOTO LOHAS BEANS S.A.S,271,316,96744.25
4,2017,1,Alemania,CAFE COLSUAVES S.A.S,300,350,64500.0


In [50]:
s10['total_kg'] = s10['Sacos de 70 kg. equivalente real Exportados'] * 70 + s10['Sacos de 60 Kg. Exportados'] * 60
s10['fecha'] = pd.to_datetime(s10['Año'].astype(str) + '-' + s10['Mes'].astype(str) + '-01')
s10.head()

Unnamed: 0,Año,Mes,País destino,Nombre exportador,Sacos de 70 kg. equivalente real Exportados,Sacos de 60 Kg. Exportados,Valor Factura (USD)*,total_kg,fecha
0,2017,1,Alemania,A LAUMAYER Y COMPAÑIA EXPORTADORES,4691,5471,1133799.64,656630,2017-01-01
1,2017,1,Alemania,ALTAMIRA SUPREMO S.A.S.,825,962,150000.0,115470,2017-01-01
2,2017,1,Alemania,BANCA EXPORTADORA S.A BANEXPORT,275,321,80000.0,38510,2017-01-01
3,2017,1,Alemania,C. I. KYOTO LOHAS BEANS S.A.S,271,316,96744.25,37930,2017-01-01
4,2017,1,Alemania,CAFE COLSUAVES S.A.S,300,350,64500.0,42000,2017-01-01


In [51]:
# Agrupar datos por fecha, país y exportador, sumando los kilogramos exportados
exportaciones_agrupadas = s10.groupby(['fecha', 'País destino', 'Nombre exportador']).agg(
    {'total_kg': 'sum'}).reset_index()

# Obtener los valores únicos de países
paises = exportaciones_agrupadas['País destino'].unique()

for pais in paises:
    # Filtrar los datos para cada país
    df_filtrado = exportaciones_agrupadas[exportaciones_agrupadas['País destino'] == pais]
    df_filtrado.head()

In [52]:
exportaciones_agrupadas.head()

Unnamed: 0,fecha,País destino,Nombre exportador,total_kg
0,2017-01-01,Alemania,A LAUMAYER Y COMPAÑIA EXPORTADORES,656630
1,2017-01-01,Alemania,ALTAMIRA SUPREMO S.A.S.,115470
2,2017-01-01,Alemania,BANCA EXPORTADORA S.A BANEXPORT,38510
3,2017-01-01,Alemania,C. I. KYOTO LOHAS BEANS S.A.S,37930
4,2017-01-01,Alemania,CAFE COLSUAVES S.A.S,42000
