# 1.- Carga de los datos


In [2]:
# Importar las bibliotecas necesarias
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

# Cargar el archivo CSV
file_path = 'productos_segmentados.csv'
data = pd.read_csv(file_path)

# Mostrar las primeras filas del dataframe
print("Primeras filas del DataFrame:")
print(data.head())

Primeras filas del DataFrame:
                                      Producto   Categoría  \
0                   Chocolat noir 65% de cacao  chocolates   
1                       70% Cacao noir intense  chocolates   
2                          Noir Excellence 90%  chocolates   
3  Excellence 85% Cacao Chocolat Noir Puissant  chocolates   
4                          Edelbitter mild 85%  chocolates   

                                        Ingredientes  Energía (kcal)  \
0                                                NaN             559   
1         cocoa paste, sugar, cocoa butter, vanilla,             566   
2  cocoa mass, cocoa butter, low-fat cocoa, sugar...             592   
3  Pâte de cacao, cacao maigre, beurre de cacao, ...             584   
4  Kakaomasse, fettarmes Kakaopulver, Kakaobutter...             579   

   Grasas (g)  Proteínas (g)  Hidratos de Carbono (g)  Azúcares (g)  \
0        41.0            6.8                     35.0          32.0   
1        41.0         

# 2.- Promedio nutricionales

In [3]:
# 2. Promedios Nutricionales por Segmento
nutritional_means = data.groupby('Segmento')[['Energía (kcal)', 'Grasas (g)', 'Proteínas (g)', 'Hidratos de Carbono (g)', 'Azúcares (g)']].mean()

# Convertir los resultados a una tabla (DataFrame)
nutritional_means_table = pd.DataFrame(nutritional_means)

# Mostrar promedios nutricionales por segmento
print("\nPromedios Nutricionales por Segmento:")
print(nutritional_means_table)

print("\nLos promedios mostrados por segmento pueden ser relevantes para consumidores que buscan productos energéticos, para aquellos que prefieren opciones bajas en calorías o productos más saludables.")



Promedios Nutricionales por Segmento:
               Energía (kcal)  Grasas (g)  Proteínas (g)  \
Segmento                                                   
Alta Energía       558.909091   39.786364       8.763636   
Alta Proteína      309.857143   25.185714      20.285714   
Bajo en Grasa      302.100000    4.080000       9.830000   
Otro               254.818182   22.872727       9.354545   

               Hidratos de Carbono (g)  Azúcares (g)  
Segmento                                              
Alta Energía                 36.036364     27.140909  
Alta Proteína                 0.600000      0.371429  
Bajo en Grasa                53.240000      6.630000  
Otro                          2.872727      2.763636  

Los promedios mostrados por segmento pueden ser relevantes para consumidores que buscan productos energéticos, para aquellos que prefieren opciones bajas en calorías o productos más saludables.


# 3.- Distribución de energía

In [5]:
# 3. Distribución de Energía
# Identificar el producto con mayor y menor cantidad de calorías
producto_mayor_calorias = data.loc[(data['Energía (kcal)']>540) & (data['Energía (kcal)']<640), ['Producto', 'Segmento', 'Energía (kcal)']]
producto_menor_calorias = data.loc[(data['Energía (kcal)']>30) & (data['Energía (kcal)']<130), ['Producto', 'Segmento', 'Energía (kcal)']]

print("\nProductos con mayor energia:")
print(producto_mayor_calorias)
print("\nProductos con menor energia:")
print(producto_menor_calorias)

print("\nEsto indica que los productos con mayor energía calórica son mayormente los chocolates que estan en el segmento de Alta Energía y que los productos con pocas calorías son muy escasos y generalmente son bajos en grasas.")



Productos con mayor energia:
                                       Producto      Segmento  Energía (kcal)
0                    Chocolat noir 65% de cacao  Alta Energía             559
1                        70% Cacao noir intense  Alta Energía             566
2                           Noir Excellence 90%  Alta Energía             592
3   Excellence 85% Cacao Chocolat Noir Puissant  Alta Energía             584
4                           Edelbitter mild 85%  Alta Energía             579
5                Extra dark chocolate 74% cacao  Alta Energía             570
7             Excellence 70% Cocoa Intense Dark  Alta Energía             566
8                                Nestlé Dessert  Alta Energía             548
9           85% Cocoa Robust Dark Chocolate Bar  Alta Energía             584
10                         Doux 70% noir subtil  Alta Energía             610
11                       Ecuador Edelbitter 70%  Alta Energía             565
12                  Bio Chocolat N

# 4.- Preferencias del mercado

In [13]:
# 4. Segmentación y Preferencias del Mercado
market_preferences = data.groupby('Segmento')['Producto'].count().reset_index().sort_values(by='Producto', ascending=False)

# Mostrar Segmentación y Preferencias del Mercado
print("\nSegmentación y Preferencias del Mercado:")
print(market_preferences)

print("\nEsto nos indica que hay mayor consumo en productos del segmento de Alta Energía seguido de los productos Bajos en Grasa, lo \nque significa que los productos de estos dos segmentos tienen una mayor preferencia.")


Segmentación y Preferencias del Mercado:
        Segmento  Producto
0   Alta Energía        22
2  Bajo en Grasa        19
3           Otro        11
1  Alta Proteína         7

Esto nos indica que hay mayor consumo en productos del segmento de Alta Energía seguido de los productos Bajos en Grasa, lo 
que significa que los productos de estos dos segmentos tienen una mayor preferencia.


# 5.- Análisis de Correlación

In [62]:
# 5. Análisis de Correlación
correlation_matrix = data[['Energía (kcal)', 'Grasas (g)', 'Proteínas (g)', 'Hidratos de Carbono (g)', 'Azúcares (g)']].corr()

# Mostrar la matriz de correlación
print("\nMatriz de Correlación:")
print(correlation_matrix)

print("\nLa matriz de correlación nos muestra que la fuerte correlación entre Energía y Grasas sugiere que los alimentos altos en grasas tienden a ser más calóricos.")
print("\nLa correlación negativa entre Proteínas y Azúcares podría indicar que los alimentos ricos en proteínas tienden a ser bajos en \nazúcares, y viceversa.")
print("\nLa correlación positiva entre Hidratos de Carbono y Azúcares muestran una correlación positiva con Azúcares, lo cual es lógico ya que los azúcares son un tipo de carbohidrato.")


Matriz de Correlación:
                         Energía (kcal)  Grasas (g)  Proteínas (g)  \
Energía (kcal)                 1.000000    0.735377      -0.091031   
Grasas (g)                     0.735377    1.000000       0.017305   
Proteínas (g)                 -0.091031    0.017305       1.000000   
Hidratos de Carbono (g)        0.351077   -0.363406      -0.321098   
Azúcares (g)                   0.639933    0.411783      -0.424614   

                         Hidratos de Carbono (g)  Azúcares (g)  
Energía (kcal)                          0.351077      0.639933  
Grasas (g)                             -0.363406      0.411783  
Proteínas (g)                          -0.321098     -0.424614  
Hidratos de Carbono (g)                 1.000000      0.377412  
Azúcares (g)                            0.377412      1.000000  

La matriz de correlación nos muestra que la fuerte correlación entre Energía y Grasas sugiere que los alimentos altos en grasas tienden a ser más calóricos.

La cor

# 6.- Análisis de Ingredientes

In [12]:
# 6. Análisis de Ingredientes
data['Número de Ingredientes'] = data['Ingredientes'].apply(lambda x: len(str(x).split(',')))
producto_Alta_Energía = data.loc[(data['Segmento']=="Alta Energía"), ['Producto', 'Número de Ingredientes', 'Ingredientes']]
producto_Bajo_en_Grasa = data.loc[(data['Segmento']=="Bajo en Grasa"), ['Producto', 'Número de Ingredientes', 'Ingredientes']]
producto_Otro = data.loc[(data['Segmento']=="Otro"), ['Producto', 'Número de Ingredientes', 'Ingredientes']]
producto_Alta_Proteína = data.loc[(data['Segmento']=="Alta Proteína"), ['Producto', 'Número de Ingredientes', 'Ingredientes']]

print("\nProductos Altos en Energía:")
print(producto_Alta_Energía)

print("\nProductos Bajos en Grasa:")
print(producto_Bajo_en_Grasa)

print("\nOtros productos:")
print(producto_Otro)

print("\nProductos Altos en Proteína:")
print(producto_Alta_Proteína)

print("\nComo se puede observar en esta comparación de ingredientes, los productos altos en proteína tienen menos cantidad de ingredientes, lo que indica que son productos más naturales o menos procesados en comparación con los productos bajos en grasas que \ntienen mayor cantidad de ingredientes en mayoría de los productos")


Productos Altos en Energía:
                                       Producto  Número de Ingredientes  \
0                    Chocolat noir 65% de cacao                       1   
1                        70% Cacao noir intense                       5   
2                           Noir Excellence 90%                       6   
3   Excellence 85% Cacao Chocolat Noir Puissant                       7   
4                           Edelbitter mild 85%                       5   
5                Extra dark chocolate 74% cacao                       8   
6                              Milka Lait Alpin                       9   
7             Excellence 70% Cocoa Intense Dark                       4   
8                                Nestlé Dessert                       9   
9           85% Cocoa Robust Dark Chocolate Bar                       5   
10                         Doux 70% noir subtil                       9   
11                       Ecuador Edelbitter 70%                       4