# Análisis del sistema NutriScore y el grado de procesamiento NOVA

## 1 Introducción

En este estudio se analiza la coherencia entre las calificaciones del sistema NutriScore y el grado de procesamiento de los alimentos según la clasificación NOVA.  
El objetivo principal es evaluar si el NutriScore refleja realmente la calidad nutricional y el nivel de procesamiento de los productos, y cómo estos afectan a los hábitos alimentarios.

El análisis se basa en datos del proyecto Open Food Facts, una base de datos colaborativa con información nutricional de miles de productos de alimentación.

---

## 2 Planteamiento del problema e hipótesis

###  Objetivo general
Analizar si el NutriScore se correlaciona con los valores nutricionales reales y con el grado de procesamiento NOVA.

### Hipótesis de trabajo


- Un peor NutriScore implica mayor contenido en azúcar, grasa y sal.

- A mayor nivel de procesamiento (peor NOVA), peor NutriScore.

- Los productos bajos en calorías no siempre obtienen un buen NutriScore.

- Dentro de los productos ultraprocesados (NOVA 4), el NutriScore no diferencia bien la calidad nutricional.

- Los alimentos más consumidos en España tienden a tener bajo NutriScore y alto nivel NOVA.
---

## 3 Carga y exploración inicial de los datos

- Importar librerías (pandas, numpy, matplotlib, seaborn, plotly).  
- Cargar el dataset original.  
- Revisar dimensiones y tipos de datos (df.info(), df.describe()).  
- Comprobar valores nulos (df.isnull().sum()).
- entender la estructura y calidad de los datos antes de analizarlos.

---

## 4 Limpieza de datos

- Eliminar columnas vacías o con demasiados nulos (df.dropna(thres=...)).  
- Mantener las variables relevantes:  
  producto, calorias, valor NOVA, valor Nutriscore, azucar, sal...
- Convertir tipos de datos si es necesario
- quedarnos con un dataset limpio y listo para el análisis.

---
## 5 Creacion de dataframes y graficos para cada hipotesis







### LECTURA DE CSV

In [4]:
import pandas as pd

In [5]:
df = pd.read_csv("../Data/openfoodfacts_export.csv", sep="\t", low_memory=False)
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3878 entries, 0 to 3877
Columns: 458 entries, code to data_sources
dtypes: float64(159), int64(1), object(298)
memory usage: 13.6+ MB


In [6]:
df_cesta_esp = pd.read_csv("../Data/cesta_spa.csv", sep="\t", encoding="latin-1")
df_cesta_esp.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 60 entries, 0 to 59
Data columns (total 4 columns):
 #   Column                                Non-Null Count  Dtype 
---  ------                                --------------  ----- 
 0   Códigos de gasto con cantidad física  60 non-null     object
 1   Cantidades medias consumidas          60 non-null     object
 2   Periodo                               60 non-null     int64 
 3   Total                                 60 non-null     object
dtypes: int64(1), object(3)
memory usage: 2.0+ KB


In [9]:
df = pd.read_csv("df_util.csv", low_memory=False)
df

Unnamed: 0.1,Unnamed: 0,product_name_es,brands,categories,countries,energy-kcal_value,fat_value,saturated-fat_value,carbohydrates_value,sugars_value,proteins_value,salt_value,off:nova_groups_tags,off:nutriscore_grade,off:nutriscore_score,off:food_groups
0,0,Tomate frito,Hacendado,"Condimentos, Salsas, en:Meal sauces, Salsas de...","Marruecos, Rumania, España",77.0,3.5,0.3,9.5,6.9,1.5,0.9825,en:4-ultra-processed-food-and-drink-products,c,4.0,en:dressings-and-sauces
1,1,Kéfir natural sabor suave,Hacendado,"Lácteos, Comidas fermentadas, Productos fermen...",España,74.0,4.2,2.9,5.1,2.3,3.9,0.0800,en:1-unprocessed-or-minimally-processed-foods,b,1.0,en:dairy-desserts
2,2,Corn Flakes 0% azúcares añadidos,Hacendado,"Alimentos y bebidas de origen vegetal, Aliment...",España,373.0,1.1,0.4,82.0,0.9,6.7,1.0000,en:3-processed-foods,c,4.0,en:breakfast-cereals
3,3,Galletas de trigo espelta 0% azúcares añadidos,Hacendado,"Botanas, Snacks dulces, Galletas y pasteles, e...",España,422.0,16.0,1.3,64.0,2.0,9.0,0.8850,en:4-ultra-processed-food-and-drink-products,b,2.0,en:biscuits-and-cakes
4,4,Tomate frito,Hacendado,"Condimentos, Salsas, en:Meal sauces, Salsas de...",España,81.0,3.0,0.4,11.6,7.2,1.4,0.0000,en:3-processed-foods,a,0.0,en:dressings-and-sauces
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
3873,3873,Potón en tinta,"Aldi, Sal de plata","Productos del mar, en:Fishes and their product...",España,212.0,17.1,1.8,4.5,2.0,9.9,0.7000,en:4-ultra-processed-food-and-drink-products,b,2.0,en:fish-and-seafood
3874,3874,Colorante alimentario,Hacendado,"Aditivos alimentarios, Colorantes alimentarios",España,,,,,,,,en:4-ultra-processed-food-and-drink-products,not-applicable,,
3875,3875,Lomo embuchado,Realvalle,"Productos a base de carne, Carnes, Carne de ce...",España,203.0,6.7,2.2,0.7,0.7,35.0,3.6000,en:4-ultra-processed-food-and-drink-products,e,21.0,en:meat-other-than-poultry
3876,3876,Pollo al curry ecológico,Dehesa del milagro,"Comidas preparadas, Ecológica",España,143.0,7.0,1.5,4.7,0.0,15.0,1.4000,en:3-processed-foods,b,2.0,en:one-dish-meals
