# Análisis del Dataset de Alimentos

In [None]:
import pandas as pd

# Load the dataset
file_path = '/mnt/data/FOOD-DATA-GROUP1.csv'
data = pd.read_csv(file_path)

# Display basic information about the dataset
data_info = data.info()
data_description = data.describe()

# Extract a brief description of what five columns represent
columns_description = {
    'Caloric Value': 'Representa la cantidad de calorías en el alimento, medida en kilocalorías (kcal).',
    'Fat': 'Indica la cantidad total de grasa en el alimento, medida en gramos (g).',
    'Carbohydrates': 'Mide la cantidad de carbohidratos presentes en el alimento, en gramos (g).',
    'Protein': 'Representa la cantidad de proteínas en el alimento, en gramos (g).',
    'Sodium': 'Indica la cantidad de sodio en el alimento, medida en miligramos (mg).',
}

data_info, data_description, columns_description

## Estadísticas del Dataset

In [None]:
# Display dataset statistics
data_description

## Descripción de Columnas Seleccionadas

In [None]:
# Display description of selected columns
columns_description

## Columnas recomendadas para modelos de machine learning

In [None]:
# Recommended columns for machine learning
ml_columns = ["Caloric Value", "Fat", "Carbohydrates", "Protein", "Sodium"]
ml_columns

## Generación del Informe en PDF

In [None]:
from fpdf import FPDF

# Create PDF document
pdf = FPDF()
pdf.add_page()
pdf.set_font("Arial", size=12)

# Add title
pdf.cell(200, 10, txt="Análisis del Dataset de Alimentos", ln=True, align='C')

# Add basic information
pdf.cell(200, 10, txt="Tipos de datos:", ln=True, align='L')
pdf.cell(200, 10, txt=str(data.dtypes), ln=True, align='L')

pdf.cell(200, 10, txt="Cantidad de columnas (campos): 37", ln=True, align='L')
pdf.cell(200, 10, txt="Cantidad de filas (registros): 551", ln=True, align='L')

# Add statistics
pdf.cell(200, 10, txt="Estadísticas del dataset:", ln=True, align='L')
pdf.cell(200, 10, txt=str(data_description), ln=True, align='L')

# Add columns description
pdf.cell(200, 10, txt="Descripción de cinco columnas:", ln=True, align='L')
for column, description in columns_description.items():
    pdf.cell(200, 10, txt=f"{column}: {description}", ln=True, align='L')

# Add ML columns
pdf.cell(200, 10, txt="Columnas recomendadas para modelos de machine learning:", ln=True, align='L')
pdf.cell(200, 10, txt="Objetivo: Predecir el valor nutricional de un alimento o recomendar alimentos saludables.", ln=True, align='L')
pdf.cell(200, 10, txt="Columnas como entrada:", ln=True, align='L')
for col in ml_columns:
    pdf.cell(200, 10, txt=f"- {col}", ln=True, align='L')

# Save PDF
pdf_output_path = "/mnt/data/food_data_analysis.pdf"
pdf.output(pdf_output_path)