# Análisis de Datos

Este notebook analiza los datos de ventas del archivo `data_file.csv` y genera una visualización de los resultados.

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import os

# Load data
data_path = os.path.join('..', 'data', 'input', 'data_file.csv')
df = pd.read_csv(data_path)

print("Dataset shape:", df.shape)
df.head()

## Exploración de Datos

Primero exploramos la estructura y estadísticas básicas del dataset.

In [None]:
# Basic statistics
print("Columnas:", df.columns.tolist())
print("\nInformación del dataset:")
df.info()
print("\nEstadísticas descriptivas:")
df.describe()

## Análisis de Ventas por Categoría

Analizamos las ventas totales por categoría de producto.

In [None]:
# Group by category
sales_by_category = df.groupby('categoria')['total'].sum().sort_values(ascending=False)
print("Ventas por categoría:")
print(sales_by_category)

## Visualización

Creamos un gráfico de barras con las ventas por categoría.

In [None]:
# Create visualization
plt.figure(figsize=(10, 6))
sales_by_category.plot(kind='bar', color='steelblue')
plt.title('Ventas Totales por Categoría')
plt.xlabel('Categoría')
plt.ylabel('Total de Ventas')
plt.xticks(rotation=45)
plt.tight_layout()

# Save the plot
output_path = os.path.join('..', 'data', 'output', 'results.png')
plt.savefig(output_path)
print(f"Gráfico guardado en: {output_path}")

plt.show()