# Desaf√≠o Adidas: An√°lisis r√°pido (10 min) üìä

Analiza el dataset de ventas de Adidas sin pandas.

**Ejercicios:**
1. **Exploraci√≥n**: ¬øCu√°ntas transacciones y qu√© columnas hay?
2. **Venta promedio**: Promedio de 'Total Sales'
3. **Top retailer**: ¬øCu√°l tiene m√°s transacciones?
4. **Top producto**: ¬øCu√°l genera m√°s ventas totales?
5. **Funci√≥n**: `top_k_productos(ventas, k)` que devuelva los k productos con m√°s ventas


In [None]:
# Funciones auxiliares
def limpiar_numero(valor):
    if isinstance(valor, str):
        valor = valor.strip()
        if valor in ['', 'N/A']:
            return 0
        return int(float(valor.replace(',', '')))
    return int(valor) if valor else 0

def limpiar_moneda(valor):
    if isinstance(valor, str):
        valor = valor.strip()
        if valor in ['', 'N/A']:
            return 0.0
        return float(valor.replace('$', '').replace(',', ''))
    return float(valor) if valor else 0.0


In [None]:
# Cargar datos
import csv
from collections import defaultdict, Counter

ventas = []
with open('adidas_sales_kaggle.csv', encoding='utf-8-sig') as f:
    reader = csv.DictReader(f)
    for row in reader:
        try:
            row['Total Sales'] = limpiar_numero(row['Total Sales'])
            row['Operating Profit'] = limpiar_moneda(row['Operating Profit'])
            ventas.append(row)
        except:
            continue

print(f"‚úÖ Cargadas: {len(ventas):,} transacciones")


In [None]:
# 1) Exploraci√≥n
print(f"Transacciones: {len(ventas):,}")
print(f"Columnas: {list(ventas[0].keys())[:5]}...")  # Solo primeras 5


In [None]:
# 2) Venta promedio
total_ventas = sum(venta['Total Sales'] for venta in ventas)
venta_promedio = total_ventas / len(ventas) if ventas else 0

print(f"üíµ Venta promedio: ${venta_promedio:,.2f}")


In [None]:
# 3) Top retailer (m√°s transacciones)
conteo_retailers = Counter(venta['Retailer'] for venta in ventas)
retailer_top = conteo_retailers.most_common(1)[0]

print(f"üè™ Top retailer: {retailer_top[0]} con {retailer_top[1]:,} transacciones")


In [None]:
# 4) Top producto (m√°s ventas totales)
ventas_por_producto = defaultdict(float)
for venta in ventas:
    ventas_por_producto[venta['Product']] += venta['Total Sales']

producto_top = max(ventas_por_producto.items(), key=lambda x: x[1])

print(f"‚≠ê Top producto: {producto_top[0]} con ventas de ${producto_top[1]:,.0f}")


In [None]:
# 5) Funci√≥n top_k_productos
def top_k_productos(ventas, k=3):
    """Devuelve los k productos con m√°s ventas totales"""
    ventas_por_producto = defaultdict(float)
    for venta in ventas:
        ventas_por_producto[venta['Product']] += venta['Total Sales']

    # Ordenar por ventas totales (descendente) y tomar los primeros k
    top_productos = sorted(ventas_por_producto.items(), key=lambda x: x[1], reverse=True)[:k]

    return top_productos

# Probar funci√≥n
print("Top 3 productos:")
top_3_productos = top_k_productos(ventas, 3)
for i, (producto, ventas_total) in enumerate(top_3_productos, 1):
    print(f"  {i}. {producto}: ${ventas_total:,.0f}")
