# TP6

### `Resolver usando Pandas`

Resolver los ejercicios del TP3 utilizando la librería Pandas.

### Ejercicio 1: Cargar Datos de ventas.

El archivo datos.dat contiene el registro de las ventas realizadas.

Tiene un formato de ancho fijo:
- `fecha`:    10 lugares
- `producto`: 30 lugares
- `precio`:   10 lugares
- `cantidad`:  5 lugares

Hacer una funcion que cargue los datos en un DataFrame de Pandas.

In [None]:
import pandas as pd  

def cargar_datos():
    
    widths = [10, 30, 10, 5]
    
    df = pd.read_fwf('datos.dat', 
                     widths=widths,
                     names=['fecha', 'producto', 'precio', 'cantidad'])
    
    df['fecha'] = pd.to_datetime(df['fecha'])
    
    df['producto'] = df['producto'].str.strip()
    
    return df
datos = cargar_datos()
datos 


ModuleNotFoundError: No module named 'pandas'

### Ejercicio 2: Calcular el total de ventas.
Hacer una función que sume los importes vendidos (precio * cantidad) y las cantidades.


In [None]:
def calcular_totales(datos):
    pass # implementar

importe = (datos['precio'] * datos['cantidad']).sum()
cantidad = datos['cantidad'].sum()    
print(f"Las ventas fueron de ${importe:.2f} en {cantidad} unidades")


### Ejercicio 3: Listar las unidades vendidas.
Listar cuántas unidades se vendieron en total para cada producto


In [None]:

def unidades_vendidas(datos):
    total_por_producto = datos.groupby('producto')['cantidad'].sum()
    print("\nUnidades vendidas por producto:")
    for producto, cantidad in total_por_producto.items():
        print(f"{producto}: {cantidad}")
unidades_vendidas(datos)

###  Ejercicio 4: Listar el precio promedio por producto.
Hacer un listado del precio promedio por producto.


In [None]:
def precio_promedio(datos):
    
    promedio_por_producto = datos.groupby('producto')['precio'].mean()
    print("\nPrecio promedio por producto:")
    for producto, precio in promedio_por_producto.items():
        print(f"{producto}: ${precio:.2f}")
        
precio_promedio(datos)

### Ejercicio 5: Ranking de productos
Realizar un listado de los 3 productos más vendidos ordenados por la cantidad de unidades vendidas (ordenadas de mayor a menor)


In [None]:
def ranking_productos(datos, top=3):
    ranking = datos.groupby('producto')['cantidad'].sum().sort_values(ascending=False).head(top)
    print("\nTop 3 productos más vendidos:")
    for producto, cantidad in ranking.items():
        print(f"{producto}: {cantidad} unidades")
ranking_productos(datos)


### Ejercicio 6: Listar las ventas por mes
Realizar un listado del total de unidades vendidas por producto separado por mes.


In [None]:

def ventas_por_mes(datos):

    datos['mes'] = datos['fecha'].dt.strftime('%Y-%m')
    
    ventas_mensual = datos.pivot_table(
        index='producto',
        columns='mes',
        values='cantidad',
        aggfunc='sum',
        fill_value=0
    )
    
    print("\nVentas por mes y producto:")
    print(ventas_mensual)
ventas_por_mes(datos)

### Ejercicio 7: Informe general

Mostrar un listado de productos ordenados alfabeticamente que contengan el precio promedio, la cantidad de unidades vendidas y el importe total vendido para cada producto

In [None]:

def resumen_ventas(datos):
    resumen = datos.groupby('producto').agg({
        'precio': 'mean',
        'cantidad': 'sum'
    }).sort_index()
    
    resumen['importe_total'] = resumen['precio'] * resumen['cantidad']
    
    print("\nResumen general por producto:")
    for producto in resumen.index:
        print(f"\n{producto}:")
        print(f"Precio promedio: ${resumen.loc[producto, 'precio']:.2f}")
        print(f"Unidades vendidas: {int(resumen.loc[producto, 'cantidad'])}")
        print(f"Importe total: ${resumen.loc[producto, 'importe_total']:.2f}")
resumen_ventas(datos)

## `Resolver usando NumPy`
## Resolver el ejercicio 2 del tp1 usando NumPy

### Ejercicio 8

Escribe una función en Python que encuentre los valores de `a`, `b`, y `c` para que la función cuadrática `f(x) = a x^2 + b x + c` pase exactamente por los siguientes puntos:

| x  | y  |
|---:|---:|
|  0 |  0 |
|  1 |  8 |
|  2 | 12 |
|  3 | 12 |
|  5 |  0 |

### Requisitos:
- La función debe explorar posibles valores de `a`, `b`, y `c` utilizando un método de prueba y error.
- Debe devolver los valores que hagan que la diferencia entre la función `f(x)` y los valores medidos `y` sea exactamente cero para cada punto.

> **Pista**: Los valores de `a`, `b`, y `c` son números pequeños.

La idea es implementar el mismo algoritmo que se uso en el TP1 pero usando NumPy en lugar de Python puro.

In [None]:
import numpy as np

def f(x, coeficientes):
    a, b, c = coeficientes
    return a * x**2 + b * x + c

def error(y, y_pred):
    return y - y_pred

X = np.array([0, 1, 2, 3, 5])
Y = np.array([0, 8, 12, 12, 0])

def buscar_coeficientes():
    mejor_error = float('inf')
    mejor_coeficientes = (0, 0, 0)
    
    for a in np.arange(-10, 10, 0.1):
        for b in np.arange(-10, 10, 0.1):
            for c in np.arange(-10, 10, 0.1):
                Y_pred = f(X, (a, b, c))
                
                total_error = np.sum(np.abs(error(Y, Y_pred)))
                
                if total_error < mejor_error:
                    mejor_error = total_error
                    mejor_coeficientes = (a, b, c)
                
                if total_error == 0:
                    return mejor_coeficientes
    
    return mejor_coeficientes

coeficientes = buscar_coeficientes()
coeficientes


(-2, 10, 0)

### Ejercicio 9: Resolver el ejercicio 3 del TP1 usando NumPy
Buscar los coeficientes de la función que minimice la suma de los cuadrados de las diferencias entre los valores medidos y los valores de la función.

1. Crear un array con los coeficientes elegidos al azar (usar `randint(-10,10,3)`).
2. Calcular el valor de la función y el error correspondiente.
3. Mientras que el error sea mayor a 1:
    1. Definir nuevos coeficientes agregándoles un pequeño valor al azar a los coeficientes actuales (aprendizaje = 0.001).
    2. Si el error para los nuevos coeficientes es menor que el anterior, reemplazar los coeficientes actuales por los nuevos.


In [None]:
import numpy as np
from numpy.random import randint

def f(x, coeficientes):
    a, b, c = coeficientes
    return a * x**2 + b * x + c

def error(y, y_pred):
    return np.sum((y - y_pred)**2)

X = np.array([0, 1, 2, 3, 5])
Y = np.array([0, 8, 12, 11, 1]) 

def buscar_coeficientes():
    coeficientes = randint(-10, 10, 3) 
    aprendizaje = 0.001
    err_actual = error(Y, f(X, coeficientes))
    
    while err_actual > 1:  
        nuevos_coeficientes = coeficientes + np.random.uniform(-aprendizaje, aprendizaje, 3)
        err_nuevo = error(Y, f(X, nuevos_coeficientes))
        
        if err_nuevo < err_actual:
            coeficientes = nuevos_coeficientes
            err_actual = err_nuevo
    
    return coeficientes

coeficientes = buscar_coeficientes()
coeficientes



Los coeficientes son [-1.781  8.961  0.615] y el error es 0.9958049999998968


array([-1.781,  8.961,  0.615])