# TP6

### `Resolver usando Pandas`

Resolver los ejercicios del TP3 utilizando la librería Pandas.

### Ejercicio 1: Cargar Datos de ventas.

El archivo datos.dat contiene el registro de las ventas realizadas.

Tiene un formato de ancho fijo:
- `fecha`:    10 lugares
- `producto`: 30 lugares
- `precio`:   10 lugares
- `cantidad`:  5 lugares

Hacer una funcion que cargue los datos en un DataFrame de Pandas.

In [111]:
import pandas as pd
def cargar_datos(archivo):
    try:
        anchos = [10, 30, 10, 5]
        nombres = ['Fecha', 'Producto', 'Precio', 'Cantidad']

        datos = pd.read_fwf(archivo, widths = anchos, names = nombres, header = None) 
        return datos
    except FileNotFoundError:
        print(f"El archivo {archivo} no se encuentra.")

datos = cargar_datos('datos.dat')
datos 

Unnamed: 0,Fecha,Producto,Precio,Cantidad
0,2024-08-27,Mirinda,1510,14
1,2024-08-27,Mirinda,1560,12
2,2024-08-28,Torasso,940,8
3,2024-08-29,Pepsi Cola,1210,10
4,2024-08-30,Mirinda,1520,1
5,2024-09-01,Mirinda,1550,15
6,2024-09-01,Sprite,810,4
7,2024-09-02,Coca Cola,1100,4
8,2024-09-02,Pepsi Cola,1220,13
9,2024-09-02,Torasso,910,5


### Ejercicio 2: Calcular el total de ventas.
Hacer una función que sume los importes vendidos (precio * cantidad) y las cantidades.


In [112]:
def calcular_totales(datos):
    datos['Importe'] = datos['Precio'] * datos['Cantidad']
    
    importe = datos['Importe'].sum()
    cantidad = datos['Cantidad'].sum()
    return importe, cantidad

importe, cantidad = calcular_totales(datos)

print(f"Las ventas fueron de ${importe:.2f} en {cantidad} unidades")

Las ventas fueron de $392730.00 en 335 unidades


### Ejercicio 3: Listar las unidades vendidas.
Listar cuántas unidades se vendieron en total para cada producto


In [113]:
def unidades_vendidas(datos):
    return datos.groupby('Producto')['Cantidad'].sum()

unidades_vendidas(datos)

Producto
Coca Cola     57
Mirinda       85
Pepsi Cola    89
Sprite        72
Torasso       32
Name: Cantidad, dtype: int64

###  Ejercicio 4: Listar el precio promedio por producto.
Hacer un listado del precio promedio por producto.


In [114]:
def precio_promedio(datos):
    # mean() para calcular el promedio, round() para redondear a 2 decimales 
    return datos.groupby('Producto')['Precio'].mean().round(2)

precio_promedio(datos)

Producto
Coca Cola     1072.50
Mirinda       1545.83
Pepsi Cola    1245.00
Sprite         841.43
Torasso        920.00
Name: Precio, dtype: float64

### Ejercicio 5: Ranking de productos
Realizar un listado de los 3 productos más vendidos ordenados por la cantidad de unidades vendidas (ordenadas de mayor a menor)


In [115]:
def ranking_productos(datos, top=3):
    vendidos = unidades_vendidas(datos)
    return vendidos.sort_values(ascending=False).head(top)

ranking_productos(datos)

Producto
Pepsi Cola    89
Mirinda       85
Sprite        72
Name: Cantidad, dtype: int64

### Ejercicio 6: Listar las ventas por mes
Realizar un listado del total de unidades vendidas por producto separado por mes.


In [116]:
def ventas_por_mes(datos):
    # Extrae el mes de la Fecha
    datos['Mes'] = pd.to_datetime(datos['Fecha']).dt.month
    
    return datos.groupby(['Producto', 'Mes'])['Cantidad'].sum()

ventas_por_mes(datos)

Producto    Mes
Coca Cola   9      57
Mirinda     8      27
            9      58
Pepsi Cola  8      10
            9      79
Sprite      9      72
Torasso     8       8
            9      24
Name: Cantidad, dtype: int64

### Ejercicio 7: Informe general

Mostrar un listado de productos ordenados alfabeticamente que contengan el precio promedio, la cantidad de unidades vendidas y el importe total vendido para cada producto

In [117]:
def resumen_ventas(datos):
    datos['Importe'] = datos['Precio'] * datos['Cantidad']

    # Sumo el importe total por producto y ordeno los resultados por nombre del producto
    resumen = datos.groupby('Producto').agg({'Importe': 'sum'}).sort_index()

    # Renombro la columna importe
    resumen = resumen.rename(columns={
        'Importe': 'Importe Total',
    })
    resumen['Unidades Vendidas'] = unidades_vendidas(datos)
    resumen['Precio Promedio'] = precio_promedio(datos)
    return resumen

resumen_ventas(datos)

Unnamed: 0_level_0,Importe Total,Unidades Vendidas,Precio Promedio
Producto,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Coca Cola,60780,57,1072.5
Mirinda,131080,85,1545.83
Pepsi Cola,110510,89,1245.0
Sprite,61040,72,841.43
Torasso,29320,32,920.0


## `Resolver usando NumPy`
## Resolver el ejercicio 2 del tp1 usando NumPy

### Ejercicio 8

Escribe una función en Python que encuentre los valores de `a`, `b`, y `c` para que la función cuadrática `f(x) = a x^2 + b x + c` pase exactamente por los siguientes puntos:

| x  | y  |
|---:|---:|
|  0 |  0 |
|  1 |  8 |
|  2 | 12 |
|  3 | 12 |
|  5 |  0 |

### Requisitos:
- La función debe explorar posibles valores de `a`, `b`, y `c` utilizando un método de prueba y error.
- Debe devolver los valores que hagan que la diferencia entre la función `f(x)` y los valores medidos `y` sea exactamente cero para cada punto.

> **Pista**: Los valores de `a`, `b`, y `c` son números pequeños.

La idea es implementar el mismo algoritmo que se uso en el TP1 pero usando NumPy en lugar de Python puro.

In [121]:
import numpy as np
def f(x, coeficientes):
    a,b,c = coeficientes
    return a*x**2 + b*x + c

def error(y, y_pred):
    return y - y_pred

X = np.array([0,1,2,3,5])
Y = np.array([0,8,12,12,0])

def buscar_coeficientes():
    for a in range(-10, 11):
        for b in range(-10, 11):
            for c in range(-10, 11):
                coeficientes = (a, b, c)
                y_pred = f(X, coeficientes)
                err = error(Y, y_pred)
                if np.all(err == 0):
                    return coeficientes

coeficientes = buscar_coeficientes()
coeficientes

(-2, 10, 0)

### Ejercicio 9: Resolver el ejercicio 3 del TP1 usando NumPy
Buscar los coeficientes de la función que minimice la suma de los cuadrados de las diferencias entre los valores medidos y los valores de la función.

1. Crear un array con los coeficientes elegidos al azar (usar `randint(-10,10,3)`).
2. Calcular el valor de la función y el error correspondiente.
3. Mientras que el error sea mayor a 1:
    1. Definir nuevos coeficientes agregándoles un pequeño valor al azar a los coeficientes actuales (aprendizaje = 0.001).
    2. Si el error para los nuevos coeficientes es menor que el anterior, reemplazar los coeficientes actuales por los nuevos.


In [143]:
import numpy as np
from numpy.random import randint

def f(x, coeficientes):
    a,b,c = coeficientes
    return a*x**2 + b*x + c

def error(y, y_pred):
    return np.sum((y - y_pred)**2)

X = np.array([0, 1, 2, 3, 5])
Y = np.array([0, 8,12,11, 1]) # Observar que no son los mismos valores que en el ejemplo anterior

def buscar_coeficientes():
    coeficientes = randint(-10, 10, 3)
    y_pred = f(X, coeficientes)
    err = error(Y, y_pred)
    while err > 1:
        nuevos_coeficientes = coeficientes + randint(-1, 2, 3) * 0.001
        nuevo_y = f(X, nuevos_coeficientes)
        nuevo_err = error(Y, nuevo_y)
        if nuevo_err < err:
            coeficientes = nuevos_coeficientes
            err = nuevo_err
    return coeficientes


coeficientes = buscar_coeficientes()
coeficientes

array([-1.779,  8.958,  0.621])