# TP6

### `Resolver usando Pandas`

Resolver los ejercicios del TP3 utilizando la librería Pandas.

### Ejercicio 1: Cargar Datos de ventas.

El archivo datos.dat contiene el registro de las ventas realizadas.

Tiene un formato de ancho fijo:
- `fecha`:    10 lugares
- `producto`: 30 lugares
- `precio`:   10 lugares
- `cantidad`:  5 lugares

Hacer una funcion que cargue los datos en un DataFrame de Pandas.

In [1]:
import pandas as pd

def cargar_datos():
    colspecs = [(0, 10), (10, 40), (40, 50), (50, 55)]
    names = ['fecha', 'producto', 'precio', 'cantidad']
    df = pd.read_fwf('datos.dat', colspecs=colspecs, names=names)
    df['fecha'] = pd.to_datetime(df['fecha'])
    return df

datos = cargar_datos()

### Ejercicio 2: Calcular el total de ventas.
Hacer una función que sume los importes vendidos (precio * cantidad) y las cantidades.


In [2]:
def calcular_totales(datos):
    datos['importe'] = datos['precio'] * datos['cantidad']
    total_importe = datos['importe'].sum()
    total_cantidad = datos['cantidad'].sum()
    return total_importe, total_cantidad

importe, cantidad = calcular_totales(datos)
print(f"Las ventas fueron de ${importe:.2f} en {cantidad} unidades")

Las ventas fueron de $392730.00 en 335 unidades


### Ejercicio 3: Listar las unidades vendidas.
Listar cuántas unidades se vendieron en total para cada producto


In [3]:
def unidades_vendidas(datos):
    resumen = datos.groupby('producto')['cantidad'].sum().sort_index()
    print(f"{'producto':<30} {'unidades'}")
    print("-" * 40) 
    for producto, cantidad in resumen.items():
        print(f"{producto:<30} {cantidad}")

unidades_vendidas(datos)

producto                       unidades
----------------------------------------
Coca Cola                      57
Mirinda                        85
Pepsi Cola                     89
Sprite                         72
Torasso                        32


###  Ejercicio 4: Listar el precio promedio por producto.
Hacer un listado del precio promedio por producto.


In [4]:
def precio_promedio(datos):
    promedio = datos.groupby('producto')['precio'].mean().sort_index()
    print(f"{'producto':<30} {'precio'}")
    print("-" * 40)  
    for producto, precio in promedio.items():
        print(f"{producto:<30} {precio:.2f}")

precio_promedio(datos)

producto                       precio
----------------------------------------
Coca Cola                      1072.50
Mirinda                        1545.83
Pepsi Cola                     1245.00
Sprite                         841.43
Torasso                        920.00


### Ejercicio 5: Ranking de productos
Realizar un listado de los 3 productos más vendidos ordenados por la cantidad de unidades vendidas (ordenadas de mayor a menor)


In [5]:
def ranking_productos(datos, top=3):
    ranking = datos.groupby('producto')['cantidad'].sum().nlargest(top)
    print(f"{'producto':<30} {'unidades'}")
    print("-" * 40)  
    for producto, cantidad in ranking.items():
        print(f"{producto:<30} {cantidad}")

ranking_productos(datos)

producto                       unidades
----------------------------------------
Pepsi Cola                     89
Mirinda                        85
Sprite                         72


### Ejercicio 6: Listar las ventas por mes
Realizar un listado del total de unidades vendidas por producto separado por mes.


In [6]:
def ventas_por_mes(datos):
    datos['mes'] = datos['fecha'].dt.to_period('M')
    ventas_mensuales = datos.groupby(['mes', 'producto'])['cantidad'].sum().sort_index()
    print(f"{'mes':<10} {'producto':<20} {'unidades'}")
    print("-" * 45) 
    for (mes, producto), cantidad in ventas_mensuales.items():
        print(f"{mes!s:<10} {producto:<20} {cantidad}")

ventas_por_mes(datos)

mes        producto             unidades
---------------------------------------------
2024-08    Mirinda              27
2024-08    Pepsi Cola           10
2024-08    Torasso              8
2024-09    Coca Cola            57
2024-09    Mirinda              58
2024-09    Pepsi Cola           79
2024-09    Sprite               72
2024-09    Torasso              24


### Ejercicio 7: Informe general

Mostrar un listado de productos ordenados alfabeticamente que contengan el precio promedio, la cantidad de unidades vendidas y el importe total vendido para cada producto

In [7]:
def resumen_ventas(datos):
    datos['importe'] = datos['precio'] * datos['cantidad']
    resumen = datos.groupby('producto').agg(
        precio_promedio=('precio', 'mean'),
        unidades_vendidas=('cantidad', 'sum'),
        importe_total=('importe', 'sum')
    ).sort_index()
    
    print(f"{'producto':<30} {'precio':<10} {'cantidad':<10} {'importe':<10}")
    print("-" * 60) 
    
    for producto, row in resumen.iterrows():
        print(f"{producto:<30} {row['precio_promedio']:<10.2f} {row['unidades_vendidas']:<10} {row['importe_total']:<10.2f}")

resumen_ventas(datos)

producto                       precio     cantidad   importe   
------------------------------------------------------------
Coca Cola                      1072.50    57.0       60780.00  
Mirinda                        1545.83    85.0       131080.00 
Pepsi Cola                     1245.00    89.0       110510.00 
Sprite                         841.43     72.0       61040.00  
Torasso                        920.00     32.0       29320.00  


## `Resolver usando NumPy`
## Resolver el ejercicio 2 del tp1 usando NumPy

### Ejercicio 8

Escribe una función en Python que encuentre los valores de `a`, `b`, y `c` para que la función cuadrática `f(x) = a x^2 + b x + c` pase exactamente por los siguientes puntos:

| x  | y  |
|---:|---:|
|  0 |  0 |
|  1 |  8 |
|  2 | 12 |
|  3 | 12 |
|  5 |  0 |

### Requisitos:
- La función debe explorar posibles valores de `a`, `b`, y `c` utilizando un método de prueba y error.
- Debe devolver los valores que hagan que la diferencia entre la función `f(x)` y los valores medidos `y` sea exactamente cero para cada punto.

> **Pista**: Los valores de `a`, `b`, y `c` son números pequeños.

La idea es implementar el mismo algoritmo que se uso en el TP1 pero usando NumPy en lugar de Python puro.

In [8]:
import numpy as np

def f(x, coeficientes):
    a, b, c = coeficientes
    return a*x**2 + b*x + c

X = np.array([0, 1, 2, 3, 5])
Y = np.array([0, 8, 12, 12, 0])

A = np.vstack([X**2, X, np.ones(len(X))]).T

coeficientes, _, _, _ = np.linalg.lstsq(A, Y, rcond=None)

print("Coeficientes a, b, c:", coeficientes)

Y_pred = f(X, coeficientes)
print("Valores predichos por la función:", Y_pred)

error = np.abs(Y - Y_pred)
print("Error en cada punto:", error)

tolerancia = 1e-10  
if np.all(error < tolerancia):
    print("La función pasa exactamente por todos los puntos dados.")
else:
    print("La función no pasa exactamente por todos los puntos dados.")

Coeficientes a, b, c: [-2.00000000e+00  1.00000000e+01 -4.88498131e-15]
Valores predichos por la función: [-4.88498131e-15  8.00000000e+00  1.20000000e+01  1.20000000e+01
 -4.88498131e-15]
Error en cada punto: [4.88498131e-15 0.00000000e+00 3.55271368e-15 5.32907052e-15
 4.88498131e-15]
La función pasa exactamente por todos los puntos dados.


### Ejercicio 9: Resolver el ejercicio 3 del TP1 usando NumPy
Buscar los coeficientes de la función que minimice la suma de los cuadrados de las diferencias entre los valores medidos y los valores de la función.

1. Crear un array con los coeficientes elegidos al azar (usar `randint(-10,10,3)`).
2. Calcular el valor de la función y el error correspondiente.
3. Mientras que el error sea mayor a 1:
    1. Definir nuevos coeficientes agregándoles un pequeño valor al azar a los coeficientes actuales (aprendizaje = 0.001).
    2. Si el error para los nuevos coeficientes es menor que el anterior, reemplazar los coeficientes actuales por los nuevos.


In [9]:
import numpy as np
from numpy.random import randint

def f(x, coeficientes):
    a, b, c = coeficientes
    return a*x**2 + b*x + c

def error(y, y_pred):
    return np.sum((y - y_pred)**2)

X = np.array([0, 1, 2, 3, 5])
Y = np.array([0, 8, 12, 11, 1])

def buscar_coeficientes():
    coeficientes = randint(-10, 10, 3)
    
    Y_pred = f(X, coeficientes)
    error_actual = error(Y, Y_pred)
    
    aprendizaje = 0.001
    
    while error_actual > 1:
        nuevos_coeficientes = coeficientes + np.random.uniform(-aprendizaje, aprendizaje, 3)
        
        Y_pred_nuevo = f(X, nuevos_coeficientes)
        nuevo_error = error(Y, Y_pred_nuevo)
        
        
        if nuevo_error < error_actual:
            coeficientes = nuevos_coeficientes
            error_actual = nuevo_error
            
    return coeficientes


coeficientes = buscar_coeficientes()
print("Coeficientes encontrados:", coeficientes)

Coeficientes encontrados: [-1.78219734  8.96549492  0.62779017]
