# TP6

### `Resolver usando Pandas`

Resolver los ejercicios del TP3 utilizando la librería Pandas.

### Ejercicio 1: Cargar Datos de ventas.

El archivo datos.dat contiene el registro de las ventas realizadas.

Tiene un formato de ancho fijo:
- `fecha`:    10 lugares
- `producto`: 30 lugares
- `precio`:   10 lugares
- `cantidad`:  5 lugares

Hacer una funcion que cargue los datos en un DataFrame de Pandas.

In [19]:
import pandas as pd

def cargar_datos():
    datos = pd.read_fwf('datos.dat', widths=[10, 30, 10, 5], header=None, 
                        names=['fecha', 'producto', 'precio', 'cantidad'])
    
    datos['precio'] = datos['precio'].astype(float)
    datos['cantidad'] = datos['cantidad'].astype(int)
    
    return datos

# Cargar los datos
datos = cargar_datos()
print(datos)


         fecha    producto  precio  cantidad
0   2024-08-27     Mirinda  1510.0        14
1   2024-08-27     Mirinda  1560.0        12
2   2024-08-28     Torasso   940.0         8
3   2024-08-29  Pepsi Cola  1210.0        10
4   2024-08-30     Mirinda  1520.0         1
5   2024-09-01     Mirinda  1550.0        15
6   2024-09-01      Sprite   810.0         4
7   2024-09-02   Coca Cola  1100.0         4
8   2024-09-02  Pepsi Cola  1220.0        13
9   2024-09-02     Torasso   910.0         5
10  2024-09-02     Torasso   920.0         3
11  2024-09-03   Coca Cola  1020.0         8
12  2024-09-03     Mirinda  1570.0         7
13  2024-09-03     Mirinda  1590.0         2
14  2024-09-04  Pepsi Cola  1220.0        13
15  2024-09-05     Mirinda  1500.0         3
16  2024-09-05  Pepsi Cola  1300.0         5
17  2024-09-06   Coca Cola  1080.0         1
18  2024-09-06      Sprite   860.0        12
19  2024-09-06     Torasso   930.0         3
20  2024-09-07   Coca Cola  1080.0        14
21  2024-0

### Ejercicio 2: Calcular el total de ventas.
Hacer una función que sume los importes vendidos (precio * cantidad) y las cantidades.


In [20]:
import pandas as pd

def calcular_totales(datos):
    datos['importe'] = datos['precio'] * datos['cantidad']
    
    total_importe = datos['importe'].sum()
    total_cantidad = datos['cantidad'].sum()
    
    return total_importe, total_cantidad

datos = cargar_datos()  

importe, cantidad = calcular_totales(datos)

print(f"Las ventas fueron de ${importe:,.2f} en {cantidad} unidades")


Las ventas fueron de $392,730.00 en 335 unidades


### Ejercicio 3: Listar las unidades vendidas.
Listar cuántas unidades se vendieron en total para cada producto


In [21]:
import pandas as pd

def unidades_vendidas(datos):
    resumen = datos.groupby('producto')['cantidad'].sum().reset_index()
    
    resumen.columns = ['producto', 'total_vendido']
    
    return resumen
datos = cargar_datos()  
resultado = unidades_vendidas(datos)

print(resultado)


     producto  total_vendido
0   Coca Cola             57
1     Mirinda             85
2  Pepsi Cola             89
3      Sprite             72
4     Torasso             32


###  Ejercicio 4: Listar el precio promedio por producto.
Hacer un listado del precio promedio por producto.


In [22]:
import pandas as pd

def precio_promedio(datos):
    promedio = datos.groupby('producto')['precio'].mean().reset_index()
    promedio.columns = ['producto', 'precio_promedio']
    return promedio

datos = cargar_datos()  
resultado = precio_promedio(datos)
print(resultado)


     producto  precio_promedio
0   Coca Cola      1072.500000
1     Mirinda      1545.833333
2  Pepsi Cola      1245.000000
3      Sprite       841.428571
4     Torasso       920.000000


### Ejercicio 5: Ranking de productos
Realizar un listado de los 3 productos más vendidos ordenados por la cantidad de unidades vendidas (ordenadas de mayor a menor)


In [23]:
import pandas as pd

def ranking_productos(datos, top=3):
    ranking = datos.groupby('producto')['cantidad'].sum().reset_index()
    ranking = ranking.sort_values(by='cantidad', ascending=False)
    return ranking.head(top)

datos = cargar_datos()  
resultado = ranking_productos(datos)
print(resultado)


     producto  cantidad
2  Pepsi Cola        89
1     Mirinda        85
3      Sprite        72


### Ejercicio 6: Listar las ventas por mes
Realizar un listado del total de unidades vendidas por producto separado por mes.


In [24]:
import pandas as pd

def ventas_por_mes(datos):
    datos['fecha'] = pd.to_datetime(datos['fecha'], format='%Y-%m-%d')  
    datos['mes'] = datos['fecha'].dt.to_period('M')  
    resumen = datos.groupby(['producto', 'mes'])['cantidad'].sum().reset_index()
    resumen.columns = ['producto', 'mes', 'total_unidades_vendidas']
    
    return resumen

datos = cargar_datos()  
resultado = ventas_por_mes(datos)
print(resultado)


     producto      mes  total_unidades_vendidas
0   Coca Cola  2024-09                       57
1     Mirinda  2024-08                       27
2     Mirinda  2024-09                       58
3  Pepsi Cola  2024-08                       10
4  Pepsi Cola  2024-09                       79
5      Sprite  2024-09                       72
6     Torasso  2024-08                        8
7     Torasso  2024-09                       24


### Ejercicio 7: Informe general

Mostrar un listado de productos ordenados alfabeticamente que contengan el precio promedio, la cantidad de unidades vendidas y el importe total vendido para cada producto

In [25]:
import pandas as pd

def resumen_ventas(datos):
    
    datos['importe'] = datos['precio'] * datos['cantidad']
    
    resumen = datos.groupby('producto').agg(
        precio_promedio=('precio', 'mean'),
        total_unidades_vendidas=('cantidad', 'sum'),
        importe_total_vendido=('importe', 'sum')
    ).reset_index()
    
    resumen = resumen.sort_values(by='producto')
    
    return resumen

datos = cargar_datos()  
resultado = resumen_ventas(datos)
print(resultado)


     producto  precio_promedio  total_unidades_vendidas  importe_total_vendido
0   Coca Cola      1072.500000                       57                60780.0
1     Mirinda      1545.833333                       85               131080.0
2  Pepsi Cola      1245.000000                       89               110510.0
3      Sprite       841.428571                       72                61040.0
4     Torasso       920.000000                       32                29320.0


## `Resolver usando NumPy`
## Resolver el ejercicio 2 del tp1 usando NumPy

### Ejercicio 8

Escribe una función en Python que encuentre los valores de `a`, `b`, y `c` para que la función cuadrática `f(x) = a x^2 + b x + c` pase exactamente por los siguientes puntos:

| x  | y  |
|---:|---:|
|  0 |  0 |
|  1 |  8 |
|  2 | 12 |
|  3 | 12 |
|  5 |  0 |

### Requisitos:
- La función debe explorar posibles valores de `a`, `b`, y `c` utilizando un método de prueba y error.
- Debe devolver los valores que hagan que la diferencia entre la función `f(x)` y los valores medidos `y` sea exactamente cero para cada punto.

> **Pista**: Los valores de `a`, `b`, y `c` son números pequeños.

La idea es implementar el mismo algoritmo que se uso en el TP1 pero usando NumPy en lugar de Python puro.

In [26]:
import numpy as np

def f(x, coeficientes):
    a, b, c = coeficientes
    return a * x**2 + b * x + c

def error(y, y_pred):
    return y - y_pred

X = np.array([0, 1, 2, 3, 5])
Y = np.array([0, 8, 12, 12, 0])

def buscar_coeficientes():
    rangos = np.linspace(-10, 10, 100) 
    
    mejor_error = float('inf')
    mejores_coeficientes = None
    
    for a in rangos:
        for b in rangos:
            for c in rangos:
                
                y_pred = f(X, (a, b, c))
                
                total_error = np.sum(np.abs(error(Y, y_pred)))  
                
                if total_error < mejor_error:
                    mejor_error = total_error
                    mejores_coeficientes = (a, b, c)
                    
                if total_error == 0:
                    return (a, b, c)
    
    return tuple(map(int, np.round(mejores_coeficientes)))

coeficientes = buscar_coeficientes()
print(coeficientes)



(-2, 10, 0)


### Ejercicio 9: Resolver el ejercicio 3 del TP1 usando NumPy
Buscar los coeficientes de la función que minimice la suma de los cuadrados de las diferencias entre los valores medidos y los valores de la función.

1. Crear un array con los coeficientes elegidos al azar (usar `randint(-10,10,3)`).
2. Calcular el valor de la función y el error correspondiente.
3. Mientras que el error sea mayor a 1:
    1. Definir nuevos coeficientes agregándoles un pequeño valor al azar a los coeficientes actuales (aprendizaje = 0.001).
    2. Si el error para los nuevos coeficientes es menor que el anterior, reemplazar los coeficientes actuales por los nuevos.


In [27]:
import numpy as np
from numpy.random import randint

def f(x, coeficientes):
    a, b, c = coeficientes
    return a * x**2 + b * x + c

def error(y, y_pred):
    return np.sum((y - y_pred)**2)

X = np.array([0, 1, 2, 3, 5])
Y = np.array([0, 8, 12, 11, 1])  

def buscar_coeficientes():
    coeficientes = randint(-10, 10, 3)
    
    y_pred = f(X, coeficientes)
    current_error = error(Y, y_pred)

    learning_rate = 0.001
    
    while current_error > 1:
        new_coeficientes = coeficientes + np.random.uniform(-learning_rate, learning_rate, 3)
        
        y_pred_new = f(X, new_coeficientes)
        new_error = error(Y, y_pred_new)
        
        if new_error < current_error:
            coeficientes = new_coeficientes
            current_error = new_error
    
    print(f"Los coeficientes son {coeficientes} y el error es {current_error}")
    return coeficientes

coeficientes = buscar_coeficientes()
print(coeficientes)


Los coeficientes son [-1.78043493  8.96193299  0.62646193] y el error es 0.9999147259590423
[-1.78043493  8.96193299  0.62646193]
