# TP6

### `Resolver usando Pandas`

Resolver los ejercicios del TP3 utilizando la librería Pandas.

### Ejercicio 1: Cargar Datos de ventas.

El archivo datos.dat contiene el registro de las ventas realizadas.

Tiene un formato de ancho fijo:
- `fecha`:    10 lugares
- `producto`: 30 lugares
- `precio`:   10 lugares
- `cantidad`:  5 lugares

Hacer una funcion que cargue los datos en un DataFrame de Pandas.

In [3]:
import pandas as pd

def cargar_datos():
    columnas = ['fecha', 'producto', 'precio', 'cantidad']
    anchos_col = [10, 30, 10, 5]  
    datos = pd.read_fwf('datos.dat', widths=anchos_col, header=None, names=columnas)
    return datos

datos = cargar_datos()
print(datos)

         fecha    producto  precio  cantidad
0   2024-08-27     Mirinda    1510        14
1   2024-08-27     Mirinda    1560        12
2   2024-08-28     Torasso     940         8
3   2024-08-29  Pepsi Cola    1210        10
4   2024-08-30     Mirinda    1520         1
5   2024-09-01     Mirinda    1550        15
6   2024-09-01      Sprite     810         4
7   2024-09-02   Coca Cola    1100         4
8   2024-09-02  Pepsi Cola    1220        13
9   2024-09-02     Torasso     910         5
10  2024-09-02     Torasso     920         3
11  2024-09-03   Coca Cola    1020         8
12  2024-09-03     Mirinda    1570         7
13  2024-09-03     Mirinda    1590         2
14  2024-09-04  Pepsi Cola    1220        13
15  2024-09-05     Mirinda    1500         3
16  2024-09-05  Pepsi Cola    1300         5
17  2024-09-06   Coca Cola    1080         1
18  2024-09-06      Sprite     860        12
19  2024-09-06     Torasso     930         3
20  2024-09-07   Coca Cola    1080        14
21  2024-0

### Ejercicio 2: Calcular el total de ventas.
Hacer una función que sume los importes vendidos (precio * cantidad) y las cantidades.


In [4]:

def calcular_totales(datos):
    total_importe = (datos['precio'] * datos['cantidad']).sum()
    total_cantidad = datos['cantidad'].sum()
    return total_importe, total_cantidad

importe, cantidad = calcular_totales(datos)

print(f"Las ventas fueron de ${importe:.2f} en {cantidad} unidades")


Las ventas fueron de $392730.00 en 335 unidades


### Ejercicio 3: Listar las unidades vendidas.
Listar cuántas unidades se vendieron en total para cada producto


In [7]:
def unidades_vendidas(datos):
    ventasproducto = datos.groupby('producto')['cantidad'].sum()
    return ventasproducto
    
resultado = unidades_vendidas(datos)
print(resultado)

producto
Coca Cola     57
Mirinda       85
Pepsi Cola    89
Sprite        72
Torasso       32
Name: cantidad, dtype: int64


###  Ejercicio 4: Listar el precio promedio por producto.
Hacer un listado del precio promedio por producto.


In [8]:
def precio_promedio(datos):
    promedioproducto = datos.groupby('producto')['cantidad'].mean()
    return promedioproducto

resultado = precio_promedio(datos)
print(resultado)

producto
Coca Cola      7.125000
Mirinda        7.083333
Pepsi Cola    11.125000
Sprite        10.285714
Torasso        6.400000
Name: cantidad, dtype: float64


### Ejercicio 5: Ranking de productos
Realizar un listado de los 3 productos más vendidos ordenados por la cantidad de unidades vendidas (ordenadas de mayor a menor)


In [11]:
def ranking_productos(datos, top=3):
    precio_prom = precio_promedio(datos)
    ranking = precio_prom.sort_values(ascending=False)
    top_productos = ranking.head(top)
    return top_productos

top = ranking_productos(datos)
print (top)

producto
Pepsi Cola    11.125000
Sprite        10.285714
Coca Cola      7.125000
Name: cantidad, dtype: float64


### Ejercicio 6: Listar las ventas por mes
Realizar un listado del total de unidades vendidas por producto separado por mes.


In [19]:
def ventas_por_mes(datos):
    datos['fecha'] = pd.to_datetime(datos['fecha'], format='%Y-%m-%d')
    
    datos['mes'] = datos['fecha'].dt.month
    
    ventas_mes = datos.groupby(['producto', 'mes'])['cantidad'].sum().reset_index()
    
    ventas_mes = ventas_mes.sort_values(by='mes')
    
    return ventas_mes

ventas_mes = ventas_por_mes(datos)

print(ventas_mes)

     producto  mes  cantidad
1     Mirinda    8        27
3  Pepsi Cola    8        10
6     Torasso    8         8
0   Coca Cola    9        57
2     Mirinda    9        58
4  Pepsi Cola    9        79
5      Sprite    9        72
7     Torasso    9        24


### Ejercicio 7: Informe general

Mostrar un listado de productos ordenados alfabeticamente que contengan el precio promedio, la cantidad de unidades vendidas y el importe total vendido para cada producto

In [27]:
def resumen_ventas(datos):
    promedio = precio_promedio(datos)
    cantidad_vendida = unidades_vendidas(datos)
    importe_total = (datos['precio'] * datos['cantidad']).groupby(datos['producto']).sum()
    
    
    informe = pd.DataFrame({
        'Precio Promedio': promedio,
        'Cantidad Vendida': cantidad_vendida,
        'Impoorte Total': importe_total
    })
    
    informe = informe.sort_index()  
    
    return informe

resumen = resumen_ventas(datos)
print(resumen)

            Precio Promedio  Cantidad Vendida  Impoorte Total
producto                                                     
Coca Cola          7.125000                57           60780
Mirinda            7.083333                85          131080
Pepsi Cola        11.125000                89          110510
Sprite            10.285714                72           61040
Torasso            6.400000                32           29320


## `Resolver usando NumPy`
## Resolver el ejercicio 2 del tp1 usando NumPy

### Ejercicio 8

Escribe una función en Python que encuentre los valores de `a`, `b`, y `c` para que la función cuadrática `f(x) = a x^2 + b x + c` pase exactamente por los siguientes puntos:

| x  | y  |
|---:|---:|
|  0 |  0 |
|  1 |  8 |
|  2 | 12 |
|  3 | 12 |
|  5 |  0 |

### Requisitos:
- La función debe explorar posibles valores de `a`, `b`, y `c` utilizando un método de prueba y error.
- Debe devolver los valores que hagan que la diferencia entre la función `f(x)` y los valores medidos `y` sea exactamente cero para cada punto.

> **Pista**: Los valores de `a`, `b`, y `c` son números pequeños.

La idea es implementar el mismo algoritmo que se uso en el TP1 pero usando NumPy en lugar de Python puro.

In [28]:
import numpy as np
def f(x, coeficientes):
    a,b,c = coeficientes
    return a*x**2 + b*x + c

def error(y, y_pred):
    return y - y_pred

X = np.array([0,1,2,3,5])
Y = np.array([0,8,12,12,0])

def buscar_coeficientes():
    rangos = np.arange(-10, 11, 1)
    for a in rangos:
        for b in rangos: 
            for c in rangos:
                y_pred = f(X, (a, b, c))
                if np.all(y_pred == Y):
                    return a, b, c
    return None

coeficientes = buscar_coeficientes()
coeficientes

(np.int64(-2), np.int64(10), np.int64(0))

### Ejercicio 9: Resolver el ejercicio 3 del TP1 usando NumPy
Buscar los coeficientes de la función que minimice la suma de los cuadrados de las diferencias entre los valores medidos y los valores de la función.

1. Crear un array con los coeficientes elegidos al azar (usar `randint(-10,10,3)`).
2. Calcular el valor de la función y el error correspondiente.
3. Mientras que el error sea mayor a 1:
    1. Definir nuevos coeficientes agregándoles un pequeño valor al azar a los coeficientes actuales (aprendizaje = 0.001).
    2. Si el error para los nuevos coeficientes es menor que el anterior, reemplazar los coeficientes actuales por los nuevos.


In [36]:
import numpy as np
from numpy.random import randint

def f(x, coeficientes):
    a,b,c = coeficientes
    return a*x**2 + b*x + c

def error(y, y_pred):
    return np.sum((y - y_pred)**2)

X = np.array([0, 1, 2, 3, 5])
Y = np.array([0, 8,12,11, 1]) # Observar que no son los mismos valores que en el ejemplo anterior

def buscar_coeficientes():
    coeficientes = randint(-10, 10, 3)
    tasa = 0.001
    error_actual = float('inf') 

    y_pred = f(X, coeficientes)
    error_actual = error(Y, y_pred)

    while error_actual > 1:
        nuevos_coeficientes = coeficientes + np.random.rand(3) * tasa * (np.random.choice([-1, 1], 3))

        y_pred_nuevo = f(X, nuevos_coeficientes)
        nuevo_error = error(Y, y_pred_nuevo)

        if nuevo_error < error_actual:
            coeficientes = nuevos_coeficientes
            error_actual = nuevo_error

    return coeficientes, error_actual
        

coeficientes, error_final = buscar_coeficientes()

print(f"Los coeficientes son {coeficientes} y el error es {error_final}")
coeficientes

Los coeficientes son [-1.77831273  8.95557345  0.61831039] y el error es 0.9993210482978152


array([-1.77831273,  8.95557345,  0.61831039])