# TP6

### `Resolver usando Pandas`

Resolver los ejercicios del TP3 utilizando la librería Pandas.

### Ejercicio 1: Cargar Datos de ventas.

El archivo datos.dat contiene el registro de las ventas realizadas.

Tiene un formato de ancho fijo:
- `fecha`:    10 lugares
- `producto`: 30 lugares
- `precio`:   10 lugares
- `cantidad`:  5 lugares

Hacer una funcion que cargue los datos en un DataFrame de Pandas.

In [1]:
import pandas as pd

def cargar_datos():
    widths = [10, 30, 10, 5]
    column_names = ['fecha', 'producto', 'precio', 'cantidad']
    df = pd.read_fwf('datos.dat', widths=widths, names=column_names)
    
    df['fecha'] = pd.to_datetime(df['fecha'].str.strip(), format='%Y-%m-%d')
    df['producto'] = df['producto'].str.strip()
    df['precio'] = df['precio'].astype(float)
    df['cantidad'] = df['cantidad'].astype(int)
    
    return df

datos = cargar_datos()
print(datos)


        fecha    producto  precio  cantidad
0  2024-08-27     Mirinda  1510.0        14
1  2024-08-27     Mirinda  1560.0        12
2  2024-08-28     Torasso   940.0         8
3  2024-08-29  Pepsi Cola  1210.0        10
4  2024-08-30     Mirinda  1520.0         1
5  2024-09-01     Mirinda  1550.0        15
6  2024-09-01      Sprite   810.0         4
7  2024-09-02   Coca Cola  1100.0         4
8  2024-09-02  Pepsi Cola  1220.0        13
9  2024-09-02     Torasso   910.0         5
10 2024-09-02     Torasso   920.0         3
11 2024-09-03   Coca Cola  1020.0         8
12 2024-09-03     Mirinda  1570.0         7
13 2024-09-03     Mirinda  1590.0         2
14 2024-09-04  Pepsi Cola  1220.0        13
15 2024-09-05     Mirinda  1500.0         3
16 2024-09-05  Pepsi Cola  1300.0         5
17 2024-09-06   Coca Cola  1080.0         1
18 2024-09-06      Sprite   860.0        12
19 2024-09-06     Torasso   930.0         3
20 2024-09-07   Coca Cola  1080.0        14
21 2024-09-07      Sprite   870.

### Ejercicio 2: Calcular el total de ventas.
Hacer una función que sume los importes vendidos (precio * cantidad) y las cantidades.


In [2]:
def calcular_totales(datos):
    datos['importe'] = datos['precio'] * datos['cantidad']
    total_importe = datos['importe'].sum()
    total_cantidad = datos['cantidad'].sum()
    
    return total_importe, total_cantidad

importe, cantidad = calcular_totales(datos)
print(f"Las ventas fueron de ${importe:.2f} en {cantidad} unidades")


Las ventas fueron de $392730.00 en 335 unidades


### Ejercicio 3: Listar las unidades vendidas.
Listar cuántas unidades se vendieron en total para cada producto


In [3]:
def unidades_vendidas(datos):
    unidades = datos.groupby('producto')['cantidad'].sum()
    print(unidades)

unidades_vendidas(datos)


producto
Coca Cola     57
Mirinda       85
Pepsi Cola    89
Sprite        72
Torasso       32
Name: cantidad, dtype: int32


###  Ejercicio 4: Listar el precio promedio por producto.
Hacer un listado del precio promedio por producto.


In [4]:
def precio_promedio(datos):

    promedio = datos.groupby('producto')['precio'].mean()
    print(promedio)

precio_promedio(datos)

producto
Coca Cola     1072.500000
Mirinda       1545.833333
Pepsi Cola    1245.000000
Sprite         841.428571
Torasso        920.000000
Name: precio, dtype: float64


### Ejercicio 5: Ranking de productos
Realizar un listado de los 3 productos más vendidos ordenados por la cantidad de unidades vendidas (ordenadas de mayor a menor)


In [5]:
def ranking_productos(datos, top=3):
    print("los 3 productos mas vendidos fueron:")
    ranking = datos.groupby('producto')['cantidad'].sum()
   
    top_productos = ranking.sort_values(ascending=False).head(top)
    print(top_productos)

ranking_productos(datos)

los 3 productos mas vendidos fueron:
producto
Pepsi Cola    89
Mirinda       85
Sprite        72
Name: cantidad, dtype: int32


### Ejercicio 6: Listar las ventas por mes
Realizar un listado del total de unidades vendidas por producto separado por mes.


In [6]:
def ventas_por_mes(datos):
   
    datos['mes'] = datos['fecha'].dt.to_period('M')

    ventas_mes = datos.groupby(['mes', 'producto'])['cantidad'].sum()
    print(ventas_mes)

ventas_por_mes(datos)

mes      producto  
2024-08  Mirinda       27
         Pepsi Cola    10
         Torasso        8
2024-09  Coca Cola     57
         Mirinda       58
         Pepsi Cola    79
         Sprite        72
         Torasso       24
Name: cantidad, dtype: int32


### Ejercicio 7: Informe general

Mostrar un listado de productos ordenados alfabeticamente que contengan el precio promedio, la cantidad de unidades vendidas y el importe total vendido para cada producto

In [7]:
def resumen_ventas(datos):
 
    datos['importe'] = datos['precio'] * datos['cantidad']
    
    resumen = datos.groupby('producto').agg({
        'precio': 'mean',
        'cantidad': 'sum',
        'importe': 'sum'
    })
 
    resumen = resumen.rename(columns={'precio': 'precio_promedio', 'cantidad': 'unidades_vendidas', 'importe': 'importe_total'})
    
    resumen = resumen.sort_index()
    
    print(resumen)

resumen_ventas(datos)

            precio_promedio  unidades_vendidas  importe_total
producto                                                     
Coca Cola       1072.500000                 57        60780.0
Mirinda         1545.833333                 85       131080.0
Pepsi Cola      1245.000000                 89       110510.0
Sprite           841.428571                 72        61040.0
Torasso          920.000000                 32        29320.0


## `Resolver usando NumPy`
## Resolver el ejercicio 2 del tp1 usando NumPy

### Ejercicio 8

Escribe una función en Python que encuentre los valores de `a`, `b`, y `c` para que la función cuadrática `f(x) = a x^2 + b x + c` pase exactamente por los siguientes puntos:

| x  | y  |
|---:|---:|
|  0 |  0 |
|  1 |  8 |
|  2 | 12 |
|  3 | 12 |
|  5 |  0 |

### Requisitos:
- La función debe explorar posibles valores de `a`, `b`, y `c` utilizando un método de prueba y error.
- Debe devolver los valores que hagan que la diferencia entre la función `f(x)` y los valores medidos `y` sea exactamente cero para cada punto.

> **Pista**: Los valores de `a`, `b`, y `c` son números pequeños.

La idea es implementar el mismo algoritmo que se uso en el TP1 pero usando NumPy en lugar de Python puro.

In [16]:
import numpy as np

def f(x, coeficientes):
    a, b, c = coeficientes
    return a * x**2 + b * x + c

def error(y, y_pred):
    return y - y_pred

X = np.array([0, 1, 2, 3, 5])
Y = np.array([0, 8, 12, 12, 0])

def buscar_coeficientes():
  
    for a in range(-10, 11): 
        for b in range(-10, 11):  
            for c in range(-10, 11):  
               
                Y_pred = f(X, (a, b, c))
                
              
                if np.all(error(Y, Y_pred) == 0):  
                    return a, b, c  

    return None  

coeficientes = buscar_coeficientes()
print(coeficientes)


(-2, 10, 0)


### Ejercicio 9: Resolver el ejercicio 3 del TP1 usando NumPy
Buscar los coeficientes de la función que minimice la suma de los cuadrados de las diferencias entre los valores medidos y los valores de la función.

1. Crear un array con los coeficientes elegidos al azar (usar `randint(-10,10,3)`).
2. Calcular el valor de la función y el error correspondiente.
3. Mientras que el error sea mayor a 1:
    1. Definir nuevos coeficientes agregándoles un pequeño valor al azar a los coeficientes actuales (aprendizaje = 0.001).
    2. Si el error para los nuevos coeficientes es menor que el anterior, reemplazar los coeficientes actuales por los nuevos.


In [28]:
import numpy as np
from numpy.random import randint

def f(x, coeficientes):
    a, b, c = coeficientes
    return a * x**2 + b * x + c

def calcular_error(y_real, y_predicho):
    return np.sum((y_real - y_predicho)**2)

def buscar_coeficientes():
    X = np.array([0, 1, 2, 3, 5])
    Y = np.array([0, 8, 12, 11, 1])  

    coeficientes = randint(-10, 10, 3).astype(float)
    tasa = 0.001

    error_actual = calcular_error(Y, f(X, coeficientes))

    while error_actual > 1:
        
        nuevos_coeficientes = coeficientes + (randint(-10, 10, 3) * tasa)

        nuevo_error = calcular_error(Y, f(X, nuevos_coeficientes))

        if nuevo_error < error_actual:
            coeficientes = nuevos_coeficientes
            error_actual = nuevo_error

    return coeficientes, error_actual

coeficientes, error = buscar_coeficientes()
print("estos son los coeficientes :", coeficientes)
print("el error es:", error)
coeficientes

los coeficientes son: [-1.781  8.961  0.601]
el error es: 0.9915489999998488


array([-1.781,  8.961,  0.601])