# TP6

### `Resolver usando Pandas`

Resolver los ejercicios del TP3 utilizando la librería Pandas.

### Ejercicio 1: Cargar Datos de ventas.

El archivo datos.dat contiene el registro de las ventas realizadas.

Tiene un formato de ancho fijo:
- `fecha`:    10 lugares
- `producto`: 30 lugares
- `precio`:   10 lugares
- `cantidad`:  5 lugares

Hacer una funcion que cargue los datos en un DataFrame de Pandas.

In [1]:
import pandas as pd

def cargar_datos():
    # Definir los anchos de las columnas basados en la descripción
    column_widths = [10, 30, 10, 5]
    column_names = ['fecha', 'producto', 'precio', 'cantidad']
    
    # Cargar los datos desde el archivo de ancho fijo
    df = pd.read_fwf('datos.dat', widths=column_widths, header=None, names=column_names)
    
    # Convertir 'precio' y 'cantidad' a enteros
    df['precio'] = pd.to_numeric(df['precio'], errors='coerce')
    df['cantidad'] = pd.to_numeric(df['cantidad'], errors='coerce')
    
    # Convertir 'fecha' a formato datetime
    df['fecha'] = pd.to_datetime(df['fecha'], format='%Y-%m-%d')
    
    return df

datos = cargar_datos()
datos.head()  # Mostrar las primeras filas


Unnamed: 0,fecha,producto,precio,cantidad
0,2024-08-27,Mirinda,1510,14
1,2024-08-27,Mirinda,1560,12
2,2024-08-28,Torasso,940,8
3,2024-08-29,Pepsi Cola,1210,10
4,2024-08-30,Mirinda,1520,1


### Ejercicio 2: Calcular el total de ventas.
Hacer una función que sume los importes vendidos (precio * cantidad) y las cantidades.


In [2]:
def calcular_totales(datos):
    # Calcular el importe total (precio * cantidad)
    datos['importe'] = datos['precio'] * datos['cantidad']
    
    # Sumar el importe total y la cantidad total de unidades vendidas
    importe_total = datos['importe'].sum()
    cantidad_total = datos['cantidad'].sum()
    
    return importe_total, cantidad_total

importe, cantidad = calcular_totales(datos)
print(f"Las ventas fueron de ${importe:.2f} en {cantidad} unidades")


Las ventas fueron de $392730.00 en 335 unidades


### Ejercicio 3: Listar las unidades vendidas.
Listar cuántas unidades se vendieron en total para cada producto


In [3]:
def unidades_vendidas(datos):
    # Agrupar por producto y sumar las cantidades
    return datos.groupby('producto')['cantidad'].sum()

print(unidades_vendidas(datos))


producto
Coca Cola     57
Mirinda       85
Pepsi Cola    89
Sprite        72
Torasso       32
Name: cantidad, dtype: int64


###  Ejercicio 4: Listar el precio promedio por producto.
Hacer un listado del precio promedio por producto.


In [4]:
def precio_promedio(datos):
    # Agrupar por producto y calcular el precio promedio
    return datos.groupby('producto')['precio'].mean()

print(precio_promedio(datos))


producto
Coca Cola     1072.500000
Mirinda       1545.833333
Pepsi Cola    1245.000000
Sprite         841.428571
Torasso        920.000000
Name: precio, dtype: float64


### Ejercicio 5: Ranking de productos
Realizar un listado de los 3 productos más vendidos ordenados por la cantidad de unidades vendidas (ordenadas de mayor a menor)


In [5]:
def ranking_productos(datos, top=3):
    # Agrupar por producto y sumar las cantidades, luego ordenar y mostrar el top
    return datos.groupby('producto')['cantidad'].sum().sort_values(ascending=False).head(top)

print(ranking_productos(datos))


producto
Pepsi Cola    89
Mirinda       85
Sprite        72
Name: cantidad, dtype: int64


### Ejercicio 6: Listar las ventas por mes
Realizar un listado del total de unidades vendidas por producto separado por mes.


In [6]:
def ventas_por_mes(datos):
    # Extraer el mes de la fecha y agrupar por producto y mes
    datos['mes'] = datos['fecha'].dt.month
    return datos.groupby(['producto', 'mes'])['cantidad'].sum()

print(ventas_por_mes(datos))


producto    mes
Coca Cola   9      57
Mirinda     8      27
            9      58
Pepsi Cola  8      10
            9      79
Sprite      9      72
Torasso     8       8
            9      24
Name: cantidad, dtype: int64


### Ejercicio 7: Informe general

Mostrar un listado de productos ordenados alfabeticamente que contengan el precio promedio, la cantidad de unidades vendidas y el importe total vendido para cada producto

In [7]:
def resumen_ventas(datos):
    # Agrupar por producto, calcular el precio promedio, las cantidades vendidas y el importe total
    resumen = datos.groupby('producto').agg(
        precio_promedio=('precio', 'mean'),
        cantidad_vendida=('cantidad', 'sum'),
        importe_total=('importe', 'sum')
    ).sort_index()
    
    return resumen

print(resumen_ventas(datos))


            precio_promedio  cantidad_vendida  importe_total
producto                                                    
Coca Cola       1072.500000                57          60780
Mirinda         1545.833333                85         131080
Pepsi Cola      1245.000000                89         110510
Sprite           841.428571                72          61040
Torasso          920.000000                32          29320


## `Resolver usando NumPy`
## Resolver el ejercicio 2 del tp1 usando NumPy

### Ejercicio 8

Escribe una función en Python que encuentre los valores de `a`, `b`, y `c` para que la función cuadrática `f(x) = a x^2 + b x + c` pase exactamente por los siguientes puntos:

| x  | y  |
|---:|---:|
|  0 |  0 |
|  1 |  8 |
|  2 | 12 |
|  3 | 12 |
|  5 |  0 |

### Requisitos:
- La función debe explorar posibles valores de `a`, `b`, y `c` utilizando un método de prueba y error.
- Debe devolver los valores que hagan que la diferencia entre la función `f(x)` y los valores medidos `y` sea exactamente cero para cada punto.

> **Pista**: Los valores de `a`, `b`, y `c` son números pequeños.

La idea es implementar el mismo algoritmo que se uso en el TP1 pero usando NumPy en lugar de Python puro.

In [14]:
import numpy as np

# Definir la función cuadrática
def f(x, coeficientes):
    a, b, c = coeficientes
    return a * x**2 + b * x + c

# Definir los puntos
X = np.array([0, 1, 2, 3, 5])
Y = np.array([0, 8, 12, 12, 0])

# Función para buscar coeficientes usando prueba y error con NumPy
def buscar_coeficientes():
    for a in np.arange(-10, 11, 1):
        for b in np.arange(-10, 11, 1):
            for c in np.arange(-10, 11, 1):
                y_pred = f(X, (a, b, c))  # Calcular la predicción para los coeficientes actuales
                if np.allclose(y_pred, Y, atol=1e-8):  # Comparar con los valores reales
                    return a, b, c
    return None

# Encontrar los coeficientes
coeficientes = buscar_coeficientes()

# Imprimir resultado
print(f"Los coeficientes son: {coeficientes}")


Los coeficientes son: (np.int64(-2), np.int64(10), np.int64(0))


### Ejercicio 9: Resolver el ejercicio 3 del TP1 usando NumPy
Buscar los coeficientes de la función que minimice la suma de los cuadrados de las diferencias entre los valores medidos y los valores de la función.

1. Crear un array con los coeficientes elegidos al azar (usar `randint(-10,10,3)`).
2. Calcular el valor de la función y el error correspondiente.
3. Mientras que el error sea mayor a 1:
    1. Definir nuevos coeficientes agregándoles un pequeño valor al azar a los coeficientes actuales (aprendizaje = 0.001).
    2. Si el error para los nuevos coeficientes es menor que el anterior, reemplazar los coeficientes actuales por los nuevos.


In [13]:
from numpy.random import randint

X = np.array([0, 1, 2, 3, 5])
Y = np.array([0, 8, 12, 11, 1])  # Valores modificados

def buscar_coeficientes():
    coeficientes = randint(-10, 10, 3)  # Coeficientes iniciales
    aprendizaje = 0.001
    error_anterior = error(Y, f(X, coeficientes))
    
    while error_anterior > 1:
        nuevos_coeficientes = coeficientes + np.random.randn(3) * aprendizaje
        nuevo_error = error(Y, f(X, nuevos_coeficientes))
        
        if nuevo_error < error_anterior:
            coeficientes = nuevos_coeficientes
            error_anterior = nuevo_error
    
    return coeficientes

coeficientes = buscar_coeficientes()
print(f"Coeficientes: {coeficientes}, Error: {error(Y, f(X, coeficientes))}")


Coeficientes: [-1.7785334   8.95964558  0.62216648], Error: 0.9999271568786811
