# TP6

### `Resolver usando Pandas`

Resolver los ejercicios del TP3 utilizando la librería Pandas.

### Ejercicio 1: Cargar Datos de ventas.

El archivo datos.dat contiene el registro de las ventas realizadas.

Tiene un formato de ancho fijo:
- `fecha`:    10 lugares
- `producto`: 30 lugares
- `precio`:   10 lugares
- `cantidad`:  5 lugares

Hacer una funcion que cargue los datos en un DataFrame de Pandas.

In [1]:
import pandas as pd

def cargar_datos():

    columnas = {
        'fecha': 10,
        'producto': 30,
        'precio': 10,
        'cantidad': 5
    }
    

    posiciones = [0]
    for ancho in columnas.values():
        posiciones.append(posiciones[-1] + ancho)
    

    df = pd.read_fwf('datos.dat', 
                     widths=list(columnas.values()),
                     names=list(columnas.keys()),
                     header=None)
    
 
    df['fecha'] = pd.to_datetime(df['fecha'])
    df['precio'] = df['precio'].astype(float)
    df['cantidad'] = df['cantidad'].astype(int)
    
    return df


datos = cargar_datos()




### Ejercicio 2: Calcular el total de ventas.
Hacer una función que sume los importes vendidos (precio * cantidad) y las cantidades.


In [2]:
def calcular_totales(datos):

    importe_total = (datos['precio'] * datos['cantidad']).sum()
    

    cantidad_total = datos['cantidad'].sum()
    
    return importe_total, cantidad_total


datos = cargar_datos()


importe, cantidad = calcular_totales(datos)


print(f"Las ventas fueron de ${importe:.2f} en {cantidad} unidades")

Las ventas fueron de $392730.00 en 335 unidades


### Ejercicio 3: Listar las unidades vendidas.
Listar cuántas unidades se vendieron en total para cada producto


In [3]:
def unidades_vendidas(datos):

    unidades_por_producto = datos.groupby('producto')['cantidad'].sum().sort_values(ascending=False)
    

    print("Unidades vendidas por producto:")
    for producto, cantidad in unidades_por_producto.items():
        print(f"{producto}: {cantidad}")
    
    return unidades_por_producto


datos = cargar_datos()

###  Ejercicio 4: Listar el precio promedio por producto.
Hacer un listado del precio promedio por producto.


In [6]:
def precio_promedio(datos):
 
    precio_promedio_por_producto = datos.groupby('producto')['precio'].mean().sort_values(ascending=False)
    

    print("Precio promedio por producto:")
    for producto, precio in precio_promedio_por_producto.items():
        print(f"{producto}: ${precio:.2f}")
    
    return precio_promedio_por_producto

datos = cargar_datos()


precio_promedio(datos)

Precio promedio por producto:
Mirinda: $1545.83
Pepsi Cola: $1245.00
Coca Cola: $1072.50
Torasso: $920.00
Sprite: $841.43


producto
Mirinda       1545.833333
Pepsi Cola    1245.000000
Coca Cola     1072.500000
Torasso        920.000000
Sprite         841.428571
Name: precio, dtype: float64

### Ejercicio 5: Ranking de productos
Realizar un listado de los 3 productos más vendidos ordenados por la cantidad de unidades vendidas (ordenadas de mayor a menor)


In [7]:
def ranking_productos(datos, top=3):
 
    ventas_por_producto = datos.groupby('producto')['cantidad'].sum().sort_values(ascending=False)
    

    top_productos = ventas_por_producto.head(top)
    
    print(f"Top {top} productos más vendidos:")
    for i, (producto, cantidad) in enumerate(top_productos.items(), 1):
        print(f"{i}. {producto}: {cantidad} unidades")
    
    


datos = cargar_datos()


ranking_productos(datos)

Top 3 productos más vendidos:
1. Pepsi Cola: 89 unidades
2. Mirinda: 85 unidades
3. Sprite: 72 unidades


### Ejercicio 6: Listar las ventas por mes
Realizar un listado del total de unidades vendidas por producto separado por mes.


In [8]:
def ventas_por_mes(datos):
  
    datos['mes_año'] = datos['fecha'].dt.to_period('M')
    

    ventas_mensuales = datos.groupby(['mes_año', 'producto'])['cantidad'].sum().unstack(fill_value=0)

    total_ventas = ventas_mensuales.sum().sort_values(ascending=False)
    ventas_mensuales = ventas_mensuales[total_ventas.index]
    

    print("Ventas por mes y producto:")
    print(ventas_mensuales)
    
    return ventas_mensuales


datos = cargar_datos()


ventas_por_mes(datos)

Ventas por mes y producto:
producto  Pepsi Cola  Mirinda  Sprite  Coca Cola  Torasso
mes_año                                                  
2024-08           10       27       0          0        8
2024-09           79       58      72         57       24


producto,Pepsi Cola,Mirinda,Sprite,Coca Cola,Torasso
mes_año,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
2024-08,10,27,0,0,8
2024-09,79,58,72,57,24


### Ejercicio 7: Informe general

Mostrar un listado de productos ordenados alfabeticamente que contengan el precio promedio, la cantidad de unidades vendidas y el importe total vendido para cada producto

In [9]:
def resumen_ventas(datos):

    precio_promedio = datos.groupby('producto')['precio'].mean()
    

    unidades_vendidas = datos.groupby('producto')['cantidad'].sum()
    

    importe_total = datos.groupby('producto').apply(lambda x: (x['precio'] * x['cantidad']).sum())
    
  
    resumen = pd.DataFrame({
        'Precio Promedio': precio_promedio,
        'Unidades Vendidas': unidades_vendidas,
        'Importe Total': importe_total
    }).sort_index()  # Ordenar alfabéticamente por producto
    
    # Formatear las columnas
    resumen['Precio Promedio'] = resumen['Precio Promedio'].map('${:,.2f}'.format)
    resumen['Importe Total'] = resumen['Importe Total'].map('${:,.2f}'.format)
    resumen['Unidades Vendidas'] = resumen['Unidades Vendidas'].map('{:,}'.format)
    
    # Mostrar los resultados
    print("Resumen de ventas por producto:")
    print(resumen)
    
    return resumen


datos = cargar_datos()


resumen_ventas(datos)

Resumen de ventas por producto:
           Precio Promedio Unidades Vendidas Importe Total
producto                                                  
Coca Cola        $1,072.50                57    $60,780.00
Mirinda          $1,545.83                85   $131,080.00
Pepsi Cola       $1,245.00                89   $110,510.00
Sprite             $841.43                72    $61,040.00
Torasso            $920.00                32    $29,320.00


  importe_total = datos.groupby('producto').apply(lambda x: (x['precio'] * x['cantidad']).sum())


Unnamed: 0_level_0,Precio Promedio,Unidades Vendidas,Importe Total
producto,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Coca Cola,"$1,072.50",57,"$60,780.00"
Mirinda,"$1,545.83",85,"$131,080.00"
Pepsi Cola,"$1,245.00",89,"$110,510.00"
Sprite,$841.43,72,"$61,040.00"
Torasso,$920.00,32,"$29,320.00"


## `Resolver usando NumPy`
## Resolver el ejercicio 2 del tp1 usando NumPy

### Ejercicio 8

Escribe una función en Python que encuentre los valores de `a`, `b`, y `c` para que la función cuadrática `f(x) = a x^2 + b x + c` pase exactamente por los siguientes puntos:

| x  | y  |
|---:|---:|
|  0 |  0 |
|  1 |  8 |
|  2 | 12 |
|  3 | 12 |
|  5 |  0 |

### Requisitos:
- La función debe explorar posibles valores de `a`, `b`, y `c` utilizando un método de prueba y error.
- Debe devolver los valores que hagan que la diferencia entre la función `f(x)` y los valores medidos `y` sea exactamente cero para cada punto.

> **Pista**: Los valores de `a`, `b`, y `c` son números pequeños.

La idea es implementar el mismo algoritmo que se uso en el TP1 pero usando NumPy en lugar de Python puro.

In [10]:
import numpy as np

def f(x, coeficientes):
    a, b, c = coeficientes
    return a * x**2 + b * x + c

def error(y, y_pred):
    return np.sum(np.abs(y - y_pred))

X = np.array([0, 1, 2, 3, 5])
Y = np.array([0, 8, 12, 12, 0])

def buscar_coeficientes():
    for a in range(-10, 11): 
        for b in range(-20, 21):  
            for c in range(-10, 11): 
                coeficientes = np.array([a, b, c])
                y_pred = f(X, coeficientes)
                if error(Y, y_pred) == 0:
                    return coeficientes
    return None  

coeficientes = buscar_coeficientes()
print(coeficientes)


if coeficientes is not None:
    y_pred = f(X, coeficientes)
    print("Valores predichos:", y_pred)
    print("Valores reales:   ", Y)
    print("Error total:", error(Y, y_pred))
else:
    print("No se encontró una solución exacta.")

[-2 10  0]
Valores predichos: [ 0  8 12 12  0]
Valores reales:    [ 0  8 12 12  0]
Error total: 0


### Ejercicio 9: Resolver el ejercicio 3 del TP1 usando NumPy
Buscar los coeficientes de la función que minimice la suma de los cuadrados de las diferencias entre los valores medidos y los valores de la función.

1. Crear un array con los coeficientes elegidos al azar (usar `randint(-10,10,3)`).
2. Calcular el valor de la función y el error correspondiente.
3. Mientras que el error sea mayor a 1:
    1. Definir nuevos coeficientes agregándoles un pequeño valor al azar a los coeficientes actuales (aprendizaje = 0.001).
    2. Si el error para los nuevos coeficientes es menor que el anterior, reemplazar los coeficientes actuales por los nuevos.


In [11]:
import numpy as np
from numpy.random import randint, normal

def f(x, coeficientes):
    a, b, c = coeficientes
    return a*x**2 + b*x + c

def error(y, y_pred):
    return np.sum((y - y_pred)**2)

X = np.array([0, 1, 2, 3, 5])
Y = np.array([0, 8, 12, 11, 1])

def buscar_coeficientes():
  
    coeficientes = randint(-10, 11, 3)
    

    y_pred = f(X, coeficientes)
    error_actual = error(Y, y_pred)
    
   
    aprendizaje = 0.001
    
    
    max_iteraciones = 100000
    for _ in range(max_iteraciones):
        if error_actual < 1:
            break
       
        nuevos_coeficientes = coeficientes + normal(0, 1, 3) * aprendizaje
        

        y_pred_nuevo = f(X, nuevos_coeficientes)
        nuevo_error = error(Y, y_pred_nuevo)
        

        if nuevo_error < error_actual:
            coeficientes = nuevos_coeficientes
            error_actual = nuevo_error
    
    return coeficientes, error_actual


coeficientes, error_final = buscar_coeficientes()

print("Coeficientes encontrados:", coeficientes)
print("Error final:", error_final)


y_pred = f(X, coeficientes)
print("\nValores predichos:", y_pred)
print("Valores reales:   ", Y)

Coeficientes encontrados: [-1.77887193  8.958489    0.62163317]
Error final: 0.9994627128191851

Valores predichos: [ 0.62163317  7.80125023 11.42312343 11.48725275  0.9422798 ]
Valores reales:    [ 0  8 12 11  1]
