# TP6

### `Resolver usando Pandas`

Resolver los ejercicios del TP3 utilizando la librería Pandas.

### Ejercicio 1: Cargar Datos de ventas.

El archivo datos.dat contiene el registro de las ventas realizadas.

Tiene un formato de ancho fijo:
- `fecha`:    10 lugares
- `producto`: 30 lugares
- `precio`:   10 lugares
- `cantidad`:  5 lugares

Hacer una funcion que cargue los datos en un DataFrame de Pandas.

In [None]:
import pandas as pd

def cargar_datos():
    widths = [10, 30, 7, 5]
    
    names = ['fecha', 'producto', 'precio', 'cantidad']
    
    df = pd.read_fwf('datos.dat', widths=widths, names=names, encoding='utf-8')
    
    df['fecha'] = pd.to_datetime(df['fecha'])
    
    df['precio'] = pd.to_numeric(df['precio'])
    df['cantidad'] = pd.to_numeric(df['cantidad'])
    
    df['producto'] = df['producto'].str.strip()
    
    return df

datos = cargar_datos()

print(datos.head())

print(datos.info())

print(datos.describe())

print(datos.isnull().sum())



### Ejercicio 2: Calcular el total de ventas.
Hacer una función que sume los importes vendidos (precio * cantidad) y las cantidades.


In [None]:
import pandas as pd

def cargar_datos():
    widths = [10, 30, 7, 5]
    names = ['fecha', 'producto', 'precio', 'cantidad']
    df = pd.read_fwf('datos.dat', widths=widths, names=names, encoding='utf-8')
    df['fecha'] = pd.to_datetime(df['fecha'])
    df['precio'] = pd.to_numeric(df['precio'])
    df['cantidad'] = pd.to_numeric(df['cantidad'])
    df['producto'] = df['producto'].str.strip()
    return df

def calcular_totales(datos):
    importe_total = (datos['precio'] * datos['cantidad']).sum()
    
    cantidad_total = datos['cantidad'].sum()
    
    return importe_total, cantidad_total

datos = cargar_datos()

importe, cantidad = calcular_totales(datos)

print(f"Las ventas fueron de ${importe:.2f} en {cantidad} unidades")



### Ejercicio 3: Listar las unidades vendidas.
Listar cuántas unidades se vendieron en total para cada producto


In [None]:
import pandas as pd

def cargar_datos():
    widths = [10, 30, 7, 5]
    names = ['fecha', 'producto', 'precio', 'cantidad']
    df = pd.read_fwf('datos.dat', widths=widths, names=names, encoding='utf-8')
    df['fecha'] = pd.to_datetime(df['fecha'])
    df['precio'] = pd.to_numeric(df['precio'])
    df['cantidad'] = pd.to_numeric(df['cantidad'])
    df['producto'] = df['producto'].str.strip()
    return df

def unidades_vendidas(datos):
    unidades_por_producto = datos.groupby('producto')['cantidad'].sum().sort_values(ascending=False)
    
    resultado = unidades_por_producto.reset_index()
    resultado.columns = ['Producto', 'Unidades Vendidas']
    
    return resultado

datos = cargar_datos()

resultado = unidades_vendidas(datos)
print(resultado.to_string(index=False))

###  Ejercicio 4: Listar el precio promedio por producto.
Hacer un listado del precio promedio por producto.


In [None]:
import pandas as pd

def cargar_datos():
    widths = [10, 30, 10, 5]
    names = ['fecha', 'producto', 'precio', 'cantidad']
    df = pd.read_fwf('datos.dat', widths=widths, names=names, encoding='utf-8')
    df['fecha'] = pd.to_datetime(df['fecha'])
    df['precio'] = pd.to_numeric(df['precio'])
    df['cantidad'] = pd.to_numeric(df['cantidad'])
    df['producto'] = df['producto'].str.strip()
    return df

def precio_promedio(datos):
    precio_promedio_por_producto = datos.groupby('producto')['precio'].mean().sort_values(ascending=False)
    
    resultado = precio_promedio_por_producto.reset_index()
    resultado.columns = ['Producto', 'Precio Promedio']
    
    resultado['Precio Promedio'] = resultado['Precio Promedio'].round(2)
    
    return resultado

datos = cargar_datos()

print("Primeras filas de los datos cargados:")
print(datos.head())
print("\nInformación del DataFrame:")
print(datos.info())

resultado = precio_promedio(datos)
print("\nPrecio promedio por producto:")
print(resultado.to_string(index=False))

### Ejercicio 5: Ranking de productos
Realizar un listado de los 3 productos más vendidos ordenados por la cantidad de unidades vendidas (ordenadas de mayor a menor)


In [None]:
import pandas as pd

def cargar_datos():
    widths = [10, 30, 10, 5]
    names = ['fecha', 'producto', 'precio', 'cantidad']
    df = pd.read_fwf('datos.dat', widths=widths, names=names, encoding='utf-8')
    df['fecha'] = pd.to_datetime(df['fecha'])
    df['precio'] = pd.to_numeric(df['precio'])
    df['cantidad'] = pd.to_numeric(df['cantidad'])
    df['producto'] = df['producto'].str.strip()
    return df

def ranking_productos(datos, top=3):
    ventas_por_producto = datos.groupby('producto')['cantidad'].sum().sort_values(ascending=False)
    
    top_productos = ventas_por_producto.head(top)
    
    ranking = pd.DataFrame({
        'Producto': top_productos.index,
        'Unidades Vendidas': top_productos.values
    }).reset_index(drop=True)
    
    ranking.index = ranking.index + 1
    ranking = ranking.rename_axis('Ranking')
    
    return ranking

datos = cargar_datos()

resultado = ranking_productos(datos)
print(resultado)

           Producto  Unidades Vendidas
Ranking                               
1        Pepsi Cola                 89
2           Mirinda                 85
3            Sprite                 72


### Ejercicio 6: Listar las ventas por mes
Realizar un listado del total de unidades vendidas por producto separado por mes.


In [None]:
import pandas as pd

def cargar_datos():
    widths = [10, 30, 10, 5]
    names = ['fecha', 'producto', 'precio', 'cantidad']
    df = pd.read_fwf('datos.dat', widths=widths, names=names, encoding='utf-8')
    df['fecha'] = pd.to_datetime(df['fecha'])
    df['precio'] = pd.to_numeric(df['precio'])
    df['cantidad'] = pd.to_numeric(df['cantidad'])
    df['producto'] = df['producto'].str.strip()
    return df

def ventas_por_mes(datos):
    datos['mes'] = datos['fecha'].dt.to_period('M')
    
    ventas_mensuales = datos.groupby(['mes', 'producto'])['cantidad'].sum().unstack(fill_value=0)
    
    ventas_mensuales = ventas_mensuales.sort_index(axis=1)
    
    ventas_mensuales.index = ventas_mensuales.index.strftime('%Y-%m')
    
    return ventas_mensuales

datos = cargar_datos()

resultado = ventas_por_mes(datos)
print(resultado)

producto  Coca Cola  Mirinda  Pepsi Cola  Sprite  Torasso
mes                                                      
2024-08           0       27          10       0        8
2024-09          57       58          79      72       24


### Ejercicio 7: Informe general

Mostrar un listado de productos ordenados alfabeticamente que contengan el precio promedio, la cantidad de unidades vendidas y el importe total vendido para cada producto

In [16]:
import pandas as pd

def cargar_datos():
    widths = [10, 30, 10, 5]
    names = ['fecha', 'producto', 'precio', 'cantidad']
    df = pd.read_fwf('datos.dat', widths=widths, names=names, encoding='utf-8')
    df['fecha'] = pd.to_datetime(df['fecha'])
    df['precio'] = pd.to_numeric(df['precio'])
    df['cantidad'] = pd.to_numeric(df['cantidad'])
    df['producto'] = df['producto'].str.strip()
    return df

def resumen_ventas(datos):
    precio_promedio = datos.groupby('producto')['precio'].mean()
    
    cantidad_total = datos.groupby('producto')['cantidad'].sum()
    
    importe_total = datos.groupby('producto').apply(lambda x: (x['precio'] * x['cantidad']).sum())
    
    resumen = pd.DataFrame({
        'Precio Promedio': precio_promedio,
        'Unidades Vendidas': cantidad_total,
        'Importe Total': importe_total
    })
    
    resumen = resumen.sort_index()
    
    resumen = resumen.round(2)
    
    return resumen

datos = cargar_datos()

resultado = resumen_ventas(datos)
print(resultado)

            Precio Promedio  Unidades Vendidas  Importe Total
producto                                                     
Coca Cola           1072.50                 57          60780
Mirinda             1545.83                 85         131080
Pepsi Cola          1245.00                 89         110510
Sprite               841.43                 72          61040
Torasso              920.00                 32          29320


  importe_total = datos.groupby('producto').apply(lambda x: (x['precio'] * x['cantidad']).sum())


## `Resolver usando NumPy`
## Resolver el ejercicio 2 del tp1 usando NumPy

### Ejercicio 8

Escribe una función en Python que encuentre los valores de `a`, `b`, y `c` para que la función cuadrática `f(x) = a x^2 + b x + c` pase exactamente por los siguientes puntos:

| x  | y  |
|---:|---:|
|  0 |  0 |
|  1 |  8 |
|  2 | 12 |
|  3 | 12 |
|  5 |  0 |

### Requisitos:
- La función debe explorar posibles valores de `a`, `b`, y `c` utilizando un método de prueba y error.
- Debe devolver los valores que hagan que la diferencia entre la función `f(x)` y los valores medidos `y` sea exactamente cero para cada punto.

> **Pista**: Los valores de `a`, `b`, y `c` son números pequeños.

La idea es implementar el mismo algoritmo que se uso en el TP1 pero usando NumPy en lugar de Python puro.

In [17]:
import numpy as np

def f(x, coeficientes):
    a, b, c = coeficientes
    return a * x**2 + b * x + c

def error(y, y_pred):
    return np.sum(np.abs(y - y_pred))

X = np.array([0, 1, 2, 3, 5])
Y = np.array([0, 8, 12, 12, 0])

def buscar_coeficientes():
    for a in range(-10, 11):
        for b in range(-10, 11):
            for c in range(-10, 11):
                coeficientes = np.array([a, b, c])
                y_pred = f(X, coeficientes)
                if error(Y, y_pred) == 0:
                    return coeficientes
    return None

coeficientes = buscar_coeficientes()
print("Coeficientes encontrados:", coeficientes)

if coeficientes is not None:
    a, b, c = coeficientes
    print(f"La función cuadrática es: f(x) = {a}x^2 + {b}x + {c}")
else:
    print("No se encontraron coeficientes que satisfagan exactamente todos los puntos.")



Coeficientes encontrados: [-2 10  0]
La función cuadrática es: f(x) = -2x^2 + 10x + 0


### Ejercicio 9: Resolver el ejercicio 3 del TP1 usando NumPy
Buscar los coeficientes de la función que minimice la suma de los cuadrados de las diferencias entre los valores medidos y los valores de la función.

1. Crear un array con los coeficientes elegidos al azar (usar `randint(-10,10,3)`).
2. Calcular el valor de la función y el error correspondiente.
3. Mientras que el error sea mayor a 1:
    1. Definir nuevos coeficientes agregándoles un pequeño valor al azar a los coeficientes actuales (aprendizaje = 0.001).
    2. Si el error para los nuevos coeficientes es menor que el anterior, reemplazar los coeficientes actuales por los nuevos.


In [None]:
import numpy as np

def f(x, coeficientes):
    a, b, c = coeficientes
    return a * x**2 + b * x + c

def error(y, y_pred):
    return np.sum((y - y_pred)**2)

X = np.array([0, 1, 2, 3, 5])
Y = np.array([0, 8, 12, 11, 1])

def buscar_coeficientes():
    coeficientes = np.random.randint(-10, 11, 3)
    mejor_error = float('inf')
    aprendizaje = 0.001
    
    while mejor_error > 1:
        y_pred = f(X, coeficientes)
        error_actual = error(Y, y_pred)
        
        if error_actual < mejor_error:
            mejor_error = error_actual
        
        nuevos_coeficientes = coeficientes + np.random.uniform(-aprendizaje, aprendizaje, 3)
        nuevos_y_pred = f(X, nuevos_coeficientes)
        nuevo_error = error(Y, nuevos_y_pred)
        
        if nuevo_error < error_actual:
            coeficientes = nuevos_coeficientes
    
    return coeficientes

coeficientes = buscar_coeficientes()
print("Coeficientes encontrados:", coeficientes)

a, b, c = coeficientes
print(f"La función cuadrática aproximada es: f(x) = {a:.4f}x^2 + {b:.4f}x + {c:.4f}")

y_pred = f(X, coeficientes)
error_final = error(Y, y_pred)
print(f"Error final: {error_final:.6f}")

Coeficientes encontrados: [-1.76882389  8.9391142   0.51583671]
La función cuadrática aproximada es: f(x) = -1.7688x^2 + 8.9391x + 0.5158
Error final: 0.999964
