## Análisis y Predicción de Ventas en una Tienda de Retail (Core)
En esta tercera parte del proyecto, continuaremos trabajando con el dataset de ventas que utilizamos en la Parte II. En esta fase, aplicaremos técnicas avanzadas de transformación y análisis de datos utilizando las nuevas habilidades adquiridas en Pandas, tales como agrupaciones complejas y el uso del método apply. Nos enfocaremos en extraer insights más profundos y preparar los datos para futuros análisis y modelos predictivos.

## Instrucciones
### Transformación de Datos
    - Crea nuevas columnas: Basándonos en los datos existentes, crea nuevas columnas que sean útiles para el análisis. Por ejemplo, calcula el ingreso total por venta y normaliza las ventas.
    - Clasifica los datos: Crea una columna que clasifique las ventas en categorías significativas (e.g., ‘Alta’, ‘Media’, ‘Baja’).

In [None]:
import pandas as pd

# Cargar datos desde un archivo CSV
df = pd.read_csv('../data/retail_sales_dataset.csv')

# Ver las primeras
print("Primeras filas del DataFrame:")
print(df.head(10))

# Identificar valores nulos en todo el DataFrame
print(df.isnull().sum())
print('-----------------------------------------', end='\n')

# Defining all the conditions inside a function
def condition(x):
    if x>500:
        return "ALTA"
    elif x>=100 and x<=499:
        return "MEDIA"
    else:
        return 'BAJA'

# Nueva columna
print(df.head(3))
df['Clasificacion'] = df['Total Amount'].apply(condition)
print(df.head(3))
print('-----------------------------------------', end='\n')



### Agrupación y Agregación
    - Agrupación por múltiples columnas: Realiza agrupaciones por categorías como producto y tienda, producto y mes, etc.
    - Aplicar funciones de agregación: Utiliza funciones como sum, mean, count, min, max, std, y var para obtener estadísticas descriptivas de cada grupo.

In [None]:
# Agrupar en categorias ('cash_type' y sumar 'money')
grouped_df = df.groupby('Clasificacion')['Total Amount'].sum().reset_index()
# Imprimir el DataFrame agrupado
print(grouped_df)
print('-----------------------------------------', end='\n')

# Agrupar en categorias ('cash_type' y promediar 'money')
grouped_df = df.groupby('Gender')['Total Amount'].mean().reset_index()
# Imprimir el DataFrame agrupado
print(grouped_df)
print('-----------------------------------------', end='\n')

### Análisis Personalizado con apply
    - Función personalizada: Aplica funciones personalizadas para realizar análisis específicos que no se pueden lograr con las funciones de agregación estándar.
    - Ejemplo de uso avanzado: Calcula la desviación de cada venta respecto a la media de su grupo.

In [7]:
# Agregar un descuento de producto
# Función para calcular el 10%
def calcular_descuento(monto):
    return monto * 0.10
# Aplicar la función a la columna 'money'
df['descuento'] = df['Total Amount'].apply(calcular_descuento)
print(df.head(3))
print('-----------------------------------------', end='\n')

   Transaction ID        Date Customer ID  Gender  Age Product Category  \
0               1  2023-11-24     CUST001    Male   34           Beauty   
1               2  2023-02-27     CUST002  Female   26         Clothing   
2               3  2023-01-13     CUST003    Male   50      Electronics   

   Quantity  Price per Unit  Total Amount Clasificacion  descuento  
0         3              50           150         MEDIA       15.0  
1         2             500          1000          ALTA      100.0  
2         1              30            30          BAJA        3.0  
-----------------------------------------


### Documentación
    - Comentarios claros: Documenta claramente cada paso del análisis, explicando qué se hizo y por qué se hizo.
    - Código legible: Asegúrate de que el código sea legible y esté bien comentado