**Carga y Preprocesamiento de Datos:**
* Carga los datos del archivo CSV utilizando NumPy.
* Realiza un preprocesamiento básico para asegurarte de que los datos estén limpios y listos para su análisis.

**Exploración de Datos:**
* Calcula el total de ventas por categoría de producto.
* Calcula el promedio de ventas diarias por categoría de producto.
* Identifica las categorías de productos con mayores y menores ventas.

**Manipulación de Datos:**
* Filtra los datos para mostrar solo las ventas de una categoría de producto específica.
* Realiza operaciones de suma, resta, multiplicación y división en los datos para obtener estadísticas adicionales.



In [12]:
import numpy as np

# Función para cargar los datos del archivo CSV
def cargar_datos(ruta_archivo):
    # Carga los datos con nombres de columnas
    datos = np.genfromtxt(ruta_archivo, delimiter=',', dtype=None, encoding='utf-8', names=True)
    return datos

def total_ventas_por_categoria(datos):
    # Calcular el total de ventas por categoría de producto (array de ventas por categoría)
    categorias_unicas = np.unique(datos['Product_Category'])
    total_ventas = {categoria: datos['Total_Amount'][datos['Product_Category'] == categoria] for categoria in categorias_unicas}
    return total_ventas

def promedio_ventas_diarias_por_categoria(datos):
    # Calcular el promedio de ventas diarias por categoría de producto
    categorias_unicas = np.unique(datos['Product_Category'])
    promedio_ventas = {categoria: np.mean(datos['Total_Amount'][datos['Product_Category'] == categoria]) for categoria in categorias_unicas}
    return promedio_ventas

def categorias_mayor_menor_ventas(total_ventas):
    # Identificar las categorías con mayores y menores ventas sumando las ventas de cada categoría
    ventas_totales = {categoria: np.sum(ventas) for categoria, ventas in total_ventas.items()}
    categoria_max_ventas = max(ventas_totales, key=ventas_totales.get)
    categoria_min_ventas = min(ventas_totales, key=ventas_totales.get)
    return categoria_max_ventas, categoria_min_ventas

def filtrar_por_categoria(datos, categoria):
    # Filtrar los datos para mostrar solo las ventas de una categoría de producto específica
    return datos[datos['Product_Category'] == categoria]

# Operaciones matemáticas en columnas
def operaciones_matematicas(datos, columna1, columna2):
    # Suma los valores de dos columnas
    suma = datos[columna1] + datos[columna2]  # Suma elemento por elemento
    # Resta los valores consecutivos de la columna1
    resta = np.diff(datos[columna1])  # Resta entre valores consecutivos
    # Multiplica los valores de dos columnas (elemento por elemento)
    multiplicacion = datos[columna1] * datos[columna2]  # Multiplicación por cada fila
    # Divide los valores de columna1 por el valor máximo de esa columna
    division = datos[columna1] / np.max(datos[columna1])  # División elemento por elemento
    return suma, resta, multiplicacion, division

if __name__ == "__main__":
    ruta_archivo = 'retail_sales_dataset.csv'  # Actualiza esta ruta según tu entorno
    datos = cargar_datos(ruta_archivo)

    # Total de ventas por categoría
    total_ventas = total_ventas_por_categoria(datos)
    print("\n\nTotal de ventas por categoría:")
    for categoria, ventas in total_ventas.items():
        print(f"{categoria}: ${np.sum(ventas):,.2f}")  # Sumar y formatear la salida

    # Promedio de ventas diarias por categoría
    promedio_ventas = promedio_ventas_diarias_por_categoria(datos)
    print("\n\nPromedio de ventas diarias por categoría:")
    for categoria, promedio in promedio_ventas.items():
        print(f"{categoria}: ${promedio:,.2f}")  # Formatear el promedio

    # Categoría con mayores y menores ventas
    cat_max, cat_min = categorias_mayor_menor_ventas(total_ventas)
    print("\n\nCategoría con mayores ventas:", cat_max)
    print("\n\nCategoría con menores ventas:", cat_min)

    # Filtrar ventas por categoría específica (por ejemplo, 'Electronics')
    ventas_filtradas = filtrar_por_categoria(datos, 'Electronics')
    print("\n\nVentas filtradas por categoría 'Electronics':\n", ventas_filtradas)

    # Operaciones matemáticas en las columnas 'Total_Amount' y 'Quantity'
    suma, resta, multiplicacion, division = operaciones_matematicas(datos, 'Total_Amount', 'Quantity')

    # Resultados de las operaciones
    print(f"\n\nSuma de columnas 'Total_Amount' + 'Quantity':\n{suma}")
    print(f"\n\nResta (diferencias consecutivas de 'Total_Amount'):\n{resta}")
    print(f"\n\nMultiplicación de columnas 'Total_Amount' * 'Quantity':\n{multiplicacion}")
    print(f"\n\nDivisión de 'Total_Amount' por su valor máximo:\n{division}")




Total de ventas por categoría:
Beauty: $143,515.00
Clothing: $155,580.00
Electronics: $156,905.00


Promedio de ventas diarias por categoría:
Beauty: $467.48
Clothing: $443.25
Electronics: $458.79


Categoría con mayores ventas: Electronics


Categoría con menores ventas: Beauty


Ventas filtradas por categoría 'Electronics':
 [(   3, '2023-01-13', 'CUST003', 'Male', 50, 'Electronics', 1,  30,   30)
 (   8, '2023-02-22', 'CUST008', 'Male', 30, 'Electronics', 4,  25,  100)
 (   9, '2023-12-13', 'CUST009', 'Male', 63, 'Electronics', 2, 300,  600)
 (  13, '2023-08-05', 'CUST013', 'Male', 22, 'Electronics', 3, 500, 1500)
 (  15, '2023-01-16', 'CUST015', 'Female', 42, 'Electronics', 4, 500, 2000)
 (  18, '2023-04-30', 'CUST018', 'Female', 47, 'Electronics', 2,  25,   50)
 (  26, '2023-10-07', 'CUST026', 'Female', 28, 'Electronics', 2, 500, 1000)
 (  29, '2023-08-18', 'CUST029', 'Female', 42, 'Electronics', 1,  30,   30)
 (  31, '2023-05-23', 'CUST031', 'Male', 44, 'Electronics', 4, 300, 1