### Python para Ciencia de Datos / Proyecto I. Análisis y predicción de ventas-Part 1 (Core)

1. Importamos libretia y cargamos los datos con NumPy

In [1]:
#importamos libretias
import numpy as np
import csv

In [2]:
#cargamos los datos con numpy, como esta en ejemplo 
def cargar_datos(ruta_archivo):
    # Carga los datos del archivo CSV utilizando NumPy
    datos = np.genfromtxt(ruta_archivo, delimiter=',', skip_header=1, dtype=str, filling_values=np.nan)
    return datos

#funcion para ver los nomnres de la columnas
def ver_columnas(ruta_archivo):
    with open(ruta_archivo, 'r', encoding='utf-8') as archivo_csv:
        lector_csv = csv.reader(archivo_csv)
        columnas = next(lector_csv) 
    return columnas


# Definimos la ruta del archivo
if __name__ == "__main__":
    
    ruta_archivo = r'C:\Users\damav\Desktop\Codingdojo\clases\ratail-sales-analysis\data\retail_sales_dataset.csv'

    columnas = ver_columnas(ruta_archivo)
    #Ubicacion del archivo
    datos = cargar_datos(ruta_archivo)
    
    #Imprir las columnas
    print("\nData Preview (first 5 rows):")
    for nombres in columnas:
        print(f"{nombres:20}", end='')  
    print()  

    # Print the first 5 rows of data
    for filas in datos[:5]:  
        for valor in filas:
            print(f"{valor:20}", end='') 
        print()  



Data Preview (first 5 rows):
Transaction ID      Date                Customer ID         Gender              Age                 Product Category    Quantity            Price per Unit      Total Amount        
1                   2023-11-24          CUST001             Male                34                  Beauty              3                   50                  150                 
2                   2023-02-27          CUST002             Female              26                  Clothing            2                   500                 1000                
3                   2023-01-13          CUST003             Male                50                  Electronics         1                   30                  30                  
4                   2023-05-21          CUST004             Male                37                  Clothing            1                   500                 500                 
5                   2023-05-06          CUST005             Male 

#### Exploración de Datos:



1. Calcula el total de ventas por categoría de producto.

In [3]:
#Definimos los indices de la columnas que necestamos para los calculos, verificacion hecha con el archivo excel del dataset.
product_category = datos[:, 5]  
total_amount = datos[:, 8].astype(float)  

#Guardamos los totales en un diccionario, por categoria
total_ventas_por_categoria = {}


for i in range(len(product_category)):
    categoria = product_category[i]
    total = total_amount[i]
    
    if categoria in total_ventas_por_categoria:
        total_ventas_por_categoria[categoria] += total
    
    else:
        total_ventas_por_categoria[categoria] = total

#Imprimir el total de ventas por categoria
print("\nTotal Ventas por Categoria de Productos:")
for categoria, total in total_ventas_por_categoria.items():
    print(f"{categoria}: {total:.2f}")


Total Ventas por Categoria de Productos:
Beauty: 143515.00
Clothing: 155580.00
Electronics: 156905.00


2. Calcula el promedio de ventas diarias por categoría de producto.

In [4]:
#Optenemos los fechas y la cantidad de dias en el dataset
dias = set('Date')
numero_de_dias = len(dias)

In [5]:
#Calculamos el promedio de ventas diarias por categoria de productos
promedio_diario_de_ventas_por_categoria = {categoria: total / numero_de_dias for categoria, total in total_ventas_por_categoria.items()}

In [6]:
#Impimir los resultados
print('\nPromedio de Ventas Diaria por Categoria de Productos')
for categoria, promedio in promedio_diario_de_ventas_por_categoria.items():
    print(f"{categoria}:{promedio:.2f}")


Promedio de Ventas Diaria por Categoria de Productos
Beauty:35878.75
Clothing:38895.00
Electronics:39226.25


3. Identifica las categorías de productos con mayores y menores ventas.

In [7]:
producto_mayor_venta = max(total_ventas_por_categoria)
producto_menor_venta = min(total_ventas_por_categoria)

In [8]:
print(f'Categoria con mayoir venta: {producto_mayor_venta}')
print(f'Categoria con menor vetnta: {producto_menor_venta}')

Categoria con mayoir venta: Electronics
Categoria con menor vetnta: Beauty


#### Manipulación de Datos:


1. Filtra los datos para mostrar solo las ventas de una categoría de producto específica.

In [9]:
# Filtrar los datos para mostrar solo las ventas de la categoría Electronics 

categoria_filtrada = 'Electronics'
ventas_categoria_especifica = []

for i in range(len(datos)):
    if datos[i, 5] == categoria_filtrada:  
        ventas_categoria_especifica.append(datos[i])

#Para ver los datos de manera mas ordenada
ventas_categoria_especifica = np.array(ventas_categoria_especifica)

In [10]:
# Imprimir los resultados
print(f"\nVentas para la categoría '{categoria_filtrada}':")
print(ventas_categoria_especifica)


Ventas para la categoría 'Electronics':
[['3' '2023-01-13' 'CUST003' ... '1' '30' '30']
 ['8' '2023-02-22' 'CUST008' ... '4' '25' '100']
 ['9' '2023-12-13' 'CUST009' ... '2' '300' '600']
 ...
 ['993' '2023-02-06' 'CUST993' ... '3' '50' '150']
 ['999' '2023-12-05' 'CUST999' ... '3' '50' '150']
 ['1000' '2023-04-12' 'CUST1000' ... '4' '30' '120']]


2. Metricas adicionales:

2.1 Promedio de ventas por clientes hombres

In [11]:
# Función para calcular el promedio de ventas por clientes masculinos
def promedio_ventas_hombres(datos):
    total_ventas = 0
    contador = 0
    
    for i in range(len(datos)):
        if datos[i, 3] == 'Male': 
            total_ventas += float(datos[i, 8])  
            contador += 1
    
    return total_ventas / contador if contador > 0 else 0


In [12]:
promedio_ventas_masculinas = promedio_ventas_hombres(datos)
print(f"Promedio de ventas por clientes masculinos: {promedio_ventas_masculinas}")

Promedio de ventas por clientes masculinos: 455.42857142857144


2.2 Porcentaje de ventas por categorias de productos

In [13]:
#creamos una funcio para calcular el porcentaje de ventas por categoria de productos
def porcentaje_ventas_por_categoria(datos):
    total_ventas = 0
    ventas_por_categoria = {}
    
    for i in range(len(datos)):
        categoria_productos = datos[i, 5]  
        ventas = float(datos[i, 8]) 
        
        if categoria_productos not in ventas_por_categoria:
            ventas_por_categoria[categoria_productos] = 0
        ventas_por_categoria[categoria_productos] += ventas
        total_ventas += ventas

    #calculamos el porcentaje
    porcentajes = {categoria_productos: (ventas / total_ventas) * 100 for categoria_productos, ventas in ventas_por_categoria.items()} #if total_ventas > 0 else {}
    
    return porcentajes

In [14]:
# Calcular el porcentaje de ventas por categoría
porcentajes = porcentaje_ventas_por_categoria(datos)
print("Porcentaje de ventas por categoría:")
for categoria_productos, porcentaje in porcentajes.items():
    print(f"{categoria_productos}: {porcentaje:.2f}%")

Porcentaje de ventas por categoría:
Beauty: 31.47%
Clothing: 34.12%
Electronics: 34.41%
