# Advanced User Data Processing and Segmentation  #


**Proyecto:** Extracci√≥n y An√°lisis Avanzado del Comportamiento del Usuario

**Autor:** Carlos Smith

**Fecha:** Junio 2025

*Descripci√≥n del Proyecto:*

Este proyecto se adentra en la extracci√≥n de informaci√≥n significativa y el an√°lisis profundo de los h√°bitos de consumo de los usuarios, partiendo de los datos previamente limpiados y estructurados en la fase anterior. Aborda el desaf√≠o de transformar datos anidados y complejos en insights accionables, crucial para la toma de decisiones estrat√©gicas.

üéØ *Objetivos Clave:*

- **Extracci√≥n de Datos Avanzada:** Implementar l√≥gicas para acceder y manipular informaci√≥n compleja dentro de estructuras de datos anidadas.
- **An√°lisis de Comportamiento:** Calcular m√©tricas clave del comportamiento de gasto del usuario para identificar patrones y preferencias.
- **Generaci√≥n de Insights:** Producir res√∫menes y agregaciones de datos que respondan directamente a las necesidades estrat√©gicas de la direcci√≥n.
- **Optimizaci√≥n de Presentaci√≥n:** Formatear los resultados de manera clara y profesional para diversas audiencias, incluyendo stakeholders t√©cnicos y no t√©cnicos.

üõ†Ô∏è *Habilidades Demostradas:*

- **Python:** Dominio en la manipulaci√≥n de estructuras de datos complejas (listas anidadas, diccionarios), agregaci√≥n de datos y uso eficiente de funciones.
- **An√°lisis de Datos:** Capacidad para definir m√©tricas relevantes, calcular agregados y extraer patrones de comportamiento.
- **Resoluci√≥n de Problemas:** Habilidad para dise√±ar soluciones efectivas para la extracci√≥n de datos desde formatos no tabulares est√°ndar.
- **Pensamiento L√≥gico/Algor√≠tmico:** Creaci√≥n de algoritmos eficientes para procesar y transformar grandes vol√∫menes de datos.
- **Comunicaci√≥n Estrat√©gica:** Presentaci√≥n de resultados de an√°lisis en formatos ejecutivos, facilitando la comprensi√≥n y la toma de decisiones basadas en datos.

Este proyecto subraya la capacidad para ir m√°s all√° de la limpieza de datos, enfoc√°ndose en la extracci√≥n de valor y la generaci√≥n de insights accionables a partir de conjuntos de datos con mayor complejidad, una habilidad indispensable para un analista de datos avanzado.

---

**Contexto del An√°lisis:**

Tras establecer una base s√≥lida con la limpieza y estructuraci√≥n de los perfiles de usuario en el Proyecto 1, esta segunda fase se concentra en la profundizaci√≥n del an√°lisis de los h√°bitos de consumo. El objetivo es proporcionar al cliente una comprensi√≥n detallada de c√≥mo los usuarios interact√∫an con las diferentes categor√≠as de productos y sus patrones de gasto, facilitando as√≠ decisiones de negocio m√°s informadas y personalizadas.

Las empresas recopilan y almacenan datos de una forma particular. Store 1 quiere almacenar toda la informaci√≥n de sus clientes en una tabla.


| user_id | user_name | user_age | purchase_category | spending_per_category |
| --- | --- | --- | --- | --- |
| '32415' | 'mike', 'reed' | 32 | 'electronics', 'sport', 'books' | 894, 213, 173 |
| '31980' | 'kate', 'morgan' | 24 | 'clothes', 'shoes' | 439, 390 |

En t√©rminos t√©cnicos, una tabla es simplemente una lista anidada que contiene una sublista para cada usuario o usuaria.

Store 1 ha creado una tabla de este tipo para sus usuarios. Est√° almacenada en la variable "users". Cada sublista contiene el ID del usuario, nombre y apellido, edad, categor√≠as favoritas y el importe gastado en cada categor√≠a.

-	**user_id:** el identificador √∫nico para cada usuario.
-	**user_name:** el nombre de usuario.
-	**user_age:** la edad del usuario.
-	**fav_categories:** las categor√≠as de art√≠culos comprados por el usuario, como 'ELECTRONICS', 'SPORT', 'BOOKS', etc.
-	**total_spendings:** la lista de enteros que indican la cantidad gastada en cada una de sus categor√≠as favoritas.


In [1]:
users = [
    ['32415', ' mike_reed ', 32.0, ['ELECTRONICS', 'SPORT', 'BOOKS'], [894, 213, 173]],
    ['31980', 'kate morgan', 24.0, ['CLOTHES', 'BOOKS'], [439, 390]],
    ['32156', ' john doe ', 37.0, ['ELECTRONICS', 'HOME', 'FOOD'], [459, 120, 99]],
    ['32761', 'SAMANTHA SMITH', 29.0, ['CLOTHES', 'ELECTRONICS', 'BEAUTY'], [299, 679, 85]],
    ['32984', 'David White', 41.0, ['BOOKS', 'HOME', 'SPORT'], [234, 329, 243]],
    ['33001', 'emily brown', 26.0, ['BEAUTY', 'HOME', 'FOOD'], [213, 659, 79]],
    ['33767', ' Maria Garcia', 33.0, ['CLOTHES', 'FOOD', 'BEAUTY'], [499, 189, 63]],
    ['33912', 'JOSE MARTINEZ', 22.0, ['SPORT', 'ELECTRONICS', 'HOME'], [259, 549, 109]],
    ['34009', 'lisa wilson ', 35.0, ['HOME', 'BOOKS', 'CLOTHES'], [329, 189, 329]],
    ['34278', 'James Lee', 28.0, ['BEAUTY', 'CLOTHES', 'ELECTRONICS'], [189, 299, 579]],
]


###  **Paso 1: Encapsulando la L√≥gica de Limpieza en una Funci√≥n Reutilizable**

En la fase final del Proyecto 1, desarrollamos un proceso robusto para limpiar y estructurar los datos de los usuarios. Este proceso inclu√≠a:

- **Normalizaci√≥n de Nombres:** Eliminaci√≥n de espacios superfluos y reemplazo de guiones bajos (_).
- **Conversi√≥n de Edad:** Transformaci√≥n del valor de la edad a un tipo de dato entero (int).
- **Descomposici√≥n de Nombres:** Divisi√≥n del nombre completo en una sublista con nombre y apellido.

Ahora, para hacer nuestro c√≥digo m√°s eficiente, modular y reutilizable, encapsularemos esta l√≥gica de limpieza dentro de una funci√≥n. Esta pr√°ctica es fundamental en el desarrollo de software y an√°lisis de datos, ya que permite aplicar el mismo conjunto de transformaciones a cualquier registro de usuario con una sola llamada.

**Objetivo**

Nuestro objetivo es crear una funci√≥n llamada clean_user que acepte la informaci√≥n de un usuario y los √≠ndices espec√≠ficos de su nombre y edad. La funci√≥n aplicar√° las transformaciones previamente definidas y devolver√° el registro del usuario ya limpio. Luego, probaremos esta funci√≥n con un usuario de prueba para verificar su correcto funcionamiento.

**Implementaci√≥n de la Funci√≥n clean_user**

La funci√≥n clean_user recibir√° tres argumentos:

- **user_info:** Una lista que contiene toda la informaci√≥n de un cliente individual.
- **name_index:** Un entero que indica la posici√≥n del nombre del cliente dentro de user_info.
- **age_index:** Un entero que indica la posici√≥n de la edad del cliente dentro de user_info.


In [2]:
def clean_user(user_info, ind_name,ind_age):# define tu funci√≥n aqu√≠

    # Paso 1: elimina del nombre espacios iniciales y finales, as√≠ como guiones
    user_name_1 = user_info[ind_name].replace("_"," ") #Accediendo al nombre del usuario y remplazando guiones bajo
    user_name_1=user_name_1.strip() #Quitando espacios en blanco del nombre del usuario
    # Paso 2: convierte la edad en entero
    user_age_1 = int(user_info[ind_age]) #Convirtiendo la edad en entero
    # Paso 3: separa el nombre y el apellido en una sublista
    user_name_1=user_name_1.split(" ") #Diviendo el nombre y apellido

    # Prepara la lista con la informaci√≥n completa del usuario
    # Reemplaza el nombre y la edad originales con los datos limpios
    user_info[ind_name]=user_name_1 #Asignando nombre 'limpio' al indice correspondiente
    user_info[ind_age]=user_age_1 #Asignando edad 'limpia' al indice correspondiente

    return user_info #Arrojando el nombre del usuario con datos corregidos

# Prueba la funci√≥n
test_user = ['32415', ' mike_reed ', 32.0, ['ELECTRONICS', 'SPORT', 'BOOKS'], [894, 213, 173]]
name_index = 1
age_index = 2

print(clean_user(test_user,name_index,age_index)) #Llamado de la funci√≥n 

['32415', ['mike', 'reed'], 32, ['ELECTRONICS', 'SPORT', 'BOOKS'], [894, 213, 173]]


Al encapsular esta l√≥gica en una funci√≥n, demostramos la habilidad para escribir c√≥digo modular, reutilizable y mantenible, lo cual es una soft skill altamente valorada en roles de analista de datos. Esto tambi√©n sienta las bases para procesar grandes conjuntos de datos de manera eficiente en los pr√≥ximos pasos.

### **Paso 2: Normalizaci√≥n de Categor√≠as Favoritas a Min√∫sculas**

En nuestro conjunto de datos, hemos observado que las categor√≠as favoritas de los usuarios +(fav_categories)* est√°n almacenadas completamente en may√∫sculas. Para garantizar la consistencia y facilitar an√°lisis posteriores (como agrupaciones o b√∫squedas, que suelen ser case-sensitive), es una buena pr√°ctica normalizar estos valores a min√∫sculas.


**Objetivo**

Nuestro objetivo en este paso es crear una nueva lista llamada *fav_categories_low* que contenga todas las categor√≠as favoritas de un usuario, pero transformadas a min√∫sculas. Esto asegurar√° la uniformidad de los datos de categor√≠a.


**Acci√≥n Clave**

Vamos a iterar sobre cada categor√≠a en la lista original *fav_categories*. Por cada categor√≠a, aplicaremos el m√©todo *lower()* para convertirla a min√∫sculas y luego la a√±adiremos a nuestra nueva lista *fav_categories_low*. Finalmente, desplegaremos el contenido de *fav_categories_low* para verificar la transformaci√≥n.


In [3]:
fav_categories = ['ELECTRONICS', 'SPORT', 'BOOKS']
fav_categories_low = []

for element in fav_categories:
    fav_categories_low.append(element.lower())#Agregando valores de categorias en minusculas a lista

print(fav_categories_low)

['electronics', 'sport', 'books']


Normalizar el uso de may√∫sculas y min√∫sculas en los datos es una habilidad fundamental en la limpieza de datos, ya que previene inconsistencias y errores en los an√°lisis, demostrando tu atenci√≥n al detalle y tu proactividad en la gesti√≥n de la calidad de los datos.

### **Paso 3: Normalizaci√≥n Masiva de Categor√≠as a Min√∫sculas para Todos los Usuarios**

Hemos visto c√≥mo normalizar las categor√≠as a min√∫sculas para un √∫nico usuario. Ahora, extenderemos esta l√≥gica para aplicarla a todos los usuarios de nuestra base de datos. Esta es una tarea com√∫n en la preparaci√≥n de datos a gran escala y es esencial para garantizar la consistencia en todo el conjunto de datos.

**Objetivo**

Nuestro objetivo es crear una nueva lista, *users_categories_low*, que contendr√° la informaci√≥n de todos los usuarios de la lista *users*, pero con sus respectivas listas de categor√≠as favoritas (*fav_categories*) convertidas completamente a min√∫sculas.

**Acci√≥n Clave**

Para lograr esto, realizaremos una doble iteraci√≥n:

- Primero, iteraremos a trav√©s de cada *user* en la lista principal *users*.
- Dentro de cada *user*, accederemos a su lista de ¬®*fav_categories* y la recorreremos, transformando cada categor√≠a individual a min√∫sculas.
- Una vez que tengamos las categor√≠as normalizadas para un usuario, construiremos un nuevo registro de usuario con esta informaci√≥n y lo a√±adiremos a *users_categories_low*.


In [4]:
users = [
    ['32415', ' mike_reed ', 32.0, ['ELECTRONICS', 'SPORT', 'BOOKS'], [894, 213, 173]],
    ['31980', 'kate morgan', 24.0, ['CLOTHES', 'BOOKS'], [439, 390]],
    ['32156', ' john doe ', 37.0, ['ELECTRONICS', 'HOME', 'FOOD'], [459, 120, 99]],
    ['32761', 'SAMANTHA SMITH', 29.0, ['CLOTHES', 'ELECTRONICS', 'BEAUTY'], [299, 679, 85]],
    ['32984', 'David White', 41.0, ['BOOKS', 'HOME', 'SPORT'], [234, 329, 243]],
    ['33001', 'emily brown', 26.0, ['BEAUTY', 'HOME', 'FOOD'], [213, 659, 79]],
    ['33767', ' Maria Garcia', 33.0, ['CLOTHES', 'FOOD', 'BEAUTY'], [499, 189, 63]],
    ['33912', 'JOSE MARTINEZ', 22.0, ['SPORT', 'ELECTRONICS', 'HOME'], [259, 549, 109]],
    ['34009', 'lisa wilson ', 35.0, ['HOME', 'BOOKS', 'CLOTHES'], [329, 189, 329]],
    ['34278', 'James Lee', 28.0, ['BEAUTY', 'CLOTHES', 'ELECTRONICS'], [189, 299, 579]],
]

users_categories_low = []
for user in users:#Iterando en cada usuario
    categories_low = [] # Definiendo lista donde se almacenaran las categorias en min√∫sculas
    users_categories = user[3] #Definiendo con √≠ndice la ubicaci√≥n de las categorias
    for category in users_categories:  # Revisando cada categor√≠a de usuario
        categories_low.append(category.lower()) #Agregando a la lista antes definida, las categor√≠as en min√∫sculas.
    user.pop(3) # Eliminando las categor√≠as en may√∫sculas.
    user.insert(3,categories_low) # Agregando categor√≠as en min√∫sculas al usuario.
    users_categories_low.append(user) # Agregando el usuario a la lista users_categories_low

print(users_categories_low) #Imprimiendo lista con categor√≠as corregidas.

[['32415', ' mike_reed ', 32.0, ['electronics', 'sport', 'books'], [894, 213, 173]], ['31980', 'kate morgan', 24.0, ['clothes', 'books'], [439, 390]], ['32156', ' john doe ', 37.0, ['electronics', 'home', 'food'], [459, 120, 99]], ['32761', 'SAMANTHA SMITH', 29.0, ['clothes', 'electronics', 'beauty'], [299, 679, 85]], ['32984', 'David White', 41.0, ['books', 'home', 'sport'], [234, 329, 243]], ['33001', 'emily brown', 26.0, ['beauty', 'home', 'food'], [213, 659, 79]], ['33767', ' Maria Garcia', 33.0, ['clothes', 'food', 'beauty'], [499, 189, 63]], ['33912', 'JOSE MARTINEZ', 22.0, ['sport', 'electronics', 'home'], [259, 549, 109]], ['34009', 'lisa wilson ', 35.0, ['home', 'books', 'clothes'], [329, 189, 329]], ['34278', 'James Lee', 28.0, ['beauty', 'clothes', 'electronics'], [189, 299, 579]]]


### **Paso 4: Finalizando la Funci√≥n clean_user y Limpieza Global de Datos**

En los pasos anteriores, hemos desarrollado la l√≥gica para limpiar nombres, edades y categor√≠as por separado. Ahora, es momento de consolidar todas estas transformaciones en nuestra funci√≥n *clean_user* para que sea una herramienta integral de preprocesamiento de datos. Luego, aplicaremos esta funci√≥n mejorada a toda nuestra lista de usuarios.

**Objetivo**

Nuestro objetivo es perfeccionar la funci√≥n *clean_user* para que tambi√©n maneje la normalizaci√≥n de las categor√≠as favoritas. Esto implica:

- A√±adir un par√°metro a *clean_user* para especificar el √≠ndice de las categor√≠as.
- Asegurar que los nombres se conviertan a min√∫sculas antes de eliminar espacios y reemplazar guiones bajos, garantizando una limpieza completa y consistente.
Una vez actualizada la funci√≥n, la aplicaremos a cada registro en nuestra lista de users y almacenaremos los resultados en una nueva lista llamada users_clean, que luego mostraremos.

**Refinando la Funci√≥n *clean_user***

Vamos a modificar nuestra funci√≥n *clean_user*

In [5]:
def clean_user(user_info, name_index, age_index, cat_index):
  # Paso 1: pon todo en min√∫sculas y elimina del nombre espacios iniciales y finales, as√≠ como guiones
    user_name_1 = user_info[name_index].lower().replace("_"," ").strip()

  # Paso 2: convierte la edad en entero
    user_age_1 = int(user_info[age_index])

  # Paso 3: separa el nombre y el apellido en una sublista
    user_name_1 = user_name_1.split(" ")

  # Paso 4: convierte en min√∫sculas todas las categor√≠as
    categories_low = []
    for category in user[cat_index]:
        categories_low.append(category.lower())
    user_info.pop(cat_index)
    user_info.insert(cat_index, categories_low)

  # Prepara la lista con la informaci√≥n completa del usuario
    clean_user_info=[]
  # Reemplaza el nombre y la edad originales con los datos limpios
    clean_user_info=[user_info[0],user_name_1, user_age_1,user_info[cat_index],user_info[4]]
    return  clean_user_info


users = [
    ['32415', ' mike_reed ', 32.0, ['ELECTRONICS', 'SPORT', 'BOOKS'], [894, 213, 173]],
    ['31980', 'kate morgan', 24.0, ['CLOTHES', 'BOOKS'], [439, 390]],
    ['32156', ' john doe ', 37.0, ['ELECTRONICS', 'HOME', 'FOOD'], [459, 120, 99]],
    ['32761', 'SAMANTHA SMITH', 29.0, ['CLOTHES', 'ELECTRONICS', 'BEAUTY'], [299, 679, 85]],
    ['32984', 'David White', 41.0, ['BOOKS', 'HOME', 'SPORT'], [234, 329, 243]],
    ['33001', 'emily brown', 26.0, ['BEAUTY', 'HOME', 'FOOD'], [213, 659, 79]],
    ['33767', ' Maria Garcia', 33.0, ['CLOTHES', 'FOOD', 'BEAUTY'], [499, 189, 63]],
    ['33912', 'JOSE MARTINEZ', 22.0, ['SPORT', 'ELECTRONICS', 'HOME'], [259, 549, 109]],
    ['34009', 'lisa wilson ', 35.0, ['HOME', 'BOOKS', 'CLOTHES'], [329, 189, 329]],
    ['34278', 'James Lee', 28.0, ['BEAUTY', 'CLOTHES', 'ELECTRONICS'], [189, 299, 579]],
]

name_index = 1
age_index = 2
cat_index = 3
users_cleaned = []

for user in users: #Iterando sobre cada usuario
  user_cleaned = clean_user(user, name_index, age_index, cat_index) #Armando usuario con datos corregidos
  users_cleaned.append(user_cleaned) # Agregando el usuario a lista corregida

print(users_cleaned)

[['32415', ['mike', 'reed'], 32, ['electronics', 'sport', 'books'], [894, 213, 173]], ['31980', ['kate', 'morgan'], 24, ['clothes', 'books'], [439, 390]], ['32156', ['john', 'doe'], 37, ['electronics', 'home', 'food'], [459, 120, 99]], ['32761', ['samantha', 'smith'], 29, ['clothes', 'electronics', 'beauty'], [299, 679, 85]], ['32984', ['david', 'white'], 41, ['books', 'home', 'sport'], [234, 329, 243]], ['33001', ['emily', 'brown'], 26, ['beauty', 'home', 'food'], [213, 659, 79]], ['33767', ['maria', 'garcia'], 33, ['clothes', 'food', 'beauty'], [499, 189, 63]], ['33912', ['jose', 'martinez'], 22, ['sport', 'electronics', 'home'], [259, 549, 109]], ['34009', ['lisa', 'wilson'], 35, ['home', 'books', 'clothes'], [329, 189, 329]], ['34278', ['james', 'lee'], 28, ['beauty', 'clothes', 'electronics'], [189, 299, 579]]]


Al consolidar estas operaciones en una √∫nica funci√≥n clean_user y aplicarla en un bucle, demuestras no solo habilidades de programaci√≥n modular y eficiente, sino tambi√©n un entendimiento de la automatizaci√≥n de tareas de preprocesamiento de datos a escala, una capacidad muy valorada para un analista de datos.

### **Paso 5: C√°lculo de Ingresos Totales de la Empresa**

Ahora que nuestros datos de clientes est√°n limpios y estandarizados, la direcci√≥n de la empresa est√° interesada en obtener una m√©trica de negocio fundamental: los ingresos totales generados por todos los clientes. Este valor es crucial para evaluar el rendimiento general y la salud financiera de la empresa.

**Objetivo**

Nuestro objetivo es calcular la suma de todos los gastos de cada usuario y, posteriormente, agregar estos totales individuales para obtener los ingresos totales globales de la empresa.

**Acciones Clave**

Para lograr esto, seguiremos un proceso de agregaci√≥n de datos:

- **Iterar sobre la lista de usuarios**: Recorreremos cada registro de usuario en nuestra lista users (o users_clean si ya aplicaste el Paso 4 a la lista completa).
- **Extraer y sumar gastos por usuario**: Para cada usuario, accederemos a su lista de total_spendings (gastos por categor√≠a) y sumaremos todos los valores que contiene para obtener el gasto total de ese usuario.
- **Acumular ingresos totales**: Sumaremos el gasto total de cada usuario a una variable acumuladora, que finalmente representar√° los ingresos totales de la empresa.

In [6]:
users = [['32415', ['mike', 'reed'], 32, ['electronics', 'sport', 'books'], [894, 213, 173]],
         ['31980', ['kate', 'morgan'], 24, ['clothes', 'books'], [439, 390]],
         ['32156', ['john', 'doe'], 37, ['electronics', 'home', 'food'], [459, 120, 99]],
         ['32761', ['samantha', 'smith'], 29, ['clothes', 'electronics', 'beauty'], [299, 679, 85]],
         ['32984', ['david', 'white'], 41, ['books', 'home', 'sport'], [234, 329, 243]],
         ['33001', ['emily', 'brown'], 26, ['beauty', 'home', 'food'], [213, 659, 79]],
         ['33767', ['maria', 'garcia'], 33, ['clothes', 'food', 'beauty'], [499, 189, 63]],
         ['33912', ['jose', 'martinez'], 22, ['sport', 'electronics', 'home'], [259, 549, 109]],
         ['34009', ['lisa', 'wilson'], 35, ['home', 'books', 'clothes'], [329, 189, 329]],
         ['34278', ['james', 'lee'], 28, ['beauty', 'clothes', 'electronics'], [189, 299, 579]]]

revenue = 0

for user in users:#Iterando sobre cada usuario
    spending_list= user[4] #Extrayendo ingresos del usuario
    total_spending = sum(spending_list) #Sumando ingresos del usuario
    revenue += total_spending #Sumando y acumulando los ingresos en la variable global revenue
    

print(f"Los ingresos totales de la empresa son: ${revenue}")

Los ingresos totales de la empresa son: $9189


Este c√°lculo demuestra habilidad para realizar agregaciones de datos, una tarea fundamental en el an√°lisis cuantitativo. Obtener el valor de los ingresos totales es un KPI (Key Performance Indicator) crucial para la direcci√≥n, mostrando capacidad para entregar m√©tricas de negocio relevantes a partir de datos crudos.

### **Paso 6: Identificaci√≥n de Clientes Leales y Simulaci√≥n de Compras**

La empresa tiene una nueva iniciativa para recompensar a sus clientes leales ofreci√©ndoles descuentos exclusivos. Se considera cliente leal a aquel que realiza compras por un **importe total superior a $1500**. Nuestro objetivo es simular este comportamiento de compra hasta que se alcance este umbral, demostrando c√≥mo identificar a estos clientes.

**Objetivo**

Crearemos un bucle *while* para simular las compras de un cliente hasta que su gasto acumulado supere los $1500. En cada "nueva compra" simulada, generaremos un valor aleatorio entre $30 y $80, que se sumar√° al total gastado por el cliente. Una vez que el total alcance o supere los $1500, el bucle se detendr√° y mostraremos el monto final gastado por el cliente.

**Acci√≥n Clave**

Utilizaremos un bucle *while* con una condici√≥n que eval√∫e si el *total_spent* del cliente ha superado el umbral de lealtad ($1500). Dentro del bucle, generaremos montos de *new_purchase* aleatorios y los sumaremos al *total_spent*.

In [7]:
from random import randint

total_amount_spent = 1280
target_amount = 1500

while total_amount_spent < target_amount:# Condici√≥n para determinar si es cliente leal
	new_purchase = randint(30, 80) # generamos un n√∫mero aleatorio de 30 a 80
	total_amount_spent += new_purchase # acumulando el monto gastado

print(f"El monto final gastado es: ${total_amount_spent}")

El monto final gastado es: $1531


Este ejercicio demuestra capacidad para aplicar estructuras de control de flujo (*while loops*) y simular escenarios de negocio utilizando l√≥gica de programaci√≥n. Adem√°s, resalta la habilidad para trabajar con generaci√≥n de datos aleatorios para probar condiciones espec√≠ficas, lo cual es muy √∫til en pruebas y modelado de escenarios

### **Paso 7: Identificaci√≥n de Clientes J√≥venes**

La empresa est√° interesada en comprender mejor la demograf√≠a de su base de clientes. Espec√≠ficamente, quieren identificar a los clientes menores de 30 a√±os. Esta informaci√≥n puede ser valiosa para campa√±as de marketing dirigidas o para entender las preferencias de un segmento m√°s joven.

**Objetivo**

Nuestro objetivo es iterar a trav√©s de la lista de todos los usuarios y, por cada uno, verificar su edad. Si la edad del cliente es menor de 30 a√±os, mostraremos su nombre.

**Acci√≥n Clave**

Vamos a recorrer la lista *users_clean* (o la lista *users* si no has aplicado la limpieza a la lista completa a√∫n). Para cada usuario, accederemos a su edad y a su nombre, aplicando una condici√≥n para filtrar solo a aquellos que cumplan con el criterio de edad.


In [8]:
users = [['32415', ['mike', 'reed'], 32, ['electronics', 'sport', 'books'], [894, 213, 173]],
         ['31980', ['kate', 'morgan'], 24, ['clothes', 'books'], [439, 390]],
         ['32156', ['john', 'doe'], 37, ['electronics', 'home', 'food'], [459, 120, 99]],
         ['32761', ['samantha', 'smith'], 29, ['clothes', 'electronics', 'beauty'], [299, 679, 85]],
         ['32984', ['david', 'white'], 41, ['books', 'home', 'sport'], [234, 329, 243]],
         ['33001', ['emily', 'brown'], 26, ['beauty', 'home', 'food'], [213, 659, 79]],
         ['33767', ['maria', 'garcia'], 33, ['clothes', 'food', 'beauty'], [499, 189, 63]],
         ['33912', ['jose', 'martinez'], 22, ['sport', 'electronics', 'home'], [259, 549, 109]],
         ['34009', ['lisa', 'wilson'], 35, ['home', 'books', 'clothes'], [329, 189, 329]],
         ['34278', ['james', 'lee'], 28, ['beauty', 'clothes', 'electronics'], [189, 299, 579]]]


for user in users: # Iterando en cada usuario
    if user[2]<30: # Condici√≥n que usuario tenga edad deseada
        print(user[1][0])  #Imprimiendo nombre si cumple condici√≥n

kate
samantha
emily
jose
james


Este paso demuestra capacidad para realizar filtrado de datos condicional e iterar eficientemente sobre estructuras de datos. Es una habilidad esencial para extraer subconjuntos espec√≠ficos de informaci√≥n que son relevantes para el negocio, lo cual es fundamental para el an√°lisis demogr√°fico y la segmentaci√≥n de clientes.

### **Paso 8: Segmentaci√≥n de Clientes por Edad y Gasto Total**

Continuando con nuestro an√°lisis demogr√°fico y de comportamiento, la empresa ahora busca identificar a un segmento de clientes muy espec√≠fico: aquellos que son **j√≥venes (menores de 30 a√±os)** y que, adem√°s, han demostrado un alto nivel de compromiso econ√≥mico al acumular un **gasto total superior a $1000**. Esta segmentaci√≥n es vital para campa√±as de marketing de alto valor o programas de lealtad dirigidos.

**Objetivo**

Nuestro objetivo es filtrar nuestra lista de usuarios para mostrar los nombres de aquellos clientes que cumplen con dos criterios simult√°neamente: tener menos de 30 a√±os de edad y haber gastado un total superior a $1000.

**Acciones Clave**

Para lograr esta segmentaci√≥n precisa, vamos a:

- Iterar sobre cada usuario en la lista *users_clean.*
- Para cada usuario, extraeremos su edad y su lista de gastos totales por categor√≠a.
- Sumaremos los gastos de cada usuario para obtener su gasto total acumulado.
- Aplicaremos una doble condici√≥n de filtrado:
    - La edad debe ser menor de 30 a√±os.
    - El gasto total acumulado debe ser mayor a $1000.
- Finalmente, mostraremos el nombre completo de los usuarios que cumplan ambas condiciones.


In [9]:
users = [['32415', ['mike', 'reed'], 32, ['electronics', 'sport', 'books'], [894, 213, 173]],
         ['31980', ['kate', 'morgan'], 24, ['clothes', 'books'], [439, 390]],
         ['32156', ['john', 'doe'], 37, ['electronics', 'home', 'food'], [459, 120, 99]],
         ['32761', ['samantha', 'smith'], 29, ['clothes', 'electronics', 'beauty'], [299, 679, 85]],
         ['32984', ['david', 'white'], 41, ['books', 'home', 'sport'], [234, 329, 243]],
         ['33001', ['emily', 'brown'], 26, ['beauty', 'home', 'food'], [213, 659, 79]],
         ['33767', ['maria', 'garcia'], 33, ['clothes', 'food', 'beauty'], [499, 189, 63]],
         ['33912', ['jose', 'martinez'], 22, ['sport', 'electronics', 'home'], [259, 549, 109]],
         ['34009', ['lisa', 'wilson'], 35, ['home', 'books', 'clothes'], [329, 189, 329]],
         ['34278', ['james', 'lee'], 28, ['beauty', 'clothes', 'electronics'], [189, 299, 579]]]

for user in users: #Iterando en cada cliente
    if user[2]<30 and sum(user[4])>1000: #Especificando condiciones a cumplir
        print(user[1][0]) #Imprimiendo el nombre del cliente

samantha
james


Este paso demuestra habilidad para realizar filtrados de datos complejos combinando m√∫ltiples criterios, una tarea esencial en la segmentaci√≥n de clientes. Al identificar a estos clientes de alto valor y j√≥venes, proporcionas insights cruciales para estrategias de negocio focalizadas

### **Paso 9: Identificaci√≥n de Compradores de Ropa**

La direcci√≥n de la empresa est√° interesada en analizar las preferencias de compra por categor√≠a. Espec√≠ficamente, quieren identificar a todos los clientes que han adquirido productos de la categor√≠a "clothes" (ropa). Esta informaci√≥n es valiosa para entender la base de clientes interesada en moda y para futuras campa√±as de marketing segmentadas.

**Objetivo**

Nuestro objetivo es iterar a trav√©s de la lista de usuarios y, para cada uno, verificar si han comprado art√≠culos en la categor√≠a "clothes". Si un usuario ha comprado ropa, imprimiremos su nombre completo y su edad en una misma l√≠nea.

**Acciones Clave**

Para lograr esto, vamos a:

- Iterar sobre cada registro de usuario en nuestra lista *users_clean*.
- Para cada usuario, accederemos a su lista de categor√≠as favoritas (*fav_categories*).
- Verificaremos si la cadena "*clothes*" (ya normalizada a min√∫sculas, gracias a nuestros pasos de limpieza anteriores) est√° presente en su lista de *fav_categories*.
- Si se encuentra la categor√≠a, extraeremos el nombre (unimos el nombre y apellido si est√°n en una sublista) y la edad del usuario.
- Finalmente, imprimiremos el nombre y la edad juntos en una sola declaraci√≥n.


In [10]:
users = [['32415', ['mike', 'reed'], 32, ['electronics', 'sport', 'books'], [894, 213, 173]],
         ['31980', ['kate', 'morgan'], 24, ['clothes', 'books'], [439, 390]],
         ['32156', ['john', 'doe'], 37, ['electronics', 'home', 'food'], [459, 120, 99]],
         ['32761', ['samantha', 'smith'], 29, ['clothes', 'electronics', 'beauty'], [299, 679, 85]],
         ['32984', ['david', 'white'], 41, ['books', 'home', 'sport'], [234, 329, 243]],
         ['33001', ['emily', 'brown'], 26, ['beauty', 'home', 'food'], [213, 659, 79]],
         ['33767', ['maria', 'garcia'], 33, ['clothes', 'food', 'beauty'], [499, 189, 63]],
         ['33912', ['jose', 'martinez'], 22, ['sport', 'electronics', 'home'], [259, 549, 109]],
         ['34009', ['lisa', 'wilson'], 35, ['home', 'books', 'clothes'], [329, 189, 329]],
         ['34278', ['james', 'lee'], 28, ['beauty', 'clothes', 'electronics'], [189, 299, 579]]]

for user in users: #Iterando en cada cliente
    if "clothes" in user[3]: # Condici√≥n que hayan comprado "clothes"
        print(f"{user[1][0]} {user[2]}") #Imprimiendo nombre y edad

kate 24
samantha 29
maria 33
lisa 35
james 28


Este paso demuestra la capacidad para realizar b√∫squedas y filtrados basados en valores espec√≠ficos dentro de listas anidadas, una habilidad esencial para el an√°lisis de comportamiento del cliente y la segmentaci√≥n del mercado. Permite a la empresa identificar r√°pidamente segmentos de clientes interesados en productos espec√≠ficos.

### **Paso 10: Creaci√≥n de la Funci√≥n get_client_by_cat para Filtrado Detallado de Clientes**

Para responder a las necesidades espec√≠ficas de la direcci√≥n, vamos a desarrollar una funci√≥n avanzada que permita **extraer informaci√≥n detallada de los clientes, filtrada por categor√≠as de compra**. Esta funci√≥n consolidar√° varios de los conceptos que hemos explorado hasta ahora, demostrando tu capacidad para construir herramientas anal√≠ticas reutilizables y potentes.

**Objetivo**

Nuestro objetivo es crear una funci√≥n robusta llamada *get_client_by_cat*. Esta funci√≥n tomar√° la lista completa de usuarios, junto con los √≠ndices espec√≠ficos de cada campo relevante. Su prop√≥sito es identificar y devolver una lista de clientes que hayan comprado en una *filter_category* espec√≠fica, proporcionando su ID, nombre completo, edad y el gasto total acumulado (no solo el gasto en esa categor√≠a espec√≠fica, sino el total general).

**Especificaciones de la Funci√≥n get_client_by_cat**

La funci√≥n estar√° dise√±ada con los siguientes par√°metros y su salida esperada:

Par√°metros:
- ***users***: Una lista que contiene los datos de todos los usuarios (se recomienda usar users_clean).
- ***id_index***: El √≠ndice num√©rico donde se encuentra el ID del cliente dentro de cada sublista de usuario.
- ***name_index***: El √≠ndice donde el nombre del cliente (como sublista ['nombre', 'apellido']) est√° almacenado.
- ***age_index***: El √≠ndice donde la edad del cliente (como entero) est√° almacenada.
- ***category_index***: El √≠ndice donde la lista de categor√≠as de compras (fav_categories) est√° almacenada.
- ***amounts_index***: El √≠ndice donde la lista de cantidades gastadas por categor√≠a (total_spendings) est√° almacenada.
- ***filter_category***: Un string que representa el nombre de la categor√≠a por la cual deseamos filtrar a los clientes (ej., 'clothes', 'electronics'). Esta categor√≠a debe ser proporcionada en min√∫sculas para coincidir con nuestros datos normalizados.

**Salida**

La funci√≥n devolver√° una lista de sublistas. Cada sublista dentro de la salida contendr√° la siguiente informaci√≥n para cada cliente que cumpla con el criterio de la categor√≠a de filtro:

- El ID del cliente.
- Una sublista con el nombre y apellido del cliente.
- La edad del cliente.
- Un entero que representa la cantidad total gastada por el cliente en todas sus categor√≠as (no solo en la categor√≠a filtrada).





In [11]:
def get_client_by_cat(users, id_index, name_index,age_index,category_index,amounts_index,filter_category): #Funci√≥n con par√°metros
    filter_clients=[] #Lista donde se almacenar√° el filtro
    for client in users:#Iterando en cada cliente
        if filter_category in client[category_index]: #Condicion para filtrar por categoria
            total_spendings=sum(client[amounts_index])
            filter_clients.append([
                                client[id_index],
                                client[name_index],
                                client[age_index],
                                total_spendings
                                ]) #Agregando elementos deseados a lista filtrada 
    return filter_clients #Regresa lista filtrada

# La lista de usuarios
users = [
    ['32415', ['mike', 'reed'], 32, ['electronics', 'sport', 'books'], [894, 213, 173]],
    ['31980', ['kate', 'morgan'], 24, ['clothes', 'books'], [439, 390]],
    ['32156', ['john', 'doe'], 37, ['electronics', 'home', 'food'], [459, 120, 99]],
    ['32761', ['samantha', 'smith'], 29, ['clothes', 'electronics', 'beauty'], [299, 679, 85]],
    ['32984', ['david', 'white'], 41, ['books', 'home', 'sport'], [234, 329, 243]],
    ['33001', ['emily', 'brown'], 26, ['beauty', 'home', 'food'], [213, 659, 79]],
    ['33767', ['maria', 'garcia'], 33, ['clothes', 'food', 'beauty'], [499, 189, 63]],
    ['33912', ['jose', 'martinez'], 22, ['sport', 'electronics', 'home'], [259, 549, 109]],
    ['34009', ['lisa', 'wilson'], 35, ['home', 'books', 'clothes'], [329, 189, 329]],
    ['34278', ['james', 'lee'], 28, ['beauty', 'clothes', 'electronics'], [189, 299, 579]]
]

# Llama a la funci√≥n con la categor√≠a 'home'
result = get_client_by_cat(users,0,1,2,3,4,'home')# Llamando a funci√≥n con par√°metros

# Muestra en pantalla la lista que resulta
print(result)


[['32156', ['john', 'doe'], 37, 678], ['32984', ['david', 'white'], 41, 806], ['33001', ['emily', 'brown'], 26, 951], ['33912', ['jose', 'martinez'], 22, 917], ['34009', ['lisa', 'wilson'], 35, 847]]


Esta funci√≥n *get_client_by_cat* es un excelente ejemplo de c√≥mo aplicar las habilidades de programaci√≥n funcional y manipulaci√≥n de datos complejos para construir herramientas anal√≠ticas reutilizables. Demuestra √±a capacidad para imprimir la l√≥gica de negocio en c√≥digo eficiente, una competencia clave para cualquier analista de datos.