In [55]:
import pandas as pd
import numpy as np
from datetime import datetime, timedelta

# Dataset de ventas para análisis
ventas = pd.DataFrame({
    'venta_id': ['V001', 'V002', 'V003', 'V004', 'V005', 'V006', 'V007', 'V008'],
    'cliente': ['Empresa A', 'Empresa B', 'Empresa C', 'Empresa A', 'Empresa D', 'Empresa B', 'Empresa C', 'Empresa E'],
    'producto': ['Consultoría', 'Software', 'Consultoría', 'Training', 'Software', 'Consultoría', 'Training', 'Software'],
    'cantidad': [1, 2, 1, 3, 1, 2, 2, 1],
    'precio_unitario': [50000, 25000, 75000, 15000, 30000, 60000, 20000, 35000],
    'descuento_pct': [0, 5, 10, 0, 15, 8, 5, 12],
    'fecha_venta': ['2024-01-15', '2024-01-20', '2024-02-10', '2024-02-15', '2024-03-05', '2024-03-10', '2024-03-20', '2024-04-01'],
    'vendedor': ['Ana', 'Carlos', 'María', 'Ana', 'Pedro', 'Carlos', 'María', 'Pedro']
})

# Convertir fecha a datetime
ventas['fecha_venta'] = pd.to_datetime(ventas['fecha_venta'])
print(ventas.info())
print(ventas.head())

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 8 entries, 0 to 7
Data columns (total 8 columns):
 #   Column           Non-Null Count  Dtype         
---  ------           --------------  -----         
 0   venta_id         8 non-null      object        
 1   cliente          8 non-null      object        
 2   producto         8 non-null      object        
 3   cantidad         8 non-null      int64         
 4   precio_unitario  8 non-null      int64         
 5   descuento_pct    8 non-null      int64         
 6   fecha_venta      8 non-null      datetime64[ns]
 7   vendedor         8 non-null      object        
dtypes: datetime64[ns](1), int64(3), object(4)
memory usage: 644.0+ bytes
None
  venta_id    cliente     producto  cantidad  precio_unitario  descuento_pct  \
0     V001  Empresa A  Consultoría         1            50000              0   
1     V002  Empresa B     Software         2            25000              5   
2     V003  Empresa C  Consultoría         1       

Creación de Columnas Básicas

Operaciones Aritméticas Simples

In [56]:
# Calcular ingresos brutos
ventas['ingresos_brutos'] = ventas['cantidad'] * ventas['precio_unitario']

# Calcular descuento en valor absoluto
ventas['descuento_valor'] = ventas['ingresos_brutos'] * (ventas['descuento_pct'] / 100)

# Calcular ingresos netos
ventas['ingresos_netos'] = ventas['ingresos_brutos'] - ventas['descuento_valor']

print("Columnas de cálculo básico:")
print(ventas[['venta_id', 'ingresos_brutos', 'descuento_valor', 'ingresos_netos']])

Columnas de cálculo básico:
  venta_id  ingresos_brutos  descuento_valor  ingresos_netos
0     V001            50000              0.0         50000.0
1     V002            50000           2500.0         47500.0
2     V003            75000           7500.0         67500.0
3     V004            45000              0.0         45000.0
4     V005            30000           4500.0         25500.0
5     V006           120000           9600.0        110400.0
6     V007            40000           2000.0         38000.0
7     V008            35000           4200.0         30800.0


Operaciones con Múltiples Columnas

In [57]:
# Calcular margen de beneficio (asumiendo costo del 60% del precio)
ventas['costo_estimado'] = ventas['ingresos_brutos'] * 0.60
ventas['beneficio_estimado'] = ventas['ingresos_netos'] - ventas['costo_estimado']
ventas['margen_beneficio_pct'] = (ventas['beneficio_estimado'] / ventas['ingresos_netos']) * 100

print("Análisis de rentabilidad:")
print(ventas[['venta_id', 'ingresos_netos', 'beneficio_estimado', 'margen_beneficio_pct']])

Análisis de rentabilidad:
  venta_id  ingresos_netos  beneficio_estimado  margen_beneficio_pct
0     V001         50000.0             20000.0             40.000000
1     V002         47500.0             17500.0             36.842105
2     V003         67500.0             22500.0             33.333333
3     V004         45000.0             18000.0             40.000000
4     V005         25500.0              7500.0             29.411765
5     V006        110400.0             38400.0             34.782609
6     V007         38000.0             14000.0             36.842105
7     V008         30800.0              9800.0             31.818182


Creación de Columnas Condicionales

Usando np.where() para Condiciones Simples

In [58]:
# Clasificar ventas por tamaño
ventas['categoria_venta'] = np.where(
    ventas['ingresos_netos'] > 50000, 
    'Grande', 
    'Pequeña'
)

# Clasificar descuentos
ventas['tipo_descuento'] = np.where(
    ventas['descuento_pct'] > 10, 
    'Alto', 
    'Normal'
)

print("Categorización básica:")
print(ventas[['venta_id', 'ingresos_netos', 'categoria_venta', 'descuento_pct', 'tipo_descuento']])

Categorización básica:
  venta_id  ingresos_netos categoria_venta  descuento_pct tipo_descuento
0     V001         50000.0         Pequeña              0         Normal
1     V002         47500.0         Pequeña              5         Normal
2     V003         67500.0          Grande             10         Normal
3     V004         45000.0         Pequeña              0         Normal
4     V005         25500.0         Pequeña             15           Alto
5     V006        110400.0          Grande              8         Normal
6     V007         38000.0         Pequeña              5         Normal
7     V008         30800.0         Pequeña             12           Alto


Condiciones Múltiples con np.select()

In [59]:
# Crear clasificación de ventas más detallada
condiciones = [
    ventas['ingresos_netos'] >= 75000,
    ventas['ingresos_netos'] >= 50000,
    ventas['ingresos_netos'] >= 25000
]

categorias = ['Premium', 'Alta', 'Media']

ventas['segmento_venta'] = np.select(condiciones, categorias, default='Básica')

print("Segmentación detallada:")
print(ventas[['venta_id', 'ingresos_netos', 'segmento_venta']])

Segmentación detallada:
  venta_id  ingresos_netos segmento_venta
0     V001         50000.0           Alta
1     V002         47500.0          Media
2     V003         67500.0           Alta
3     V004         45000.0          Media
4     V005         25500.0          Media
5     V006        110400.0        Premium
6     V007         38000.0          Media
7     V008         30800.0          Media


Usando pd.cut() para Rangos

In [60]:
# Crear segmentos de ingresos usando rangos
bins = [0, 30000, 60000, 90000, np.inf]
labels = ['Bajo', 'Medio', 'Alto', 'Premium']

ventas['rango_ingresos'] = pd.cut(ventas['ingresos_netos'], bins=bins, labels=labels, include_lowest=True)

print("Segmentación por rangos:")
print(ventas[['venta_id', 'ingresos_netos', 'rango_ingresos']])

Segmentación por rangos:
  venta_id  ingresos_netos rango_ingresos
0     V001         50000.0          Medio
1     V002         47500.0          Medio
2     V003         67500.0           Alto
3     V004         45000.0          Medio
4     V005         25500.0           Bajo
5     V006        110400.0        Premium
6     V007         38000.0          Medio
7     V008         30800.0          Medio


Transformaciones de Fechas

Extracción de Componentes de Fecha

In [61]:
# Extraer componentes de fecha
ventas['año'] = ventas['fecha_venta'].dt.year
ventas['mes'] = ventas['fecha_venta'].dt.month
ventas['trimestre'] = ventas['fecha_venta'].dt.quarter
ventas['dia_semana'] = ventas['fecha_venta'].dt.day_name()

print("Componentes de fecha:")
print(ventas[['venta_id', 'fecha_venta', 'año', 'mes', 'trimestre', 'dia_semana']])

Componentes de fecha:
  venta_id fecha_venta   año  mes  trimestre dia_semana
0     V001  2024-01-15  2024    1          1     Monday
1     V002  2024-01-20  2024    1          1   Saturday
2     V003  2024-02-10  2024    2          1   Saturday
3     V004  2024-02-15  2024    2          1   Thursday
4     V005  2024-03-05  2024    3          1    Tuesday
5     V006  2024-03-10  2024    3          1     Sunday
6     V007  2024-03-20  2024    3          1  Wednesday
7     V008  2024-04-01  2024    4          2     Monday


Cálculos con Fechas

In [62]:
# Calcular días desde la primera venta
fecha_inicio = ventas['fecha_venta'].min()
ventas['dias_desde_inicio'] = (ventas['fecha_venta'] - fecha_inicio).dt.days

# Calcular días hasta hoy
hoy = datetime.now()
ventas['dias_desde_venta'] = (hoy - ventas['fecha_venta']).dt.days

print("Cálculos temporales:")
print(ventas[['venta_id', 'fecha_venta', 'dias_desde_inicio', 'dias_desde_venta']])

Cálculos temporales:
  venta_id fecha_venta  dias_desde_inicio  dias_desde_venta
0     V001  2024-01-15                  0               520
1     V002  2024-01-20                  5               515
2     V003  2024-02-10                 26               494
3     V004  2024-02-15                 31               489
4     V005  2024-03-05                 50               470
5     V006  2024-03-10                 55               465
6     V007  2024-03-20                 65               455
7     V008  2024-04-01                 77               443


Transformaciones de Texto

Manipulación Básica de Strings

In [63]:
# Normalizar nombres de clientes
ventas['cliente_normalizado'] = ventas['cliente'].str.upper()

# Extraer primera palabra del cliente
ventas['empresa_tipo'] = ventas['cliente'].str.split().str[0]

# Crear código corto del producto
ventas['producto_codigo'] = ventas['producto'].str[:4].str.upper()

print("Transformaciones de texto:")
print(ventas[['cliente', 'cliente_normalizado', 'empresa_tipo', 'producto', 'producto_codigo']])

Transformaciones de texto:
     cliente cliente_normalizado empresa_tipo     producto producto_codigo
0  Empresa A           EMPRESA A      Empresa  Consultoría            CONS
1  Empresa B           EMPRESA B      Empresa     Software            SOFT
2  Empresa C           EMPRESA C      Empresa  Consultoría            CONS
3  Empresa A           EMPRESA A      Empresa     Training            TRAI
4  Empresa D           EMPRESA D      Empresa     Software            SOFT
5  Empresa B           EMPRESA B      Empresa  Consultoría            CONS
6  Empresa C           EMPRESA C      Empresa     Training            TRAI
7  Empresa E           EMPRESA E      Empresa     Software            SOFT


Creación de Variables Dummy/Categóricas

In [64]:
# Crear variables dummy para vendedores
vendedor_dummies = pd.get_dummies(ventas['vendedor'], prefix='vendedor')
ventas = pd.concat([ventas, vendedor_dummies], axis=1)

print("Variables dummy para vendedores:")
print(ventas[['vendedor', 'vendedor_Ana', 'vendedor_Carlos', 'vendedor_María', 'vendedor_Pedro']])

Variables dummy para vendedores:
  vendedor  vendedor_Ana  vendedor_Carlos  vendedor_María  vendedor_Pedro
0      Ana          True            False           False           False
1   Carlos         False             True           False           False
2    María         False            False            True           False
3      Ana          True            False           False           False
4    Pedro         False            False           False            True
5   Carlos         False             True           False           False
6    María         False            False            True           False
7    Pedro         False            False           False            True


Funciones Personalizadas y apply()

Función Simple con apply()

In [65]:
# Función para calcular comisión del vendedor
def calcular_comision(row):
    base = row['ingresos_netos'] * 0.05  # 5% base
    if row['segmento_venta'] == 'Premium':
        bonus = row['ingresos_netos'] * 0.02  # 2% bonus adicional
    elif row['segmento_venta'] == 'Alta':
        bonus = row['ingresos_netos'] * 0.01  # 1% bonus adicional
    else:
        bonus = 0
    return base + bonus

ventas['comision_vendedor'] = ventas.apply(calcular_comision, axis=1)

print("Comisiones calculadas:")
print(ventas[['venta_id', 'vendedor', 'segmento_venta', 'ingresos_netos', 'comision_vendedor']])

Comisiones calculadas:
  venta_id vendedor segmento_venta  ingresos_netos  comision_vendedor
0     V001      Ana           Alta         50000.0             3000.0
1     V002   Carlos          Media         47500.0             2375.0
2     V003    María           Alta         67500.0             4050.0
3     V004      Ana          Media         45000.0             2250.0
4     V005    Pedro          Media         25500.0             1275.0
5     V006   Carlos        Premium        110400.0             7728.0
6     V007    María          Media         38000.0             1900.0
7     V008    Pedro          Media         30800.0             1540.0


Funciones Más Complejas

In [66]:
# Función para evaluar calidad de la venta
def evaluar_calidad_venta(row):
    score = 0
    
    # Puntos por tamaño de venta
    if row['ingresos_netos'] > 50000:
        score += 3
    elif row['ingresos_netos'] > 25000:
        score += 2
    else:
        score += 1
    
    # Puntos por margen
    if row['margen_beneficio_pct'] > 35:
        score += 2
    elif row['margen_beneficio_pct'] > 25:
        score += 1
    
    # Penalización por descuento alto
    if row['descuento_pct'] > 10:
        score -= 1
    
    # Clasificar
    if score >= 5:
        return 'Excelente'
    elif score >= 3:
        return 'Buena'
    else:
        return 'Regular'

ventas['calidad_venta'] = ventas.apply(evaluar_calidad_venta, axis=1)

print("Evaluación de calidad de ventas:")
print(ventas[['venta_id', 'ingresos_netos', 'margen_beneficio_pct', 'descuento_pct', 'calidad_venta']])


Evaluación de calidad de ventas:
  venta_id  ingresos_netos  margen_beneficio_pct  descuento_pct calidad_venta
0     V001         50000.0             40.000000              0         Buena
1     V002         47500.0             36.842105              5         Buena
2     V003         67500.0             33.333333             10         Buena
3     V004         45000.0             40.000000              0         Buena
4     V005         25500.0             29.411765             15       Regular
5     V006        110400.0             34.782609              8         Buena
6     V007         38000.0             36.842105              5         Buena
7     V008         30800.0             31.818182             12       Regular


Transformaciones Avanzadas

Cálculos por Grupos

In [67]:
# Calcular participación de cada venta en el total del cliente
ventas['total_cliente'] = ventas.groupby('cliente')['ingresos_netos'].transform('sum')
ventas['participacion_cliente_pct'] = (ventas['ingresos_netos'] / ventas['total_cliente']) * 100

# Ranking de ventas por vendedor
ventas['ranking_vendedor'] = ventas.groupby('vendedor')['ingresos_netos'].rank(ascending=False)

print("Análisis por grupos:")
print(ventas[['venta_id', 'cliente', 'vendedor', 'ingresos_netos', 'participacion_cliente_pct', 'ranking_vendedor']])


Análisis por grupos:
  venta_id    cliente vendedor  ingresos_netos  participacion_cliente_pct  \
0     V001  Empresa A      Ana         50000.0                  52.631579   
1     V002  Empresa B   Carlos         47500.0                  30.082331   
2     V003  Empresa C    María         67500.0                  63.981043   
3     V004  Empresa A      Ana         45000.0                  47.368421   
4     V005  Empresa D    Pedro         25500.0                 100.000000   
5     V006  Empresa B   Carlos        110400.0                  69.917669   
6     V007  Empresa C    María         38000.0                  36.018957   
7     V008  Empresa E    Pedro         30800.0                 100.000000   

   ranking_vendedor  
0               1.0  
1               2.0  
2               1.0  
3               2.0  
4               2.0  
5               1.0  
6               2.0  
7               1.0  


Ventanas Móviles y Acumulados

In [68]:
# Ordenar por fecha para cálculos secuenciales
ventas_ordenadas = ventas.sort_values('fecha_venta')

# Ingresos acumulados
ventas_ordenadas['ingresos_acumulados'] = ventas_ordenadas['ingresos_netos'].cumsum()

# Promedio móvil de 3 ventas
ventas_ordenadas['promedio_movil_3'] = ventas_ordenadas['ingresos_netos'].rolling(window=3).mean()

print("Análisis temporal:")
print(ventas_ordenadas[['venta_id', 'fecha_venta', 'ingresos_netos', 'ingresos_acumulados', 'promedio_movil_3']])


Análisis temporal:
  venta_id fecha_venta  ingresos_netos  ingresos_acumulados  promedio_movil_3
0     V001  2024-01-15         50000.0              50000.0               NaN
1     V002  2024-01-20         47500.0              97500.0               NaN
2     V003  2024-02-10         67500.0             165000.0      55000.000000
3     V004  2024-02-15         45000.0             210000.0      53333.333333
4     V005  2024-03-05         25500.0             235500.0      46000.000000
5     V006  2024-03-10        110400.0             345900.0      60300.000000
6     V007  2024-03-20         38000.0             383900.0      57966.666667
7     V008  2024-04-01         30800.0             414700.0      59733.333333


Casos Prácticos de Consultoría

Caso 1: Análisis de Rendimiento de Vendedores

In [69]:
# Crear métricas comprehensivas de vendedores
metricas_vendedor = ventas.groupby('vendedor').agg({
    'venta_id': 'count',
    'ingresos_netos': ['sum', 'mean'],
    'comision_vendedor': 'sum',
    'margen_beneficio_pct': 'mean'
}).round(2)

# Aplanar columnas multiníve
metricas_vendedor.columns = ['num_ventas', 'ingresos_totales', 'ingreso_promedio', 'comision_total', 'margen_promedio']
metricas_vendedor.reset_index(inplace=True)

# Calcular eficiencia (ingresos por venta)
metricas_vendedor['eficiencia'] = metricas_vendedor['ingresos_totales'] / metricas_vendedor['num_ventas']

print("Métricas de rendimiento por vendedor:")
print(metricas_vendedor)

Métricas de rendimiento por vendedor:
  vendedor  num_ventas  ingresos_totales  ingreso_promedio  comision_total  \
0      Ana           2           95000.0           47500.0          5250.0   
1   Carlos           2          157900.0           78950.0         10103.0   
2    María           2          105500.0           52750.0          5950.0   
3    Pedro           2           56300.0           28150.0          2815.0   

   margen_promedio  eficiencia  
0            40.00     47500.0  
1            35.81     78950.0  
2            35.09     52750.0  
3            30.61     28150.0  


Caso 2: Segmentación de Clientes

In [70]:
# Análisis RFM simplificado (Recency, Frequency, Monetary)
hoy = datetime.now()

rfm_clientes = ventas.groupby('cliente').agg({
    'fecha_venta': lambda x: (hoy - x.max()).days,  # Recency
    'venta_id': 'count',  # Frequency
    'ingresos_netos': 'sum'  # Monetary
}).round(2)

rfm_clientes.columns = ['dias_ultima_compra', 'num_compras', 'valor_total']

# Crear scores RFM simplificados
rfm_clientes['score_recency'] = pd.cut(rfm_clientes['dias_ultima_compra'], bins=3, labels=[3, 2, 1])
rfm_clientes['score_frequency'] = pd.cut(rfm_clientes['num_compras'], bins=3, labels=[1, 2, 3])
rfm_clientes['score_monetary'] = pd.cut(rfm_clientes['valor_total'], bins=3, labels=[1, 2, 3])

# Score compuesto
rfm_clientes['rfm_score'] = (
    rfm_clientes['score_recency'].astype(int) + 
    rfm_clientes['score_frequency'].astype(int) + 
    rfm_clientes['score_monetary'].astype(int)
)

print("Análisis RFM de clientes:")
print(rfm_clientes)

Análisis RFM de clientes:
           dias_ultima_compra  num_compras  valor_total score_recency  \
cliente                                                                 
Empresa A                 489            2      95000.0             1   
Empresa B                 465            2     157900.0             2   
Empresa C                 455            2     105500.0             3   
Empresa D                 470            1      25500.0             2   
Empresa E                 443            1      30800.0             3   

          score_frequency score_monetary  rfm_score  
cliente                                              
Empresa A               3              2          6  
Empresa B               3              3          8  
Empresa C               3              2          8  
Empresa D               1              1          4  
Empresa E               1              1          5  


Caso 3: Indicadores de Alerta Temprana

In [71]:
# Crear banderas de alerta para el negocio
def crear_alertas(df):
    df = df.copy()
    
    # Alerta: ventas con descuentos muy altos
    df['alerta_descuento'] = df['descuento_pct'] > 10
    
    # Alerta: margen muy bajo
    df['alerta_margen'] = df['margen_beneficio_pct'] < 20
    
    # Alerta: venta demasiado pequeña para el cliente
    promedio_cliente = df.groupby('cliente')['ingresos_netos'].transform('mean')
    df['alerta_venta_pequeña'] = df['ingresos_netos'] < (promedio_cliente * 0.5)
    
    # Contador total de alertas
    df['total_alertas'] = (
        df['alerta_descuento'].astype(int) + 
        df['alerta_margen'].astype(int) + 
        df['alerta_venta_pequeña'].astype(int)
    )
    
    return df

ventas_con_alertas = crear_alertas(ventas)

print("Ventas con alertas:")
alertas_ventas = ventas_con_alertas[ventas_con_alertas['total_alertas'] > 0]
print(alertas_ventas[['venta_id', 'cliente', 'alerta_descuento', 'alerta_margen', 'alerta_venta_pequeña', 'total_alertas']])


Ventas con alertas:
  venta_id    cliente  alerta_descuento  alerta_margen  alerta_venta_pequeña  \
4     V005  Empresa D              True          False                 False   
7     V008  Empresa E              True          False                 False   

   total_alertas  
4              1  
7              1  


Ejercicios Prácticos

Ejercicio 1: Métricas Básicas

In [72]:
# TODO: Crear las siguientes columnas:
# 1. 'precio_con_descuento': precio unitario después del descuento
# 2. 'categoria_precio': 'Alto' si precio_unitario > 40000, sino 'Normal'
# 3. 'mes_texto': nombre del mes de la venta

# Tu solución aquí:
ventas['precio_con_descuento'] = ventas['precio_unitario'] * (1 - ventas['descuento_pct'] / 100)
ventas['categoria_precio'] = np.where(ventas['precio_unitario'] > 40000, 'Alto', 'Normal')
ventas['mes_texto'] = ventas['fecha_venta'].dt.month_name()
print("Nuevas columnas agregadas:")
print(ventas[['venta_id', 'precio_con_descuento', 'categoria_precio', 'mes_texto']])

# Guardar el DataFrame final a un archivo CSV
ventas.to_csv('ventas_analizadas.csv', index=False)
print("Datos de ventas analizados y guardados en 'ventas_analizadas.csv'.")


Nuevas columnas agregadas:
  venta_id  precio_con_descuento categoria_precio mes_texto
0     V001               50000.0             Alto   January
1     V002               23750.0           Normal   January
2     V003               67500.0             Alto  February
3     V004               15000.0           Normal  February
4     V005               25500.0           Normal     March
5     V006               55200.0             Alto     March
6     V007               19000.0           Normal     March
7     V008               30800.0           Normal     April
Datos de ventas analizados y guardados en 'ventas_analizadas.csv'.


Ejercicio 2: Análisis Temporal

In [73]:
# TODO: Crear columnas que muestren:
# 1. 'trimestre_texto': 'Q1', 'Q2', etc.
# 2. 'es_primer_semestre': True si la venta fue en los primeros 6 meses
# 3. 'semanas_desde_inicio': semanas transcurridas desde la primera venta

# Tu solución aquí:
ventas['trimestre_texto'] = 'Q' + ventas['trimestre'].astype(str)
ventas['es_primer_semestre'] = ventas['mes'] <= 6
ventas['semanas_desde_inicio'] = (ventas['fecha_venta'] - fecha_inicio).dt.days // 7
print("Nuevas columnas de trimestre y semanas agregadas:")
print(ventas[['venta_id', 'trimestre_texto', 'es_primer_semestre', 'semanas_desde_inicio']])

# Guardar el DataFrame final actualizado a un archivo CSV
ventas.to_csv('ventas_analizadas_actualizadas.csv', index=False)
print("Datos de ventas actualizados y guardados en 'ventas_analizadas_actualizadas.csv'.")

Nuevas columnas de trimestre y semanas agregadas:
  venta_id trimestre_texto  es_primer_semestre  semanas_desde_inicio
0     V001              Q1                True                     0
1     V002              Q1                True                     0
2     V003              Q1                True                     3
3     V004              Q1                True                     4
4     V005              Q1                True                     7
5     V006              Q1                True                     7
6     V007              Q1                True                     9
7     V008              Q2                True                    11
Datos de ventas actualizados y guardados en 'ventas_analizadas_actualizadas.csv'.


Función Personalizada

In [82]:
# TODO: Crear una función que evalúe el 'potencial_cliente':
# - 'Alto': si tiene más de 1 compra Y valor total > 50000
# - 'Medio': si tiene 1 compra Y valor > 30000, O más compras con valor total <= 50000
# - 'Bajo': otros casos

# Tu solución aquí:
def evaluar_potencial_cliente(row):
    if row['cantidad'] > 1 and row['precio_unitario'] > 50000:
        return 'Alto'
    elif (row['cantidad'] == 1 and row['precio_unitario'] > 30000) or (row['cantidad'] > 1 and row['precio_unitario'] <= 50000):
        return 'Medio'
    else:
        return 'Bajo'


ventas['potencial_cliente'] = ventas.apply(evaluar_potencial_cliente, axis=1)
print("Evaluación de potencial de clientes:")
print(ventas[['cliente', 'cantidad', 'precio_unitario', 'potencial_cliente']])

# Guardar el DataFrame de RFM actualizado a un archivo CSV
ventas.to_csv('clientes_analizados.csv', index=False)
print("Datos de RFM de clientes analizados y guardados en 'clientes_analizados.csv'.")

Evaluación de potencial de clientes:
     cliente  cantidad  precio_unitario potencial_cliente
0  Empresa A         1            50000             Medio
1  Empresa B         2            25000             Medio
2  Empresa C         1            75000             Medio
3  Empresa A         3            15000             Medio
4  Empresa D         1            30000              Bajo
5  Empresa B         2            60000              Alto
6  Empresa C         2            20000             Medio
7  Empresa E         1            35000             Medio
Datos de RFM de clientes analizados y guardados en 'clientes_analizados.csv'.
