# Ejercicio 1: Identificar empleados en formación

Este ejercicio permite practicar cómo inducir reglas lógicas simples a partir de diferencias entre ejemplos positivos y negativos, tal como lo hace el algoritmo FOIL en su forma más básica.
Se tiene un conjunto de datos con personas que trabajan en una empresa. Algunas están en formación (aprendices) y otras no. Cada persona tiene atributos como:
- edad
- departamento
- nivel_educativo
- en_formacion (booleano: True o False)

In [9]:
# Dataset de ejemplo
datos = [
{"edad": 22, "departamento": "IT", "nivel_educativo": "terciario", "en_formacion": True},
{"edad": 24, "departamento": "IT", "nivel_educativo": "universitario", "en_formacion": True},
{"edad": 21, "departamento": "RRHH", "nivel_educativo": "terciario", "en_formacion": True},
{"edad": 35, "departamento": "IT", "nivel_educativo": "universitario", "en_formacion": False},
{"edad": 40, "departamento": "Finanzas", "nivel_educativo": "maestría", "en_formacion": False},
{"edad": 29, "departamento": "RRHH", "nivel_educativo": "universitario", "en_formacion": False},
{"edad": 23, "departamento": "IT", "nivel_educativo": "terciario", "en_formacion": True},
{"edad": 38, "departamento": "Finanzas", "nivel_educativo": "universitario", "en_formacion": False}]

**Objetivo del ejercicio:**
1. Separar los ejemplos positivos (en_formacion == True) y negativos (en_formacion == False).
2. Para cada atributo, identificar los valores que aparecen en los positivos pero no en los negativos.
3. Desarrollar un programa en Python que muestre la Regla inducida para identificar a personas en formación:</br>
        **Regla inducida para identificar a personas en formación:** <br/>
        **Respuestas a las preguntas guía:**
- ¿Qué valores de departamento aparecen solo en los positivos?
- ¿Qué niveles educativos son comunes en los positivos pero no en los negativos?
- ¿Qué edades aparecen solo en los positivos?

In [10]:
# Primero, separemos los datos entre los positivos y negativos:
positivos = [p for p in datos if p["en_formacion"]]
negativos = [p for p in datos if not p["en_formacion"]]

In [19]:
# Paso 2: Extraer valores únicos de cada atributo
def extraer_valores(lista, atributo):
   return set(item[atributo] for item in lista)


In [20]:
# Obtener valores únicos por atributo
departamentos_pos = extraer_valores(positivos, "departamento")
departamentos_neg = extraer_valores(negativos, "departamento")

niveles_pos = extraer_valores(positivos, "nivel_educativo")
niveles_neg = extraer_valores(negativos, "nivel_educativo")

edades_pos = extraer_valores(positivos, "edad")
edades_neg = extraer_valores(negativos, "edad")

In [21]:
# Paso 3: Identificar valores exclusivos de los positivos
dept_solo_positivos = departamentos_pos - departamentos_neg
niveles_solo_positivos = niveles_pos - niveles_neg
edades_solo_positivas = edades_pos - edades_neg

In [22]:
print("1. ¿Qué valores de departamento aparecen solo en los positivos?")
if dept_solo_positivos:
    print(f"   → {dept_solo_positivos}")
else:
    print("   → Ninguno (todos los departamentos de positivos también aparecen en negativos)")


1. ¿Qué valores de departamento aparecen solo en los positivos?
   → Ninguno (todos los departamentos de positivos también aparecen en negativos)


In [23]:
print("\n2. ¿Qué niveles educativos son comunes en los positivos pero no en los negativos?")
if niveles_solo_positivos:
    print(f"   → {niveles_solo_positivos}")
else:
    print("   → Ninguno")


2. ¿Qué niveles educativos son comunes en los positivos pero no en los negativos?
   → {'terciario'}


In [24]:
print("\n3. ¿Qué edades aparecen solo en los positivos?")
if edades_solo_positivas:
    print(f"   → {sorted(edades_solo_positivas)}")
else:
    print("   → Ninguna")


3. ¿Qué edades aparecen solo en los positivos?
   → [21, 22, 23, 24]


In [25]:
# Paso 4: Construir la regla inducida
print("\n" + "="*70)
print("REGLA INDUCIDA PARA IDENTIFICAR A PERSONAS EN FORMACIÓN")
print("="*70)

reglas = []

if niveles_solo_positivos:
    reglas.append(f"nivel_educativo IN {niveles_solo_positivos}")

if edades_solo_positivas:
    rango_edad = f"edad IN {sorted(edades_solo_positivas)}"
    reglas.append(rango_edad)

if dept_solo_positivos:
    reglas.append(f"departamento IN {dept_solo_positivos}")


REGLA INDUCIDA PARA IDENTIFICAR A PERSONAS EN FORMACIÓN


In [27]:
# Observaciones adicionales
edad_max_positivos = max(p["edad"] for p in positivos)
edad_min_negativos = min(n["edad"] for n in negativos)

print("\nRegla basada en atributos exclusivos:")
if reglas:
    print("  " + " Y ".join(reglas))
else:
    print("  No hay atributos completamente exclusivos de los positivos.")

print("\nRegla alternativa basada en patrones observados:")
print(f"  SI (edad <= {edad_max_positivos}) Y (nivel_educativo = 'terciario' O edad <= 24)")
print(f"  ENTONCES en_formacion = True")

print("\n** Observaciones: **")
print(f"  - Todas las personas en formación tienen 24 años o menos")
print(f"  - El nivel 'terciario' aparece SOLO en personas en formación")
print(f"  - Las personas no en formación tienen 29 años o más")



Regla basada en atributos exclusivos:
  nivel_educativo IN {'terciario'} Y edad IN [21, 22, 23, 24]

Regla alternativa basada en patrones observados:
  SI (edad <= 24) Y (nivel_educativo = 'terciario' O edad <= 24)
  ENTONCES en_formacion = True

** Observaciones: **
  - Todas las personas en formación tienen 24 años o menos
  - El nivel 'terciario' aparece SOLO en personas en formación
  - Las personas no en formación tienen 29 años o más
