# Domina Python para LLMs - Parte 3

## Funciones y Lambda: La base del procesamiento en LLMs con Python

### La importancia de las funciones bien estructuradas

In [1]:
from typing import List, Dict

def preprocesar_texto(
    texto: str,
    stop_words: set = None,
    min_longitud: int = 3
) -> List[str]:
    """
    Preprocesa texto para su uso con LLMs.

    Args:
        texto: Texto a procesar
        stop_words: Conjunto de palabras a filtrar
        min_longitud: Longitud mínima de tokens a conservar

    Returns:
        Lista de tokens procesados y filtrados
    """
    tokens = texto.lower().split()
    if stop_words:
        tokens = [t for t in tokens if t not in stop_words]
    return [t for t in tokens if len(t) >= min_longitud]

### El poder de las expresiones lambda

In [2]:
# Funciones lambda para transformaciones comunes
normalizar = lambda x: x.lower().strip()
extraer_entidades = lambda texto: [palabra for palabra in texto.split() if palabra[0].isupper()]
calcular_longitud = lambda texto: len(texto.split())

# Aplicación práctica
textos = ['  Machine Learning es FASCINANTE  ', 'Python para NLP   ']
textos_normalizados = list(map(normalizar, textos))

### Combinando funciones y operadores funcionales

In [3]:
from functools import reduce

def crear_pipeline_procesamiento(textos: List[str]) -> List[str]:
    # Paso 1: Normalización
    normalizados = map(normalizar, textos)

    # Paso 2: Filtrado de textos vacíos
    filtrados = filter(lambda x: len(x) > 0, normalizados)

    # Paso 3: Tokenización y limpieza
    procesados = [preprocesar_texto(texto) for texto in filtrados]

    return list(procesados)

### Mejores prácticas para funciones en proyectos de LLMs

In [4]:
def procesar_prompt(texto: str, max_longitud: int = 1000) -> str:
    """
    Procesa y valida un prompt para enviar a un LLM.
    """
    if not texto:
        raise ValueError("El prompt no puede estar vacío")

    texto_procesado = normalizar(texto)

    if len(texto_procesado) > max_longitud:
        raise ValueError(f"El prompt excede la longitud máxima de {max_longitud} caracteres")

    return texto_procesado