# Introducción a las Expresiones Regulares en Python con el Módulo `re`

## 1. Conceptos teoricos

### 1.1. ¿Qué son las Expresiones Regulares?

Una **expresión regular** (del inglés *Regular Expression*, comúnmente abreviada como **"regex"**) es una secuencia de caracteres que conforma un patrón de búsqueda. Constituyen un lenguaje formal utilizado para la identificación, extracción y manipulación de cadenas de texto basadas en patrones definidos.

Su aplicación es fundamental en campos como la bioinformática, el procesamiento de lenguaje natural y el desarrollo de software, para tareas como:
* **Validación de datos**: Asegurar que la entrada del usuario cumpla con un formato específico (p. ej., correos electrónicos, contraseñas, números de teléfono).
* **Extracción de información (Parsing)**: Analizar grandes volúmenes de texto para extraer datos estructurados, como fechas o identificadores únicos.
* **Búsqueda y reemplazo avanzado**: Realizar sustituciones complejas en editores de código y procesadores de texto.



### 1.2. Componentes Fundamentales de una Expresión Regular

Un patrón de regex se construye mediante la combinación de **caracteres literales** (p. ej., `a`, `b`, `1`) y **metacaracteres**, que son caracteres con una interpretación especial. A continuación, se clasifican los metacaracteres esenciales según su función.

#### 1.2.1. Clases de Caracteres

Representan un conjunto de caracteres que pueden coincidir en una posición determinada.

| Símbolo | Descripción | Ejemplo de Coincidencia | Caso de Uso Práctico |
|:---|:---|:---|:---|
| `.` | Coincide con cualquier carácter, excepto el salto de línea. | `c.t` coincide con "cat", "cot", "c&t". | Buscar archivos con una extensión de 3 letras (ej: `reporte.log`, `reporte.txt`). |
| `\d` | Coincide con cualquier dígito decimal (equivalente a `[0-9]`). | `ID-\d\d` coincide con "ID-25", "ID-99". | Extraer el número de un identificador de producto. |
| `\D` | Coincide con cualquier carácter que **no** sea un dígito. | `\D+` coincide con "Texto", "!@#". | Detectar caracteres inválidos en un campo de teléfono. |
| `\w` | Coincide con un carácter de palabra (alfanumérico y guion bajo). | `\w{3}` coincide con "usr", "num", "id_". | Validar que un nombre de usuario contenga solo caracteres permitidos. |
| `\W` | Coincide con cualquier carácter que **no** sea de palabra. | `\W` coincide con " ", "*", "-". | Dividir una frase en palabras usando símbolos (`-`, ` `) como separadores. |
| `\s` | Coincide con cualquier carácter de espacio en blanco (espacio, tabulador). | `valor\sfinal` coincide con "valor final". | Eliminar o normalizar espacios duplicados en un texto. |
| `\S` | Coincide con cualquier carácter que **no** sea un espacio en blanco. | `\S+` coincide con una cadena sin espacios. | Contar el número de palabras en un texto (buscando secuencias de no-espacios). |
| `[xyz]` | Conjunto definido. Coincide con un solo carácter del conjunto. | `v[ae]l` coincide con "vel" y "val". | Verificar que el estado de un pedido sea 'A' (Aprobado) o 'P' (Pendiente). |
| `[^xyz]`| Conjunto negado. Coincide con cualquier carácter **excepto** los del conjunto. | `[^A-Z]` coincide con cualquier carácter no mayúsculo. | Prohibir caracteres especiales (`/`, `\`, `:`) en un nombre de archivo. |
| `[a-z]` | Rango. Coincide con cualquier carácter dentro del rango especificado. | `[0-9]` coincide con cualquier dígito. | Requerir que una contraseña contenga al menos una letra minúscula. |

#### 1.2.2. Anclas (Anchors)

Las anclas no coinciden con caracteres, sino con una posición específica dentro de la cadena de texto.

| Símbolo | Descripción | Caso de Uso Práctico |
|:---|:---|:---|
| `^` | Representa el inicio de la cadena de texto. | Asegurar que un texto de entrada comience con un prefijo obligatorio, como `INV-` para facturas. |
| `$` | Representa el final de la cadena de texto. | Validar que una URL de imagen termine en `.jpg` o `.png`. |
| `\b` | Representa un límite de palabra. | Buscar la palabra "red" sin que coincida con "reducción" o "pared". |

#### 1.2.3. Cuantificadores (Quantifiers)

Especifican el número de veces que el elemento precedente (carácter o grupo) debe aparecer para que haya una coincidencia.

| Símbolo | Descripción | Caso de Uso Práctico |
|:---|:---|:---|
| `*` | Cero o más ocurrencias del elemento precedente. | Permitir un campo opcional, como un segundo apellido (`apellido1 \w*`). |
| `+` | Una o más ocurrencias del elemento precedente. | Asegurar que un campo obligatorio (como el nombre de usuario) no esté vacío. |
| `?` | Cero o una ocurrencia del elemento precedente. | Aceptar el formato internacional de teléfono, con un `+` opcional al inicio. |
| `{n}` | Exactamente `n` ocurrencias. | Validar un código postal de 5 dígitos o un año de 4 dígitos. |
| `{n,m}` | Un mínimo de `n` y un máximo de `m` ocurrencias. | Establecer un requisito de longitud para una contraseña (entre 8 y 16 caracteres). |
| `{n,}` | Como mínimo `n` ocurrencias. | Verificar que una reseña de producto tenga un mínimo de 20 caracteres. |


#### 1.2.4. Agrupación y Alternancia

Permiten definir sub-expresiones y especificar alternativas.

| Símbolo | Descripción | Caso de Uso Práctico |
|:---|:---|:---|
| `( ... )` | Agrupa una serie de elementos para que funcionen como una sola unidad. | Repetir una secuencia, como `(ha)+` para buscar "ha", "haha", "hahaha", etc. |
| `A\|B` | Operador de alternancia (OR). Coincide con la expresión `A` o con la `B`. | Aceptar múltiples formas de un término, como `(USA\|EEUU\|Estados Unidos)`. |

### 1.3. Implementación de Expresiones Regulares en Python: El Módulo `re`

Python incluye una potente biblioteca estándar para aplicar la teoría de regex: el módulo `re`. Este módulo proporciona funciones para compilar y utilizar los patrones en cadenas de texto.

**Es una buena práctica usar cadenas crudas (raw strings)**, prefijando la cadena con una `r` (ej: `r"\d+"`), para evitar que Python interprete los caracteres de escape (`\`) de forma inesperada.

#### 1.3.1. Funciones Principales

| Función | Descripción | Ejemplo de Uso (Python) |
|:---|:---|:---|
| `re.search(p, s)` | Busca la **primera** coincidencia del patrón `p` en la cadena `s`. | ``re.search(r'o', 'hola mundo').span() # (1, 2)`` |
| `re.match(p, s)` | Busca una coincidencia del patrón `p` **solo al principio** de la cadena `s`. | ``re.match(r'hola', 'hola mundo') # Coincide`` |
| `re.findall(p, s)`| Encuentra **todas** las coincidencias del patrón `p` en `s`. | ``re.findall(r'\d', 'item-1, item-2') # ['1', '2']`` |
| `re.sub(p, r, s)` | **Sustituye** las coincidencias del patrón `p` por el reemplazo `r` en `s`.| ``re.sub(r'-', ' ', 'hola-mundo') # 'hola mundo'`` |
| `re.split(p, s)` | **Divide** la cadena `s` en una lista, usando el patrón `p` como separador. | ``re.split(r'[,;]', 'a,b;c') # ['a', 'b', 'c']`` |


#### 1.3.2. El Objeto `Match`

Las funciones como `search` y `match` retornan un **objeto `Match`** que contiene información sobre la coincidencia.

*Para los siguientes ejemplos, considere este código de preparación:*
`match = re.search(r'#(\d+)', 'Pedido #101 recibido')`

| Método del `Match` | Descripción | Ejemplo de Uso (Python) |
|:---|:---|:---|
| `match.group(0)` | Retorna la subcadena completa que coincidió. | ``match.group(0) # Retorna '#101'`` |
| `match.group(1)` | Retorna el texto capturado por el primer grupo `(...)`. | ``match.group(1) # Retorna '101'`` |
| `match.start()` | Retorna el índice de inicio de la coincidencia. | ``match.start() # Retorna 8`` |
| `match.end()` | Retorna el índice de fin de la coincidencia. | ``match.end() # Retorna 12`` |
| `match.span()` | Retorna una tupla `(inicio, fin)`. | ``match.span() # Retorna (8, 12)`` |

In [2]:
import re

## 2. Ejemplos

A continuación se muestran varios ejemplos de aplicación empleando expresiones regulares. El obtetivo consiste en analizar cada uno de los ejemplos en [regex101.com](https://regex101.com/) y su implementación en python y comparar los resultados.

### 2.1. Ejemplo 1: Coincidencia de Caracteres Exactos y Clases Predefinidas (`.`, `\d`, `\w`)

Este ejemplo demuestra cómo buscar coincidencias de caracteres literales y utilizar clases de caracteres predefinidas como `.` (cualquier carácter excepto salto de línea), `\d` (dígito) y `\w` (carácter de palabra).

*   **Patrón de Regex:** `r'a.\d\w'`
    *   `a`: Coincide con el carácter literal 'a'.
    *   `.`: Coincide con cualquier carácter (excepto nueva línea) después de 'a'.
    *   `\d`: Coincide con un dígito después del carácter anterior.
    *   `\w`: Coincide con un carácter de palabra (letra, número o guion bajo) después del dígito.
*   **Texto de Ejemplo:** `El código es aX1b y la clave es aY2c.`

**Prueba en regex101**

Introduzca el patrón `a.\d\w` y el texto de ejemplo `El código es aX1b y la clave es aY2c.` para ver las coincidencias. La siguiente figura muestra lo que se espera visualizar:

![ejemplo](regex_101_example.png)

**Implementación en Python**

En la siguiente figura se muestra un resultado similar usando la función `re.findall()` para encontrar e imprimir todos los patrones del texto que coinciden con el patron de Regex empleado.

In [3]:
text = "El código es aX1b y la clave es aY2c."
pattern = r'a.\d\w'

matches = re.findall(pattern, text)
print(matches)

['aX1b', 'aY2c']


> **Conclusión**: El primer ejemplo demostró con éxito la coincidencia de caracteres literales y clases de caracteres básicas (`.`, `\d`, `\w`),encontrando "aX1b" y "aY2c" en el texto de ejemplo.

### 2.2. Ejemplo 2: Uso de Cuantificadores: `*`, `+`, `?`, `{}`

Este ejemplo ilustra cómo utilizar cuantificadores en expresiones regulares para especificar cuántas veces un carácter o grupo debe aparecer para que haya una coincidencia.

*   **Texto de Ejemplo:** `ac, abc, abbc, abbbc, abbbbc, abbbbbc`

*   **Patrones de Regex y Explicaciones:**
    *   `r'ab*c'`: Coincide con 'a', seguido de **cero o más** 'b's, y terminado en 'c'. (`*`)
    *   `r'ab+c'`: Coincide con 'a', seguido de **una o más** 'b's, y terminado en 'c'. (`+`)
    *   `r'ab?c'`: Coincide con 'a', seguido de **cero o una** 'b', y terminado en 'c'. (`?`)
    *   `r'ab{2,4}c'`: Coincide con 'a', seguido de **entre 2 y 4** 'b's (inclusive), y terminado en 'c'. (`{n,m}`)

**Prueba en regex101.com**

Introduzca cada patrón (`ab*c`, `ab+c`, `ab?c`, `ab{2,4}c`) por separado y el texto de ejemplo `ac, abc, abbc, abbbc, abbbbc, abbbbbc` para ver las coincidencias de cada uno.

**Implementación en python**

In [4]:
text = "ac, abc, abbc, abbbc, abbbbc, abbbbbc"

patterns = {
    r'ab*c': "Cero o más 'b's (*)",
    r'ab+c': "Una o más 'b's (+)",
    r'ab?c': "Cero o una 'b' (?)",
    r'ab{2,4}c': "Entre 2 y 4 'b's ({2,4})"
}

for pattern, description in patterns.items():
    matches = re.findall(pattern, text)
    print(f"Patrón: '{pattern}' ({description}) -> Coincidencias: {matches}")

Patrón: 'ab*c' (Cero o más 'b's (*)) -> Coincidencias: ['ac', 'abc', 'abbc', 'abbbc', 'abbbbc', 'abbbbbc']
Patrón: 'ab+c' (Una o más 'b's (+)) -> Coincidencias: ['abc', 'abbc', 'abbbc', 'abbbbc', 'abbbbbc']
Patrón: 'ab?c' (Cero o una 'b' (?)) -> Coincidencias: ['ac', 'abc']
Patrón: 'ab{2,4}c' (Entre 2 y 4 'b's ({2,4})) -> Coincidencias: ['abbc', 'abbbc', 'abbbbc']


> **Conclusión**: El segundo ejemplo ilustró el uso de cuantificadores (`*`, `+`, `?`, `{}`), haciendo coincidir correctamente patrones con un número variable de caracteres repetidos según el cuantificador utilizado (por ejemplo, `ab*c` coincidió con "ac", "abc", "abbc", etc., mientras que `ab{2,4}c` solo coincidió con "abbc", "abbbc", "abbbbc").

### 2.3. Ejemplo 3: Anclas (`^`, `$`, y `\b`)

Las anclas en expresiones regulares no coinciden con caracteres, sino con posiciones específicas dentro de la cadena de texto. Son útiles para asegurar que un patrón aparezca solo al principio, al final, o en los límites de una palabra.

*   `^`: Coincide con el inicio de la cadena.
*   `$`: Coincide con el final de la cadena.
*   `\b`: Coincide con un límite de palabra. Un límite de palabra se define como la posición entre un carácter de palabra (`\w`) y un carácter que no es de palabra (`\W`), o el inicio/fin de la cadena si el primer/último carácter es un carácter de palabra.

A continuación se va a proceder a analizar su efecto en el siguiente ejemplo:
*   **Texto de Ejemplo:** `Empieza con hola. hola mundo. El fin es hola`
*   **Patrones de Regex y Explicaciones:**
    *   `r'^hola'`: Coincide con la palabra "hola" solo si está al **inicio** de la cadena.
    *   `r'hola$'`: Coincide con la palabra "hola" solo si está al **final** de la cadena.
    *   `r'\bhola\b'`: Coincide con la palabra "hola" solo si aparece como una **palabra completa** (rodeada de límites de palabra).


**Prueba en regex101.com** 

Introduzca cada patrón (`^hola`, `hola$`, `\bhola\b`) por separado y el texto de ejemplo `Empieza con hola. hola mundo. El fin es hola` para ver las coincidencias de cada uno.

**Implementación en python**

In [5]:
text = "Empieza con hola. hola mundo. El fin es hola"

anchor_patterns = {
    r'^hola': "Coincide 'hola' al inicio (^)",
    r'hola$': "Coincide 'hola' al final ($)",
    r'\bhola\b': "Coincide 'hola' como palabra completa (\\b)"
}

for pattern, description in anchor_patterns.items():
    matches = re.findall(pattern, text)
    print(f"Patrón: '{pattern}' ({description}) -> Coincidencias: {matches}")

Patrón: '^hola' (Coincide 'hola' al inicio (^)) -> Coincidencias: []
Patrón: 'hola$' (Coincide 'hola' al final ($)) -> Coincidencias: ['hola']
Patrón: '\bhola\b' (Coincide 'hola' como palabra completa (\b)) -> Coincidencias: ['hola', 'hola', 'hola']


> **Conclusión**: El tercer ejemplo mostró el uso de anclas (`^`, `$`, `\b`), evidenciando que `^hola` no encontró coincidencias, `hola$` coincidió con "hola" al final de la cadena, y `\bhola\b` coincidió con "hola" solo cuando apareció como una palabra completa.

### 2.4. Ejemplo 4: Conjuntos de Caracteres (`[]`, `[^]`, y `-`)

Los conjuntos de caracteres permiten definir un grupo de caracteres que pueden coincidir en una posición.
* `[xyz]`: Coincide con cualquier carácter dentro de los corchetes.
* `[^xyz]`: Coincide con cualquier carácter **excepto** los que están dentro de los corchetes (conjunto negado).
* `[a-z]`: Dentro de corchetes, el guion (`-`) define un rango de caracteres (por ejemplo, todas las letras minúsculas de 'a' a 'z').

Para comprender lo que hacen los caracteres previamente vistos vamos analizar el siguiente ejemplo:
* **Texto de Ejemplo:** `El documento es DOC-123, la version es v4.5, y hay un error en ABC-999.`
* **Patrones de Regex y Explicaciones:**
  * `r'[aeiouAEIOU]'`: Coincide con cualquier vocal, tanto minúscula como mayúscula.
  * `r'[^0-9\s]'`: Coincide con cualquier carácter que **no** sea un dígito (`0-9`) ni un espacio en blanco (`\s`).
  * `r'[a-zA-Z0-9]'`: Coincide con cualquier carácter alfanumérico (letras minúsculas `a-z`, letras mayúsculas `A-Z`, o dígitos `0-9`).

**Prueba en regex101.com**

Introduzca el texto de ejemplo `El documento es DOC-123, la version es v4.5, y hay un error en ABC-999.` y pruebe cada patrón (`[aeiouAEIOU]`, `[^0-9\s]`, `[a-zA-Z0-9]`) por separado para ver las coincidencias.

In [7]:
text = "El documento es DOC-123, la version es v4.5, y hay un error en ABC-999."

char_set_patterns = {
    r'[aeiouAEIOU]': "Coincide con cualquier vocal",
    r'[^0-9\s]': "Coincide con cualquier carácter que NO sea un dígito o espacio en blanco",
    r'[a-zA-Z0-9]': "Coincide con cualquier carácter alfanumérico"
}

for pattern, description in char_set_patterns.items():
    matches = re.findall(pattern, text)
    print(f"Patrón: '{pattern}' ({description}) -> Coincidencias: {matches}")

Patrón: '[aeiouAEIOU]' (Coincide con cualquier vocal) -> Coincidencias: ['E', 'o', 'u', 'e', 'o', 'e', 'O', 'a', 'e', 'i', 'o', 'e', 'a', 'u', 'e', 'o', 'e', 'A']
Patrón: '[^0-9\s]' (Coincide con cualquier carácter que NO sea un dígito o espacio en blanco) -> Coincidencias: ['E', 'l', 'd', 'o', 'c', 'u', 'm', 'e', 'n', 't', 'o', 'e', 's', 'D', 'O', 'C', '-', ',', 'l', 'a', 'v', 'e', 'r', 's', 'i', 'o', 'n', 'e', 's', 'v', '.', ',', 'y', 'h', 'a', 'y', 'u', 'n', 'e', 'r', 'r', 'o', 'r', 'e', 'n', 'A', 'B', 'C', '-', '.']
Patrón: '[a-zA-Z0-9]' (Coincide con cualquier carácter alfanumérico) -> Coincidencias: ['E', 'l', 'd', 'o', 'c', 'u', 'm', 'e', 'n', 't', 'o', 'e', 's', 'D', 'O', 'C', '1', '2', '3', 'l', 'a', 'v', 'e', 'r', 's', 'i', 'o', 'n', 'e', 's', 'v', '4', '5', 'y', 'h', 'a', 'y', 'u', 'n', 'e', 'r', 'r', 'o', 'r', 'e', 'n', 'A', 'B', 'C', '9', '9', '9']


> **Conclusión**: El cuarto ejemplo demostró los conjuntos de caracteres (`[]`, `[^]`, `-`), coincidiendo exitosamente con vocales, caracteres no dígitos/no espacios en blanco, y caracteres alfanuméricos según los conjuntos definidos.

### 2.5. Ejemplo 5: Agrupación (`()`) y Alternancia (`|`)

La agrupación con paréntesis `()` permite tratar múltiples caracteres o metacaracteres como una única unidad a la que se le pueden aplicar cuantificadores. La alternancia con `|` actúa como un operador lógico OR, permitiendo que la expresión coincida si cualquiera de las subexpresiones separadas por `|` es encontrada.

*   **Texto de Ejemplo:** `hahaha, hohoho, hihihi. Color favorito: rojo o azul? Elige verde o amarillo.`
*   **Patrones de Regex y Explicaciones:**
    *   `r'(ha)+`': Este patrón busca una o más repeticiones del grupo `ha`.
    *   `r'(rojo|azul|verde|amarillo)'`: Este patrón busca una coincidencia exacta con cualquiera de las palabras "rojo", "azul", "verde" o "amarillo".


**Prueba en regex101.com** 

Introduzca el texto de ejemplo `hahaha, hohoho, hihihi. Color favorito: rojo o azul? Elige verde o amarillo.` y pruebe cada patrón (`(ha)+`, `(rojo|azul|verde|amarillo)`) por separado para ver las coincidencias.

**Implementación en python**

In [8]:
text = "hahaha, hohoho, hihihi. Color favorito: rojo o azul? Elige verde o amarillo."

group_alternation_patterns = {
    r'(ha)+': "Agrupación y cuantificador (+)",
    r'(rojo|azul|verde|amarillo)': "Alternancia (OR)"
}

for pattern, description in group_alternation_patterns.items():
    matches = re.findall(pattern, text)
    print(f"Patrón: '{pattern}' ({description}) -> Coincidencias: {matches}")

Patrón: '(ha)+' (Agrupación y cuantificador (+)) -> Coincidencias: ['ha']
Patrón: '(rojo|azul|verde|amarillo)' (Alternancia (OR)) -> Coincidencias: ['rojo', 'azul', 'verde', 'amarillo']


> **Conclusión**: * El quinto ejemplo explicó y demostró la agrupación (`()`) y la alternancia (`|`), con `(ha)+` coincidiendo con secuencias repetidas de "ha" y `(rojo|azul|verde|amarillo)` coincidiendo con cualquiera de los colores especificados.

### 2.6. Ejemmplo 6 - Combinando Conceptos: Extracción de Correos Electrónicos

En escenarios reales, las expresiones regulares se vuelven muy potentes cuando se combinan varios metacaracteres, cuantificadores y anclas para crear patrones complejos que coincidan con estructuras específicas, como direcciones de correo electrónico, números de teléfono, URLs, etc.

Este ejemplo demuestra cómo construir un patrón de regex para encontrar direcciones de correo electrónico en un texto, combinando clases de caracteres, cuantificadores y el carácter literal '@'.

*   **Texto de Ejemplo:**
    ```
    Contacto: usuario123@dominio.com para soporte y admin@sub.dominio.net para consultas. También puedes escribir a test.user+alias@example.org. Correo inválido: @dominio.com o usuario@dominio.
    ```

*   **Patrón de Regex:** `r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,}\b'`

*   **Explicación del Patrón:**
    *   `\b`: Coincide con un **límite de palabra**. Esto asegura que no coincida con partes de palabras.
    *   `[A-Za-z0-9._%+-]+`: Coincide con la **parte del usuario** del correo.
        *   `[A-Za-z0-9._%+-]`: Un conjunto de caracteres que incluye letras (mayúsculas y minúsculas), dígitos, puntos, guiones bajos, porcentajes, signos más y guiones. Estos son caracteres comunes permitidos en la parte del usuario.
        *   `+`: Indica que debe haber **una o más** de las coincidencias del conjunto anterior.
    *   `@`: Coincide con el carácter literal '@', que separa el usuario del dominio.
    *   `[A-Za-z0-9.-]+`: Coincide con la **parte del subdominio y dominio**.
        *   `[A-Za-z0-9.-]`: Un conjunto de caracteres que incluye letras (mayúsculas y minúsculas), dígitos, puntos y guiones.
        *   `+`: Indica que debe haber **una o más** de las coincidencias del conjunto anterior.
    *   `\.`: Coincide con un **punto literal** que separa el dominio de nivel superior (TLD). Se necesita escapar con `\` porque `.` tiene un significado especial en regex.
    *   `[A-Za-z]{2,}`: Coincide con el **dominio de nivel superior (TLD)**.
        *   `[A-Za-z]`: Un conjunto que incluye letras (mayúsculas y minúsculas).
        *   `{2,}`: Indica que debe haber **dos o más** letras para el TLD (ej. `.com`, `.org`, `.net`, etc.).
    *   `\b`: Coincide con otro **límite de palabra** al final, para asegurar que el correo termine correctamente.

**Prueba en regex101.com** 

Introduzca el patrón `\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,}\b` y el texto de ejemplo en la sección de texto de prueba para ver las coincidencias. Selecciona el "Flavor" Python.

**Implementación en Python**

In [9]:
text = """
Contacto: usuario123@dominio.com para soporte y admin@sub.dominio.net para consultas. También puedes escribir a test.user+alias@example.org. Correo inválido: @dominio.com o usuario@dominio.
"""

email_pattern = r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,}\b'

found_emails = re.findall(email_pattern, text)
print(f"Correos encontrados: {found_emails}")

Correos encontrados: ['usuario123@dominio.com', 'admin@sub.dominio.net', 'test.user+alias@example.org']


> **Conclusión**: * El sexto ejemplo combinó varios conceptos para extraer direcciones de correo electrónico, identificando exitosamente 'usuario123@dominio.com', 'admin@sub.dominio.net' y 'test.user+alias@example.org', mientras ignoraba formatos inválidos.