# üß© 03 ‚Äì Cuantificadores y Grupos en Expresiones Regulares

En este notebook aprender√°s a usar **cuantificadores** y **grupos** en expresiones regulares.

Estas dos caracter√≠sticas te permiten definir **cu√°ntas veces debe repetirse un patr√≥n**
y **capturar partes concretas del texto** para analizarlas o transformarlas.

**Duraci√≥n estimada:** 25‚Äì30 minutos.

---
## üéØ Objetivos
- Comprender los cuantificadores m√°s usados (`*`, `+`, `?`, `{n}`, `{n,m}`).
- Entender la diferencia entre **grupos de captura** y **grupos no capturantes**.
- Aplicar estos conceptos para extraer informaci√≥n estructurada de texto (como correos electr√≥nicos).

---
## 1Ô∏è‚É£ Cuantificadores b√°sicos

| Cuantificador | Significado |
|:--------------:|-------------|
| `*` | Cero o m√°s repeticiones |
| `+` | Una o m√°s repeticiones |
| `?` | Cero o una repetici√≥n |
| `{n}` | Exactamente *n* repeticiones |
| `{n,}` | *n* o m√°s repeticiones |
| `{n,m}` | Entre *n* y *m* repeticiones |

üëâ Puedes combinarlos con cualquier patr√≥n. Por ejemplo, `a{2,4}` busca *"aa"*, *"aaa"* o *"aaaa"*.

In [2]:
import re

texto = "aa aaaa aaaaaa"

print(re.findall(r"a{2,4}", texto))  # entre 2 y 4 letras a
print(re.findall(r"a+", texto))      # una o m√°s letras a consecutivas

['aa', 'aaaa', 'aaaa', 'aa']
['aa', 'aaaa', 'aaaaaa']


---
## 2Ô∏è‚É£ Grupos de captura `( )`

Los **grupos** permiten capturar partes espec√≠ficas del texto.

Por ejemplo, si quieres extraer el prefijo y el n√∫mero de una matr√≠cula, puedes agrupar ambas partes:

`(\d{4})-([A-Z]{3})`

- Grupo 1 ‚Üí n√∫meros
- Grupo 2 ‚Üí letras

In [3]:
texto = "Coches: 1234-ABC, 5555-XYZ"
patron = r"(\d{4})-([A-Z]{3})"

coincidencias = re.findall(patron, texto)
print(coincidencias)  # [('1234', 'ABC'), ('5555', 'XYZ')]

[('1234', 'ABC'), ('5555', 'XYZ')]


Cuando usas par√©ntesis en un `findall`, cada coincidencia se devuelve como una **tupla de grupos**.

Si solo quieres agrupar sin capturar, usa un **grupo no capturante**: `(?: ... )`.

In [4]:
texto = "aaa bbb ccc"
# grupo capturante: devuelve coincidencias de cada grupo
print(re.findall(r"(a+)", texto))
# grupo no capturante: el resultado es el texto completo encontrado
print(re.findall(r"(?:a+)", texto))

['aaa']
['aaa']


---
## 3Ô∏è‚É£ Grupos con `search()` y el objeto `Match`

Al usar `re.search()` o `re.match()`, podemos acceder a los grupos mediante m√©todos:

- `.group(n)` ‚Üí devuelve el texto del grupo *n*.
- `.groups()` ‚Üí devuelve una tupla con todos los grupos.
- `.start()` / `.end()` ‚Üí posiciones de la coincidencia.

In [5]:
m = re.search(r"(\d{4})-([A-Z]{3})", "Matr√≠cula: 4321-DFG")
if m:
    print("Coincidencia completa:", m.group(0))
    print("Grupo 1 (n√∫meros):", m.group(1))
    print("Grupo 2 (letras):", m.group(2))
    print("Todos los grupos:", m.groups())

Coincidencia completa: 4321-DFG
Grupo 1 (n√∫meros): 4321
Grupo 2 (letras): DFG
Todos los grupos: ('4321', 'DFG')


---
## 4Ô∏è‚É£ Ejercicio guiado ‚Äì Extracci√≥n de correos electr√≥nicos

Vamos a extraer **nombre** y **dominio** de una lista de correos electr√≥nicos.

### Requisitos del patr√≥n:
- El nombre puede contener letras, n√∫meros, guiones o puntos.
- El dominio tambi√©n puede tener puntos.
- La expresi√≥n debe capturar dos grupos: nombre y dominio.

üí° *Pista:* usa un patr√≥n con dos grupos `( ... )@( ... )` y el s√≠mbolo `+` para una o m√°s repeticiones.

In [7]:
texto = "Correos: ana@gmail.com, juan.perez@empresa.es, maria-99@uni.edu"

# TODO: escribe tu patr√≥n aqu√≠
# patron = r"( ... )@( ... )"

# resultados = re.findall(patron, texto)
# print(resultados)

# ‚úÖ Resultado esperado:
# [('ana', 'gmail.com'), ('juan.perez', 'empresa.es'), ('maria-99', 'uni.edu')]

---
## 5Ô∏è‚É£ Versi√≥n resuelta (oculta para revisi√≥n)

Puedes probar esta soluci√≥n si quieres verificar tu resultado:

In [8]:
patron = r"([\w\.-]+)@([\w\.-]+)"
re.findall(patron, texto)

[('ana', 'gmail.com'), ('juan.perez', 'empresa.es'), ('maria-99', 'uni.edu')]

---
## üìö 6Ô∏è‚É£ Resumen del notebook

- `*`, `+`, `?`, `{n}`, `{n,m}` ‚Üí controlan **cu√°ntas veces** debe aparecer un patr√≥n.
- `( )` ‚Üí crea un **grupo de captura**.
- `(?: )` ‚Üí crea un grupo **no capturante**.
- `m.group(n)` o `m.groups()` permiten acceder al contenido capturado.

üí™ Dominar los grupos es clave para **extraer informaci√≥n estructurada** y construir validadores m√°s complejos.

---
**Fin del notebook 03 ‚Äì Cuantificadores y Grupos.**