# üß© 1.3 ‚Äì Cuantificadores y Grupos

En este notebook aprender√°s a controlar **cu√°ntas veces se repite un patr√≥n** y c√≥mo **agrupar partes espec√≠ficas** del texto mediante **grupos de captura**.

---
## üéØ Objetivos
- Comprender el uso de `*`, `+`, `?`, `{n}`, `{n,m}`.
- Entender la diferencia entre grupos capturantes `( )` y no capturantes `(?: )`.
- Acceder a los grupos mediante el objeto `Match`.
- Aplicar estos conceptos en la extracci√≥n de datos estructurados (ej. correos electr√≥nicos).

> üí° **Recuerda:** ejecuta las celdas en orden para mantener las variables disponibles.

---
## 1Ô∏è‚É£ Cuantificadores b√°sicos

| S√≠mbolo | Significado | Ejemplo |
|:--------:|:------------|:--------|
| `*` | Cero o m√°s repeticiones | `ba*` ‚Üí b, ba, baa, baaa |
| `+` | Una o m√°s repeticiones | `ba+` ‚Üí ba, baa |
| `?` | Cero o una repetici√≥n | `colou?r` ‚Üí color o colour |
| `{n}` | Exactamente n repeticiones | `\d{4}` ‚Üí 4 d√≠gitos |
| `{n,m}` | Entre n y m repeticiones | `a{2,4}` ‚Üí aa, aaa, aaaa |

In [1]:
import re

texto = "ba baa baaa baaaa"

print(re.findall(r"ba*", texto))   # cero o m√°s 'a'
print(re.findall(r"ba+", texto))   # una o m√°s 'a'
print(re.findall(r"ba{2,3}", texto)) # entre 2 y 3 'a'

['ba', 'baa', 'baaa', 'baaaa']
['ba', 'baa', 'baaa', 'baaaa']
['baa', 'baaa', 'baaa']


---
## 2Ô∏è‚É£ Grupos de captura `( )`

Los par√©ntesis permiten **agrupar y capturar** partes espec√≠ficas del texto.

Por ejemplo, para capturar el n√∫mero y las letras de una matr√≠cula espa√±ola (`1234-ABC`):

In [2]:
texto = "Coches: 1234-ABC, 5555-XYZ"
patron = r"(\d{4})-([A-Z]{3})"

coincidencias = re.findall(patron, texto)
print(coincidencias)  # [('1234', 'ABC'), ('5555', 'XYZ')]

[('1234', 'ABC'), ('5555', 'XYZ')]


‚úÖ Cada coincidencia devuelve una **tupla** con el contenido de los grupos.

Si solo quieres agrupar sin capturar, usa **grupos no capturantes**: `(?: ... )`.

In [3]:
texto = "aaa bbb ccc"
print(re.findall(r"(a+)", texto))     # grupo capturante
print(re.findall(r"(?:a+)", texto))   # grupo no capturante

['aaa']
['aaa']


---
## 3Ô∏è‚É£ El objeto `Match`

Cuando usamos `re.search()` o `re.match()`, obtenemos un objeto `Match` que guarda los grupos encontrados.

Podemos acceder a ellos mediante:
- `.group(n)` ‚Üí texto del grupo *n*.
- `.groups()` ‚Üí todos los grupos.
- `.start()` / `.end()` ‚Üí posiciones en el texto.

In [4]:
m = re.search(r"(\d{4})-([A-Z]{3})", "Matr√≠cula: 4321-DFG")

if m:
    print("Coincidencia completa:", m.group(0))
    print("Grupo 1 (n√∫meros):", m.group(1))
    print("Grupo 2 (letras):", m.group(2))
    print("Posici√≥n en texto:", m.span())

Coincidencia completa: 4321-DFG
Grupo 1 (n√∫meros): 4321
Grupo 2 (letras): DFG
Posici√≥n en texto: (11, 19)


---
## 4Ô∏è‚É£ Ejercicio guiado ‚Äì Extraer nombre y dominio de correos electr√≥nicos

Tenemos un texto con correos electr√≥nicos y queremos separar:
- **nombre de usuario**
- **dominio** (ej. `gmail.com`)

üí° *Pista:* usa dos grupos `( ... )@( ... )` y el cuantificador `+`.

In [5]:
texto = "Correos: ana@gmail.com, juan.perez@empresa.es, maria-99@uni.edu"

# TODO: escribe tu patr√≥n aqu√≠
# patron = r"( ... )@( ... )"
# resultados = re.findall(patron, texto)
# print(resultados)

# Resultado esperado:
# [('ana', 'gmail.com'), ('juan.perez', 'empresa.es'), ('maria-99', 'uni.edu')]

---
## 5Ô∏è‚É£ Soluci√≥n sugerida
Puedes comprobar tu resultado con esta celda:

In [6]:
patron = r"([\w\.-]+)@([\w\.-]+)"
resultados = re.findall(patron, texto)
print(resultados)

[('ana', 'gmail.com'), ('juan.perez', 'empresa.es'), ('maria-99', 'uni.edu')]


---
## 6Ô∏è‚É£ Bonus ‚Äì Validaci√≥n con grupos

Podemos usar grupos tambi√©n en validaciones, por ejemplo para comprobar si un email es v√°lido:

`^[\w\.-]+@[\w\.-]+\.\w+$`

In [7]:
correos = ["usuario@mail.com", "nombre@empresa", "maria99@uni.edu"]
patron = r"^[\w\.-]+@[\w\.-]+\.\w+$"

for c in correos:
    print(c, "‚úÖ" if re.match(patron, c) else "‚ùå")

usuario@mail.com ‚úÖ
nombre@empresa ‚ùå
maria99@uni.edu ‚úÖ


---
## 7Ô∏è‚É£ Resumen del notebook

- Los **cuantificadores** controlan el n√∫mero de repeticiones.
- Los **grupos `( )`** permiten extraer partes concretas del texto.
- Los **grupos no capturantes `(?: )`** agrupan sin devolver resultados.
- El **objeto Match** proporciona m√©todos √∫tiles (`group()`, `span()`, etc.).

ÔøΩÔøΩ Dominar los grupos es esencial para estructurar y validar texto en cualquier contexto (correos, logs, formularios, etc.).

---
**Fin del notebook 1.3 ‚Äì Cuantificadores y Grupos.**