# üß© 1.2 ‚Äì Metacaracteres b√°sicos en Expresiones Regulares

En este notebook aprender√°s el significado de los **metacaracteres b√°sicos** de las expresiones regulares:

`. ^ $ * + ? { } [ ] | ( )`

Estos s√≠mbolos son los **bloques fundamentales** para construir patrones complejos.

---
## üéØ Objetivos
- Comprender el significado de cada metacar√°cter.
- Usar clases de caracteres y rangos (`[abc]`, `[A-Z]`, `[^0-9]`).
- Probar patrones usando `re.findall()` y `re.search()`.
- Resolver un ejercicio tem√°tico sobre detecci√≥n de c√≥digos de producto.

> üí° **Recuerda:** ejecuta las celdas en orden o usa ‚ÄúEjecutar todo‚Äù.

---
## 1Ô∏è‚É£ Metacaracteres principales

| S√≠mbolo | Significado | Ejemplo |
|:--------:|:------------|:--------|
| `.` | Cualquier car√°cter excepto salto de l√≠nea | `a.c` ‚Üí "abc", "a9c" |
| `^` | Inicio de la cadena | `^Hola` ‚Üí solo si empieza por "Hola" |
| `$` | Fin de la cadena | `fin$` ‚Üí solo si termina en "fin" |
| `*` | Cero o m√°s repeticiones | `ba*` ‚Üí "b", "ba", "baa" |
| `+` | Una o m√°s repeticiones | `ba+` ‚Üí "ba", "baa" |
| `?` | Cero o una repetici√≥n | `colou?r` ‚Üí "color" o "colour" |
| `{n}` | Exactamente *n* repeticiones | `\d{4}` ‚Üí 4 d√≠gitos |
| `{n,m}` | Entre *n* y *m* repeticiones | `a{2,4}` ‚Üí "aa", "aaa", "aaaa" |
| `[abc]` | Cualquier car√°cter dentro del conjunto | `[aeiou]` ‚Üí vocales |
| `[^abc]` | Cualquier car√°cter **excepto** los del conjunto | `[^0-9]` ‚Üí no d√≠gitos |
| `( )` | Agrupa o captura subpatrones | `(\d{2})/(\d{2})` |
| `|` | Alternativa l√≥gica (OR) | `gato|perro` |

---

## 2Ô∏è‚É£ Ejemplo b√°sico: clases de caracteres `[ ]`

Los corchetes permiten definir **conjuntos o rangos** de caracteres v√°lidos.

- `[aeiou]` ‚Üí cualquier vocal.
- `[A-Z]` ‚Üí cualquier letra may√∫scula.
- `[0-9]` ‚Üí cualquier d√≠gito.
- `[^0-9]` ‚Üí cualquier car√°cter **que no sea un d√≠gito**.

In [1]:
import re

texto = "A1 B2 c3 D4 e5"
print(re.findall(r"[A-Z]", texto))    # may√∫sculas
print(re.findall(r"[0-9]", texto))    # d√≠gitos
print(re.findall(r"[^0-9\s]", texto)) # todo menos n√∫meros y espacios

['A', 'B', 'D']
['1', '2', '3', '4', '5']
['A', 'B', 'c', 'D', 'e']


In [3]:
texto = "A1 B2 c3 D4 e5"
print(re.findall(r"[A-Z]", texto, flags= re.IGNORECASE))    # ejemplo ignorando may√∫sculas
print(re.findall(r"[0-9]", texto))    # d√≠gitos
print(re.findall(r"[^0-9\s]", texto)) # todo menos n√∫meros y espacios

['A', 'B', 'c', 'D', 'e']
['1', '2', '3', '4', '5']
['A', 'B', 'c', 'D', 'e']


---
## 3Ô∏è‚É£ Puntos y anclas (`. ^ $`)

- `.` representa **cualquier car√°cter** (excepto salto de l√≠nea).  
- `^` indica el **inicio** del texto.  
- `$` indica el **final** del texto.

In [4]:
texto = "Hola mundo Haala"
print(re.findall(r"^Hola", texto))   # solo si empieza por Hola
print(re.findall(r"mundo$", texto)) # solo si termina por mundo
print(re.findall(r"H(.*?)la", texto))   # el punto reemplaza un car√°cter intermedio

['Hola']
[]
['o', 'aa']


---
## 4Ô∏è‚É£ Cuantificadores: `*`, `+`, `?`, `{n,m}`

Los cuantificadores controlan **cu√°ntas veces** debe aparecer un patr√≥n.

Veamos ejemplos con la letra `a`:

In [5]:
texto = "b ba baa baaa baaaa"
print(re.findall(r"ba*", texto))   # cero o m√°s 'a'
print(re.findall(r"ba+", texto))   # una o m√°s 'a'
print(re.findall(r"ba{2,3}", texto)) # entre 2 y 3 'a'

['b', 'ba', 'baa', 'baaa', 'baaaa']
['ba', 'baa', 'baaa', 'baaaa']
['baa', 'baaa', 'baaa']


---
## 5Ô∏è‚É£ alternativas `|`
  
- `|` funciona como un **OR l√≥gico**.

Ejemplo: buscar las palabras "gato" o "perro":

In [6]:
texto = "Tengo un gato, un perro y un pez."
animales = re.findall(r"gato|perro|pez", texto)
print(animales)

['gato', 'perro', 'pez']


---
## 6Ô∏è‚É£ Ejercicio tem√°tico ‚Äì C√≥digos de producto

Tenemos una lista de c√≥digos de producto con el formato:

`AA-1234`, `B-9`, `XYZ-99999`, `C-15`

Queremos encontrar **solo los c√≥digos v√°lidos**:
- de una a tres letras may√∫sculas.
- Un guion `-`.
- Entre 2 y 5 d√≠gitos.

üí° *Pista:* combina `[A-Z]{2,3}`, el guion y `\d{2,5}`.

In [8]:
texto = "AA-1234 B-9 XYZ-99999 C-15 ABCD-000 ZZ-1"

# TODO: escribe tu expresi√≥n regular
patron = r"[A-Z]{1,3}-\d{2,5}"
validos = re.findall(patron, texto)
print(validos)

# Resultado esperado: ['AA-1234', 'XYZ-99999', 'C-15']

['AA-1234', 'XYZ-99999', 'C-15', 'BCD-000']


---
## 7Ô∏è‚É£ Soluci√≥n sugerida

Puedes comprobar tu resultado con esta celda:

In [9]:
patron = r"[A-Z]{1,3}-\d{2,5}"
validos = re.findall(patron, texto)
print(validos)

['AA-1234', 'XYZ-99999', 'C-15', 'BCD-000']


---
## 8Ô∏è‚É£ Resumen del notebook

- Los **metacaracteres** definen c√≥mo se comportan los patrones: posici√≥n, cantidad o agrupaci√≥n.
- `[ ]` define conjuntos de caracteres.
- `.` representa cualquier car√°cter.
- `^` y `$` anclan al inicio y fin.
- `*`, `+`, `?`, `{n,m}` controlan repeticiones.
- `( )` agrupa; `|` ofrece alternativas.

üëâ Dominar estos s√≠mbolos es esencial para cualquier expresi√≥n regular compleja.

---
**Fin del notebook 1.2 ‚Äì Metacaracteres b√°sicos.**