# üìÅ M√≥dulo 8 ‚Äî Ficheros y Expresiones Regulares

En este notebook aprender√°s a manejar archivos y usar expresiones regulares para:

- Leer y escribir ficheros
- Trabajar con rutas (`os`, `pathlib`)
- Buscar patrones en texto
- Validar formatos (emails, DNI, fechas, URLs‚Ä¶)
- Extraer informaci√≥n con grupos de captura

---

## 1Ô∏è‚É£ Lectura de archivos

La forma correcta y segura de abrir archivos en Python es usando `with open()`:

In [None]:
with open('ejemplo.txt', 'w', encoding='utf-8') as f:
    f.write('Hola mundo\nLinea 2')

with open('ejemplo.txt', 'r', encoding='utf-8') as f:
    contenido = f.read()

contenido

---
## 2Ô∏è‚É£ Leer l√≠nea a l√≠nea (eficiente para ficheros grandes)


In [None]:
with open('ejemplo.txt', 'r', encoding='utf-8') as f:
    for linea in f:
        print('‚Üí', linea.strip())

---
## 3Ô∏è‚É£ Manejo de rutas (`os`, `pathlib`)


In [None]:
import os
from pathlib import Path

Path('.').resolve(), os.listdir('.')[:5]

---
## 4Ô∏è‚É£ Expresiones Regulares (`re`)

Importamos el m√≥dulo:

In [None]:
import re

### Buscar un patr√≥n ‚Üí `re.search()`

Ejemplo: buscar un n√∫mero dentro de un texto.

In [None]:
texto = 'El pedido tiene ID 5342 y estado OK'
re.search(r'\d+', texto)

### Extraer todos los n√∫meros ‚Üí `re.findall()`

In [None]:
re.findall(r'\d+', texto)

### Grupos de captura
Extraer fecha de un texto:

In [None]:
texto_fecha = 'Factura emitida el 2024-01-15 para el cliente X'
m = re.search(r'(\d{4})-(\d{2})-(\d{2})', texto_fecha)
m.group(0), m.group(1), m.group(2), m.group(3)

---
## 5Ô∏è‚É£ Validaci√≥n de formatos

### Email:

In [None]:
email = 'usuario@example.com'
bool(re.match(r'^[\w.-]+@[\w.-]+\.[a-zA-Z]{2,}$', email))

### DNI (Espa√±a):

In [None]:
dni = '12345678Z'
bool(re.match(r'^[0-9]{8}[A-Za-z]$', dni))

### URL:

In [None]:
url = 'https://misitio.com/path?id=123'
bool(re.match(r'^https?://[\w.-]+(?:/[\w.-]*)*', url))

---
## 6Ô∏è‚É£ Ejercicio pr√°ctico

Dado el texto:
```
Usuario: Juan P√©rez
Email: juan.perez@example.com
Tel√©fono: +34 612-555-123
Fecha registro: 2024-02-11
``` 

### üß© Objetivos
1. Extraer el email
2. Extraer el tel√©fono
3. Extraer la fecha
4. Validar que la fecha tiene formato YYYY-MM-DD

Escribe tu soluci√≥n abajo:

In [None]:
# TU C√ìDIGO AQU√ç


---
## ‚úÖ Soluciones (ocultas)

<details>
<summary>Mostrar soluciones</summary>

```python
texto = """
Usuario: Juan P√©rez
Email: juan.perez@example.com
Tel√©fono: +34 612-555-123
Fecha registro: 2024-02-11
"""

re.search(r'[\w.-]+@[\w.-]+', texto).group()
```

```python
re.search(r'\+\d{2} \d{3}-\d{3}-\d{3}', texto).group()
```

```python
re.search(r'\d{4}-\d{2}-\d{2}', texto).group()
```

```python
bool(re.match(r'^\d{4}-\d{2}-\d{2}$', '2024-02-11'))
```

</details>