<a href="https://colab.research.google.com/github/davidlealo/sic_ai_2025_jun/blob/main/04pln/clase_23.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Clase 23

In [None]:
# https://docs.python.org/3/library/stdtypes.html#text-sequence-type-str


# Manipulación de Cadenas en Python

Python ofrece una gran variedad de métodos para trabajar con cadenas de texto, fundamentales para el procesamiento de datos.

## Métodos Comunes de Cadenas

| Función                  | Explicación                                                                 |
|--------------------------|------------------------------------------------------------------------------|
| `x.lstrip()`             | Elimina espacios a la izquierda.                                            |
| `x.rstrip()`             | Elimina espacios a la derecha.                                              |
| `x.strip()`              | Elimina espacios en ambos lados.                                            |
| `x.replace(str1, str2)`  | Reemplaza la subcadena `str1` por `str2`.                                   |
| `x.count(str)`           | Cuenta cuántas veces aparece `str` en `x`.                                  |
| `x.find(str)`            | Devuelve el índice de la primera ocurrencia de `str`, o `-1` si no existe.  |
| `x.index(str)`           | Igual que `find`, pero lanza un error si `str` no se encuentra.             |
| `y.join(str_list)`       | Une los elementos de `str_list` usando `y` como separador.                  |
| `x.split(y)`             | Divide la cadena `x` usando `y` como separador.                             |
| `x.upper()`              | Convierte la cadena a mayúsculas.                                           |
| `x.lower()`              | Convierte la cadena a minúsculas.                                           |
| `len(x)`                 | Devuelve la longitud de la cadena.                                          |

## Aplicaciones Prácticas

### Ejercicio 1: Limpieza de texto
```python
texto = "   Hola mundo   "
print(texto.strip())
```

### Ejercicio 2: Reemplazo y conteo
```python
frase = "python es genial, python es fácil"
print(frase.replace("python", "Python"))
print(frase.count("python"))
```

### Ejercicio 3: Búsqueda
```python
mensaje = "Bienvenido al curso de Python"
print(mensaje.find("curso"))
print(mensaje.index("Python"))
```

### Ejercicio 4: Join y Split
```python
palabras = ["hola", "mundo"]
frase = "-".join(palabras)
print(frase)

print(frase.split("-"))
```

### Ejercicio 5: Mayúsculas y minúsculas
```python
x = "Python"
print(x.upper())
print(x.lower())
```

### Ejercicio 6: Longitud de la cadena
```python
mensaje = "Esto es una prueba"
print(len(mensaje))
```

## Expresiones Regulares

Las expresiones regulares son herramientas potentes para buscar patrones dentro de texto.

### Metacaracteres Comunes

```
. ^ $ * + ? { } [ ] \ | ( )
```

Estos caracteres tienen significados especiales y permiten construir patrones complejos.

Más información en: https://docs.python.org/3/howto/regex.html

## Ejercicios con Expresiones Regulares

### Ejercicio 7: Buscar números en texto
```python
import re

texto = "La temperatura es de 28 grados hoy."
resultado = re.findall(r"\d+", texto)
print(resultado)
```

### Ejercicio 8: Validar un correo electrónico
```python
import re

correo = "usuario@dominio.com"
patron = r"^[\w\.-]+@[\w\.-]+\.\w+$"
print(re.match(patron, correo) is not None)
```

### Ejercicio 9: Reemplazar espacios por guiones
```python
import re

frase = "texto con varios espacios"
print(re.sub(r"\s+", "-", frase))
```

### Ejercicio 10: Extraer datos de texto estructurado
```python
import re

texto = "Nombre: Juan, Edad: 35, Correo: juan@mail.com"
nombre = re.findall(r"Nombre: (\w+)", texto)
edad = re.findall(r"Edad: (\d+)", texto)
correo = re.findall(r"Correo: ([\w.-]+@[\w.-]+\.\w+)", texto)

print(nombre, edad, correo)
```

### Ejercicio 11: Detectar palabras que empiecen con mayúscula
```python
import re

texto = "Mi nombre es Carlos y vivo en Santiago"
palabras = re.findall(r"\b[A-Z][a-z]+\b", texto)
print(palabras)
```

### Ejercicio 12: Detectar fechas en formato dd/mm/aaaa
```python
import re

texto = "Fechas: 25/12/2025, 01/01/2026"
fechas = re.findall(r"\b\d{2}/\d{2}/\d{4}\b", texto)
print(fechas)
```

## Desafío Final

Dado el siguiente texto:

```python
texto = "Estudiante: Maria, Edad: 21, Email: maria23@gmail.com"
```

1. Extrae el nombre usando `split()` o `find()`.
2. Extrae el número de edad usando una expresión regular.
3. Verifica si el correo electrónico es válido con regex.


In [1]:
# Eliminar espacios a la derecha
texto = "   Hola mundo   "
print(texto.rstrip())

   Hola mundo


In [2]:
# Eliminar espacios a la izquierda

texto = "   Hola mundo   "
print(texto.lstrip())

Hola mundo   


In [3]:
# Eliminar espacios en ambos sentidos

texto = "   Hola mundo   "
print(texto.strip())

Hola mundo


In [4]:
frase = "python es genial, python es fácil"
print(frase.replace("python", "Python"))
print(frase.count("python"))

Python es genial, Python es fácil
2


In [5]:
frase = "Pedro faltó ayer"

In [6]:
frase

'Pedro faltó ayer'

In [7]:
frase.replace("Pedro", "María")

'María faltó ayer'

In [60]:
import requests
from bs4 import BeautifulSoup

res = requests.get('https://www.gutenberg.org/files/11/11-h/11-h.htm')
soup = BeautifulSoup(res.text, 'html.parser')


In [None]:

parrafos = soup.find_all("p")
texto = ""

for parrafo in parrafos:
  texto += parrafo.text.strip() + "\n"
  print(parrafo.text)

In [15]:
texto.count('very')

176

In [16]:
texto.count('Alice')

394

In [18]:
mensaje = "Bienvenido al curso de Python"


In [19]:
print(mensaje.find("curso"))

14


In [21]:
print(mensaje.index("curso"))

14


In [20]:
print(mensaje.index("Python"))

23


In [22]:
texto.find('Alice')

0

In [23]:
texto.find('very')

27

In [25]:
texto.find('ought')

261

In [26]:
texto.find('Artificial') # Al no encontrar la cadena de texto imprime -1

-1

In [27]:
texto.index('Artificial') # Al no encontrar la cadena de texto un error

ValueError: substring not found

In [29]:
palabras = ["hola", "mundo"]


In [30]:
frase = "-".join(palabras)


In [31]:
print(frase)


hola-mundo


In [32]:

print(frase.split("-"))

['hola', 'mundo']


In [None]:
lista_texto = texto.split(" ")
print(lista_texto)

In [None]:
# Contar la cantidad de cada palabra en lista_texto usando count

from collections import Counter

# Suponiendo que ya tienes:
# lista_texto = texto.split(" ")

# Contar las repeticiones
conteo_palabras = Counter(lista_texto)

# Mostrar el resultado
for palabra, cantidad in conteo_palabras.items():
    print(f"{palabra}: {cantidad}")


In [38]:
from collections import Counter

# Suponiendo que ya tienes la lista:
# lista_texto = texto.split(" ")

# Contar las repeticiones
conteo_palabras = Counter(lista_texto)

# Mostrar las 10 palabras más repetidas
for palabra, cantidad in conteo_palabras.most_common(10):
    print(f"{palabra}: {cantidad}")


the: 1344
to: 631
and: 625
a: 552
of: 446
she: 428
said: 412
it: 315
in: 315
was: 298


In [39]:
texto.count('the')

2109

In [40]:
texto.count('The')

182

In [41]:
import nltk
nltk.download('stopwords')

[nltk_data] Downloading package stopwords to /root/nltk_data...
[nltk_data]   Unzipping corpora/stopwords.zip.


True

In [47]:
from nltk.corpus import stopwords
spanish_stopwords = stopwords.words('spanish')
spanish_stopwords.append('cachai')

In [None]:
spanish_stopwords

In [51]:
print(len(spanish_stopwords))

314


In [49]:
x = "Python"
print(x.upper())
print(x.lower())

PYTHON
python


In [50]:
mensaje = "Esto es una prueba"
print(len(mensaje))

18


In [54]:
print(mensaje.lower())

esto es una prueba


In [55]:
print(mensaje.capitalize())

Esto es una prueba


In [56]:
'Python'.center(10, '-')

'--Python--'

In [58]:
mensaje.center(100, '-')

'-----------------------------------------Esto es una prueba-----------------------------------------'

In [None]:
# Revisa los otros en
# https://docs.python.org/3/library/stdtypes.html#text-sequence-type-str

## Expresiones regulares

In [59]:
import re

texto = "La temperatura es de 28 grados hoy."
resultado = re.findall(r"\d+", texto)
print(resultado)

['28']


In [None]:
import re

texto = "La temperatura es de 28 grados hoy."
resultado = re.findall(r"\d+", texto)
print(resultado)

In [66]:
resultado = re.findall(r"\d+", texto)
print(resultado)

[]


In [67]:
import re

# Expresión regular
patron = r"[abc]"

# Lista de cadenas para probar
cadenas = ["a", "before", "dude"]

# Probar cada cadena
for cadena in cadenas:
    if re.search(patron, cadena):
        print(f'"{cadena}": Sí – Coincide con el patrón')
    else:
        print(f'"{cadena}": No – No hay coincidencia')


"a": Sí – Coincide con el patrón
"before": Sí – Coincide con el patrón
"dude": No – No hay coincidencia


In [68]:
import re

# Expresión regular
patron = r"[abcd]"

# Lista de cadenas para probar
cadenas = ["a", "before", "dude"]

# Probar cada cadena
for cadena in cadenas:
    if re.search(patron, cadena):
        print(f'"{cadena}": Sí – Coincide con el patrón')
    else:
        print(f'"{cadena}": No – No hay coincidencia')


"a": Sí – Coincide con el patrón
"before": Sí – Coincide con el patrón
"dude": Sí – Coincide con el patrón


In [69]:
import re

# Expresión regular
patron = r"[a-d]"

# Lista de cadenas para probar
cadenas = ["a", "before", "dude"]

# Probar cada cadena
for cadena in cadenas:
    if re.search(patron, cadena):
        print(f'"{cadena}": Sí – Coincide con el patrón')
    else:
        print(f'"{cadena}": No – No hay coincidencia')


"a": Sí – Coincide con el patrón
"before": Sí – Coincide con el patrón
"dude": Sí – Coincide con el patrón


In [70]:
import re

# Expresión regular
patron = r"[a-d]"

# Lista de cadenas para probar
cadenas = ["a", "Before", "dude"]

# Probar cada cadena
for cadena in cadenas:
    if re.search(patron, cadena):
        print(f'"{cadena}": Sí – Coincide con el patrón')
    else:
        print(f'"{cadena}": No – No hay coincidencia')


"a": Sí – Coincide con el patrón
"Before": No – No hay coincidencia
"dude": Sí – Coincide con el patrón


In [71]:
import re

# Expresión regular
patron = r"[a-dA-D]"

# Lista de cadenas para probar
cadenas = ["a", "Before", "dude"]

# Probar cada cadena
for cadena in cadenas:
    if re.search(patron, cadena):
        print(f'"{cadena}": Sí – Coincide con el patrón')
    else:
        print(f'"{cadena}": No – No hay coincidencia')


"a": Sí – Coincide con el patrón
"Before": Sí – Coincide con el patrón
"dude": Sí – Coincide con el patrón


In [73]:
import re

# Expresión regular
patron = r"[a-zD]"

# Lista de cadenas para probar
cadenas = ["a", "Before", "dude"]

# Probar cada cadena
for cadena in cadenas:
    if re.search(patron, cadena):
        print(f'"{cadena}": Sí – Coincide con el patrón')
    else:
        print(f'"{cadena}": No – No hay coincidencia')


"a": Sí – Coincide con el patrón
"Before": Sí – Coincide con el patrón
"dude": Sí – Coincide con el patrón


In [78]:
import re

# Expresión regular
patron = r"^abc"

# Lista de cadenas para probar
cadenas = ["a", "Before", "dude"]

# Probar cada cadena
for cadena in cadenas:
    if re.search(patron, cadena):
        print(f'"{cadena}": Sí – Coincide con el patrón')
    else:
        print(f'"{cadena}": No – No hay coincidencia')


"a": No – No hay coincidencia
"Before": No – No hay coincidencia
"dude": No – No hay coincidencia


In [79]:
import re

# Expresión regular
patron = r"^abc"

# Lista de cadenas para probar
cadenas = ["a", "Before", "dude", "abcdef"]

# Probar cada cadena
for cadena in cadenas:
    if re.search(patron, cadena):
        print(f'"{cadena}": Sí – Coincide con el patrón')
    else:
        print(f'"{cadena}": No – No hay coincidencia')


"a": No – No hay coincidencia
"Before": No – No hay coincidencia
"dude": No – No hay coincidencia
"abcdef": Sí – Coincide con el patrón


In [76]:
# Target strings.
x1 = "That is your book."
x2 = "This is my book."


In [77]:
# A regular expression.
my_exp = "^This"

In [80]:
if re.search(my_exp, x1):
    print("Yes!")
else:
    print("No")

No


In [81]:
if re.search(my_exp, x2):
    print("Yes!")
else:
    print("No")

Yes!



# Metacaracteres en Expresiones Regulares: `[]` y `[^]`

Las expresiones regulares utilizan metacaracteres para construir patrones de búsqueda complejos. Aquí nos enfocamos en los corchetes `[]` y su versión negada `[^]`, junto con abreviaciones muy utilizadas en Python.

---

## `[]` – Conjunto de caracteres permitidos

Se usa para definir un conjunto de caracteres que pueden coincidir.

- `[aeiou]` coincide con cualquier vocal.
- `[0-9]` coincide con cualquier dígito del 0 al 9.
- `[a-zA-Z0-9_]` coincide con letras, números o guion bajo.

## `[^]` – Conjunto negado

Colocar un `^` dentro de los corchetes niega el conjunto: coincide con cualquier carácter **que NO esté** en el grupo.

- `[^aeiou]` coincide con cualquier carácter que no sea vocal.
- `[^0-9]` coincide con cualquier carácter que no sea número.

---

## Abreviaciones útiles en regex

| Abreviación | Equivalente       | Significado                                               |
|-------------|-------------------|-----------------------------------------------------------|
| `\w`       | `[a-zA-Z0-9_]`    | Carácter alfanumérico o guion bajo                       |
| `\W`       | `[^a-zA-Z0-9_]`   | Cualquier carácter que **no** sea alfanumérico o `_`     |
| `\d`       | `[0-9]`           | Cualquier dígito                                           |
| `\D`       | `[^0-9]`          | Cualquier carácter que no sea un número                   |
| `\s`       | espacio en blanco | Cualquier espacio, tabulación o salto de línea            |
| `\S`       | no espacio        | Cualquier carácter que no sea espacio                     |

---

## Ejemplos prácticos en Python

```python
import re

texto = "Python 3.10 es genial!"

# Palabras completas (alfanuméricos)
print(re.findall(r"\w+", texto))  # ['Python', '3', '10', 'es', 'genial']

# Dígitos
print(re.findall(r"\d", texto))  # ['3', '1', '0']

# No dígitos
print(re.findall(r"\D", texto))  # ['P', 'y', 't', 'h', 'o', 'n', ' ', '.', ' ', 'e', 's', ' ', 'g', 'e', 'n', 'i', 'a', 'l', '!']

# Espacios
print(re.findall(r"\s", texto))  # [' ', ' ', ' ']

# Caracteres que no son espacios
print(re.findall(r"\S", texto))  # ['P', 'y', 't', 'h', 'o', 'n', '3', '.', '1', '0', 'e', 's', 'g', 'e', 'n', 'i', 'a', 'l', '!']
```

---

## Desafío

Usa expresiones regulares para hacer lo siguiente:

1. Encontrar todas las palabras en un texto.
2. Extraer sólo los números.
3. Detectar todas las letras mayúsculas.
4. Detectar todos los caracteres que no sean letras ni números.


In [82]:
import re

textoPython = "Python 3.10 es genial!"



In [83]:
# Palabras completas (alfanuméricos)
print(re.findall(r"\w+", textoPython))

['Python', '3', '10', 'es', 'genial']


In [84]:
print(re.findall(r"\W+", textoPython))

[' ', '.', ' ', ' ', '!']


In [85]:
# Dígitos
print(re.findall(r"\d", textoPython))

['3', '1', '0']


In [86]:
# No Dígitos
print(re.findall(r"\D", textoPython))

['P', 'y', 't', 'h', 'o', 'n', ' ', '.', ' ', 'e', 's', ' ', 'g', 'e', 'n', 'i', 'a', 'l', '!']


In [87]:
# Espacios
print(re.findall(r"\s", textoPython))

[' ', ' ', ' ']


In [88]:
# NO Espacios
print(re.findall(r"\S", textoPython))

['P', 'y', 't', 'h', 'o', 'n', '3', '.', '1', '0', 'e', 's', 'g', 'e', 'n', 'i', 'a', 'l', '!']


# Ejercicios Avanzados de Expresiones Regulares

A continuación se presentan varios ejercicios prácticos para reforzar el uso de expresiones regulares en Python.

---

## Ejercicio 1: Extracción de Contactos

Dado el siguiente texto, extraiga nombre, teléfono y correo de cada persona.

```python
import re

texto = '''
Nombre: Ana Torres, Teléfono: +56 9 9876 5432, Email: ana.torres@gmail.com
Nombre: Luis Rojas, Teléfono: +56 9 1234 5678, Email: lrojas1990@yahoo.com
Nombre: Marta Pérez, Teléfono: +56 9 4444 3333, Email: marta.p@hotmail.cl
'''

patron = r"Nombre: ([A-ZÁÉÍÓÚÑ][a-záéíóúñ]+ [A-ZÁÉÍÓÚÑ][a-záéíóúñ]+), Teléfono: (\+56 9 \d{4} \d{4}), Email: ([\w\.-]+@[\w\.-]+\.\w+)"

resultados = re.findall(patron, texto)

for nombre, telefono, email in resultados:
    print(f"Nombre: {nombre}")
    print(f"Teléfono: {telefono}")
    print(f"Email: {email}")
    print("---")
```

---

## Ejercicio 2: Validar RUT Chileno

Valide si los RUTs están en un formato válido.

```python
import re

ruts = [
    "12.345.678-5",
    "7.654.321-K",
    "12345678-9",
    "12.345.678-0"
]

patron = r"^\d{1,2}\.\d{3}\.\d{3}-[\dkK]$"

for rut in ruts:
    print(f"{rut}: {'Válido' if re.match(patron, rut) else 'Inválido'}")
```

---

## Ejercicio 3: Detectar URLs en un texto

Extraiga todos los enlaces web de un párrafo.

```python
import re

texto = "Visita nuestro sitio en https://www.ejemplo.com o síguenos en http://blog.ejemplo.org."

urls = re.findall(r"https?://[\w\.-]+", texto)
print(urls)
```

---

## Ejercicio 4: Detectar Horarios

Encuentre todas las horas en formato 24h en un texto.

```python
import re

agenda = "Las reuniones son a las 09:00, 14:30 y 18:45. No hay reunión a las 25:00."

horas = re.findall(r"\b([01]?\d|2[0-3]):[0-5]\d\b", agenda)
print(horas)
```

---

## Ejercicio 5: Extraer hashtags de publicaciones

```python
import re

post = "Hoy estuvimos trabajando en el proyecto #AI y #Python. ¡Muy productivo! #Innovación"

hashtags = re.findall(r"#\w+", post)
print(hashtags)
```

---

## Ejercicio 6: Extraer años desde texto histórico

```python
import re

texto = "Chile logró su independencia en 1818 y la dictadura terminó en 1990."

anios = re.findall(r"\b(18\d{2}|19\d{2}|20\d{2})\b", texto)
print(anios)
```

---

## Ejercicio 7: Identificar palabras repetidas

```python
import re

frase = "Este es un ejemplo ejemplo con palabras repetidas repetidas."

repetidas = re.findall(r"\b(\w+) \1\b", frase)
print(repetidas)
```


In [89]:
texto = '''
Nombre: Ana Torres, Teléfono: +56 9 9876 5432, Email: ana.torres@gmail.com
Nombre: Luis Rojas, Teléfono: +56 9 1234 5678, Email: lrojas1990@yahoo.com
Nombre: Marta Pérez, Teléfono: +56 9 4444 3333, Email: marta.p@hotmail.cl
'''

patron = r"Nombre: ([A-ZÁÉÍÓÚÑ][a-záéíóúñ]+ [A-ZÁÉÍÓÚÑ][a-záéíóúñ]+), Teléfono: (\+56 9 \d{4} \d{4}), Email: ([\w\.-]+@[\w\.-]+\.\w+)"

resultados = re.findall(patron, texto)

for nombre, telefono, email in resultados:
    print(f"Nombre: {nombre}")
    print(f"Teléfono: {telefono}")
    print(f"Email: {email}")
    print("---")

Nombre: Ana Torres
Teléfono: +56 9 9876 5432
Email: ana.torres@gmail.com
---
Nombre: Luis Rojas
Teléfono: +56 9 1234 5678
Email: lrojas1990@yahoo.com
---
Nombre: Marta Pérez
Teléfono: +56 9 4444 3333
Email: marta.p@hotmail.cl
---


In [90]:
texto = '''
Nombre: Ana Torres, Teléfono: +56 9 9876 5432, Email: ana.torres@gmail.com
Nombre: Luis de la Torre, Teléfono: +56 9 1234 5678, Email: lrojas1990@yahoo.com
Nombre: Marta Pérez, Teléfono: +56 9 4444 3333, Email: marta.p@hotmail.cl
'''

patron = r"Nombre: ([A-ZÁÉÍÓÚÑ][a-záéíóúñ]+ [A-ZÁÉÍÓÚÑ][a-záéíóúñ]+), Teléfono: (\+56 9 \d{4} \d{4}), Email: ([\w\.-]+@[\w\.-]+\.\w+)"

resultados = re.findall(patron, texto)

for nombre, telefono, email in resultados:
    print(f"Nombre: {nombre}")
    print(f"Teléfono: {telefono}")
    print(f"Email: {email}")
    print("---")

Nombre: Ana Torres
Teléfono: +56 9 9876 5432
Email: ana.torres@gmail.com
---
Nombre: Marta Pérez
Teléfono: +56 9 4444 3333
Email: marta.p@hotmail.cl
---


In [91]:
texto = '''
Nombre: Vincent van Gogh, Teléfono: +56 9 9876 5432, Email: ana.torres@gmail.com
Nombre: Luis de la Torre, Teléfono: +56 9 1234 5678, Email: lrojas1990@yahoo.com
Nombre: Marta Pérez, Teléfono: +56 9 4444 3333, Email: marta.p@hotmail.cl
'''

patron = r"Nombre: ([A-ZÁÉÍÓÚÑ][a-záéíóúñ]+ [A-ZÁÉÍÓÚÑ][a-záéíóúñ]+), Teléfono: (\+56 9 \d{4} \d{4}), Email: ([\w\.-]+@[\w\.-]+\.\w+)"

resultados = re.findall(patron, texto)

for nombre, telefono, email in resultados:
    print(f"Nombre: {nombre}")
    print(f"Teléfono: {telefono}")
    print(f"Email: {email}")
    print("---")

Nombre: Marta Pérez
Teléfono: +56 9 4444 3333
Email: marta.p@hotmail.cl
---


In [92]:
import re

ruts = [
    "12.345.678-5",
    "7.654.321-K",
    "12345678-9",
    "12.345.678-0"
]

patron = r"^\d{1,2}\.\d{3}\.\d{3}-[\dkK]$"

for rut in ruts:
    print(f"{rut}: {'Válido' if re.match(patron, rut) else 'Inválido'}")

12.345.678-5: Válido
7.654.321-K: Válido
12345678-9: Inválido
12.345.678-0: Válido


para los que quieran practicar expresiones regulares, sirve mucho https://regex101.com/


In [93]:
import re

texto = "Visita nuestro sitio en https://www.ejemplo.com o síguenos en http://blog.ejemplo.org."

urls = re.findall(r"https?://[\w\.-]+", texto)
print(urls)

['https://www.ejemplo.com', 'http://blog.ejemplo.org.']


In [94]:
import re

agenda = "Las reuniones son a las 09:00, 14:30 y 18:45. No hay reunión a las 25:00."

horas = re.findall(r"\b([01]?\d|2[0-3]):[0-5]\d\b", agenda)
print(horas)

['09', '14', '18']


In [95]:
import re

post = "Hoy estuvimos trabajando en el proyecto #AI y #Python. ¡Muy productivo! #Innovación"

hashtags = re.findall(r"#\w+", post)
print(hashtags)

['#AI', '#Python', '#Innovación']


In [96]:
import re

texto = "Chile logró su independencia en 1818 y la dictadura terminó en 1990."

anios = re.findall(r"\b(18\d{2}|19\d{2}|20\d{2})\b", texto)
print(anios)

['1818', '1990']


In [97]:
import re

frase = "Este es un ejemplo ejemplo con palabras repetidas repetidas."

repetidas = re.findall(r"\b(\w+) \1\b", frase)
print(repetidas)

['ejemplo', 'repetidas']


# Quedamos en la p 46