## Patrones de REGEX

Aquí te proporciono una lista de algunos patrones comunes que puedes usar en expresiones regulares en Python:

1. **\d**: Coincide con cualquier dígito decimal; es equivalente a la clase de caracteres [0-9].
2. **\D**: Coincide con cualquier carácter que no sea un dígito; es equivalente a la clase de caracteres [^0-9].
3. **\w**: Coincide con cualquier carácter alfanumérico; es equivalente a la clase de caracteres [a-zA-Z0-9_].
4. **\W**: Coincide con cualquier carácter que no sea alfanumérico; es equivalente a la clase de caracteres [^a-zA-Z0-9_].
5. **\s**: Coincide con cualquier carácter de espacio en blanco, como espacios, tabulaciones, saltos de línea, etc.
6. **\S**: Coincide con cualquier carácter que no sea un espacio en blanco.
7. **\b**: Coincide con un límite de palabra (es decir, el inicio o el final de una palabra).
8. **\B**: Coincide con cualquier lugar que no sea un límite de palabra.
9. **.**: Coincide con cualquier carácter excepto el salto de línea (\n).
10. **^**: Coincide con el inicio de la cadena.
11. **$**: Coincide con el final de la cadena.
12. **[ ]**: Define un conjunto de caracteres. Por ejemplo, [aeiou] coincidirá con cualquier vocal.
13. **[^ ]**: Define un conjunto de caracteres negado. Por ejemplo, [^0-9] coincidirá con cualquier carácter que no sea un dígito.
14. **( )**: Agrupa subpatrones.
15. **|**: Operador "o" que indica alternancia. Por ejemplo, (a|b) coincidirá con 'a' o 'b'.

Estos son solo algunos de los patrones más comunes utilizados en expresiones regulares. La lista completa de patrones y operadores es más extensa y puede ser más compleja dependiendo de la funcionalidad que necesites implementar.

## EJEMPLOS DE PATRONES 

In [9]:

# 1. \d: Coincide con cualquier dígito decimal; es equivalente a la clase de caracteres [0-9].

import re

texto = "La temperatura es 25 grados Celsius."
patron = r'\d'

resultado = re.findall(patron, texto)

print(resultado)  # Salida: ['2', '5']

['2', '5']


In [10]:


# 2. \D: Coincide con cualquier carácter que no sea un dígito; es equivalente a la clase de caracteres [^0-9].

import re

texto = "El 80% de los estudiantes pasaron el examen."
patron = r'\D'

resultado = re.findall(patron, texto)

print(resultado)  # Salida: ['E', 'l', ' ', '%', ' ', 'd', 'e', ' ', 'l', 'o', 's', ' ', 'e', 's', 't', 'u', 'd', 'i', 'a', 'n', 't', 'e', 's', ' ', 'p', 'a', 's', 'a', 'r', 'o', 'n', ' ', 'e', 'l', ' ', 'e', 'x', 'a', 'm', 'e', 'n', '.']

['E', 'l', ' ', '%', ' ', 'd', 'e', ' ', 'l', 'o', 's', ' ', 'e', 's', 't', 'u', 'd', 'i', 'a', 'n', 't', 'e', 's', ' ', 'p', 'a', 's', 'a', 'r', 'o', 'n', ' ', 'e', 'l', ' ', 'e', 'x', 'a', 'm', 'e', 'n', '.']


In [None]:


# 3. \w: Coincide con cualquier carácter alfanumérico; es equivalente a la clase de caracteres [a-zA-Z0-9_].

import re

texto = "El usuario admin_123 tiene acceso."
patron = r'\w+'

resultado = re.findall(patron, texto)

print(resultado)  # Salida: ['El', 'usuario', 'admin_123', 'tiene', 'acceso']


In [None]:

#  4. \W: Coincide con cualquier carácter que no sea alfanumérico; es equivalente a la clase de caracteres [^a-zA-Z0-9_].

import re

texto = "El usuario admin_123 tiene acceso."
patron = r'\W'

resultado = re.findall(patron, texto)

print(resultado)  # Salida: [' ', ' ', ' ', ' ', '.']


In [None]:

# 5. \s: Coincide con cualquier carácter de espacio en blanco, como espacios, tabulaciones, saltos de línea, etc.

import re

texto = "Hola,\t¿cómo estás?\nBien, gracias."
patron = r'\s'

resultado = re.findall(patron, texto)

print(resultado)  # Salida: ['\t', '\n', ' ', ' ', '\n']


In [None]:

# 6. \S: Coincide con cualquier carácter que no sea un espacio en blanco.

import re

texto = "Esto es una frase con varios espacios."
patron = r'\S+'

resultado = re.findall(patron, texto)

print(resultado)  # Salida: ['Esto', 'es', 'una', 'frase', 'con', 'varios', 'espacios.']


In [20]:
#  7. \b: Coincide con un límite de palabra (es decir, el inicio o el final de una palabra).

import re

texto = "Esto es una prueba."
patron = r'\b\w{4}\b'

resultado = re.findall(patron, texto)

print(resultado)  # Salida: ['Esto']

# '''patron = r'\b\w{3}\b': Aquí está definido el patrón que se utilizará para buscar coincidencias en el texto. Desglosemos el patrón:

# \b: Coincide con un límite de palabra, lo que significa que coincide con el inicio o el final de una palabra.
# \w{4}: Coincide con exactamente 4 caracteres alfanuméricos consecutivos. 
# \w representa cualquier carácter alfanumérico (letras del alfabeto, dígitos o guiones bajos) y {3} indica que debe coincidir exactamente tres veces.
# \b: Otro límite de palabra, lo que significa que la coincidencia debe terminar en el límite de una palabra.
# '''


['Esto']


In [23]:
#  8. \B: Coincide con cualquier lugar que no sea un límite de palabra.

import re

texto = "Esto es una prueba. dueba rueda"
patron = r'\Bue\B'

resultado = re.findall(patron, texto)

print(resultado)  # Salida: ['ue', 'ue', 'ue']


['ue', 'ue', 'ue']


In [25]:

# 9. ".": Coincide con cualquier carácter excepto el salto de línea (\n).

import re

texto = "Esto es una prueba.\n sadsfer"
patron = r'.+'

resultado = re.findall(patron, texto)

print(resultado)  # Salida: ['Esto es una prueba.', ' sadsfer']

['Esto es una prueba.', ' sadsfer']


In [26]:

# 10. **^**: Coincide con el inicio de la cadena.

import re

texto = "Inicio de la cadena."
patron = r'^Inicio'

resultado = re.findall(patron, texto)

print(resultado)  # Salida: ['Inicio']


['Inicio']


In [27]:

# 11. $: Coincide con el final de la cadena.

import re

texto = "Final de la cadena."
patron = r'cadena.$'

resultado = re.findall(patron, texto)

print(resultado)  # Salida: ['cadena.']


['cadena.']


In [None]:
# 12. [ ]: Define un conjunto de caracteres. Por ejemplo, [aeiou] coincidirá con cualquier vocal.

import re

texto = "La palabra 'Python' contiene letras."
patron = r'[aeiou]'

resultado = re.findall(patron, texto)

print(resultado)  # Salida: ['a', 'a', 'o', 'o', 'e', 'e', 'a', 'a']

In [28]:


#  13. [^ ]: Define un conjunto de caracteres negado. Por ejemplo, [^0-9] coincidirá con cualquier carácter que no sea un dígito.

import re

texto = "La contraseña es: Abc123#"
patron = r'[^a-zA-Z0-9]'

resultado = re.findall(patron, texto)

print(resultado)  # Salida: [' ', ':', '#']

# [^...]: Este es un conjunto de caracteres negado. La expresión dentro de los corchetes indica los caracteres que se excluyen de la búsqueda.
# a-zA-Z0-9: Este es un rango de caracteres que incluye todas las letras minúsculas (a-z), todas las letras mayúsculas (A-Z) y todos los dígitos (0-9). 
# Estos son los caracteres alfanuméricos.
# ^ (dentro de los corchetes): Cuando el símbolo ^ aparece como el primer carácter dentro de los corchetes, indica negación. En este contexto, 
#  [^a-zA-Z0-9] significa "cualquier carácter que no sea una letra minúscula, una letra mayúscula o un dígito".

[' ', 'ñ', ' ', ':', ' ', '#']


## Concidencia de patron simple 

In [4]:
import re

# Definir el patrón que buscamos
patron = r'\d+'     # Busqueda de secuencia de digitos

# Cadena de texto en la que buscamos el patrón
texto = 'Hola, 45 ¿cómo estás? 12 ffr 123'

# Buscar el patrón en el texto
coincidencia = re.search(patron, texto)     # Solo encuentra la primera secuencia de digitos 

if coincidencia:
    print('Se encontró el patrón.')
    print(coincidencia)
else:
    print('No se encontró el patrón.')


Se encontró el patrón.
<re.Match object; span=(6, 8), match='45'>


## Buscar y Reemplazar 

In [1]:
import re

# Definir el patrón que queremos reemplazar
patron = r'\d+'  # Buscará cualquier secuencia de dígitos

# Cadena de texto en la que queremos hacer el reemplazo
texto = 'Tengo 3 perros y 2 gatos.'

# Reemplazar los números por la palabra 'número'
resultado = re.sub(patron, 'número', texto)

print(resultado)  # Tengo número perros y número gatos.


Tengo número perros y número gatos.


## Dividir una cadena en funcion de un patron 

In [7]:
import re

# Definir el patrón para dividir la cadena
patron = r'\s+'  # Dividir por espacios en blanco

# Cadena de texto que queremos dividir
texto = 'Esto es una frase    con     varios espacios.'

# Dividir la cadena en función del patrón
resultado = re.split(patron, texto)

print(resultado)  # ['Esto', 'es', 'una', 'frase', 'con', 'varios', 'espacios.']


['Esto', 'es', 'una', 'frase', 'con', 'varios', 'espacios.']


## Encontrar todas las ocurrencias de un patron en la cadena 

In [None]:
import re

# Definir el patrón que buscamos
patron = r'\d+'  # Buscará cualquier secuencia de dígitos

# Cadena de texto en la que queremos encontrar todas las ocurrencias del patrón
texto = 'Hay 3 manzanas, 5 naranjas y 8 plátanos.'

# Encontrar todas las ocurrencias del patrón en el texto
resultados = re.findall(patron, texto)

print(resultados)  # ['3', '5', '8']
