<h1><span style="color:Darkblue">Expresiones Regulares</span></h1>

Las expresiones regulares (regular expressions o regex) son una herramienta poderosa para buscar, analizar y manipular cadenas de texto basadas en **patrones**. En Python, las expresiones regulares se manejan con el módulo **<span style="color:red">"re"</span>**.

El módulo "re" en Python es una biblioteca estándar que proporciona herramientas para trabajar con expresiones regulares y permite utilizar estos patrones para buscar, analizar y manipular texto de manera eficiente.

#### Funcionalidades de "re"
El módulo re ofrece diversas funciones para trabajar con expresiones regulares:
   

**1. re.search():** La función re.search() se utiliza para buscar un patrón específico dentro de una cadena de texto. Si encuentra una coincidencia, devuelve un objeto que contiene información sobre esa coincidencia. Si no encuentra ninguna coincidencia, devuelve **<span style="color:red">"None"</span>**.

##### **Codigo Ejemplar**

In [5]:
import re
texto = "Puedes contactarme al 123-456-7890."
patron = r"\d{3}-\d{3}-\d{4}"

# Buscar el patrón en el texto
resultado = re.search(patron, texto)

# Verificar si se encontró una coincidencia
if resultado:
    print("Se encontró un número de teléfono:", resultado.group())
else:
    print("No se encontró ningún número de teléfono")
#output: Se encontró un número de teléfono: 123-456-7894

Se encontró un número de teléfono: 123-456-7890


**2. re.match():** La función re.match() se utiliza para determinar si un patrón específico coincide con el comienzo de una cadena de texto. Si la coincidencia se encuentra al principio de la cadena, re.match() devuelve un objeto que contiene información sobre esa coincidencia. Si no hay coincidencia al inicio de la cadena, devuelve <span style="color:red">"None"</span>. 

##### **Codigo Ejemplar**

In [12]:
import re
texto = "Hola, ¿cómo estás?"
patron = r"Hola" #

# Comprobar si el texto comienza con el patrón
resultado = re.match(patron, texto)

# Verificar si se encontró una coincidencia al inicio
if resultado:
    print("El texto comienza con 'Hola':", resultado.group())
else:
    print("El texto no comienza con 'Hola'")

#output: Hola

El texto comienza con 'Hola': Hola


**3. re.findall:** La función re.findall() se utiliza para encontrar todas las coincidencias de un patrón dentro de una cadena de texto y devolverlas en una lista. A diferencia de re.search() y re.match(), que devuelven solo una coincidencia, re.findall() devuelve **todas las coincidencias en una lista**.

##### **Codigo Ejemplar 1**

In [9]:
import re
texto = "Tengo 2 perros y 3 gatos."
patron = r"\d+" #patron = r"\d+" es el patrón que busca uno o más dígitos.

# Encontrar todas las coincidencias del patrón en el texto
coincidencias = re.findall(patron, texto)

# Mostrar las coincidencias encontradas
print("Números encontrados:", coincidencias)

Números encontrados: ['2', '3']


##### **Codigo Ejemplar 2**

In [11]:
import re
texto = "Alice y Bob fueron al cine con Charlie y David."
patron = r"\b[A-Z][a-z]*\b" # es el patrón que busca palabras que comienzan con una letra mayúscula.

# Encontrar todas las coincidencias del patrón en el texto
coincidencias = re.findall(patron, texto)

# Mostrar las coincidencias encontradas
print("Palabras que comienzan con mayúscula:", coincidencias)

Palabras que comienzan con mayúscula: ['Alice', 'Bob', 'Charlie', 'David']


### Dato 0.0 :
 - A diferencia de re.search() y re.match(), que devuelven solo una coincidencia, re.findall() devuelve todas las coincidencias en una lista.

**4. re.split():** La función re.split() se utiliza para dividir una cadena de texto en partes utilizando un patrón como separador. A diferencia del método split() de las cadenas de texto, que solo acepta cadenas simples como separadores, **re.split()** puede <span style="color:red">usar expresiones regulares como separadores, lo que brinda mayor flexibilidad al dividir texto</span>

##### **Codigo Ejemplar 1**

In [41]:
import re 
texto = "Hola, ¿cómo estás? Espero que bien."
 #es el patrón que busca uno o más espacios o signos de puntuación como separadores.
# patron= r"[ ¿,?!]+"
# Dividir la cadena en palabras utilizando el patrón como separador
partes = re.split("[ ¿,?!]+",texto)
#partes = split("[ ¿,?!]+",texto)


# Mostrar las partes resultantes
print("Palabras divididas:", partes)

Palabras divididas: ['Hola', 'cómo', 'estás', 'Espero', 'que', 'bien.']


##### **Codigo Ejemplar 2**

In [40]:
#O sin usar expresiones regulares:
texto = "From: 20221412@lamolina.edu.pe asunto: todo bien Fri 15 june 14:28:10 2005"
words = texto.split()
print(words)
email = words[1]
print(email)
piezas = email.split('@')
print(piezas)
print(piezas[1])

['From:', '20221412@lamolina.edu.pe', 'asunto:', 'todo', 'bien', 'Fri', '15', 'june', '14:28:10', '2005']
20221412@lamolina.edu.pe
['20221412', 'lamolina.edu.pe']
lamolina.edu.pe


### **Datito 0.0 :** 
##### <span style="color:darkgreen">Expresión regular con r:</span>
La r antes de una cadena en Python significa que esa cadena se debe tomar tal como está escrita, sin interpretar ningún carácter especial dentro de ella. Por ejemplo, \n generalmente representa una nueva línea en Python, pero si usas r"\n", Python lo verá como los caracteres \ y n literalmente, sin interpretarlos como una nueva línea

### <span style="color:darkred">¿A qué se refiere la palabra "Empatar" en expresiones regulares?</span>
**"Empatar"** en el contexto de expresiones regulares se refiere al proceso de encontrar coincidencias entre un patrón definido y el texto que estás analizando. Es un concepto fundamental en el uso efectivo de expresiones regulares para buscar, extraer o manipular información en cadenas de texto.

#### Guía rápida de expresiones regulares:

1. "." (punto): Representa cualquier carácter, excepto el salto de línea.2. 
*: Representa cero o más repeticiones del elemento anterior.3. 
+: Representa una o más repeticiones del elemento anterior.
?: Representa cero o una repetición del elemento anterior (hace que el elemento anterior sea opcional).
^: Representa el inicio de una línea o de una cadena.
$: Representa el final de una línea o de una cadena.
\: Se utiliza para escapar caracteres especiales, permitiendo que se interpreten literalmente.