[![imagenes](imagenes/pythonista.png)](https://pythonista.mx)

Las expresiones regulares son parte de los lenguajes formales y corresponden a una secuencia de caracteres que definen  un patrón.

Mediante el uso de lenguajes formales, es posible buscar patrones dentro de un flujo de texto.

## Metacaracteres.

Python reconoce a los siguientes caracteres como componentes sintácticos de una expresión regular.

** . ^ $ * + ? { } [ ] \ | ( ) **

El uso de los metacaracteres se estudiará más adelante.

## El módulo _re_.

Es el módulo que contiene funciones y clases relativas a búsqueda de patrones mediante expresiones regulares.

In [2]:
import re

In [None]:
help(re)

## Parámetros de búsqueda.

* _re.A_ ó _ASCII_
* _re.I_ ó _IGNORECASE_
* _re.L_ ó _LOCALE_
* _re.M_ ó _MULTILINE_
* _re.S_ ó _DOTALL_
* _re.X_ ó _VERBOSE_
* _re.U_ ó _UNICODE_

## Funciones del módulo _re_.

### La función _re.search()_.

Busca un patrón desde el principio de  la cadena de caracteres. Al encontrar la primera conicidencia, regresa un objeto.

**Sintaxis:**

```
re.search(<patrón>, <cadena de caracteres>, <parámetros>)
```

**Ejemplos:**

In [None]:
texto = "Azucar azu azucarado zucarita, asucar azurca azucar"
patron = "azu"

In [None]:
re.search(patron, texto)

In [None]:
busqueda = re.search(patron, texto)

In [None]:
dir(busqueda)

In [None]:
busqueda.string

In [None]:
busqueda.span()

In [None]:
busqueda.start()

In [None]:
busqueda.end()

In [None]:
re.search(patron, texto, re.I)

### La función _re.findall()_.
Busca todas las coincidencias de un patrón desde el principio de  la cadena de caracteres. Regresa una lista con todas las coincidencias.

**Sintaxis:**

```
re.findall(<patrón>, <cadena de caracteres>, <parámetros>)
```

**Ejemplos:**

In [None]:
texto = "Azucar azu azucarado zucarita, asucar azurca azucar"
patron = "azu"

In [None]:
re.findall(patron, texto)

In [None]:
re.findall(patron, texto, re.I)

### La función _re.finditer()_.

Busca todas las coincidencias de un patrón desde el principio de  la cadena de caracteres. Regresa un iterador con todas las coincidencias.

**Sintaxis:**

```
re.finditer(<patrón>, <cadena de caracteres>, <parámetros>)
```

**Ejemplos:**

In [None]:
patron = 'azucar'
texto = "Azucar azu azucarado zucarita, asucar azurca azucar"

In [None]:
re.finditer(patron, texto)

In [None]:
for elemento in busca.finditer(texto):
    print(elemento)

### La función _re.split()_.
Busca todas las coincidencias de un patrón desde el principio de  la cadena de caracteres y separa los elementos utilizando al patrón como separador.
Regresa una lista de cadenas de caracteres con los textos separados. En caso de no encontrar coincidencias, regresa un objeto de tipo _list_ con el texto original. 

**Sintaxis:**

```
re.split(<patrón>, <cadena de caracteres>, <parámetros>)
```

**Ejemplos:**

In [None]:
patron = ('azu')
texto = "Azucar azu azucarado zucarita, asucar azurca azucar"

In [None]:
re.split(patron, texto)

In [None]:
patron = ('sal')
texto = "Azucar azu azucarado zucarita, asucar azurca azucar"

In [None]:
re.split(patron, texto)

### La función _re.sub()_.

Busca todas las coincidencias de un patrón desde el principio de la cadena de caracteres y dichas coincidencias serán sustituida con un nuevo texto. Regresa una cadena de caracteres con el texto modificado.

**Sintaxis:**

```
re.sub(<patrón>, <texto a sustituir>, <texto>, <parámetros>)
```

**Ejemplos:**

In [None]:
patron = 'azucar'
texto = "Azucar azu azucarado zucarita, asucar azurca azucar"

In [None]:
re.sub(patron, 'dulce', texto)

In [None]:
patron = 'sal'

In [None]:
re.sub(patron, 'dulce', texto)

### La función _re.subn()_.

Busca todas las coincidencias de un patrón desde el principio de la cadena de caracteres y dichas coincidencias serán sustituida con un nuevo texto. Regresa un objeto de tipo _tuple_ que incluye la cadena de caracteres con el texto modificado y el número de coincidencias.

**Sintaxis:**

```
re.subn(<patrón>, <texto a sustituir>, <texto>, <parámetros>)
```

**Ejemplos:**

In [None]:
patron = 'azucar'
texto = "Azucar azu azucarado zucarita, asucar azurca azucar"

In [None]:
re.subn(patron, 'dulce', texto)

In [None]:
patron = 'sal'

In [None]:
re.subn(patron, 'dulce', texto)

### La función _re.match()_.
Evalúa si el patron ingresado coincide con el inicio de una cadena de caracteres. En caso de que se encuentre el patrón, regresará un objeto con la información de la coincidencia.

**Sintaxis:**

```
re.match(<patrón>, <texto>, <parámetros>)
```
**Ejemplos:**

In [None]:
patron = 'azucar'
texto = "Azucar azu azucarado zucarita, asucar azurca azucar"

In [None]:
print(re.match(texto, patron))

In [None]:
re.match(patron, texto, re.I)

### La función _re.compile()_.
Crea un objeto que incluye los siguientes métodos, los cuales se comportan de forma idéntica a las funciones del módulo _re_ utilizando el patron que se ingresa como parámetro:
* _search()_.
* _findall()_.
* _finditer()_.
* _split()_.
* _sub()_.
* _subn()_.
* _match()_.

En cada módulo se ingresa un texto como parámetro para que el patrón sea aplicado en éste.

**Sintaxis:**
```
re.compile(<patrón>, <parámetros>)
```

**Ejemplos:**

In [None]:
texto = "Azucar azu azucarado zucarita, asucar azurca azucar"

In [None]:
re.compile('azucar')

In [None]:
busca = re.compile('azucar')

In [None]:
busca.match(texto)

In [None]:
busca = re.compile('azucar', re.IGNORECASE)

In [None]:
busca.match(texto)

In [None]:
busca.search(texto)

In [None]:
busca.subn("dulce", texto)

## Algunos patrones con expresiones regulares.
Es posible construir patrones que no necesariamente corresponden a una cadena de caracteres única mediante las expresiones regulares.

### El metacaracter ".".
Indica que debe de haber un caracter en lugar del punto.

In [None]:
texto = "Carro carcar carrreta caar craacar Carranza"
patron = "c.ar"
re.findall(patron, texto, re.I)

In [None]:
patron = "ca..r"
re.findall(patron, texto, re.I)

In [None]:
patron = "..ar"
re.findall(patron, texto, re.I)

### El metacaracter "^".
Indica que el principio de la cadena de caracteres debe de coincidir con la expresión.

In [None]:
texto = "Carro carcar carrreta caar craacar Carranza"
patron = "^car"
re.findall(patron, texto, re.I)

In [None]:
texto = "Cuenta cuentos cuenta cuentas cuantas cuentas cuenta"
patron = "^.ue"
re.findall(patron, texto, re.I)

### El metacaracter "$".
Indica que el final de la cadena de caracteres debe de coincidir con la expresión.

In [None]:
texto = "Carro carcar carrreta caar craacar Carranza"
patron = "rranza$"
re.findall(patron, texto, re.I)

# El metacaracter "*".
Indica que puede haber 0 o más caracteres en la posición indicada.

In [None]:
texto = "Carro carcar carrreta caar craacar Carranza"
patron = "ca*r"
re.findall(patron, texto, re.I)

In [None]:
texto = "Carro carcar carrreta caar craacar Carranza"
patron = "ca*"
re.findall(patron, texto, re.I)

## El metacaracter "+".
Indica que puede haber 1 o más caracteres en la posición indicada.

In [5]:
texto = "Carro carcar carrreta caar craacar Carranza caaar"
patron = "ca+"
re.findall(patron, texto, re.I)

['Ca', 'ca', 'ca', 'ca', 'caa', 'ca', 'Ca', 'caaa']

## El metacarcter "*?*".

Indica que pueden haber cero o una coincidencia con el caracter de la izquierda.

In [4]:
texto = "Carro carcar carrreta caar craacar Carranza, caaar"
patron = "ca?r"
re.findall(patron, texto, re.I)

['Car', 'car', 'car', 'car', 'cr', 'car', 'Car']

## El uso de corchetes "*[_..._]*"
\
Indica un conjunto de caracteres.

In [None]:
texto = "Azucar azu azecarado zucarita, asucar azurca azicar"
patron = "az[aeiou]car"
re.findall(patron, texto, re.I)

## El uso de llaves "*{m_, _n}*"

indica un rango de coincidencias del caracter.

In [None]:
texto = "1211111111 11111 1111 11111 11 11 13"
patron = "1{3,4}"
re.findall(patron, texto, re.I)

## Siguiente pasos.

Python ofrece un tutorial de expresiones regulares en https://docs.python.org/3/howto/regex.html

<p style="text-align: center"><a rel="license" href="http://creativecommons.org/licenses/by/4.0/"><img alt="Licencia Creative Commons" style="border-width:0" src="https://i.creativecommons.org/l/by/4.0/80x15.png" /></a><br />Esta obra está bajo una <a rel="license" href="http://creativecommons.org/licenses/by/4.0/">Licencia Creative Commons Atribución 4.0 Internacional</a>.</p>
<p style="text-align: center">&copy; José Luis Chiquete Valdivieso. 2018.</p>