In [None]:
#include <regex>
#include <string>
#include <iostream>
#include <iterator>

using namespace std;

# Expresiones regulares

En general, una expresión regular es un patrón de búsqueda. Especifica la "forma" que
debe de tener un texto para cumplir con el patrón. Veamos con un ejemplo analizando la frase:
 
```La expresión boom!, boooom! o booooooom! se dice en español como ¡bum!, ¡buuuuum! y ¡buuuuuuum!. ```

En su forma más sencilla, una expresión regular nos permite identificar una secuencia de caracteres:

In [None]:
string frase = "La expresión boom!, boooom! o booooooom! se dice en español como ¡bum!, ¡buuuuum! y ¡buuuuuuum!.";
frase

In [None]:
string patron = "boom";
regex expresion_regular(patron);

if(regex_search(frase, expresion_regular)){
    cout << "La frase contiene: " << patron << endl;
} else {
    cout << "La frase no contiene: " << patron << endl;
}

Útil, pero ésto fácilmente lo podríamos hacer directamente con el string:

In [None]:
if(frase.find(patron) != string::npos){
    cout << "La frase contiene: " << patron << endl;
} else {
    cout << "La frase no contiene: " << patron << endl;
}

---

Ahora, ¿qué sucede si queremos buscar todas las formas en que se escribe `boom`? Tendríamos que 
saber exactamente cuáles formas aparecen en la frase y hacer la búsqueda con cada una. O podríamos
construir una epxresión regular:

In [None]:
void imprimir_coincidencias(string cadena, regex exp){
    auto inicio = sregex_iterator(cadena.begin(), cadena.end(), exp);
    auto fin = sregex_iterator();
    
    for(auto iter = inicio; iter != fin; ++iter){
        smatch coincidencia = *iter;
        cout << "Encontrado: " << coincidencia.str() << endl;
    }
}

In [None]:
expresion_regular = regex(R"(bu+m)");
imprimir_coincidencias(frase, expresion_regular);

(Haré la introducción formal a funciones un poco más adelante y de iteradores en el siguiente proyecto)

Aquí estamos introduciendo también cadenas literales (¿crudas?). Una cadena en la forma `R"(<cadena>)"` determina que todos los caracteres
deben de ser tomados de forma literal, por lo que evita el tener que agregar caracteres de escape. Todo lo que se encuentre entre los 
delimitadores `R("` y `")` se toma de forma "literal", tal cual aparece. Este tipo de cadenas son útiles especialmente para expresiones regulares.

Podemos ver que esta expresión realizó una coincidencia con cada una de las formas de "boom" en la frase. Los operadores más
básicos de una expresión regular son:
* `(exp)` Agrupa una secuencia para ser tomada como un solo elemento
* `|` Indica opción entre dos elementos
* `+` Una o más ocurrencias del elemento
* `*` Cero o más ocurrencias del elemento

Existen extensiones a las librerías de expresiones regulares que permiten un mayor grado de expresividad y control. C++
ofrece soporte para estas variaciones.

De esta manera podríamos también realizar coincidencias con las formas en inglés y español de la frase boom:

In [None]:
expresion_regular = regex(R"(b(o|u)+m)");
imprimir_coincidencias(frase, expresion_regular);