# Expresiones regulares básicas

- La cadena vacía es expresión regular e.r.
- Cualquier símbolo del alfabeto es una e.r.
- Concatenación: Si R1 y R2 es una e.r entonces R1R2 también es e.r.
- Cerradura de Klein (estrella): SI R es e.r. entonces R* también es e.r.
  - (es concatenar R cero o más veces). 
- Disyunción (OR): Si R1 y R2 son e.r. también lo es R1 | R2. 
- Agrupación: Si R es e.r. entonces (R) también lo es.

In [27]:
# importar módulo de expresiones regulares
import re


# definir función de python


# Cuando se reconoce la cadena: <re.Match object; span=(0, 0), match=''>
# Cuando no se reconoce la cadena: None
def ev_exp_reg(exp_reg, string):
    result = re.fullmatch(exp_reg, string)
    if result:  # Si result contiene algo (es diferente de none)
        print(result, ": accepted")
    else:
        print(result, ": rejected")


# Reconocer cadenas vacías

string = ""
exp_reg = ""
ev_exp_reg(exp_reg, string)

# expresión regular como un solo símbolo
exp_reg = "a"
string = "hola"
ev_exp_reg(exp_reg, string) # no reconoce la cadena string porque no cumple con la expresión regular, en este caso solo un símbolo "a"


<re.Match object; span=(0, 0), match=''> : accepted
None : rejected


## Concatenación

In [28]:
# expresión regular concatenación
exp_reg = "ab" # se reconoce ab
string = "ab"
string2 ="abc"
ev_exp_reg(exp_reg, string) # reconoce la cadena string porque cumple con la expresión regular "ab"
ev_exp_reg(exp_reg, string2) # no reconoce la cadena string porque no cumple con la expresión regular, solo reconoce "ab"

<re.Match object; span=(0, 2), match='ab'> : accepted
None : rejected


## Cerradura de Klein

In [29]:
# ? cerradura de klein
exp_reg = "a*"  # se reconoce 0 más veces la letra "a"
string = "aa"
string2 = ""
string3 = "aaab"
ev_exp_reg(exp_reg, string)  # reconoce la cadena
ev_exp_reg(exp_reg, string2)  # reconoce la cadena string
ev_exp_reg(exp_reg, string3)  # no reconoce la cadena string
exp_reg = "a+b"  # se reconoce 0 más veces la letra "a"
ev_exp_reg(exp_reg, string3)  # reconoce la cadena string

<re.Match object; span=(0, 2), match='aa'> : accepted
<re.Match object; span=(0, 0), match=''> : accepted
None : rejected
<re.Match object; span=(0, 4), match='aaab'> : accepted


## Agrupación

In [30]:
# ? Agrupación

exp_reg = "(ab)*"  # se reconoce 0 más veces la letra "a"
string = "ab"
string2 = "(ab)"
string3 = "ababab"
ev_exp_reg(exp_reg, string)  # reconoce la cadena
ev_exp_reg(
    exp_reg, string2
)  # no reconoce la cadena porque los parentesis son metacaracter
ev_exp_reg(exp_reg, string3)  # reconoce porque el patrón "ab" se repite 0 o más veces

<re.Match object; span=(0, 2), match='ab'> : accepted
None : rejected
<re.Match object; span=(0, 6), match='ababab'> : accepted


## Disyunción 

In [31]:
# ? Disyunción

exp_reg = "a|b"  # se reconoce 0 más veces la letra "a"
string = "a"
string2 = "b"
string3 = "ab"
ev_exp_reg(exp_reg, string)  # reconoce la cadena a
ev_exp_reg(exp_reg, string2)  # reconoce la cadena b
ev_exp_reg(exp_reg, string3)  # no  reconoce

<re.Match object; span=(0, 1), match='a'> : accepted
<re.Match object; span=(0, 1), match='b'> : accepted
None : rejected


# Ejercicios

### Expresión regular `R?`
0 o una ocurrencia de la expresión regular `R`

In [32]:
# Expresión regular avanzada
exp_reg_adv= "a?"
string = "a"
string2 = ""

ev_exp_reg(exp_reg_adv, string)
ev_exp_reg(exp_reg_adv, string2)

# Expresión regular equivalente
exp_reg = "|a"  

ev_exp_reg(exp_reg, string)
ev_exp_reg(exp_reg, string2)

<re.Match object; span=(0, 1), match='a'> : accepted
<re.Match object; span=(0, 0), match=''> : accepted
<re.Match object; span=(0, 1), match='a'> : accepted
<re.Match object; span=(0, 0), match=''> : accepted


### Expresión regular `R+`
1 o más veces la expresión regular `R`

In [42]:
# Expresión regular avanzada
exp_reg_adv= "a+"
string = "aaaa"
string2 = "aa"
string3 = ""

ev_exp_reg(exp_reg_adv, string)
ev_exp_reg(exp_reg_adv, string2)
ev_exp_reg(exp_reg_adv, string3)

# Expresión regular equivalente
exp_reg = "a(a*)"  

ev_exp_reg(exp_reg, string)
ev_exp_reg(exp_reg, string2)
ev_exp_reg(exp_reg, string3)

<re.Match object; span=(0, 4), match='aaaa'> : accepted
<re.Match object; span=(0, 2), match='aa'> : accepted
None : rejected
<re.Match object; span=(0, 4), match='aaaa'> : accepted
<re.Match object; span=(0, 2), match='aa'> : accepted
None : rejected


### Expresión regular `R{3}`
La expresión regular `R` concatenada 3 veces

In [34]:
# Expresión regular avanzada
exp_reg_adv= "a{3}"
string = "aaa"
string2 = "aa"
string3 = ""

ev_exp_reg(exp_reg_adv, string)
ev_exp_reg(exp_reg_adv, string2)
ev_exp_reg(exp_reg_adv, string3)

# Expresión regular equivalente
exp_reg = "(aaa)"  

ev_exp_reg(exp_reg, string)
ev_exp_reg(exp_reg, string2)
ev_exp_reg(exp_reg_adv, string3)

<re.Match object; span=(0, 3), match='aaa'> : accepted
None : rejected
None : rejected
<re.Match object; span=(0, 3), match='aaa'> : accepted
None : rejected
None : rejected


### Expresión regular `R{3,5}`
La expresión regular `R` concatenada 3, 4 o 5 veces 

In [35]:
# Expresión regular avanzada
exp_reg_adv= "a{3,5}"
string = "aaa"
string2 = "aaaaa"
string3 = "aaaa"

ev_exp_reg(exp_reg_adv, string)
ev_exp_reg(exp_reg_adv, string2)
ev_exp_reg(exp_reg_adv, string3)

# Expresión regular equivalente
exp_reg = "(aaa)|(aaaa)|(aaaaa)"  

ev_exp_reg(exp_reg, string)
ev_exp_reg(exp_reg, string2)
ev_exp_reg(exp_reg_adv, string3)

<re.Match object; span=(0, 3), match='aaa'> : accepted
<re.Match object; span=(0, 5), match='aaaaa'> : accepted
<re.Match object; span=(0, 4), match='aaaa'> : accepted
<re.Match object; span=(0, 3), match='aaa'> : accepted
<re.Match object; span=(0, 5), match='aaaaa'> : accepted
<re.Match object; span=(0, 4), match='aaaa'> : accepted


### Expresión regular `R{3,}`
La expresión regular `R` concatenada 3 veces o más

In [36]:
# Expresión regular avanzada
exp_reg_adv= "a{3,}"
string = "aaa"
string2 = "aaaaaaa"
string3 = "aaaa"

ev_exp_reg(exp_reg_adv, string)
ev_exp_reg(exp_reg_adv, string2)
ev_exp_reg(exp_reg_adv, string3)

# Expresión regular equivalente
exp_reg = "(aaa*)"  

ev_exp_reg(exp_reg, string)
ev_exp_reg(exp_reg, string2)
ev_exp_reg(exp_reg_adv, string3)

<re.Match object; span=(0, 3), match='aaa'> : accepted
<re.Match object; span=(0, 7), match='aaaaaaa'> : accepted
<re.Match object; span=(0, 4), match='aaaa'> : accepted
<re.Match object; span=(0, 3), match='aaa'> : accepted
<re.Match object; span=(0, 7), match='aaaaaaa'> : accepted
<re.Match object; span=(0, 4), match='aaaa'> : accepted


### Expresión regular `\d`
1 sólo digito (puede ser 0,1,2,3,4,5,6,7,8,9)

In [38]:
# Expresión regular avanzada
exp_reg_adv= "\d"
string = "1"
string2 = "2"
string3 = ""

ev_exp_reg(exp_reg_adv, string)
ev_exp_reg(exp_reg_adv, string2)
ev_exp_reg(exp_reg_adv, string3)

# Expresión regular equivalente
exp_reg = "1|2|3|4|5|6|7|8|9|0"  

ev_exp_reg(exp_reg, string)
ev_exp_reg(exp_reg, string2)
ev_exp_reg(exp_reg_adv, string3)

<re.Match object; span=(0, 1), match='1'> : accepted
<re.Match object; span=(0, 1), match='2'> : accepted
<re.Match object; span=(0, 1), match='0'> : accepted
<re.Match object; span=(0, 1), match='1'> : accepted
<re.Match object; span=(0, 1), match='2'> : accepted
<re.Match object; span=(0, 1), match='0'> : accepted


### Expresión regular `[abc]`
Las letras `a`, `b`, `c`

In [39]:
# Expresión regular avanzada
exp_reg_adv= "[abc]"
string = "a"
string2 = "b"
string3 = "ab"

ev_exp_reg(exp_reg_adv, string)
ev_exp_reg(exp_reg_adv, string2)
ev_exp_reg(exp_reg_adv, string3)

# Expresión regular equivalente
exp_reg = "a|b|c"  

ev_exp_reg(exp_reg, string)
ev_exp_reg(exp_reg, string2)
ev_exp_reg(exp_reg_adv, string3)

<re.Match object; span=(0, 1), match='a'> : accepted
<re.Match object; span=(0, 1), match='b'> : accepted
None : rejected
<re.Match object; span=(0, 1), match='a'> : accepted
<re.Match object; span=(0, 1), match='b'> : accepted
None : rejected
