# Questão 1

In [71]:
import re
from collections.abc import Callable

def testa_regex(
    expressao: str,
    aceitos: list[str],
    rejeitados: list[str],
    condicao_adicional: Callable[[str], bool] = lambda c: True,
    imprimir=True,
) -> bool:
    # str -> cadeia. bool -> resultado esperado. bool -> resultado atual
    resultados_validos: list[tuple[str, bool, bool]] = []
    resultados_invalidos: list[tuple[str, bool, bool]] = []

    for cadeia in aceitos:
        aceito: bool = re.fullmatch(
            expressao, cadeia
        ) is not None and condicao_adicional(cadeia)
        if aceito:
            resultados_validos.append((cadeia, True, aceito))
        else:
            resultados_invalidos.append((cadeia, True, aceito))

    for cadeia in rejeitados:
        aceito: bool = re.fullmatch(
            expressao, cadeia
        ) is not None and condicao_adicional(cadeia)
        if not aceito:
            resultados_validos.append((cadeia, False, aceito))
        else:
            resultados_invalidos.append((cadeia, False, aceito))

    if resultados_validos and imprimir:
        print("-" * 15)
        print("Casos válidos:")
        for resultado in resultados_validos:
            cadeia: str = resultado[0]
            esperado: str = "aceito" if resultado[1] else "rejeitado"
            atual: str = "aceito" if resultado[2] else "rejeitado"

            print(f'Cadeia "{cadeia}" deve ser {esperado}. Foi {atual}')

    if resultados_invalidos and imprimir:
        print("\n" + "-" * 15)
        print("Casos inválidos:")
        for resultado in resultados_invalidos:
            cadeia: str = resultado[0]
            esperado: str = "aceito" if resultado[1] else "rejeitado"
            atual: str = "aceito" if resultado[2] else "rejeitado"

            print(f'Cadeia "{cadeia}" deve ser {esperado}. Foi {atual}')

    expressao_valida = len(resultados_invalidos) == 0
    if imprimir:
        print("\nExpressão " + ("válida" if expressao_valida else "inválida"))
    return expressao_valida

Considere os seguintes alfabetos Σ = {a, b, c, …, z}, Γ = {A, B, C, …, Z} e N = {0,
1, 2, …, 9}.

• Nome, nome do meio e sobrenome:
1. Nome, nome do meio e sobrenome devem vir separados por um espaço apenas
2. O nome do meio é opcional
3. Nome e sobrenome devem ser ambos não vazios
4. Não deve aceitar caracteres especiais ou números
5. O primeiro símbolo do nome e sobrenome, e do nome do meio se existir, deve ser
do alfabeto Γ e os outros símbolos devem ser do alfabeto Σ

Ex. de sentenças aceitas: Ada Lovelace, Alan Turing, Stephen Cole Kleene

Ex. de cadeias rejeitadas: 1Alan, Alan, A1an, A1an Turing, Alan turing


In [72]:
regex = r"([A-Z][a-z]+\s)+[A-Z][a-z]+"

aceitos = [
    "Ada Lovelace",
    "Alan Turing",
    "Stephen Cole Kleene",
    "Carlos Vitor",
    "Joao Pedro",
    "Virgilo Neto",
    "Ze Jo",
]

rejeitados = [
    "1Alan",
    "Alan",
    "A1an",
    "A1an Turing",
    "Alan turing",
    "Carlos ViTor",
    "João Pedro",
]

testa_regex(regex, aceitos, rejeitados)

---------------
Casos válidos:
Cadeia "Ada Lovelace" deve ser aceito. Foi aceito
Cadeia "Alan Turing" deve ser aceito. Foi aceito
Cadeia "Stephen Cole Kleene" deve ser aceito. Foi aceito
Cadeia "Carlos Vitor" deve ser aceito. Foi aceito
Cadeia "Joao Pedro" deve ser aceito. Foi aceito
Cadeia "Virgilo Neto" deve ser aceito. Foi aceito
Cadeia "Ze Jo" deve ser aceito. Foi aceito
Cadeia "1Alan" deve ser rejeitado. Foi rejeitado
Cadeia "Alan" deve ser rejeitado. Foi rejeitado
Cadeia "A1an" deve ser rejeitado. Foi rejeitado
Cadeia "A1an Turing" deve ser rejeitado. Foi rejeitado
Cadeia "Alan turing" deve ser rejeitado. Foi rejeitado
Cadeia "Carlos ViTor" deve ser rejeitado. Foi rejeitado
Cadeia "João Pedro" deve ser rejeitado. Foi rejeitado

Expressão válida


True

• E-mail:
1. Sentenças devem conter um, e apenas um, símbolo “@”
2. Excetuando o símbolo “@”, as sentenças possuem apenas símbolos de Σ
3. Sentenças não devem começar com o símbolo “@”
4. Sentenças devem terminar com a subcadeia “.com.br” ou “.br”
5. Sentenças devem ter, pelo menos, um símbolo de Σ entre o símbolo “@” e a
subcadeia “.com.br” ou a subcadeia “.br”

Ex. de sentenças aceitas: a@a.br, divulga@ufpa.br, a@a.com.br

Ex. de cadeias rejeitadas: @, a@.br, @a.br, T@teste.br, a@A.com.br

In [73]:
regex = r"[a-z]+\@[a-z]+(\.com)?\.br"

aceitos = ["a@a.br", "divulga@ufpa.br", "a@a.com.br", "a@com.br"]
rejeitados = ["@", "a@.br", "@a.br", "T@teste.br", "a@A.com.br", "_teste@A.br"]

testa_regex(regex, aceitos, rejeitados)

---------------
Casos válidos:
Cadeia "a@a.br" deve ser aceito. Foi aceito
Cadeia "divulga@ufpa.br" deve ser aceito. Foi aceito
Cadeia "a@a.com.br" deve ser aceito. Foi aceito
Cadeia "a@com.br" deve ser aceito. Foi aceito
Cadeia "@" deve ser rejeitado. Foi rejeitado
Cadeia "a@.br" deve ser rejeitado. Foi rejeitado
Cadeia "@a.br" deve ser rejeitado. Foi rejeitado
Cadeia "T@teste.br" deve ser rejeitado. Foi rejeitado
Cadeia "a@A.com.br" deve ser rejeitado. Foi rejeitado
Cadeia "_teste@A.br" deve ser rejeitado. Foi rejeitado

Expressão válida


True

• Senha:
1. Sentenças podem conter símbolos de Σ∪Γ∪N
2. Sentenças devem ter pelo menos um símbolo de Γ e outro de N
3. Sentenças devem ter comprimento igual a 8

Ex. de sentenças aceitas: 518R2r5e, F123456A, 1234567T, ropsSoq0

Ex. de cadeias rejeitadas: F1234567A, abcdefgH, 1234567HI

Obs.: nesta linguagem é permido utilizar recursos da linguagem de programação (e.g., size,
length ou lookahead) para descobrir se a cadeia tem comprimento 8.

In [76]:
regex = (
    r"([A-z0-9]*[A-Z][A-z0-9]*[0-9][A-z0-9]*)|([A-z0-9]*[0-9][A-z0-9]*[A-Z][A-z0-9]*)"
)
aceitos = ["518R2r5e", "F123456A", "1234567T", "ropsSoq0"]
rejeitados = ["F1234567A", "abcdefgH", "1234567HI"]
testa_regex(regex, aceitos, rejeitados, condicao_adicional=lambda c: len(c) == 8)

---------------
Casos válidos:
Cadeia "518R2r5e" deve ser aceito. Foi aceito
Cadeia "F123456A" deve ser aceito. Foi aceito
Cadeia "1234567T" deve ser aceito. Foi aceito
Cadeia "ropsSoq0" deve ser aceito. Foi aceito
Cadeia "F1234567A" deve ser rejeitado. Foi rejeitado
Cadeia "abcdefgH" deve ser rejeitado. Foi rejeitado
Cadeia "1234567HI" deve ser rejeitado. Foi rejeitado

Expressão válida


True

• CPF:
1. Sentenças devem ter o formato xxx.xxx.xxx-xx, onde x N ∈

Ex. de sentenças aceitas: 123.456.789-09, 000.000.000-00

Ex. de cadeias rejeitadas: 123.456.789-0, 111.111.11-11

In [77]:
regex = r"\d{3}\.\d{3}\.\d{3}-\d{2}"
aceitos = ["123.456.789-09", "000.000.000-00"]
rejeitados = ["123.456.789-0", "111.111.11-11"]
testa_regex(regex, aceitos, rejeitados)

---------------
Casos válidos:
Cadeia "123.456.789-09" deve ser aceito. Foi aceito
Cadeia "000.000.000-00" deve ser aceito. Foi aceito
Cadeia "123.456.789-0" deve ser rejeitado. Foi rejeitado
Cadeia "111.111.11-11" deve ser rejeitado. Foi rejeitado

Expressão válida


True

• Telefone:
1. Sentenças devem ter um dos formatos seguintes
- (xx) 9xxxx-xxxx
- (xx) 9xxxxxxxx
- xx 9xxxxxxxx

onde x N. ∈

Ex. de sentenças aceitas: (91) 99999-9999, (91) 999999999, 91 999999999

Ex. de cadeias rejeitadas: (91) 59999-9999, 99 99999-9999, (94)95555-5555

In [79]:
regex = r"(\(\d\d\)\s9[0-9]{4}-?[0-9]{4})|(\d\d\s9[0-9]{8})"
aceitos = ["(91) 99999-9999", "(91) 999999999", "91 999999999"]
rejeitados = ["(91) 59999-9999", "99 99999-9999", "(94)95555-5555"]
testa_regex(regex, aceitos, rejeitados)

---------------
Casos válidos:
Cadeia "(91) 99999-9999" deve ser aceito. Foi aceito
Cadeia "(91) 999999999" deve ser aceito. Foi aceito
Cadeia "91 999999999" deve ser aceito. Foi aceito
Cadeia "(91) 59999-9999" deve ser rejeitado. Foi rejeitado
Cadeia "99 99999-9999" deve ser rejeitado. Foi rejeitado
Cadeia "(94)95555-5555" deve ser rejeitado. Foi rejeitado

Expressão válida


True

• Data e horário:
1. Sentenças devem ter o formato dd/mm/aaaa hh:mm:ss, onde d, m, a, h, m, s ∈ N.

Ex. de sentenças aceitas: 31/08/2019 20:14:55, 99/99/9999 23:59:59

Ex. de cadeias rejeitadas: 99/99/9999 3:9:9, 9/9/99 99:99:99, 99/99/999903:09:09

In [80]:
regex = r"\d{2}\/\d{2}\/\d{4}\s\d{2}\:\d{2}\:\d{2}"
aceitos = ["31/08/2019 20:14:55", "99/99/9999 23:59:59"]
rejeitados = ["99/99/9999 3:9:9", "9/9/99 99:99:99", "99/99/999903:09:09"]
testa_regex(regex, aceitos, rejeitados)

---------------
Casos válidos:
Cadeia "31/08/2019 20:14:55" deve ser aceito. Foi aceito
Cadeia "99/99/9999 23:59:59" deve ser aceito. Foi aceito
Cadeia "99/99/9999 3:9:9" deve ser rejeitado. Foi rejeitado
Cadeia "9/9/99 99:99:99" deve ser rejeitado. Foi rejeitado
Cadeia "99/99/999903:09:09" deve ser rejeitado. Foi rejeitado

Expressão válida


True

• Número real com ou sem sinal:
1. Sentenças devem começar com um dos símbolos do alfabeto {+, -, ε}
2. Em seguida, as sentenças devem ter, pelo menos, um símbolo do alfabeto N
3. Em seguida, as sentenças devem ter, exatamente, um símbolo separador “.”
4. Em seguida, as sentenças devem finalizar com, pelo menos, um símbolo de N
5. Exceção: números sem a parte fracionária também devem ser aceitos

Ex. de sentenças aceitas: -25.467, 1, -1, +1, 64.2

Ex. de cadeias rejeitadas: 1., .2, +64,2

In [82]:
regex = r"[+-]?[0-9]+(\.?[0-9]+)?"
aceitos = ['-25.467', '1', '-1', '+1', '64.2']
rejeitados = ['1.', '.2', '+64,2']
testa_regex(regex, aceitos, rejeitados)

---------------
Casos válidos:
Cadeia "-25.467" deve ser aceito. Foi aceito
Cadeia "1" deve ser aceito. Foi aceito
Cadeia "-1" deve ser aceito. Foi aceito
Cadeia "+1" deve ser aceito. Foi aceito
Cadeia "64.2" deve ser aceito. Foi aceito
Cadeia "1." deve ser rejeitado. Foi rejeitado
Cadeia ".2" deve ser rejeitado. Foi rejeitado
Cadeia "+64,2" deve ser rejeitado. Foi rejeitado

Expressão válida


True

# Questão 2

[6.0 pontos] Implemente, na linguagem de programação de sua preferência, os arranjos
familiares solicitados nos itens abaixo sobre o alfabeto Σ = {H, M, h, m}, com significado:
- H representa um homem;
- M representa uma mulher;
- h representa um filho do sexo masculino (natural ou adotado);
- m representa uma filha do sexo feminimo (natural ou adotado);

A posição relativa de uma letra em relação às demais indica a idade relativa daquele
membro da família em relação aos demais (os mais novos estão sempre à direita).
Exemplo: a cadeia “MHhmm” representa uma família com um casal heterossexual em que a
mulher é mais velha que o homem. Além disso, esse casal possui três filhos, um homem e
duas mulheres, sendo que o filho homem é o mais velho dos três.

a) Casais heterossexuais mais velhos que os filhos com pelo menos duas filhas mulheres,
ou pelo menos um filho homem, ou ainda pelo menos dois filhos homens e uma filha
mulher

In [None]:
regex = r"(MH|HM)[(m{2,})(h+)(h{2,}m)(mh{2,})]"

b) Casais heterossexuais mais velhos que os filhos e com uma quantidade ímpar de filhas
mulheres.

In [None]:
regex = r"(MH|HM)(mm)*m"

c) Casais heterossexuais mais velhos que os filhos, com a filha mais velha mulher e o filho
mais novo homem.

In [None]:
regex = r"(MH|HM)mh"

d) Casais homossexuais mais velhos que os filhos, com pelo menos seis filhos, em que os
dois primeiros filhos formam um casal e os últimos também.

In [None]:
regex = r"(MM|HH)(mh|hm)[mh]{2}(mh|hm)"

e) Casais homossexuais mais velhos que os filhos, em que o sexo dos filhos é alternado
conforme a ordem de nascimento.

In [None]:
regex =r"(MM|HH)((mh)*|(hm)*)"

f) Casais homossexuais mais velhos que os filhos, com qualquer quantidade de filhos
homens e mulheres, mas que não tiveram dois filhos homens consecutivos.


In [None]:
regex = r"(MM|HH)((h?m+)|(m+h?))*"

g) Arranjo de no mínimo x∈ℕ e no máximo y∈ℕ , com x>0 , y>0 , e x≤y , de
adultos (Hs ou Ms) mais velhos que os filhos, com qualquer quantidade de filhos
homens e mulheres, mas que os três filhos mais novos não foram homens.

In [None]:
regex = r"[MH]+([mh]*(m|(mh)|(mhh)))?"