<a href="https://colab.research.google.com/github/Giovanni-Ornellas/IA-de-Linguagem-Neutra/blob/develop/IA_de_linguagem_Neutra.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## üíæ Como Salvar este Notebook no GitHub

Para manter o versionamento deste projeto e colaborar com a equipe, siga os passos abaixo para salvar este notebook diretamente no seu reposit√≥rio GitHub:

1. V√° at√© o menu superior e clique em **Arquivo > Salvar uma c√≥pia no GitHub**.
2. Escolha o reposit√≥rio desejado e, se quiser, uma pasta espec√≠fica.
3. Escreva uma mensagem clara de commit, por exemplo: `"Atualiza pr√©-processamento de texto para linguagem neutra"`.
4. Clique em **OK** para fazer o commit.

**Sempre que fizer altera√ß√µes importantes**, salve no GitHub para manter o hist√≥rico e facilitar o trabalho em equipe!

> Este notebook deve ser versionado no reposit√≥rio oficial:
> https://github.com/Giovanni-Ornellas/IA-de-Linguagem-Neutra/tree/develop
> Se n√£o tiver acesso, solicite permiss√£o.

Sempre salve na branch develop at√© que esteja, pois a main s√≥ ser√° usada para salvar vers√µes est√°veis do c√≥digo!
---


##  Primeira Vers√£o - Substitui√ß√£o por Regras (Regex)

Nesta primeira vers√£o do projeto de linguagem neutra, implementaremos um sistema baseado em **express√µes regulares (regex)** para transformar frases marcadas por g√™nero em vers√µes neutras.

###  Objetivo
Criar um **MVP (Produto M√≠nimo Vi√°vel)** funcional, capaz de demonstrar a viabilidade da ideia de neutraliza√ß√£o textual de forma simples, r√°pida e interpret√°vel.

---

### Por que usar Regex primeiro?

Utilizar regex como abordagem inicial oferece diversas vantagens no in√≠cio do desenvolvimento:

- ‚úÖ **R√°pida implementa√ß√£o**: poucas linhas de c√≥digo j√° entregam resultados funcionais.
- ‚úÖ **Sem necessidade de treinamento de modelos**: n√£o requer datasets extensos ou GPUs.
- ‚úÖ **Facilidade para testar regras lingu√≠sticas**: ideal para validar quais substitui√ß√µes fazem sentido.
- ‚úÖ **Alta interpretabilidade**: todas as transforma√ß√µes s√£o vis√≠veis e compreens√≠veis.
- ‚úÖ **Boa base para compara√ß√µes futuras**: os resultados dessa vers√£o servir√£o de refer√™ncia para avaliar modelos baseados em IA.

---

### üîÑ Sobre a abordagem
A substitui√ß√£o foi feita com base em um **dicion√°rio de padr√µes regulares**, que cobre pronomes, possessivos, artigos, substantivos comuns e adjetivos marcados por g√™nero. A transforma√ß√£o busca sempre **preservar o sentido** da frase, enquanto neutraliza o g√™nero de forma respeitosa e coerente.

Exemplo:



In [4]:
"""
Dicion√°rio de substitui√ß√µes para neutraliza√ß√£o de g√™nero em texto.

Cada entrada do dicion√°rio utiliza uma express√£o regular (regex) para identificar
palavras ou padr√µes de linguagem marcados por g√™nero, substituindo-os por formas
neutras. Este recurso ser√° usado na fun√ß√£o principal de transforma√ß√£o de texto
como parte da primeira vers√£o (MVP) do projeto de linguagem neutra.
"""
tradutor_neutro = {
    # Pronomes pessoais
    r"\bele(s)?\b": "elu",
    r"\bela(s)?\b": "elu",

    # Pronomes possessivos
    r"\bdele(s)?\b": "delu",
    r"\bdela(s)?\b": "delu",
    r"\bseu(s)?\b": "seu",      # Amb√≠guo ‚Äî manter neutro
    r"\bsua(s)?\b": "seu",

    # Artigos e determinantes
    r"\bo(s)?\b": "le",
    r"\ba(s)?\b": "le",
    r"\bum(s)?\b": "une",
    r"\buma(s)?\b": "une",

    # Substantivos comuns
    r"\baluno(s)?\b": "estudante",
    r"\baluna(s)?\b": "estudante",
    r"\bprofessor(es)?\b": "docente",
    r"\bprofessora(s)?\b": "docente",
    r"\bmenino(s)?\b": "crian√ßa",
    r"\bmenina(s)?\b": "crian√ßa",
    r"\bgaroto(s)?\b": "jovem",
    r"\bgarota(s)?\b": "jovem",

    # Adjetivos e outros marcadores
    r"\btodos\b": "todes",
    r"\btodas\b": "todes",
    r"\bbem-vindo(s)?\b": "bem-vinde",
    r"\bbem-vinda(s)?\b": "bem-vinde",
    r"\bquerido(s)?\b": "queride",
    r"\bquerida(s)?\b": "queride",
    r"\bobrigado\b": "obrigade",
    r"\bobrigada\b": "obrigade",

    # Tratamentos formais
    r"\bsenhor(es)?\b": "pessoa",
    r"\bsenhora(s)?\b": "pessoa",
    r"\bmo√ßo(s)?\b": "pessoa",
    r"\bmo√ßa(s)?\b": "pessoa",
}


In [8]:
import re

def neutralizar_texto(texto, regras=tradutor_neutro):
    """
    @brief Aplica regras de neutraliza√ß√£o de g√™nero em um texto usando express√µes regulares.

    Esta fun√ß√£o percorre um dicion√°rio de padr√µes regex e substitui√ß√µes neutras,
    e aplica cada uma delas ao texto fornecido. Serve como n√∫cleo do sistema de
    transforma√ß√£o lingu√≠stica para linguagem neutra.

    @param texto (str): Texto original com termos possivelmente marcados por g√™nero.
    @param regras (dict): Dicion√°rio de padr√µes regex e palavras neutras.

    @return str: Texto com as palavras marcadas por g√™nero substitu√≠das por formas neutras.
    """
    for padrao, neutro in regras.items():
        texto = re.sub(padrao, neutro, texto, flags=re.IGNORECASE)
    return texto


In [9]:
exemplos_simples = [
    "A professora querida agradeceu a todos os alunos pela ajuda.",
    "Ele e a menina chegaram juntos, bem-vindos √† cerim√¥nia.",
    "Todos os garotos e todas as garotas estavam empolgados para a viagem.",
    "Dela era a miss√£o de orientar os alunos mais novos.",
    "O senhor e a senhora participaram da reuni√£o com o diretor.",
    "A garota ajudou o menino a encontrar a professora.",
    "Obrigado, querido aluno, pela sua aten√ß√£o.",
    "As mo√ßas e os rapazes se apresentaram ao professor com entusiasmo.",
    "O aluno e a aluna entregaram os trabalhos ao mesmo tempo.",
    "Ela disse que seu amigo e sua amiga n√£o poderiam comparecer.",
]


In [10]:
for frase in exemplos_simples:
    print("Original:", frase)
    print("Neutro  :", neutralizar_texto(frase))
    print()


Original: A professora querida agradeceu a todos os alunos pela ajuda.
Neutro  : le docente queride agradeceu le todes le estudante pela ajuda.

Original: Ele e a menina chegaram juntos, bem-vindos √† cerim√¥nia.
Neutro  : elu e le crian√ßa chegaram juntos, bem-vinde √† cerim√¥nia.

Original: Todos os garotos e todas as garotas estavam empolgados para a viagem.
Neutro  : todes le jovem e todes le jovem estavam empolgados para le viagem.

Original: Dela era a miss√£o de orientar os alunos mais novos.
Neutro  : delu era le miss√£o de orientar le estudante mais novos.

Original: O senhor e a senhora participaram da reuni√£o com o diretor.
Neutro  : le pessoa e le pessoa participaram da reuni√£o com le diretor.

Original: A garota ajudou o menino a encontrar a professora.
Neutro  : le jovem ajudou le crian√ßa le encontrar le docente.

Original: Obrigado, querido aluno, pela sua aten√ß√£o.
Neutro  : obrigade, queride estudante, pela seu aten√ß√£o.

Original: As mo√ßas e os rapazes se aprese