<a href="https://colab.research.google.com/github/Giovanni-Ornellas/IA-de-Linguagem-Neutra/blob/develop/IA_de_linguagem_Neutra.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## 💾 Como Salvar este Notebook no GitHub

Para manter o versionamento deste projeto e colaborar com a equipe, siga os passos abaixo para salvar este notebook diretamente no seu repositório GitHub:

1. Vá até o menu superior e clique em **Arquivo > Salvar uma cópia no GitHub**.
2. Escolha o repositório desejado e, se quiser, uma pasta específica.
3. Escreva uma mensagem clara de commit, por exemplo: `"Atualiza pré-processamento de texto para linguagem neutra"`.
4. Clique em **OK** para fazer o commit.

**Sempre que fizer alterações importantes**, salve no GitHub para manter o histórico e facilitar o trabalho em equipe!

> Este notebook deve ser versionado no repositório oficial:
> https://github.com/Giovanni-Ornellas/IA-de-Linguagem-Neutra/tree/develop
> Se não tiver acesso, solicite permissão.

Sempre salve na branch develop até que esteja, pois a main só será usada para salvar versões estáveis do código!
---


##  Primeira Versão - Substituição por Regras (Regex)

Nesta primeira versão do projeto de linguagem neutra, implementaremos um sistema baseado em **expressões regulares (regex)** para transformar frases marcadas por gênero em versões neutras.

###  Objetivo
Criar um **MVP (Produto Mínimo Viável)** funcional, capaz de demonstrar a viabilidade da ideia de neutralização textual de forma simples, rápida e interpretável.

---

### Por que usar Regex primeiro?

Utilizar regex como abordagem inicial oferece diversas vantagens no início do desenvolvimento:

- ✅ **Rápida implementação**: poucas linhas de código já entregam resultados funcionais.
- ✅ **Sem necessidade de treinamento de modelos**: não requer datasets extensos ou GPUs.
- ✅ **Facilidade para testar regras linguísticas**: ideal para validar quais substituições fazem sentido.
- ✅ **Alta interpretabilidade**: todas as transformações são visíveis e compreensíveis.
- ✅ **Boa base para comparações futuras**: os resultados dessa versão servirão de referência para avaliar modelos baseados em IA.

---

### 🔄 Sobre a abordagem
A substituição foi feita com base em um **dicionário de padrões regulares**, que cobre pronomes, possessivos, artigos, substantivos comuns e adjetivos marcados por gênero. A transformação busca sempre **preservar o sentido** da frase, enquanto neutraliza o gênero de forma respeitosa e coerente.

Exemplo:



In [4]:
"""
Dicionário de substituições para neutralização de gênero em texto.

Cada entrada do dicionário utiliza uma expressão regular (regex) para identificar
palavras ou padrões de linguagem marcados por gênero, substituindo-os por formas
neutras. Este recurso será usado na função principal de transformação de texto
como parte da primeira versão (MVP) do projeto de linguagem neutra.
"""
tradutor_neutro = {
    # Pronomes pessoais
    r"\bele(s)?\b": "elu",
    r"\bela(s)?\b": "elu",

    # Pronomes possessivos
    r"\bdele(s)?\b": "delu",
    r"\bdela(s)?\b": "delu",
    r"\bseu(s)?\b": "seu",      # Ambíguo — manter neutro
    r"\bsua(s)?\b": "seu",

    # Artigos e determinantes
    r"\bo(s)?\b": "le",
    r"\ba(s)?\b": "le",
    r"\bum(s)?\b": "une",
    r"\buma(s)?\b": "une",

    # Substantivos comuns
    r"\baluno(s)?\b": "estudante",
    r"\baluna(s)?\b": "estudante",
    r"\bprofessor(es)?\b": "docente",
    r"\bprofessora(s)?\b": "docente",
    r"\bmenino(s)?\b": "criança",
    r"\bmenina(s)?\b": "criança",
    r"\bgaroto(s)?\b": "jovem",
    r"\bgarota(s)?\b": "jovem",

    # Adjetivos e outros marcadores
    r"\btodos\b": "todes",
    r"\btodas\b": "todes",
    r"\bbem-vindo(s)?\b": "bem-vinde",
    r"\bbem-vinda(s)?\b": "bem-vinde",
    r"\bquerido(s)?\b": "queride",
    r"\bquerida(s)?\b": "queride",
    r"\bobrigado\b": "obrigade",
    r"\bobrigada\b": "obrigade",

    # Tratamentos formais
    r"\bsenhor(es)?\b": "pessoa",
    r"\bsenhora(s)?\b": "pessoa",
    r"\bmoço(s)?\b": "pessoa",
    r"\bmoça(s)?\b": "pessoa",
}


In [8]:
import re

def neutralizar_texto(texto, regras=tradutor_neutro):
    """
    @brief Aplica regras de neutralização de gênero em um texto usando expressões regulares.

    Esta função percorre um dicionário de padrões regex e substituições neutras,
    e aplica cada uma delas ao texto fornecido. Serve como núcleo do sistema de
    transformação linguística para linguagem neutra.

    @param texto (str): Texto original com termos possivelmente marcados por gênero.
    @param regras (dict): Dicionário de padrões regex e palavras neutras.

    @return str: Texto com as palavras marcadas por gênero substituídas por formas neutras.
    """
    for padrao, neutro in regras.items():
        texto = re.sub(padrao, neutro, texto, flags=re.IGNORECASE)
    return texto


In [9]:
exemplos_simples = [
    "A professora querida agradeceu a todos os alunos pela ajuda.",
    "Ele e a menina chegaram juntos, bem-vindos à cerimônia.",
    "Todos os garotos e todas as garotas estavam empolgados para a viagem.",
    "Dela era a missão de orientar os alunos mais novos.",
    "O senhor e a senhora participaram da reunião com o diretor.",
    "A garota ajudou o menino a encontrar a professora.",
    "Obrigado, querido aluno, pela sua atenção.",
    "As moças e os rapazes se apresentaram ao professor com entusiasmo.",
    "O aluno e a aluna entregaram os trabalhos ao mesmo tempo.",
    "Ela disse que seu amigo e sua amiga não poderiam comparecer.",
]


In [10]:
for frase in exemplos_simples:
    print("Original:", frase)
    print("Neutro  :", neutralizar_texto(frase))
    print()


Original: A professora querida agradeceu a todos os alunos pela ajuda.
Neutro  : le docente queride agradeceu le todes le estudante pela ajuda.

Original: Ele e a menina chegaram juntos, bem-vindos à cerimônia.
Neutro  : elu e le criança chegaram juntos, bem-vinde à cerimônia.

Original: Todos os garotos e todas as garotas estavam empolgados para a viagem.
Neutro  : todes le jovem e todes le jovem estavam empolgados para le viagem.

Original: Dela era a missão de orientar os alunos mais novos.
Neutro  : delu era le missão de orientar le estudante mais novos.

Original: O senhor e a senhora participaram da reunião com o diretor.
Neutro  : le pessoa e le pessoa participaram da reunião com le diretor.

Original: A garota ajudou o menino a encontrar a professora.
Neutro  : le jovem ajudou le criança le encontrar le docente.

Original: Obrigado, querido aluno, pela sua atenção.
Neutro  : obrigade, queride estudante, pela seu atenção.

Original: As moças e os rapazes se apresentaram ao profe