In [1]:
import torch
import torch.nn as nn
import torch.nn.functional as F
from torch_geometric.nn import GATv2Conv, global_mean_pool, global_max_pool

class HybridNeutralizationModel(nn.Module):
    """
    Arquitetura de Rede Neuronal H√≠brida (GNN + Sem√¢ntica) para o M√≥dulo 1.

    Esta classe define a estrutura do modelo que prev√™ a aptid√£o viral (neutraliza√ß√£o).
    Cumpre o Requisito de Inova√ß√£o atrav√©s do uso de Graph Attention Networks (GATv2).


    Inputs:
        1. Dados Estruturais (Grafo 3D do Anticorpo):
           - Constru√≠do a partir das coordenadas dos √°tomos das cadeias Pesada (H) e Leve (L).
           - Os n√≥s do grafo representam os amino√°cidos da sequ√™ncia; as arestas representam a proximidade espacial.
        2. Dados Sem√¢nticos (ID da Variante Viral):
           - Representa√ß√£o vetorial da variante alvo.
    """

    def __init__(self, num_node_features=1, num_variants=10, embedding_dim=64, hidden_dim=128):
        super(HybridNeutralizationModel, self).__init__()

        # --- COMPONENTE A: CODIFICADOR ESTRUTURAL (GNN) ---
        # Objetivo: Extrair features geom√©tricas do anticorpo (CDRs, loops, superf√≠cie).
        # Escolha: GATv2 (Graph Attention Network) para permitir que o modelo
        # aprenda a focar-se em res√≠duos cr√≠ticos e ignorar o esqueleto r√≠gido.

        # 1. Embedding de Amino√°cidos (Representa√ß√£o Qu√≠mica)
        # Transforma o √≠ndice do amino√°cido (0-20) num vetor denso.
        self.node_embedding = nn.Embedding(21, hidden_dim)

        # 2. Camadas de Convolu√ß√£o em Grafos (Extra√ß√£o de Padr√µes 3D)
        # Camada 1: Extrai rela√ß√µes locais vizinhan√ßa-vizinhan√ßa
        self.conv1 = GATv2Conv(hidden_dim, hidden_dim, heads=4, concat=True, dropout=0.1)

        # Camada 2: Refina a representa√ß√£o (Output dim = hidden_dim)
        self.conv2 = GATv2Conv(hidden_dim * 4, hidden_dim, heads=1, concat=False, dropout=0.1)

        # --- COMPONENTE B: CODIFICADOR SEM√ÇNTICO (NLP) ---
        # Objetivo: Representar a variante viral num espa√ßo vetorial.
        # Isto permite ao modelo generalizar para diferentes variantes sem precisar da sua estrutura 3D.
        self.variant_embedding = nn.Embedding(num_embeddings=num_variants, embedding_dim=hidden_dim)

        # --- COMPONENTE C: M√ìDULO DE FUS√ÉO E PREVIS√ÉO ---
        # Objetivo: Cruzar a informa√ß√£o do anticorpo com a da variante.

        # A dimens√£o de entrada √© a soma das features do Grafo + features da Variante
        self.fusion_dim = hidden_dim * 2

        self.classifier = nn.Sequential(
            nn.Linear(self.fusion_dim, 128),
            nn.BatchNorm1d(128), # Estabiliza√ß√£o do treino
            nn.ReLU(),
            nn.Dropout(0.3),     # Regulariza√ß√£o para evitar overfitting

            nn.Linear(128, 64),
            nn.ReLU(),

            nn.Linear(64, 1)     # Output Final: Logits (Probabilidade n√£o normalizada)
        )

    def forward(self, data, variant_ids):
        """
        Define o fluxo de dados (Data Flow) atrav√©s da rede.
        """
        # 1. Extra√ß√£o de Inputs do Batch
        x, edge_index, batch = data.x, data.edge_index, data.batch

        # 2. Processamento do Grafo (Anticorpo)
        x = self.node_embedding(x.squeeze())

        x = self.conv1(x, edge_index)
        x = F.elu(x)
        x = self.conv2(x, edge_index)
        x = F.elu(x)

        # Global Pooling: Compactar todos os n√≥s num √∫nico vetor que representa o anticorpo inteiro.
        # Usamos (Mean + Max) para capturar tanto a forma m√©dia como caracter√≠sticas extremas.
        x_graph = global_mean_pool(x, batch) + global_max_pool(x, batch)

        # 3. Processamento da Variante
        x_variant = self.variant_embedding(variant_ids)

        # 4. Fus√£o Multi-Modal
        # Aqui acontece a "magia": o modelo correlaciona a estrutura com a variante
        combined = torch.cat([x_graph, x_variant], dim=1)

        # 5. Classifica√ß√£o
        logits = self.classifier(combined)

        return logits

# --- BLOCO DE VALIDA√á√ÉO T√âCNICA (Para a Apresenta√ß√£o) ---
if __name__ == "__main__":
    print("--- üèóÔ∏è Valida√ß√£o da Arquitetura Inicial (M√≥dulo 1) ---")

    # 1. Instanciar o Modelo
    try:
        model = HybridNeutralizationModel(num_node_features=1, num_variants=50)
        print("‚úÖ Modelo instanciado com sucesso.")

        # 2. Imprimir Estat√≠sticas
        num_params = sum(p.numel() for p in model.parameters())
        print(f"‚úÖ Complexidade do Modelo: {num_params:,} par√¢metros trein√°veis.")
        print("‚úÖ Arquitetura definida: GNN (GATv2) + Embedding + MLP.")

        print("\n--- Estrutura das Camadas ---")
        print(model)

    except Exception as e:
        print(f"‚ùå Erro na defini√ß√£o do modelo: {e}")

--- üèóÔ∏è Valida√ß√£o da Arquitetura Inicial (M√≥dulo 1) ---
‚úÖ Modelo instanciado com sucesso.
‚úÖ Complexidade do Modelo: 315,265 par√¢metros trein√°veis.
‚úÖ Arquitetura definida: GNN (GATv2) + Embedding + MLP.

--- Estrutura das Camadas ---
HybridNeutralizationModel(
  (node_embedding): Embedding(21, 128)
  (conv1): GATv2Conv(128, 128, heads=4)
  (conv2): GATv2Conv(512, 128, heads=1)
  (variant_embedding): Embedding(50, 128)
  (classifier): Sequential(
    (0): Linear(in_features=256, out_features=128, bias=True)
    (1): BatchNorm1d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (2): ReLU()
    (3): Dropout(p=0.3, inplace=False)
    (4): Linear(in_features=128, out_features=64, bias=True)
    (5): ReLU()
    (6): Linear(in_features=64, out_features=1, bias=True)
  )
)


# Especifica√ß√£o T√©cnica da Arquitetura de Modela√ß√£o (M√≥dulo 1)

## 1. Defini√ß√£o Formal do Modelo

O modelo desenvolvido √© classificado como uma **Rede Neuronal H√≠brida Multi-Modal (*Multi-Modal Hybrid Neural Network*)**.

A sua fun√ß√£o matem√°tica, , procura aproximar a probabilidade condicional de neutraliza√ß√£o , dados dois inputs heterog√©neos: a estrutura topol√≥gica do anticorpo () e a identidade sem√¢ntica da variante viral ().

Onde:

*  √© o grafo molecular do anticorpo.
*  √© o identificador categ√≥rico da variante.
*  representa os par√¢metros trein√°veis da rede.
*  √© a fun√ß√£o de ativa√ß√£o Sigm√≥ide que mapeia o output para o intervalo .

---

## 2. Decomposi√ß√£o da Arquitetura

A rede est√° estruturada em tr√™s blocos funcionais sequenciais:

### Bloco A: Codificador Estrutural (The Structural Encoder)

**Objetivo:** Transformar a estrutura 3D complexa e esparsa do anticorpo num vetor de caracter√≠sticas latentes de dimens√£o fixa.

* **Representa√ß√£o de Entrada (Input):** O anticorpo n√£o √© tratado como uma imagem (grid Euclidiana), mas sim como um **Grafo Geom√©trico n√£o-Euclidiano**.
* **N√≥s ():** Cada n√≥ representa um res√≠duo de amino√°cido (Cadeias Pesada e Leve).
* **Arestas ():** Definidas por um *cutoff* de dist√¢ncia espacial (< 10 √Öngstr√∂ms) entre Carbonos-Alfa (). Isto captura as intera√ß√µes n√£o-covalentes e a geometria de dobragem da prote√≠na.
* **Features dos N√≥s:** Inicialmente, cada n√≥ possui apenas um √≠ndice inteiro representando o seu tipo de amino√°cido (0-20). Uma camada de *Embedding* () projeta este √≠ndice num espa√ßo vetorial denso (), permitindo √† rede aprender propriedades f√≠sico-qu√≠micas (ex: hidrofobicidade, carga) de forma aut√≥noma.


* **Mecanismo de Processamento: Graph Attention Networks (GATv2):**
Em vez de convolu√ß√µes em grafos padr√£o (GCN), utilizamos a arquitetura **GATv2**.
* *Justifica√ß√£o Te√≥rica:* Numa intera√ß√£o anticorpo-antig√©nio, nem todos os res√≠duos s√£o iguais. Apenas os res√≠duos nas regi√µes CDR (*Complementarity-Determining Regions*) interagem diretamente com o v√≠rus.
* *Mecanismo:* A GATv2 aplica um **Mecanismo de Aten√ß√£o (*Self-Attention*)**. Para cada n√≥, a rede calcula uma pontua√ß√£o de import√¢ncia para os seus vizinhos. Isto permite ao modelo "aprender a olhar" preferencialmente para as regi√µes estruturais cr√≠ticas para a liga√ß√£o, ignorando o "ru√≠do" do esqueleto proteico conservado.


* **Agrega√ß√£o (Global Pooling):**
Ap√≥s as camadas convolucionais, o grafo de  n√≥s precisa de ser reduzido a um √∫nico vetor que represente a mol√©cula inteira. Utilizamos uma estrat√©gia h√≠brida:



Isto captura tanto a composi√ß√£o m√©dia do anticorpo como a presen√ßa de caracter√≠sticas locais fortes (motivos estruturais espec√≠ficos).

### Bloco B: Codificador Sem√¢ntico (The Semantic Encoder)

**Objetivo:** Injetar o contexto biol√≥gico da variante viral alvo.

* **O Problema dos Dados:** Como o dataset de treino possui apenas a identifica√ß√£o nominal das variantes (ex: "Omicron", "Delta") e n√£o as suas estruturas 3D complexadas, a estrutura viral n√£o pode ser inserida na GNN.
* **A Solu√ß√£o (Learned Embeddings):**
Utilizamos uma camada de *Embedding* que mapeia cada ID de variante () para um vetor denso ().
* Durante o processo de *Backpropagation*, a rede ajusta os valores deste vetor.
* **Interpreta√ß√£o:** Variantes que s√£o neutralizadas pelos mesmos anticorpos acabar√£o por ter representa√ß√µes vetoriais matematicamente pr√≥ximas neste espa√ßo latente ("Clusteriza√ß√£o Funcional").
Justifica√ß√£o da Escolha:
* **Roadmap Futuro**: Para a vers√£o final, planeamos enriquecer o dataset com sequ√™ncias externas (NCBI) para substituir este m√≥dulo por um processador de sequ√™ncias (ProtBERT), permitindo generaliza√ß√£o total.



### Bloco C: M√≥dulo de Fus√£o e Classifica√ß√£o (Fusion & MLP Head)

**Objetivo:** Correlacionar a estrutura do anticorpo com a identidade do v√≠rus para prever o fen√≥tipo.

* **Fus√£o Multi-Modal:** Os vetores latentes do anticorpo () e da variante () s√£o concatenados, criando um vetor √∫nico que representa o **par biol√≥gico**.


* **Perceptr√£o Multicamada (MLP):**
O vetor combinado atravessa camadas densas (*Linear Layers*) que aprendem as rela√ß√µes n√£o-lineares complexas entre a forma do anticorpo e o tipo de v√≠rus.
* **Regulariza√ß√£o e Estabilidade:**
* **Batch Normalization:** Normaliza os outputs de cada camada interm√©dia para estabilizar e acelerar o treino.
* **Dropout (0.3):** Desativa aleatoriamente 30% dos neur√≥nios durante o treino. Isto introduz ru√≠do estoc√°stico que previne o modelo de "memorizar" exemplos espec√≠ficos (*Overfitting*), for√ßando-o a aprender padr√µes generaliz√°veis.



---

## 3. Fluxo de Aprendizagem (Training Dynamics)

Embora a classe `HybridNeutralizationModel` defina a estrutura (o "corpo"), a intelig√™ncia surge atrav√©s do processo de otimiza√ß√£o:

1. **Forward Pass (Infer√™ncia):** Os dados fluem da entrada para a sa√≠da, gerando uma previs√£o .
2. **C√°lculo de Perda (Loss Function):** Utilizamos a **Entropia Cruzada Bin√°ria com Logits (*BCEWithLogitsLoss*)**. Esta fun√ß√£o mede a dist√¢ncia matem√°tica entre a previs√£o do modelo e a realidade biol√≥gica (0 ou 1).
3. **Backward Pass (Retropropaga√ß√£o):** O algoritmo de *Backpropagation* calcula o gradiente do erro em rela√ß√£o a cada um dos ~315.000 par√¢metros da rede.
4. **Otimiza√ß√£o (Adam):** O otimizador atualiza os pesos na dire√ß√£o oposta ao gradiente para minimizar o erro na pr√≥xima itera√ß√£o.

---

## 4. Resumo das Inova√ß√µes (M√≥dulo 1)

Esta arquitetura cumpre os requisitos de inova√ß√£o do projeto atrav√©s de:

1. **Deep Learning Geom√©trico:** Abandono de descritores lineares cl√°ssicos em favor de representa√ß√µes baseadas em grafos que preservam a topologia 3D nativa.
2. **Mecanismos de Aten√ß√£o:** Uso de GATv2 para mimetizar o foco biol√≥gico nas regi√µes de intera√ß√£o.