In [4]:
import torch
import torch.nn as nn
print(torch.__version__)

2.0.1+cu117


In [2]:
class TextClassifier(nn.Module):
    def __init__(self, vocab_size, embedding_dim, hidden_dim, output_dim):
        super().__init__()

        # Capa de embedding para mapear índices de palabras a vectores de embeddings
        self.embedding = nn.Embedding(vocab_size, embedding_dim)

        # Capa LSTM para procesar los embeddings y obtener estados ocultos
        self.rnn = nn.LSTM(embedding_dim, hidden_dim, num_layers=2, batch_first=True)

        # Capa lineal para proyectar el último estado oculto en la salida final
        self.fc = nn.Linear(hidden_dim, output_dim)

    def forward(self, text):
        # Obtener los embeddings de las palabras
        embedded = self.embedding(text)

        # Propagar los embeddings a través de la capa LSTM
        output, (hidden, cell) = self.rnn(embedded)

        # Seleccionar el último estado oculto como estado final
        final_hidden = hidden[-1]

        # Pasar el estado final a través de la capa lineal para obtener la salida final
        return self.fc(final_hidden)


# Parámetros del modelo
vocab_size = 10000
embedding_dim = 100
hidden_dim = 256
output_dim = 2

# Crear instancia del modelo
model = TextClassifier(vocab_size, embedding_dim, hidden_dim, output_dim)

# Imprimir la estructura del modelo
print(model)

TextClassifier(
  (embedding): Embedding(10000, 100)
  (rnn): LSTM(100, 256, num_layers=2, batch_first=True)
  (fc): Linear(in_features=256, out_features=2, bias=True)
)


In [3]:
class MultiHeadedAttention(nn.Module):
  def __init__(self, h, d_modelo):
    "Se reciben el número de cabezas (h) y las dimensiones de cada cabeza (d)"
    super(MultiHeadedAttention, self).__init__()
    self.h = h
    self.d_modelo = d_modelo
    self.linear_w0 = nn.Linear(d_modelo, d_modelo)

  def forward(self, query, key, value):
    "Definimos el grafo a seguir."
    query = query.view(-1, self.h, int(self.d_modelo / self.h)).transpose(1,2)
    key = key.view(-1, self.h, int(self.d_modelo / self.h)).transpose(1,2)
    value = value.view(-1, self.h, int(self.d_modelo / self.h)).transpose(1,2)

    z, _ = attention(query, key, value)

    z = z.transpose(1,2).contiguous().view(n_palabras, -1)

    z = linear_w0(z)

    return z