In [67]:
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import Dataset, DataLoader
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from tqdm import tqdm
from collections import Counter
from rich import print
from sklearn.metrics import precision_score, recall_score, mean_absolute_error


In [97]:

class GenomicTokenizer:
    def __init__(self, ngram=5, stride=2):
        self.ngram = ngram
        self.stride = stride
        
    def tokenize(self, t):
        t = t.upper()
        if self.ngram == 1:
            toks = list(t)
        else:
            toks = [t[i:i+self.ngram] for i in range(0, len(t), self.stride) if len(t[i:i+self.ngram]) == self.ngram]
        if len(toks[-1]) < self.ngram:
            toks = toks[:-1]
        return toks


class GenomicVocab:
    def __init__(self, itos):
        self.itos = itos
        self.stoi = {v:k for k,v in enumerate(self.itos)}
        
    @classmethod
    def create(cls, tokens, max_vocab, min_freq):
        freq = Counter(tokens)
        itos = ['<pad>'] + [o for o,c in freq.most_common(max_vocab-1) if c >= min_freq]
        return cls(itos)


class SiRNADataset(Dataset):
    def __init__(self, df, columns, vocab, tokenizer, max_len):
        self.df = df
        self.columns = columns
        self.vocab = vocab
        self.tokenizer = tokenizer
        self.max_len = max_len

    def __len__(self):
        return len(self.df)

    def __getitem__(self, idx):
        row = self.df.iloc[idx]
        
        seqs = [self.tokenize_and_encode(row[col]) for col in self.columns]
        target = torch.tensor(row['mRNA_remaining_pct'], dtype=torch.float)

        return seqs, target

    def tokenize_and_encode(self, seq):
        if ' ' in seq:  # Modified sequence
            tokens = seq.split()
        else:  # Regular sequence
            tokens = self.tokenizer.tokenize(seq)
        
        encoded = [self.vocab.stoi.get(token, 0) for token in tokens]  # Use 0 (pad) for unknown tokens
        padded = encoded + [0] * (self.max_len - len(encoded))
        return torch.tensor(padded[:self.max_len], dtype=torch.long)



In [98]:

class SiRNAModel(nn.Module):
    def __init__(self, vocab_size, embed_dim=200, hidden_dim=256, n_layers=3, dropout=0.2):
        super(SiRNAModel, self).__init__()
        
        self.embedding = nn.Embedding(vocab_size, embed_dim, padding_idx=0)
        self.lstm = nn.LSTM(embed_dim, hidden_dim, n_layers, bidirectional=True, batch_first=True, dropout=dropout)
        self.attention = nn.Linear(hidden_dim * 2, 1)
        self.fc = nn.Linear(hidden_dim * 4, 1)
        self.dropout = nn.Dropout(dropout)
        self.layer_norm = nn.LayerNorm(hidden_dim * 4)
    
    def forward(self, x):
        embedded = [self.embedding(seq) for seq in x]
        outputs = []
        for embed in embedded:
            x, _ = self.lstm(embed)
            
            # Apply attention
            attn_weights = torch.softmax(self.attention(x), dim=1)
            x = torch.sum(attn_weights * x, dim=1)  # Apply attention weights
            
            x = self.dropout(x)  # Dropout on the attended output
            outputs.append(x)
        
        x = torch.cat(outputs, dim=1)
        x = self.layer_norm(x)
        x = self.fc(x)
        return x.squeeze()


def calculate_metrics(y_true, y_pred, threshold=30):
    mae = np.mean(np.abs(y_true - y_pred))

    y_true_binary = (y_true < threshold).astype(int)
    y_pred_binary = (y_pred < threshold).astype(int)

    mask = (y_pred >= 0) & (y_pred <= threshold)
    range_mae = mean_absolute_error(y_true[mask], y_pred[mask]) if mask.sum() > 0 else 100

    precision = precision_score(y_true_binary, y_pred_binary, average='binary')
    recall = recall_score(y_true_binary, y_pred_binary, average='binary')
    f1 = 2 * precision * recall / (precision + recall)
    score = (1 - mae / 100) * 0.5 + (1 - range_mae / 100) * f1 * 0.5
    return score



def train_model(model, train_loader, val_loader, criterion, optimizer, num_epochs=50, device='cuda'):
    model.to(device)
    best_score = -float('inf')
    best_model = None

    for epoch in range(num_epochs):
        model.train()
        train_loss = 0
        for inputs, targets in tqdm(train_loader, desc=f'Epoch {epoch+1}/{num_epochs}'):
            inputs = [x.to(device) for x in inputs]
            targets = targets.to(device)
            
            optimizer.zero_grad()
            outputs = model(inputs)
            loss = criterion(outputs, targets)
            loss.backward()
            optimizer.step()
            
            train_loss += loss.item()
        
        model.eval()
        val_loss = 0
        val_preds = []
        val_targets = []

        with torch.no_grad():
            for inputs, targets in val_loader:
                inputs = [x.to(device) for x in inputs]
                targets = targets.to(device)
                outputs = model(inputs)
                loss = criterion(outputs, targets)
                val_loss += loss.item()
                val_preds.extend(outputs.cpu().numpy())
                val_targets.extend(targets.cpu().numpy())
        
        train_loss /= len(train_loader)
        val_loss /= len(val_loader)
        
        val_preds = np.array(val_preds)
        val_targets = np.array(val_targets)
        score = calculate_metrics(val_targets, val_preds)
        
        print(f'Epoch {epoch+1}/{num_epochs}')
        print(f'Train Loss: {train_loss:.4f}, Val Loss: {val_loss:.4f}')
        print(f'Learning Rate: {optimizer.param_groups[0]["lr"]:.6f}')
        print(f'Validation Score: {score:.4f}')

        if score > best_score:
            best_score = score
            best_model = model.state_dict().copy()
            print(f'New best model found with socre: {best_score:.4f}')

    return best_model

def evaluate_model(model, test_loader, device='cuda'):
    model.eval()
    predictions = []
    targets = []
    
    with torch.no_grad():
        for inputs, target in test_loader:
            inputs = [x.to(device) for x in inputs]
            outputs = model(inputs)
            predictions.extend(outputs.cpu().numpy())
            targets.extend(target.numpy())

    y_pred = np.array(predictions)
    y_test = np.array(targets)
    
    score = calculate_metrics(y_test, y_pred)
    print(f"Test Score: {score:.4f}")



In [99]:

device = 'cuda' if torch.cuda.is_available() else 'cpu'

# Load data
train_data = pd.read_csv('train_data.csv')
columns = ['siRNA_antisense_seq', 'modified_siRNA_antisense_seq_list']

train_data.dropna(subset=columns + ['mRNA_remaining_pct'], inplace=True)
train_data, val_data = train_test_split(train_data, test_size=0.1, random_state=42)

# Create vocabulary
tokenizer = GenomicTokenizer(ngram=9, stride=2)

all_tokens = []
for col in columns:
    for seq in train_data[col]:
        if ' ' in seq:  # Modified sequence
            all_tokens.extend(seq.split())
        else:
            all_tokens.extend(tokenizer.tokenize(seq))
vocab = GenomicVocab.create(all_tokens, max_vocab=10000, min_freq=1)

# Find max sequence length (==25 in this case)
max_len = max(max(len(seq.split()) if ' ' in seq else len(tokenizer.tokenize(seq)) 
                    for seq in train_data[col]) for col in columns)


In [102]:

# Create datasets
train_dataset = SiRNADataset(train_data, columns, vocab, tokenizer, max_len)
val_dataset = SiRNADataset(val_data, columns, vocab, tokenizer, max_len)

# Create data loaders
train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)
val_loader = DataLoader(val_dataset, batch_size=32)


# Initialize model
model = SiRNAModel(len(vocab.itos))
criterion = nn.MSELoss()
optimizer = optim.Adam(model.parameters(), lr=0.002)


In [103]:

train_model(model, train_loader, val_loader, criterion, optimizer, 50, device)


Epoch 1/50: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:54<00:00,  6.37it/s]
  _warn_prf(average, modifier, f"{metric.capitalize()} is", len(result))
  f1 = 2 * precision * recall / (precision + recall)


Epoch 2/50: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:53<00:00,  6.37it/s]


Epoch 3/50: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:54<00:00,  6.36it/s]


Epoch 4/50: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:56<00:00,  6.22it/s]


Epoch 5/50: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:54<00:00,  6.36it/s]


Epoch 6/50: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:54<00:00,  6.33it/s]


Epoch 7/50: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:55<00:00,  6.30it/s]


Epoch 8/50: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:55<00:00,  6.30it/s]


Epoch 9/50: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:54<00:00,  6.33it/s]


Epoch 10/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:56<00:00,  6.24it/s]


Epoch 11/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:55<00:00,  6.28it/s]


Epoch 12/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:55<00:00,  6.28it/s]


Epoch 13/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:55<00:00,  6.27it/s]


Epoch 14/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:56<00:00,  6.25it/s]


Epoch 15/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:56<00:00,  6.24it/s]


Epoch 16/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:57<00:00,  6.20it/s]


Epoch 17/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:58<00:00,  6.12it/s]


Epoch 18/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:58<00:00,  6.13it/s]


Epoch 19/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:58<00:00,  6.10it/s]


Epoch 20/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:58<00:00,  6.10it/s]


Epoch 21/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:59<00:00,  6.08it/s]


Epoch 22/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:59<00:00,  6.09it/s]


Epoch 23/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:59<00:00,  6.07it/s]


Epoch 24/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:59<00:00,  6.06it/s]


Epoch 25/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [02:00<00:00,  6.04it/s]


Epoch 26/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:59<00:00,  6.07it/s]


Epoch 27/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:59<00:00,  6.06it/s]


Epoch 28/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [02:00<00:00,  6.05it/s]


Epoch 29/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [02:00<00:00,  6.01it/s]


Epoch 30/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [02:03<00:00,  5.86it/s]


Epoch 31/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [02:00<00:00,  6.01it/s]


Epoch 32/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:58<00:00,  6.11it/s]


Epoch 33/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [02:01<00:00,  5.96it/s]


Epoch 34/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [02:00<00:00,  6.02it/s]


Epoch 35/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [02:01<00:00,  6.00it/s]


Epoch 36/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:52<00:00,  6.45it/s]


Epoch 37/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:50<00:00,  6.55it/s]


Epoch 38/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:52<00:00,  6.47it/s]


Epoch 39/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:51<00:00,  6.51it/s]


Epoch 40/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:53<00:00,  6.40it/s]


Epoch 41/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:52<00:00,  6.45it/s]


Epoch 42/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:56<00:00,  6.24it/s]


Epoch 43/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:55<00:00,  6.28it/s]


Epoch 44/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:54<00:00,  6.33it/s]


Epoch 45/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:55<00:00,  6.29it/s]


Epoch 46/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:52<00:00,  6.44it/s]


Epoch 47/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:54<00:00,  6.33it/s]


Epoch 48/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:54<00:00,  6.34it/s]


Epoch 49/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:53<00:00,  6.41it/s]


Epoch 50/50: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 726/726 [01:55<00:00,  6.31it/s]


OrderedDict([('embedding.weight',
              tensor([[ 0.0000,  0.0000,  0.0000,  ...,  0.0000,  0.0000,  0.0000],
                      [-0.2887, -0.4800, -0.6377,  ..., -1.0781, -0.0733, -0.2984],
                      [ 0.0484,  0.1830, -1.0581,  ..., -0.1943, -0.8987,  0.2708],
                      ...,
                      [ 0.9330,  0.8001,  0.4689,  ..., -1.6466,  0.1337,  0.2197],
                      [ 0.4705,  0.2970, -0.1352,  ..., -0.0710,  0.2592, -2.4104],
                      [-1.3390, -1.2971,  1.6403,  ...,  0.4002,  0.8238, -0.2867]])),
             ('lstm.weight_ih_l0',
              tensor([[-0.0904,  0.3925, -0.1041,  ..., -0.2597,  0.0713, -0.2107],
                      [ 0.3379,  0.3167, -0.4686,  ..., -0.0332, -0.0452,  0.1079],
                      [ 0.3379,  0.1414,  0.2184,  ...,  0.4023,  0.1695,  0.2794],
                      ...,
                      [ 0.3224, -0.4389,  0.0124,  ...,  0.2079, -0.0164, -0.2543],
                      [ 0.4327,  0

In [8]:
train_data
# a Af u a a Af a u u c a g g Af a Uf u c c u g c u
# a Af u a a Af a u u c a g g Af a Uf u c c u g c u

Unnamed: 0,id,publication_id,gene_target_symbol_name,gene_target_ncbi_id,gene_target_species,siRNA_duplex_id,siRNA_sense_seq,siRNA_antisense_seq,cell_line_donor,siRNA_concentration,concentration_unit,Transfection_method,Duration_after_transfection_h,modified_siRNA_sense_seq,modified_siRNA_antisense_seq,modified_siRNA_sense_seq_list,modified_siRNA_antisense_seq_list,gene_target_seq,mRNA_remaining_pct
15055,31472,WOda137ca368,ANGPTL3,NM_014495.3,Homo sapiens,AD-1479424.1,UGUUCACAAUUAAGCUCCUUU,AAAGGAGCUUAAUUGUGAACG,Primary Monkey Hepatocytes,0.1,nM,Lipofectamine,24.0,uguucaCfaAfUfUfaagcuccuuuL96,adAagdGa(G2p)cuuaauUfgUfgaacg,u g u u c a Cf a Af Uf Uf a a g c u c c u u u L96,a dA a g dG a (G2p) c u u a a u Uf g Uf g a a c g,ATATATAGAGTTAAGAAGTCTAGGTCTGCTTCCAGAAGAAAACAGT...,100.520
17579,37098,WOf5583f6d6e,Flna,XM_006527911.5,Mus musculus,AD-1692616.1,GCCUUACUGUUUCUAGUCUUA,UAAGACUAGAAACAGUAAGGCGG,COS-7 Cells,1.0,nM,Lipofectamine,48.0,gccuu(Ahd)CfuGfUfUfucuagucuua,VPuAfagaCfuAfGfaaacAfgUfaaggcgg,g c c u u (Ahd) Cf u Gf Uf Uf u c u a g u c u u a,VP u Af a g a Cf u Af Gf a a a c Af g Uf a a g...,TGAGCGGGGCACTTGAGCTCGTGGCGAGCCCCGCACCCACTCCCTG...,14.100
4057,8396,WO6db0c26e50,SCN9A,NM_001365536.1,Homo sapiens,AD-795132.1,AAGGGAAAACAAUCUUCCGUA,UACGGAAGAUUGUUUUCCCUUUG,BE(2)-C Cells,0.1,nM,Lipofectamine,24.0,aaggg(Ahd)AfaAfCfAfaucuuccguaL96,VPuAfcggAfaGfAfuuguUfuUfcccuuug,a a g g g (Ahd) Af a Af Cf Af a u c u u c c g ...,VP u Af c g g Af a Gf Af u u g u Uf u Uf c c c...,AGTCTGCTTGCAGGCGGTCGCCAGCGCTCCAGCGGCGGCTGTCGGC...,83.300
7109,17672,WO2527cd3fe5,ATXN2,NM_002973.3,Homo sapiens,AD-367853.1,GUGAUUCUUGCUGCUAUUACU,AGUAAUAGCAGCAAGAAUCACUC,Hep3B Cells,0.1,nM,Lipofectamine,24.0,gugauuCfuUfGfCfugcuauuacuL96,aGfuaau(Agn)gcagcaAfgAfaucacuc,g u g a u u Cf u Uf Gf Cf u g c u a u u a c u L96,a Gf u a a u (Agn) g c a g c a Af g Af a u c a...,ACCCCCGAGAAAGCAACCCAGCGCGCCGCCCGCTCCTCACGTGTCC...,102.800
3111,6628,WO182f2c5b3a,,,,AD-958787.1,CAGGGCUACCCUUCUAAGGUA,UACCUUAGAAGGGUAGCCCUGCA,Human Trabecular Meshwork Cells,50.0,nM,Lipofectamine,24.0,caggg(Chd)uadCcdCuucuaagguaL96,VPudAccdTudAgaagdGgdTagcccugca,c a g g g (Chd) u a dC c dC u u c u a a g g u ...,VP u dA c c dT u dA g a a g dG g dT a g c c c ...,,64.470
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
21575,48744,WO1b379c9eef,CIDEB,NM_001393338.1,Homo sapiens,AD-1700917.1,UUCACCUUUGACGUGUACAAU,AUUGUACACGUCAAAGGUGAAUC,Hep3B Cells,0.1,nM,Lipofectamine,24.0,uucaccUfuUfGfAfcguguacaauL96,aUfugdTa(Cgn)acgucaAfaGfgugaauc,u u c a c c Uf u Uf Gf Af c g u g u a c a a u L96,a Uf u g dT a (Cgn) a c g u c a Af a Gf g u g ...,CCCTTCCGGTGGAGCCAGCGCTGCGACCGCCTGCAGAAGGTTGACT...,65.700
5390,10992,WOd9a3dd8c47,CFB,NM_001710.5,Homo sapiens,AD-558965.1,UCAGGCUCCAUGAACAUCUAU,AUAGAUGUUCAUGGAGCCUGAAG,Primary Mouse Hepatocytes,1.0,nM,Lipofectamine,24.0,ucaggcUfcCfAfUfgaacaucuauL96,aUfagaUfgUfUfcaugGfaGfccugaag,u c a g g c Uf c Cf Af Uf g a a c a u c u a u L96,a Uf a g a Uf g Uf Uf c a u g Gf a Gf c c u g ...,GACTTCTGCAGTTTCTGTTTCCTTGACTGGCAGCTCAGCGGGGCCC...,94.610
860,2474,WO28aca1a182,ACE2,XM_005593037.2,Macaca fascicularis,AD-1230860.1,UAAAUGUCUGUUGAAUUUCUA,UAGAAAUUCAACAGACAUUUACA,Primary Human Hepatocytes,1.0,nM,Lipofectamine,24.0,uaaaug(Uhd)cUfGfUfugaauuucua,VPuAfgaaAfuucaacaGfaCfauuuaca,u a a a u g (Uhd) c Uf Gf Uf u g a a u u u c u a,VP u Af g a a Af u u c a a c a Gf a Cf a u u u...,CATACATACACTCTAGTAATGAGGACACTGAGCTCGCGTCTGAAAT...,29.770
15795,32464,WO5355a219aa,GSK3A,NM_019884.3,Homo sapiens,AD-1622539.1,UGAUUACACCUCAUCCAUCGA,UCGAUGGAUGAGGUGUAAUCAGU,A549 Cells,10.0,nM,Lipofectamine,24.0,ugauu(Ahd)CfaCfCfUfcauccaucga,VPuCfgauGfgAfUfgaggUfgUfaaucagu,u g a u u (Ahd) Cf a Cf Cf Uf c a u c c a u c g a,VP u Cf g a u Gf g Af Uf g a g g Uf g Uf a a u...,GCTGGGCCGGAGCCGGAGCCCAAGCCAGAGCGGCGCGGCCTGGAAG...,30.587


In [9]:
for inputs, targets in train_loader:
    inputs = [x.to(device) for x in inputs]
    targets = targets.to(device)
            
    optimizer.zero_grad()
    outputs = model(inputs)
    break


In [10]:
outputs

tensor([53.1601, 53.1601, 53.1601, 53.1601, 53.1601, 53.1601, 53.1601, 53.1601,
        53.1601, 53.1601, 53.1601, 53.1601, 53.1601, 53.1601, 53.1601, 53.1601,
        53.1601, 53.1601, 53.1601, 53.1601, 53.1601, 53.1601, 53.1601, 53.1601,
        53.1601, 53.1601, 53.1601, 53.1601, 53.1601, 53.1601, 53.1601, 53.1601],
       grad_fn=<SqueezeBackward0>)

In [11]:
train_dataset.__getitem__(3)

([tensor([999, 907, 553, 509, 305, 152,   0,   0,   0,   0,   0,   0,   0,   0,
            0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0]),
  tensor([ 1,  8,  2,  1,  1,  2, 15,  3,  4,  1,  3,  4,  1,  6,  3,  6,  1,  2,
           4,  1,  4,  2,  4,  0,  0])],
 tensor(102.8000))