# Analiza zależnościowa

## Wstęp

Język, którym posługujemy się na co dzień, funkcjonuje na zasadzie kompozycyjności. Oznacza to, że znaczenie złożonych wyrażeń językowych można wywnioskować z ich części składowych i z relacji między nimi. Ta właściwość pozwala użytkownikom języka na daleko idącą kreatywność w sposobie konstruowania wypowiedzi, przy zachowaniu precyzji komunikacji. Sposób w jaki słowa w zdaniu są ze sobą związane, tworzy strukturę ukorzenionego drzewa. Problemem, który rozważamy w tym zadaniu, jest automatyczna konstrukcja takich drzew dla zdań w języku polskim. Problem nosi nazwę analizy składniowej zdań, a konkretnie dokonywać będziemy analizy zależnościowej. 

Analiza składniowa jest w ogólności trudna. Na przykład, mimo że zdania `(1) Maria do jutra jest zajęta.` oraz `(2) Droga do domu jest zajęta.` zawierają kolejno te same części mowy, w dodatku o dokładnie tej samej formie gramatycznej, to w zdaniu (1) fraza "do jutra" modyfikuje czasownik "jest zajęta", natomiast w zdaniu (2) fraza "do domu" jest podrzędnikiem rzeczownika "droga". W dodatku, czasami nawet natywni użytkownicy języka mogą zinterpretować strukturę zdania na dwa różne sposoby: zdanie `Zauważyłem dziś samochód Adama, którego dawno nie widziałem.` może być interpretowane na dwa sposoby w zależności od tego, do czego odnosi się "którego": czy do "samochodu Adama", czy może do "Adama".

Istnieje wiele różnych algorytmów rozwiązujących problem analizy zależnościowej. Klasyczne metody przetwarzają zdanie słowo po słowie, od lewej do prawej i wstawiają krawędzie w oparciu albo o pewien ustalony zbiór reguł lub o algorytm uczenia maszynowego. W tym zadaniu użyjemy innej metody. Twoim zadaniem będzie przewidzenie drzewa zależnościowego w oparciu o wektory słów otrzymane modelem HerBERT.

HerBERT to polska wersja BERT, który jest modelem językowym i działa następująco:
1. BERT posiada moduł nazywany tokenizatorem (ang. tokenizer), który dzieli zdanie na pewne podsłowa. Na przykład zdanie `Dostaję klucz i biegnę do swojego pokoju.` dzieli na `'Dosta', 'ję', 'klucz', 'i', 'bieg', 'nę', 'do', 'swojego', 'pokoju', '.'`. Tokenizator jest wyposażony w słownik, który podsłowom przypisuje unikalne liczby: w praktyce zatem otrzymujemy mało zrozumiałe dla człowieka `18577, 2779, 22816, 1009, 4775, 2788, 2041, 5058, 7217, 1899`.
1. Następnie BERT posiada słownik, który zamienia te liczby na wektory o długości 768. Otrzymujemy zatem macierz o rozmiarach `10 x 768`.
1. BERT posiada 12 warstw, z których każda bierze wynik poprzedniej i wykonuje na niej pewną transformację. Szczegóły nie są istotne w tym zadaniu! Ważne jest natomiast to, że cały model jest uczony automatycznie, przy użyciu dużych korpusów tekstu. Zinterpretowanie działania każdej warstwy jest niemożliwe! Natomiast być może w skomplikowanym algorytmie, którego nauczył się BERT różne warstwy pełnią różne role.

## Zadanie

Twoim zadaniem będzie automatyczna analiza składniowa zdań w języku polskim. Pominiemy dokładne objaśnienie sposobu konstruowania takich drzew, możesz samemu popatrzeć na przykłady! Dostaniesz zbiór danych treningowych zawierający 1000 przykładów rozkładów zdań. W pliku `train.conll` znajdują się poetykietowane zdania, na przykład:

| # | Word      | - | - | - | - | Head | - | - | - |
|---|-----------|---|---|---|---|--------|---|---|---|
| 1 | Wyobraź   | _ | _ | _ | _ | 0      | _ | _ | _ |
| 2 | sobie     | _ | _ | _ | _ | 1      | _ | _ | _ |
| 3 | człowieka | _ | _ | _ | _ | 1      | _ | _ | _ |
| 4 | znajdującego | _ | _ | _ | _ | 3    | _ | _ | _ |
| 5 | się       | _ | _ | _ | _ | 4      | _ | _ | _ |
| 6 | na        | _ | _ | _ | _ | 4      | _ | _ | _ |
| 7 | ogromnej  | _ | _ | _ | _ | 8      | _ | _ | _ |
| 8 | górze     | _ | _ | _ | _ | 6      | _ | _ | _ |
| 9 | .         | _ | _ | _ | _ | 1      | _ | _ | _ |

Co jest sposobem na zakodowanie następującego drzewa składniowego zdania złożonego:
```
      Wyobraź                          
   ______|_____________                 
  |      |         człowieka           
  |      |             |                
  |      |        znajdującego         
  |      |      _______|__________      
  |      |     |                  na   
  |      |     |                  |     
  |      |     |                górze  
  |      |     |                  |     
sobie    .    się              ogromnej
```
Dostarczamy Ci funkcję w Pythonie służącą do wczytania przykładów z tego pliku i na ich wizualizację. Twoje rozwiązanie powinno:
1. Dzielić zdanie na podsłowa.
1. Dla każdego podsłowa przypisywać wektor. Należy użyć tutaj finalnych lub pośrednich wektorów wyliczonych przez model HerBERT.
1. Agregować wektory podsłów tak aby otrzymać wektory słów.
1. Zaimplementować i wyuczyć prosty model przewidujący odległości w drzewie i głębokości w drzewie poszczególnych słów w zdaniu.
1. Użyć modeli odległości i głębokości do skonstruowania drzewa składniowego.


## Ograniczenia
- Twoje finalne rozwiązanie będzie testowane w środowisku **bez** GPU.
- Ewaluacja twojego rozwiązania (bez treningu) na 200 przykładach testowych powinna trwać nie dłużej niż 5 minut na Google Colab bez GPU.
- Do dyspozycji masz model typu BERT: `allegro/herbert-base-cased` oraz tokenizer `allegro/herbert-base-cased`. Nie wolno korzystać z innych uprzednio wytrenowanych modeli oraz ze zbiorów danych innych niż dostarczony. 
- Lista dopuszczalnych bibliotek: `transformers`, `nltk`, `torch`. 

## Uwagi i wskazówki
- Liczne wskazówki znajdują się we wzorcach funkcji, które powinieneś zaimplementować.

## Pliki zgłoszeniowe
Rozwiązanie zadania stanowi plik archiwum zip zawierające:
1. Ten notebook
2. Plik z wagami modelu odległości: `distance_model.pth`
3. Plik z wagami modelu głębokości: `depth_model.pth`

Uruchomienie całego notebooka z flagą `FINAL_EVALUATION_MODE` ustawioną na `False` powinno w maksymalnie 10 minut skutkować utworzeniem obu plików z wagami.

## Ewaluacja
Podczas sprawdzania flaga `FINAL_EVALUATION_MODE` zostanie ustawiona na `True`, a następnie zostanie uruchomiony cały notebook.
Zaimplementowana przez Ciebie funkcja `parse_sentence`, której wzorzec znajdziesz na końcu tego notatnika, zostanie oceniona na 200 przykładach testowych.
Ewaluacja będzie podobna do tej zaimplementowanej w funkcji `evaluate_model`. 
Pamiętaj jednak, że ostateczna funkcja do ewaluacji sprawdzała będzie dodatkowo, czy zwracane przez twoją funkcję `parse_sentence` drzewa są poprawne!

Ewaluacja nie może zajmować więcej niż 3 minuty. Możesz uruchomić walidację swojego rozwiązania na dostarczonym zbiorze danych walidacyjnych na Google Colab, aby przekonać się czy nie przekraczasz czasu.
Za pomocą skryptu `validation_script.py` będziesz mógł upewnić się, że Twoje rozwiązanie zostanie prawidłowo wykonane na naszych serwerach oceniających:

```
python3 validation_script.py --train
python3 validation_script.py
```

Podczas sprawdzania zadania, użyjemy dwóch metryk: UUAS oraz root placement.
1. Root placemenet oznacza ułamek przykładów na których poprawnie wskażesz korzeń drzewa składniowego,
2. UUAS dla konkretnego zdania to ułamek poprawnie umieszczonych krawędzi. UUAS dla zbioru to średnia wyników dla poszczególnych zdań.


Za to zadanie możesz zdobyć pomiędzy pomiędzy 0 i 2 punkty. Twój wynik za to zadanie zostanie wyliczony za pomocą funkcji:
```Python
def points(root_placement, uuas):
    def scale(x, lower=0.5, upper=0.85):
        scaled = min(max(x, lower), upper)
        return (scaled - lower) / (upper - lower)
    return (scale(root_placement) + scale(uuas))
```
Innymi słowy, twój wynik jest sumą wyników za root placement i UUAS. Wynik za daną metrykę jest 0 jeśli wartość danej metryki jest poniżej 0.5 i 1 jeśli jest powyżej 0.85. Pomiędzy tymi wartościami, wynik rośnie liniowo z wartością metryki.

# Kod startowy

In [57]:
FINAL_EVALUATION_MODE = False  # W czasie sprawdzania twojego rozwiązania, zmienimy tą wartość na True
DEPTH_MODEL_PATH = 'depth_model.pth'  # Nie zmieniaj!
DISTANCE_MODEL_PATH = 'distance_model.pth'  # Nie zmieniaj!

In [58]:
from typing import List

import numpy as np
import torch
from torch.utils.data import DataLoader
from tqdm import tqdm
from transformers import (AutoModel, AutoTokenizer, PreTrainedModel,
                          PreTrainedTokenizer)
from utils import (ListDataset, ParsedSentence, Sentence, merge_subword_tokens,
                   read_conll, uuas_score)

In [None]:
tokenizer = AutoTokenizer.from_pretrained("allegro/herbert-base-cased")
model = AutoModel.from_pretrained("allegro/herbert-base-cased")

In [None]:
train_sentences = read_conll('train.conll')  # 1000 zdań
val_sentences = read_conll('valid.conll')  # 200 zdań

train_sentences[6].pretty_print()  # wyświetl drzewo jednego zdania
print(train_sentences[6])

# Twoje rozwiązanie

In [None]:
# Hubert Jastrzębski - V LO Kraków

from torch.nn.utils.rnn import pack_padded_sequence, pad_packed_sequence
import torch.nn.functional as F
import torch.nn as nn
from torch import optim
from copy import deepcopy

np.random.seed(42)
torch.manual_seed(42)

In [None]:
def get_distances(sentence: ParsedSentence):
    """Znajdź odległości między każdą parą słów w zdaniu.
    Zwraca macierz numpy o wymiarach (len(sentence), len(sentence))."""

    ls = len(sentence)
    distances = np.zeros((ls, ls))

    def DFS(u, v, p, d):
        distances[u][v] = d
        G = deepcopy(sentence.node_to_children[v])
        if sentence.heads[v] != 0:
            G += [sentence.heads[v] - 1]
        for nv in G:
            if nv != p:
                DFS(u, nv, v, d + 1)

    for u in range(ls):
        DFS(u, u, u, 0)

    return distances

print(get_distances(train_sentences[1]))

In [63]:
def get_bert_embeddings(
    sentences_s: List[str],
    tokenizer: PreTrainedTokenizer, 
    model: PreTrainedModel,
    progress_bar: bool = False,
):
    """
    Funkcja zwraca embeddingi podsłów dla listy zdań.

    Argumenty:
        sentences_s: Lista zdań. Każde zdanie jest reprezentowane jako string.
        tokenizer: Tokenizator HERBERT
        model: Model HERBERT
        progress_bar: Czy wyświetlać pasek postępu.

    Zwraca:
        tokens: Lista, która dla każdego zdania zawiera listę tokenów podsłów tego zdania.
        embeddings: Lista, która dla każdego zdania zawiera listę tensorów o wymiarach 
            (seq_len, emb_dim). Zauważ, że seq_len może być różne dla różnych zdań.
    """

    # Wskazówki:
    #  1. Możesz użyć funkcji:
    #   encoded = tokenizer.batch_encode_plus(...)
    #   with torch.no_grad():
    #     model(**encoded, output_hidden_states=True)
    #  2. Aby przyspieszyć obliczenia, pamiętaj o zgrupowaniu (batching) zdań, przed podaniem ich do modelu.
    #  3. Pamiętaj, że każde zdanie może mieć inną długość, więc żeby wypełnić dodatkowe miejsce w zwracanym
    #   tensorze, HERBERT zastosuje padding. Pamiętaj o usunięciu paddingu z wyników.
    #  4. Tokenizator i model używa specjalnych tokenów (np. początku i końca zdania), które również powinny 
    #   zostać usunięte.

    batch_size = 16

    tokens, embeddings = [], []
    batches = [sentences_s[i:i+batch_size] for i in range(0, len(sentences_s), batch_size)]

    for batch in (tqdm(batches) if progress_bar else batches):
        batch_encoded = tokenizer.batch_encode_plus(batch, padding=True, return_tensors="pt")
        with torch.no_grad():
            batch_embeds = model(**batch_encoded, output_hidden_states=True)
            for encoded, embeds in zip(batch_encoded['input_ids'], batch_embeds['last_hidden_state']):
                mask = encoded > 4 # 2 czy 4?
                tokens.append(encoded[mask])
                embeddings.append(embeds[mask])

    return tokens, embeddings


In [64]:
def get_word_embeddings(sentences: List[Sentence], tokenizer, model):
    """Funkcja zwraca embeddingi słów dla listy zdań, używając modelu i tokenizatora."""

    # Wskazówki:
    #  1. Użyj funkcji get_bert_embeddings do uzyskania embeddingów podsłów.
    #  2. Użyj funkcji merge_subword_tokens do uzyskania embeddingów słów.

    sentences_s = [str(sentence) for sentence in sentences]
    bert_tokens, bert_embeddings = get_bert_embeddings(sentences_s, tokenizer, model, False)

    embeddings = []
    for sentence, bert_token, bert_embedding in zip(sentences, bert_tokens, bert_embeddings):
        embedding = merge_subword_tokens(sentence.words, bert_token, bert_embedding, tokenizer, agg_fn)
        embeddings.append(embedding)

    return embeddings

In [65]:
def agg_fn(sub_embeddings):
    embeddings = torch.mean(sub_embeddings, axis=0)
    return embeddings

In [66]:
def get_datasets(sentences: List[ParsedSentence], tokenizer, model):
    embeddings = get_word_embeddings(sentences, tokenizer, model)
    distances = [get_distances(sent) for sent in sentences]
    depths = [dist[sent.root][..., None] for dist, sent in zip(distances, sentences)]
    dataset_dist = ListDataset(list(zip(embeddings, distances, sentences)))
    dataset_depth = ListDataset(list(zip(embeddings, depths, sentences)))
    return dataset_dist, dataset_depth


if not FINAL_EVALUATION_MODE:
    trainset_dist, trainset_depth =  get_datasets(train_sentences, tokenizer, model)
    valset_dist, valset_depth = get_datasets(val_sentences, tokenizer, model)

In [67]:
def pad_arrays(sequence, pad_with=np.inf):
    """
    Zakłada, że sequence zawiera tablice (ndarrays) o takiej samej liczbie wymiarów.
    Zwraca tensor, zawierający dane dopełnione do tych samych wymiarów wartością pad_with, 
    gdzie indeks sekwencji odpowiada pierwszemu wymiarowi.
    """

    shapes = np.array([list(seq.shape) for seq in sequence])
    max_lens = list(shapes.max(axis=0))
    padded = [np.pad(
                seq, 
                tuple((0, max_lens[i] - seq.shape[i]) for i in range(seq.ndim)), 
                'constant', 
                constant_values=pad_with
            ) for seq in sequence]
    return torch.tensor(padded)


def collate_fn(batch):
    embeddings, targets, sentences = zip(*batch)
    padded_embeddings = pad_arrays(embeddings, pad_with=0)
    padded_targets = pad_arrays(targets, pad_with=np.inf)
    mask = padded_targets != torch.inf
    return padded_embeddings, padded_targets, mask, sentences


if not FINAL_EVALUATION_MODE:
    dist_trainloader = DataLoader(trainset_dist, batch_size=32, shuffle=True, collate_fn=collate_fn)
    dist_valloader = DataLoader(valset_dist, batch_size=32, shuffle=False, collate_fn=collate_fn)

    depth_trainloader = DataLoader(trainset_depth, batch_size=32, shuffle=True, collate_fn=collate_fn)
    depth_valloader = DataLoader(valset_depth, batch_size=32, shuffle=False, collate_fn=collate_fn)

# dist_trainloader i dist_valloader zwracają krotki (embeddings, distances, masks, sentences)
# depths_trainloader i depths_valloader zwracają krotki (embeddings, depths, masks, sentences)  
# embeddings.shape: (batch_size, max_seq_len, emb_dim)
# distances.shape: (batch_size, max_seq_len, max_seq_len)
# depths.shape: (batch_size, max_seq_len, 1)

In [68]:
max_input_length = 45

def compute_error(model, dataloader):
    model.eval()

    losses = 0
    num_of_el = 0
    with torch.no_grad():
        for inputs, targets, masks, sentences in dataloader:
            input_lengths = torch.sum(masks, axis=1)[:, :1].reshape(-1)
            outputs = model(inputs, input_lengths)
            num_of_el += 1
            losses += loss_fn(outputs.float(), targets.float(), masks)

    return losses / num_of_el

In [69]:
class DistanceModel(torch.nn.Module):
    def __init__(self):
        super().__init__()
        self.rnn = nn.LSTM(768, 128, batch_first=True, num_layers=3, bidirectional=True)
        self.layers = nn.Sequential(
            nn.Linear(256, 128),
            nn.Linear(128, max_input_length)
        )
    
    def forward(self, x, input_lengths):
        packed_inputs = pack_padded_sequence(x, input_lengths, batch_first=True, enforce_sorted=False)
        packed_outputs, _ = self.rnn(packed_inputs)
        outputs, _ = pad_packed_sequence(packed_outputs, batch_first=True)
        outputs = self.layers(outputs)
        outputs = outputs[:, :, :len(packed_inputs.batch_sizes)]
        return outputs


class DepthModel(torch.nn.Module):
    def __init__(self):
        super().__init__()
        self.rnn = nn.LSTM(768, 64, batch_first=True, bidirectional=True)
        self.fc = nn.Linear(128, 1)

    def forward(self, x, input_lengths):
        packed_inputs = pack_padded_sequence(x, input_lengths, batch_first=True, enforce_sorted=False)
        packed_outputs, _ = self.rnn(packed_inputs)
        outputs, _ = pad_packed_sequence(packed_outputs, batch_first=True)
        outputs = self.fc(outputs)
        return outputs

In [None]:
def loss_fn(output, target, mask):
    # mask, target, output to tensory o tym samym kształcie
    # mask zawiera 1 tam, gdzie target zawiera dane, a 0 tam, gdzie jest padding

    output_masked = output[mask]
    target_masked = target[mask]

    loss = F.mse_loss(output_masked, target_masked)

    return loss


def train_model(model, dataloader, valloader, epochs, lr, verbose=False):
    """Pętla ucząca twoich modeli."""
    
    optimizer = optim.NAdam(model.parameters(), lr=lr)

    best_epoch = None
    best_params = None
    best_val_loss = np.inf

    for epoch in range(epochs):
        model.train()
        _iter = 1
        for inputs, targets, masks, sentences in dataloader:
            input_lengths = torch.sum(masks, axis=1)[:, :1].reshape(-1)

            optimizer.zero_grad()
            outputs = model(inputs, input_lengths)
            loss = loss_fn(outputs.float(), targets.float(), masks)
            loss.backward()
            optimizer.step()

            if verbose:
                if _iter % 10 == 0:
                    print(f"Minibatch {_iter:>6}    |  loss {loss.item():>5.2f}  |")

            _iter +=1

        val_loss = compute_error(model, valloader)

        if val_loss < best_val_loss:
            best_epoch = epoch
            best_val_loss = val_loss
            best_params = [deepcopy(p.detach().cpu()) for p in model.parameters()]

        if verbose:
            #clear_output(True)
            m = f"After epoch {epoch:>2} | valid loss: {val_loss:>5.2f}"
            print("{0}\n{1}\n{0}".format("-" * len(m), m))

    if best_params is not None:
        if verbose:
            print(f"\nLoading best params on validation set in epoch {best_epoch} with loss {best_val_loss:.2f}")
        with torch.no_grad():
            for param, best_param in zip(model.parameters(), best_params):
                param[...] = best_param


# W czasie ewaluacji, modele nie powinny być ponownie trenowane.
if not FINAL_EVALUATION_MODE: 
    print("Training depth model")
    depth_model = DepthModel()
    
    lr_depth = 0.008
    epochs_depth = 5

    train_model(depth_model, depth_trainloader, depth_valloader, lr=lr_depth, epochs=epochs_depth)  
    # zapisz wagi modelu do pliku
    torch.save(depth_model.state_dict(), DEPTH_MODEL_PATH)

    print("Training distance model")
    distance_model = DistanceModel()
    
    lr_dist = 0.00325
    epochs_dist = 35

    train_model(distance_model, dist_trainloader, dist_valloader, lr=lr_dist, epochs=epochs_dist)
    # zapisz wagi modelu do pliku
    torch.save(distance_model.state_dict(), DISTANCE_MODEL_PATH)  

In [71]:
class UnionFind:
    def __init__(self, numOfElements):
        self.parent = self.makeSet(numOfElements)
        self.size = [1] * numOfElements
    
    def makeSet(self, numOfElements):
        return [x for x in range(numOfElements)]

    def find(self, node):
        while node != self.parent[node]:
            self.parent[node] = self.parent[self.parent[node]]
            node = self.parent[node]
        return node
    
    def union(self, node1, node2):
        root1 = self.find(node1)
        root2 = self.find(node2)

        if root1 == root2:
            return

        if self.size[root1] > self.size[root2]:
            self.parent[root2] = root1
            self.size[root1] += 1
        else:
            self.parent[root1] = root2
            self.size[root2] += 1

    def is_connected(self, node1, node2):
        root1 = self.find(node1)
        root2 = self.find(node2)

        return root1 == root2

In [None]:
def parse_sentence(sent: Sentence, distance_model, depth_model, tokenizer, model) -> ParsedSentence:
    """Zbuduj drzewo składniowe dla pojedynczego zdania.

    Argumenty:
        sent: Zdanie do sparsowania.
        distance_model: Wytrenowany model odległości
        depth_model: Wytrenowany model głębokości
        tokenizer: Tokenizator HERBERT
        model: Model HERBERT

    Zwraca:
        ParsedSentence: Zdanie z przewidzianym drzewem składniowym.

    """

    # Twoje rozwiązanie powinno:
    # 1. Uzyskać embeddingi słów dla zdania.
    # 2. Wybrać korzeń drzewa składniowego heurystycznie, używając depth_model.
    # 3. Obliczyć odległości między każdą parą węzłów, używając distance_model.
    # 4. Zaimplementować wymyśloną przez Ciebie heurystyczną metodę wyboru krawędzi 
    #    drzewa na podstawie przewidywanych odległości.
    # 5. Uzyskać obiekt ParsedSentence. Możesz użyć funkcji ParsedSentence.from_edges_and_root
    # 6. Zwróć obiekt ParsedSentence.

    # Wskazówki:
    #  Możesz użyć sent.pretty_print() do wizualizacji sparsowanego zdania.

    # Uwaga:
    # Ta funkcja zostanie użyta do oceny twojego rozwiązania. Ta funkcja powinna zwrócić rzeczywiste drzewo,
    # z len(sent) - 1 krawędziami. Jeśli twoje przewidywanie nie będzie drzewem, będzie ono nieprawidłowe i
    # nie zdobędziesz za nie punktów. Jeśli chcesz zdobyć tylko część punktów, konkurując tylko w metryce 
    # root placement, nadal powinieneś zwrócić poprawne drzewo.

    in_len = len(sent)

    embeddings = get_word_embeddings([sent], tokenizer, model)[0]
    embeddings = torch.unsqueeze(embeddings, 0)
    input_lengths = torch.tensor([in_len])

    depth_model.eval()
    depth_outputs = depth_model(embeddings, input_lengths)[0].detach().numpy()

    distance_model.eval()
    distance_outputs = distance_model(embeddings, input_lengths)[0].detach().numpy()

    root = np.argmin(depth_outputs)

    s_distances = []
    for x in range(in_len):
        for y in range(x + 1, in_len):
            s_distances.append(((distance_outputs[x][y] + distance_outputs[y][x]) / 2, x, y))
    s_distances.sort()


    uf = UnionFind(in_len)
    edges = []
    for c, x, y in s_distances:
        if not uf.is_connected(x, y):
            edges.append((x, y))
            uf.union(x, y)
        if len(edges) >= in_len - 1:
            break

    my_sent = ParsedSentence.from_edges_and_root(sent.words, edges, root)
    
    return my_sent

if not FINAL_EVALUATION_MODE:
    sent = train_sentences[30]
    parse_sentence(sent, distance_model, depth_model, tokenizer, model).pretty_print()  # Przewidziane drzewo
    sent.pretty_print()  # Złote drzewo (ze zbioru danych)
    print(sent)

# Ewaluacja
Kod bardzo podobny do poniższego będzie służył do ewaluacji rozwiązania na zdaniach testowych. Wywołując poniższe komórki możesz dowiedzieć się ile punktów zdobyłoby twoje rozwiązanie, gdybyśmy ocenili je na danych walidacyjnych. Przed wysłaniem rozwiązania upewnij się, że cały notebook wykonuje się od początku do końca bez błędów i bez ingerencji użytkownika po wykonaniu polecenia `Run All`.

In [73]:
def points(root_placement, uuas):
    def scale(x, lower=0.5, upper=0.85):
        scaled = min(max(x, lower), upper)
        return (scaled - lower) / (upper - lower)
    return (scale(root_placement) + scale(uuas))

def evaluate_model(sentences: List[ParsedSentence], distance_model, depth_model, tokenizer, model):
    sum_uuas = 0
    root_correct = 0
    with torch.no_grad():
        for sent in sentences:
            parsed = parse_sentence(sent, distance_model, depth_model, tokenizer, model)
            root_correct += int(parsed.root == sent.root)
            sum_uuas += uuas_score(sent, parsed)
    
    root_placement = root_correct / len(sentences)
    uuas = sum_uuas / len(sentences)

    print(f"UUAS: {uuas * 100:.3}%")
    print(f"Root placement: {root_placement * 100:.3}%")
    print(f"Your score: {points(root_placement, uuas):.3}/2.0")

In [None]:
if not FINAL_EVALUATION_MODE:
    distance_model_loaded = DistanceModel()
    distance_model_loaded.load_state_dict(torch.load(DISTANCE_MODEL_PATH))

    depth_model_loaded = DepthModel()
    depth_model_loaded.load_state_dict(torch.load(DEPTH_MODEL_PATH))

    evaluate_model(val_sentences, distance_model_loaded, depth_model_loaded, tokenizer, model)