# Zadanie: Analiza tekstu z wykorzystaniem ramek semantycznych i skryptów semantycznych

W tym zadaniu będziemy pracować nad analizą tekstu z wykorzystaniem ramek semantycznych i skryptów semantycznych. Użyjemy biblioteki Framenet, która jest implementacją teorii ramek semantycznych w Pythonie, oraz spaCy do przetwarzania tekstu.

In [None]:
import nltk
from nltk.corpus import framenet as fn
import spacy

# Pobieranie potrzebnych zasobów
nltk.download('framenet_v17')

# Wczytanie modelu spaCy
nlp = spacy.load("en_core_web_sm")

print("Biblioteki zostały zaimportowane i zasoby pobrane.")

## Krok 1: Przygotowanie funkcji do identyfikacji ramek semantycznych

In [None]:
def identify_semantic_frames(sentence):
    doc = nlp(sentence)
    frames = []
    
    for token in doc:
        if token.pos_ == "VERB":
            # Szukamy ramek semantycznych dla czasowników
            for lemma in fn.lemmata(token.lemma_):
                for frame in lemma.frames:
                    frames.append((token.text, frame.name))
    
    return frames

print("Funkcja identify_semantic_frames została zdefiniowana.")

## Krok 2: Przygotowanie funkcji do analizy skryptu semantycznego

In [None]:
def analyze_semantic_script(frames):
    script = []
    for verb, frame in frames:
        frame_info = fn.frame(frame)
        script.append({
            'verb': verb,
            'frame': frame,
            'core_elements': [fe.name for fe in frame_info.FE.values() if fe.coreType == 'Core']
        })
    return script

print("Funkcja analyze_semantic_script została zdefiniowana.")

## Krok 3: Analiza przykładowego zdania

In [None]:
# Przykładowe zdanie do analizy
sentence = "The chef cooked a delicious meal for his guests."

# Analiza zdania
identified_frames = identify_semantic_frames(sentence)
semantic_script = analyze_semantic_script(identified_frames)

print("Zidentyfikowane ramki semantyczne:")
for verb, frame in identified_frames:
    print(f"- Czasownik: {verb}, Ramka: {frame}")

print("\nSkrypt semantyczny:")
for item in semantic_script:
    print(f"- Czasownik: {item['verb']}")
    print(f"  Ramka: {item['frame']}")
    print(f"  Kluczowe elementy: {', '.join(item['core_elements'])}")

## Zadanie dla uczestników

1. Rozszerz analizę o identyfikację ról semantycznych dla argumentów czasowników.
2. Zaimplementuj funkcję do wizualizacji ramek semantycznych i skryptów (możesz użyć biblioteki networkx).
3. Przeprowadź analizę na dłuższym tekście, np. akapicie, i porównaj wyniki.
4. Zbadaj, jak zmienia się analiza dla różnych typów zdań (np. pytania, rozkazy).
5. Porównaj wyniki analizy z wykorzystaniem różnych modeli spaCy (np. en_core_web_sm vs en_core_web_lg).

Powodzenia!