# Oppimisprojekti 3: Mallien yhdistäminen

Tässä tehtävässä toteutetaan yksinkertainen "Puheesta generoitua tekstiä" - sovellus, joka ottaa syötteeksi äänitiedoston, transkriboi sen tekstiksi ja käyttää tulosta generaattorin syötteenä.

#### 1. Transkriptio äänitiedostosta

In [None]:
# Torch backend, ei tarvitse suorittaa

import whisper
from IPython.display import Audio, display

audio_file = "../week3_sounds/tarzan.wav"

model = whisper.load_model("large")

result = model.transcribe(audio_file)

with open("transkriptio.txt", "w") as f:
    f.write(result["text"])

display(Audio(audio_file, rate=16000))
print("Transkriptio:")
print(result["text"])

Transkriptio:
 Hän oli paljon nuorempi puolisoansa ja tietämättänsä hän oli kaivannut ystävyyden satamaan jonkun samanikäisemmän kanssa.


#### 2. Transkription lataus

In [12]:
# Tästä eteenpäin suoritus

with open("transkriptio.txt") as f:
    seed = f.read().strip()

#### 3. Mallin lataus

In [None]:
# Tästä eteenpäin keras

from keras.models import load_model

model = load_model("tarzan_best_model.keras", compile=False)

In [14]:
import sentencepiece as spm

sp = spm.SentencePieceProcessor()
sp.load("tarzan_sp.model")

True

#### 4. Tekstin siistiminen ennen tulostusta

In [None]:
import re


def clean_generated_text(text):
    # Ylimääräiset välilyönnit pois
    text = re.sub(r"\s+", " ", text)

    # Poista lainausmerkkejä ja ylimääräisiä välimerkkejä
    text = re.sub(r'["“”]', "", text)
    text = re.sub(r'[^\w\s\.\,\-\?!"\'äöÄÖ]', "", text)

    # Erotetaan lauseet pisteistä yms
    sentences = re.split(r"(?<=[\.\?\!])\s+", text)

    # Lauseet isolla alkukirjaimella ja lyhyet lauseet pois
    sentences = [s.strip().capitalize() for s in sentences if len(s.strip()) > 10]

    # Yhdistetään kokonaiseksi tekstiksi
    cleaned = " ".join(sentences)
    return cleaned

#### 5. Tekstigeneraattorin toteutus

In [None]:
import numpy as np


def generate_text(model, sp, seed_text, length=100, temperature=1.0):
    model_input = list(map(int, sp.encode_as_ids(seed_text)))

    for _ in range(length):
        input_ids = model_input[-64:]
        if len(input_ids) < 64:
            input_ids = [0] * (64 - len(input_ids)) + input_ids
        input_array = np.array([input_ids], dtype=np.int32)
        prediction = model.predict(input_array, verbose=0)
        logits = prediction[0, -1]
        logits = logits / temperature
        exp_preds = np.exp(logits - np.max(logits))
        probs = exp_preds / np.sum(exp_preds)
        next_token_id = np.random.choice(len(probs), p=probs)
        model_input.append(int(next_token_id))

    return sp.decode_ids(model_input)


print("Seed:")
print(seed)

generated = generate_text(model, sp, seed, length=150, temperature=0.9)
generated = clean_generated_text(generated)
print("\nGeneroitu teksti:")
print(generated)

Seed:
Hän oli paljon nuorempi puolisoansa ja tietämättänsä hän oli kaivannut ystävyyden satamaan jonkun samanikäisemmän kanssa.

Generoitu teksti:
Hän oli paljon nuorempi puolisoansa ja tietämättänsä hän oli kaivannut ystävyyden satamaan jonkun samanikäisemmän kanssa. Nainen katsahti häneen odottaen näkevänsä murhanhimon vimmatun välkkeen silmissä yläpuolellaan. Sensijaan hän näkikin surua ja katumusta. Huudahti hän. Katsokaa, mitä olette tehnyt. Hän oli puolisoni. Minä rakastin häntä ja te olette hänet tappanut. Hyvin hellävaroen nosti tarzan kreivi de couden hervottoman ruumiin ja kantoi sen vuoteelle. Sitten hän painoi korvansa miehen rintaa vasten. Hiukan konjakkia, olga! Kreivitär toi sitä, ja yhdessä he kaatoivat sitä hänen huuliensa välitse. Samalla nämä valkoiset huulet heikosti hengähtivät. Pää kääntyi, ja de coude voihkaisi. Hän ei kuole, sanoi tarzan. Jumalan kiitos! Miksi niin teitte, jean? Kysyi kreivitär. Hän löi minua ja minä vimmastuin. Olen nähnyt heimoni apinain tekev