# Trabalho PLN

**Autor:** Carlos Valdir Bortolotti

**Data:** 16/04/2024

**Objetivo:** Avaliar a performance da transcrição de um audio.

## Instalar pacotes

In [1]:
!pip install -r ./requirements.txt



## Importar Bibliotecas necessárias

In [26]:
import os
import whisper as wr
import pygame as pg
import Levenshtein as lev
from gtts import gTTS

## Limpar pastas de saída

In [55]:
!rm ./*.mp3 -r

## Funções

In [48]:
def transcribe_audio(type_model,file_path):
    model = wr.load_model(type_model)
    transcription = model.transcribe(file_path)
    print("Transcrição: ", transcription["text"])
    return transcription["text"]

def compare_texts(original_text, transcribed_text):
    distance = lev.distance(original_text, transcribed_text)
    max_distance = max(len(original_text), len(transcribed_text))
    similarity = (max_distance - distance) / max_distance * 100
    print(f"Similaridade: {similarity:.2f}%")

def search_term_in_text(text, term):
    sentences = text.split('.')
    matches = [sentence.strip() + '.' for sentence in sentences if term.lower() in sentence.lower()]
    print("Frase(s) contendo o termo:", matches)
    return matches

def text_to_speech(phrase, term,index, lang='pt', tld='com.br'):
    speech = gTTS(text=phrase, lang=lang, tld=tld, slow=False)
    filename = f"output_{term}_{index}.mp3"
    speech.save(filename)

def play_audio(prefix='output', directory='.'):
    pg.mixer.init()
    files = os.listdir(directory)
    audio_files = [file for file in files if file.startswith(prefix) and file.endswith('.mp3')]
    
    for file in audio_files:
        file_path = os.path.join(directory, file)
        print(f"Tocando {file}...")
        pg.mixer.music.load(file_path)
        pg.mixer.music.play()
       
        while pg.mixer.music.get_busy():
            pg.time.Clock().tick(10)
       
    pg.mixer.quit()
    print("Todos os arquivos foram tocados")        


## Variáveis e parâmetros

In [49]:
audio_file_path = './cavalo_pegasus.wav'
model = "small"

with open("./texto_original.txt", "rt") as f:
    original_text = "".join(f.readlines())

## Transcrever o áudio

In [50]:
# Transcrever audio
transcribed_text = transcribe_audio(model,audio_file_path)

Transcrição:   Pegasus, o cavalo valente, teve sua jornada marcada por uma coragem inabalada desde o momento em que veio ao mundo numa modesta fazenda. Desde jovem, mostrou-se destenido e ágil, conquistando o coração de seu dono e tornando-se um pié o companheiro nos trabalhos diários da fazenda. O espírito intrépido o levou além das fronteiras da cortina rural, quando foi convocado para servir em tempos de guerra. Nas batalhas, Pegasus não recuou diante do perigo, galupando intensamente ao lado dos soldados de sua patria, inspirando-os com sua bravura e determinação. Ao retornar para casa, depois de anos de serviço honrado, Pegasus encontrou paz nos campos verdejantes e tanto amada. Lá, sob o céu amplo e estrelado, ele encerrou sua jornada, deixando para trás uma lenda de coragem e realdade que coalia pelos tempos.


## Comparar e medir a similiariedade

In [51]:
# Comparar transcrição
compare_texts(original_text, transcribed_text)

Similaridade: 96.58%


## Procurar um termo no texto

In [52]:
# Procura o termo dentro do texto. 
term = "Pegasus"
phrases_found = search_term_in_text(transcribed_text, term)

Frase(s) contendo o termo: ['Pegasus, o cavalo valente, teve sua jornada marcada por uma coragem inabalada desde o momento em que veio ao mundo numa modesta fazenda.', 'Nas batalhas, Pegasus não recuou diante do perigo, galupando intensamente ao lado dos soldados de sua patria, inspirando-os com sua bravura e determinação.', 'Ao retornar para casa, depois de anos de serviço honrado, Pegasus encontrou paz nos campos verdejantes e tanto amada.']


## Converter o texto em áudio

In [53]:
# Converte as frases encontradas em audio
index = 1
for sentence in phrases_found:
    text_to_speech(sentence,term,index)
    index += 1

## Tocar o texto convertido

In [54]:
# Fala as Frases encontradas com referencia ao termo pesquisado

play_audio()


Tocando output_Pegasus_2.mp3...
Tocando output_Pegasus_1.mp3...
Tocando output_Pegasus_3.mp3...
Todos os arquivos foram tocados
