# Trabalho PLN

**Autor:** Carlos Valdir Bortolotti

**Data:** 16/04/2024

**Objetivo:** Avaliar a performance da transcrição de um audio.

## Instalar pacotes

In [1]:
!pip install -r ./requirements.txt



In [25]:
!pip freeze > ./requirements.txt

In [24]:
!pip install gtts

Collecting gtts
  Downloading gTTS-2.5.1-py3-none-any.whl.metadata (4.1 kB)
Collecting click<8.2,>=7.1 (from gtts)
  Downloading click-8.1.7-py3-none-any.whl.metadata (3.0 kB)
Downloading gTTS-2.5.1-py3-none-any.whl (29 kB)
Downloading click-8.1.7-py3-none-any.whl (97 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m97.9/97.9 kB[0m [31m808.3 kB/s[0m eta [36m0:00:00[0ma [36m0:00:01[0m
[?25hInstalling collected packages: click, gtts
Successfully installed click-8.1.7 gtts-2.5.1


## Importar Bibliotecas necessárias

In [26]:
import os
import whisper as wr
import pygame as pg
import Levenshtein as lev
from gtts import gTTS

## Limpar pastas de saída

In [13]:
!rm ./output -r

rm: cannot remove './output': No such file or directory


## Funções

In [30]:
def transcribe_audio(type_model,file_path):
    model = wr.load_model(type_model)
    transcription = model.transcribe(file_path)
    print("Transcrição: ", transcription["text"])
    return transcription["text"]

def compare_texts(original_text, transcribed_text):
    distance = lev.distance(original_text, transcribed_text)
    max_distance = max(len(original_text), len(transcribed_text))
    #similarity = (1 - distance / max_distance) * 100
    similarity = (max_distance - distance) / max_distance * 100
    print(f"Similaridade: {similarity:.2f}%")


def search_term_in_text(text, term):
    sentences = text.split('.')
    matches = [sentence.strip() + '.' for sentence in sentences if term.lower() in sentence.lower()]
    print("Frase(s) contendo o termo:", matches)
    return matches

def text_to_speech(phrase, term,index, lang='pt', tld='com.br'):
    speech = gTTS(text=phrase, lang=lang, tld=tld, slow=False)
    filename = f"output_{term}_{index}.mp3"
    speech.save(filename)

def play_audio(prefix='output', directory='.'):
    pg.mixer.init()
    files = os.listdir(directory)
    audio_files = [file for file in files if file.startswith(prefix) and file.endswith('.mp3')]
    
    for file in audio_files:
        file_path = os.path.join(directory, file)
        print(f"Tocando {file}...")
        pg.mixer.music.load(file_path)
        pg.mixer.music.play()
       
        while pg.mixer.music.get_busy():
            pg.time.Clock().tick(10)
       
    pg.mixer.quit()
    print("Todos os arquivos foram tocados")        


In [42]:
audio_file_path = './Joao_garrafa.wav'
model = "small"

with open("./Joao_garrafa_original.txt", "rt") as f:
    original_text = "".join(f.readlines())

In [39]:
# Transcrever audio
transcribed_text = transcribe_audio(model,audio_file_path)

Transcrição:   Numa manhã ensolarada, João decidiu ir à praia para aproveitar o belo dia. Enquanto caminhava pela ola, observando as ondas quebrarem suavemente na areia, notou algo brilhante ao longe. Movido pela curiosidade, ele se aproximou e descobriu que se tratava de uma pequena garrafa com a mensagem dentro. Ele abriu com cuidado, ansioso para descobrir o segredo que estava aguardado há anos no coração do oceano. A mensagem estava um pouco desbotada, mas ainda era possível ler. Quem encontrar esta mensagem saiba que a vida é uma aventura maravilhosa. Viva plenamente e busque seus sonhos. João, inspirado pelas palavras, decidiu naquele momento fazer uma viagem que sempre adiou. Sentindo-se grato por esse encontro fortuito ter renovado seu espírito aventureiro.


In [44]:
# Comparar transcrição
compare_texts(original_text, transcribed_text)

Similaridade: 98.05%


In [45]:
# Procura o termo dentro do texto. 
term = "João"
phrases_found = search_term_in_text(transcribed_text, term)

Frase(s) contendo o termo: ['Numa manhã ensolarada, João decidiu ir à praia para aproveitar o belo dia.', 'João, inspirado pelas palavras, decidiu naquele momento fazer uma viagem que sempre adiou.']


In [46]:
# Converte as frases encontradas em audio
index = 1
for sentence in phrases_found:
    text_to_speech(sentence,term,index)
    index += 1

In [29]:
# Fala as Frases encontradas com referencia ao termo pesquisado

play_audio()


Tocando output_João_1.mp3...
Tocando output_João_2.mp3...
Todos os arquivos foram tocados
