# Classes feitas at√© aqui para o trabalho

In [1]:
!sudo apt update && sudo apt install ffmpeg -y
!pip install openai-whisper
!pip install telebot
!pip install openai-whisper


####Bibliotecas usadas:

In [2]:
import telebot
import io
import tensorflow as tf
import tensorflow_hub as hub
import librosa
import whisper
import csv

### Classifica√ß√£o do √°udio:

In [3]:
class ClassificadorAudio:
    def __init__(self):
        print("Carregando YAMNet...")
        self.model = hub.load('https://tfhub.dev/google/yamnet/1')
        class_map_path = self.model.class_map_path().numpy().decode('utf-8')
        self.class_names = self._ler_labels(class_map_path)

    def _ler_labels(self, path):
        classes = []
        with tf.io.gfile.GFile(path) as f:
            reader = csv.DictReader(f)
            for row in reader:
                classes.append(row['display_name'])
        return classes

    def identificar_som(self, arquivo_memoria):
        arquivo_memoria.seek(0)
        audio, sr = librosa.load(arquivo_memoria, sr=16000, mono=True)
        scores, _, _ = self.model(audio)
        media_scores = tf.reduce_mean(scores, axis=0)
        idx_max = tf.argmax(media_scores)
        return self.class_names[idx_max], media_scores[idx_max].numpy()


###Transcri√ß√£o de √°udio:

In [4]:
class TranscritorWhisper:
    def __init__(self):
        print("Carregando Whisper (modelo large)...")
        self.model = whisper.load_model("large")

    def transcrever(self, arquivo_memoria):
        arquivo_memoria.seek(0)
        audio, sr = librosa.load(arquivo_memoria, sr=16000)
        resultado = self.model.transcribe(audio=audio, fp16=False)
        arquivo_memoria.close()
        return resultado['text']

### Base do Bot

In [5]:
class BotTelegram:
    def __init__(self, token):
        self.__token = token  # Atributo privado
        self.bot = telebot.TeleBot(self.__token)
    def _configurar_handlers(self):

        @self.bot.message_handler(commands=['start'])
        def start(message):
            nome = message.from_user.first_name
            self.bot.reply_to(message, f"Ol√°, {nome}! Sou um BOT criado para transcrever seus √°udios e classificar √°udios e imagens.")

        @self.bot.message_handler(commands=['ajuda'])
        def ajuda(message):
            self.bot.reply_to(message, "Experimente me enviar uma imagem ou √°udio e eu vou tentar classific√°-lo.")

        @self.bot.message_handler(content_types=['video', 'sticker', 'animation', 'video_note', 'document', 'poll'])
        def responder(message):
            self.bot.reply_to(message, "Desculpe, n√£o trabalhamos com esse tipo de arquivo. Tente nos enviar uma imagem ou um √°udio.")

        @self.bot.message_handler(content_types=['text'])
        def texto(message):
            self.bot.reply_to(message, "Desculpe, n√£o consigo entender o que voc√™ diz. N√£o sou adaptado para compreender e responder textos. Eu apenas consigo classificar e/ou transcrever imagens e √°udios que voc√™ me enviar.")

    def executar(self):
        print("Bot online.")
        self.bot.infinity_polling()

###Bot para √°udio:

In [6]:
class BotAudio(BotTelegram):
    def __init__(self, token, motor_som, motor_texto):
        super().__init__(token)

        self.classificador = motor_som
        self.transcritor = motor_texto
        self._configurar_handlers()

    def _configurar_handlers(self):
        super()._configurar_handlers()
        @self.bot.message_handler(content_types=['voice', 'audio'])
        def tratar_audio(message):
            status = self.bot.reply_to(message, "‚è≥ Analisando √°udio...")
            try:
                file_info = self.bot.get_file(message.voice.file_id if message.voice else message.audio.file_id)
                downloaded_file = self.bot.download_file(file_info.file_path)
                audio_ram = io.BytesIO(downloaded_file)

                classe, confianca = self.classificador.identificar_som(audio_ram)
                resposta = f"‚úÖ Som identificado: {classe} ({confianca:.2%})\n"

                if "Speech" in classe or "Conversation" in classe:
                    self.bot.edit_message_text(resposta + "üéôÔ∏è Transcrevendo...", message.chat.id,
                                               status.message_id)
                    texto = self.transcritor.transcrever(audio_ram)
                    resposta += f"\nüìù Transcri√ß√£o: {texto}"

                self.bot.edit_message_text(resposta, message.chat.id, status.message_id, parse_mode="Markdown")

            except Exception as e:
                resposta += f"\nErro: {str(e)}"
                self.bot.edit_message_text(resposta, message.chat.id, status.message_id, parse_mode="Markdown")

            finally:
                audio_ram.close()

##Execu√ß√£o:

In [7]:
if __name__ == "__main__":
    TOKEN = '7812768588:AAFyWirqLGt_B-cdMip7sWMp8n_bVBYvzyo'

    # 1. Instancia as IAs primeiro
    ia_som = ClassificadorAudio()
    ia_texto = TranscritorWhisper()

    # 2. Instancia a classe FILHA, que j√° configura o PAI internamente
    meu_bot = BotAudio(TOKEN, ia_som, ia_texto)

    # 3. Inicia o polling
    meu_bot.executar()

Carregando YAMNet...
Carregando Whisper (modelo large)...
Bot online.


2025-12-27 15:48:39,441 (__init__.py:1121 MainThread) ERROR - TeleBot: "Infinity polling: polling exited"
ERROR:TeleBot:Infinity polling: polling exited
2025-12-27 15:48:39,452 (__init__.py:1123 MainThread) ERROR - TeleBot: "Break infinity polling"
ERROR:TeleBot:Break infinity polling
