<a href="https://colab.research.google.com/github/Gabrielasants7/Portfolio-Ciencia-de-Dados/blob/main/assistente_de_reuni%C3%A3o_.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Escopo do Projeto: Assistente de Reuniões com Transcrição e Tradução Automática

## Objetivo
O objetivo deste projeto é desenvolver um **Assistente de Reuniões** que transcreve em tempo real as discussões durante as reuniões e organiza as informações chave, como **ideias**, **decisões**, **itens de ação** e **prazos**. O assistente não só realiza a transcrição, mas também cria atas de reunião estruturadas e acionáveis, permitindo que os participantes da reunião possam se concentrar na discussão sem se preocupar em perder detalhes importantes.

Além disso, o diferencial do projeto será o suporte a **tradução automática** entre **português** e **inglês**, com foco em trabalhadores brasileiros que ainda estão em processo de adaptação à língua inglesa. A ferramenta ajudará na transição e facilitará a compreensão em tempo real, sem barreiras linguísticas.

## Funcionalidades
1. **Transcrição de Áudio em Tempo Real**:
   - O modelo **Whisper** da OpenAI será utilizado para transcrever automaticamente o áudio da reunião para texto em tempo real.
   - O áudio será processado e convertido em texto enquanto a reunião ocorre, sem a necessidade de intervenções manuais.

2. **Tradução Automática (Português e Inglês)**:
   - A transcrição será traduzida automaticamente entre os idiomas **português** e **inglês**, permitindo que os participantes brasileiros possam compreender facilmente as discussões em inglês.
   - A tradução será feita com modelos de tradução automática, garantindo que o conteúdo seja acessível para todos os participantes, independentemente da sua fluência em inglês.

3. **Organização das Atas de Reunião**:
   - O assistente organizará a transcrição em **ata de reunião** estruturada, destacando:
     - **Ideias** discutidas.
     - **Decisões** tomadas.
     - **Itens de ação** com prazos e responsáveis.
   - A IA será capaz de identificar automaticamente os pontos mais importantes durante a reunião e gerar um resumo claro e organizado.

4. **Interface de Usuário (Gradio)**:
   - O sistema permitirá que os usuários façam o **upload de arquivos de áudio** da reunião ou usem a gravação em tempo real.
   - A interface será simples, com campos de upload de áudio, exibição da transcrição em tempo real, tradução e as atas geradas.

5. **Exportação de Resultados**:
   - Os resultados da transcrição e tradução poderão ser exportados em **formato de texto** ou **PDF**, facilitando o compartilhamento com os participantes da reunião.

## Tecnologias Utilizadas
- **Python 3.x**: Linguagem principal para o desenvolvimento do projeto.
- **Transformers (Hugging Face)**: Para utilizar o modelo **Whisper** para transcrição de áudio em tempo real e modelos de tradução automática.
- **Torch (PyTorch)**: Framework utilizado para rodar os modelos de aprendizado de máquina.
- **Gradio**: Biblioteca para criar uma interface de usuário interativa para upload de áudio e exibição da transcrição e tradução.
- **Google Colab**: Ambiente de desenvolvimento utilizado para executar o código, aproveitando recursos de processamento em nuvem.

## Fluxo do Sistema
1. **Entrada**:
   - O usuário faz o upload de um arquivo de áudio de uma reunião ou grava a reunião em tempo real.
   
2. **Processamento**:
   - O arquivo de áudio é enviado para o modelo **Whisper** que realiza a transcrição.
   - A transcrição é então traduzida automaticamente entre os idiomas **português** e **inglês**.
   
3. **Saída**:
   - A transcrição e tradução são exibidas em tempo real na interface do Gradio.
   - A IA organiza a transcrição em uma **ata de reunião**, destacando decisões, ideias e itens de ação.
   
4. **Exportação**:
   - A ata de reunião pode ser exportada para **PDF** ou **texto**, permitindo o envio para os participantes.


## Dependências
- **transformers**: Biblioteca para acessar modelos de NLP (Natural Language Processing), como o modelo **Whisper** e modelos de tradução automática.
- **torch**: Framework para execução dos modelos de aprendizado profundo.
- **gradio**: Biblioteca para criar interfaces de usuário interativas.
- **pydantic**: Biblioteca para validar e configurar as entradas e saídas do aplicativo.
- **ffmpeg**: Ferramenta para manipulação e conversão de arquivos de áudio, se necessário.

## Passos para Execução no Colab
1. **Instalar Dependências**:
   - Instalar as bibliotecas necessárias com os seguintes comandos:
     ```bash
    !pip install transformers==4.35.2 pydantic==2.10.3 torch==2.1.1 langchain==0.3.12 langchain-community==0.3.12 gradio==5.9.0 deep_translator googletrans  reportlab
     ```
   
2. **Carregar e Processar o Áudio**:
   - Utilizar a função de transcrição do modelo **Whisper**.
   - Adicionar a funcionalidade de tradução automática para converter entre português e inglês.
   
3. **Configurar a Interface Gradio**:
   - Criar a interface de upload de áudio e exibir a transcrição e tradução em tempo real.
   
4. **Testar a Aplicação**:
   - Testar a funcionalidade de upload, transcrição e tradução no ambiente Colab.
   
5. **Gerar Link Público**:
   - Usar o parâmetro `share=True` para gerar um link público que permita aos usuários acessarem a aplicação.

## Possíveis Melhorias
- **Suporte a Outros Idiomas**: Implementar suporte para outros idiomas além do português e inglês, facilitando a inclusão de participantes de diferentes regiões.

- **Integração com Calendários**: Integrar o sistema com ferramentas de calendário (como Google Calendar) para automaticamente gerar atas com base nas reuniões agendadas.

## Dado para teste

- **faça o upload do dado para teste  aqui

https://drive.google.com/file/d/1TBPIRdfdVKlqAx_SFdHuSF-Qh-duek-x/view?usp=sharing



## Conclusão
Este projeto visa simplificar o processo de **anotação de reuniões** e **organização de tarefas**, ao mesmo tempo em que facilita a comunicação entre equipes internacionais, com suporte a **tradução em tempo real** e **transcrição automática**.

---




In [5]:
#instalando as bibliotecas necessárias
!pip install transformers==4.35.2 pydantic==2.10.3 torch==2.1.1 langchain==0.3.12 langchain-community==0.3.12 gradio==5.9.0 deep_translator googletrans  reportlab



Collecting reportlab
  Downloading reportlab-4.2.5-py3-none-any.whl.metadata (1.5 kB)
Downloading reportlab-4.2.5-py3-none-any.whl (1.9 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.9/1.9 MB[0m [31m17.9 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: reportlab
Successfully installed reportlab-4.2.5


In [6]:
#instalando a biblioteca para pré-processamento e manipulação de  arquivos de áudio
!apt install ffmpeg -y

Reading package lists... Done
Building dependency tree... Done
Reading state information... Done
ffmpeg is already the newest version (7:4.4.2-0ubuntu0.22.04.1).
0 upgraded, 0 newly installed, 0 to remove and 18 not upgraded.


In [7]:
#fazendo upload do arquivo
from google.colab import files

uploaded = files.upload()

Saving trimmed_02.wav to trimmed_02 (1).wav


In [13]:
#importação das bibliotecas
import torch #transcrição para processar os dados
from transformers import pipeline # fornece o modelo Whisper que faz a transcrição de áudio em texto
from deep_translator import GoogleTranslator # tradução
import os #gerenciar diretórios e arquivos do sistema
import gradio as gr #cria a interface web para upload de áudio e interação com o usuário
from reportlab.lib.pagesizes import A4 #Gera o PDF formatado da ata da reunião
from reportlab.pdfgen import canvas
from reportlab.lib.utils import simpleSplit
from datetime import datetime #obtém a data atual para organizar os arquivos da reunião.

#  pipeline de reconhecimento de fala (ASR)
pipe = pipeline(
    "automatic-speech-recognition",
    model="openai/whisper-tiny.en",
    chunk_length_s=30,
)

#  arquivo de áudio
sample = "trimmed_02.wav"

# rodando a transcrição
transcription_en = pipe(sample, batch_size=8)["text"]

# traduzindo para português
translator = GoogleTranslator(source="en", target="pt")
transcription_pt = translator.translate(transcription_en)

# exibindo os resultados
print("🔹 Transcrição em Inglês:\n", transcription_en)
print("\n🔹 Tradução para Português:\n", transcription_pt)


Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.


🔹 Transcrição em Inglês:
  99% confidence level indicating that our maximum loss will mat exceed 5 million in the next trading day. We've adopted a conservative approach to managing our leverage and have a healthy tier one capital ratio of 12.5%. Our forecast for the coming quarter is positive. We expect revenue to be around 135 million and 8% quarter over quarter growth driven primarily by our cutting-edge blockchain chain solutions and AI driven predictive analytics. We're also excited about the upcoming IPO of our FinTech subsidiary pay plus which we expect to raise 200 million significantly bolstering our liquidity and paving the way for aggressive growth strategies. We thank our shareholders for their continued faith in us and we look forward to an even more successful Q3. Thank you so much.

🔹 Tradução para Português:
 Nível de confiança de 99% indicando que nossa perda máxima pode exceder 5 milhões no próximo dia de negociação. Adotamos uma abordagem conservadora para gerenciar 

In [14]:
# criando o pipeline de transcrição
pipe = pipeline(
    "automatic-speech-recognition",
    model="openai/whisper-tiny.en",
    chunk_length_s=30,
)

# função para transcrever e traduzir áudio
def transcript_audio(audio_file):
    # criando diretório para armazenar os arquivos
    data_atual = datetime.now().strftime("%Y-%m-%d")
    folder_name = f"Atas_de_Reunioes/{data_atual}_Reuniao"
    os.makedirs(folder_name, exist_ok=True)

    # processando transcrição
    result = pipe(audio_file)["text"]
    translation = GoogleTranslator(source="auto", target="pt").translate(result)

    # salvando gravação no diretório
    audio_path = os.path.join(folder_name, os.path.basename(audio_file))
    os.rename(audio_file, audio_path)

    # criando e salvando PDF formatado
    pdf_path = generate_meeting_pdf(data_atual, translation, audio_path)

    return (
        f"**Transcrição (Inglês):**\n{result}\n\n**Transcrição (Português):**\n{translation}",
        pdf_path,
    )

# função para gerar PDF formatado corretamente
def generate_meeting_pdf(date, transcription, audio_path):
    pdf_path = f"Atas_de_Reunioes/{date}_Reuniao/{date}_Ata.pdf"
    c = canvas.Canvas(pdf_path, pagesize=A4)
    width, height = A4

    # cabeçalho
    c.setFont("Helvetica-Bold", 14)
    c.drawString(50, height - 50, f"📅 Data: {date}")

    # linha de separação
    c.setStrokeColorRGB(0, 0, 0)
    c.line(50, height - 60, width - 50, height - 60)

    # adicionando a transcrição ao PDF
    c.setFont("Helvetica-Bold", 12)
    c.drawString(50, height - 80, "📝 Transcrição (Português):")
    c.setFont("Helvetica", 12)

    # dividindo o texto para evitar cortes
    text_lines = simpleSplit(transcription, "Helvetica", 12, width - 100)
    y_position = height - 110

    for line in text_lines:
        if y_position < 50:  # criar nova página se o texto ultrapassar o limite
            c.showPage()
            y_position = height - 50
            c.setFont("Helvetica", 12)
        c.drawString(50, y_position, line)
        y_position -= 20

    # adicionando link da gravação
    c.setFont("Helvetica-Bold", 12)
    c.drawString(50, y_position - 20, f"🔗 Link para a Gravação: {audio_path}")

    # salvando PDF
    c.save()
    return pdf_path

# função para pesquisa por palavras-chave
def search_keywords(transcription, keyword):
    if keyword.lower() in transcription.lower():
        return f"🔎 Palavra-chave encontrada: **{keyword}** aparece na transcrição!"
    return "❌ Palavra-chave não encontrada."

# interface Gradio
audio_input = gr.Audio(sources="upload", type="filepath")
output_text = gr.Textbox(label="Transcrição e Tradução")
keyword_input = gr.Textbox(label="🔍 Pesquisar Palavra-Chave")
keyword_output = gr.Textbox(label="Resultado da Pesquisa")
download_pdf = gr.File(label="📄 Baixar PDF")

iface = gr.Interface(
    fn=transcript_audio,
    inputs=audio_input,
    outputs=[output_text, download_pdf],
    title="📌 Assistente de Reuniões com IA",
    description="📢 Faça o upload do áudio da reunião para transcrição e tradução automática. Gere atas formatadas e pesquise palavras-chave na transcrição.",
)

iface.launch(share=True)


Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.


Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
* Running on public URL: https://6616649ce3c8031c57.gradio.live

This share link expires in 72 hours. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)


