# üéØ Sistema de Gera√ß√£o Autom√°tica de Atas - UFS

**Demonstra√ß√£o Interativa para Conselho Universit√°rio**

Este notebook implementa uma interface visual para demonstrar o sistema de gera√ß√£o autom√°tica de atas de reuni√£o desenvolvido para a Universidade Federal de Sergipe (UFS).

## üöÄ Funcionalidades

- ‚úÖ **Upload de √°udio** - Suporte a .mp3, .wav, .m4a
- ‚úÖ **Diariza√ß√£o autom√°tica** - Separa√ß√£o de speakers com IA
- ‚úÖ **Transcri√ß√£o precisa** - Convers√£o √°udio ‚Üí texto com Whisper
- ‚úÖ **Gera√ß√£o de ata** - Cria√ß√£o autom√°tica de ata estruturada
- ‚úÖ **Interface amig√°vel** - Demonstra√ß√£o visual completa

---

## üì¶ Instala√ß√£o das Depend√™ncias

In [None]:
# Instala√ß√£o das depend√™ncias necess√°rias
!pip install gradio -q
!pip install git+https://github.com/openai/whisper.git -q
!pip install openai -q
!pip install pyannote.audio -q
!pip install torch torchvision torchaudio -q
!pip install pydub -q

In [None]:
# Imports necess√°rios
import gradio as gr
import whisper
import os
from openai import OpenAI
from pyannote.audio import Pipeline
import torch
from datetime import datetime
import json
import tempfile
from collections import defaultdict
import warnings
warnings.filterwarnings('ignore')

print("‚úÖ Bibliotecas importadas com sucesso!")

## ‚öôÔ∏è Configura√ß√£o dos Modelos de IA

In [None]:
# Configura√ß√£o da API OpenAI
# IMPORTANTE: Substitua pela sua chave de API
OPENAI_API_KEY = "your-openai-api-key-here"  # ou use os.getenv("OPENAI_API_KEY")

if OPENAI_API_KEY == "your-openai-api-key-here":
    print("‚ö†Ô∏è ATEN√á√ÉO: Configure sua chave da OpenAI API")
    print("   Edite a vari√°vel OPENAI_API_KEY acima")
else:
    client = OpenAI(api_key=OPENAI_API_KEY)
    print("‚úÖ Cliente OpenAI configurado!")

In [None]:
# Carregamento dos modelos
print("üîÑ Carregando modelo Whisper...")
whisper_model = whisper.load_model("small")
print("‚úÖ Whisper carregado!")

print("üîÑ Configurando pipeline de diariza√ß√£o...")
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(f"   Dispositivo: {device}")

# Nota: Para usar pyannote, aceite os termos em:
# https://huggingface.co/pyannote/speaker-diarization
# https://huggingface.co/pyannote/segmentation
try:
    diarization_pipeline = Pipeline.from_pretrained("pyannote/speaker-diarization@2.1")
    diarization_pipeline.to(device)
    print("‚úÖ Pipeline de diariza√ß√£o configurado!")
    DIARIZATION_AVAILABLE = True
except Exception as e:
    print(f"‚ö†Ô∏è Diariza√ß√£o n√£o dispon√≠vel: {e}")
    print("   Sistema funcionar√° sem separa√ß√£o de speakers")
    DIARIZATION_AVAILABLE = False

## üõ†Ô∏è Fun√ß√µes do Sistema

In [None]:
def perform_diarization(audio_path):
    """
    Realiza diariza√ß√£o (separa√ß√£o de speakers) do √°udio
    """
    if not DIARIZATION_AVAILABLE:
        return []
    
    try:
        diarization = diarization_pipeline(audio_path)
        speakers_info = []
        
        for turn, _, speaker in diarization.itertracks(yield_label=True):
            speakers_info.append({
                "speaker": speaker,
                "start": turn.start,
                "end": turn.end,
                "duration": turn.end - turn.start
            })
        
        return speakers_info
    except Exception as e:
        print(f"Erro na diariza√ß√£o: {e}")
        return []

In [None]:
def transcribe_with_diarization(audio_path, speakers_info):
    """
    Transcreve √°udio com informa√ß√µes de diariza√ß√£o
    """
    try:
        # Transcri√ß√£o completa com Whisper
        result = whisper_model.transcribe(audio_path, language="pt")
        full_transcription = result["text"]
        segments = result.get("segments", [])
        
        if not speakers_info or not segments:
            return [], full_transcription
        
        # Associar segmentos com speakers
        speaker_transcriptions = []
        
        for segment in segments:
            segment_center = (segment["start"] + segment["end"]) / 2
            assigned_speaker = "PARTICIPANTE"
            
            # Encontrar speaker para este segmento
            for speaker_info in speakers_info:
                if speaker_info["start"] <= segment_center <= speaker_info["end"]:
                    assigned_speaker = speaker_info["speaker"]
                    break
            
            speaker_transcriptions.append({
                "speaker": assigned_speaker,
                "start": segment["start"],
                "end": segment["end"],
                "text": segment["text"].strip(),
                "duration": segment["end"] - segment["start"]
            })
        
        return speaker_transcriptions, full_transcription
    
    except Exception as e:
        print(f"Erro na transcri√ß√£o: {e}")
        return [], ""

In [None]:
def generate_speaker_stats(speaker_transcriptions):
    """
    Gera estat√≠sticas dos participantes
    """
    speaker_stats = defaultdict(lambda: {"total_time": 0, "segments": 0, "words": 0})
    
    for segment in speaker_transcriptions:
        speaker = segment["speaker"]
        speaker_stats[speaker]["total_time"] += segment["duration"]
        speaker_stats[speaker]["segments"] += 1
        speaker_stats[speaker]["words"] += len(segment["text"].split())
    
    return dict(speaker_stats)

In [None]:
def generate_meeting_minutes(transcription, speaker_stats=None):
    """
    Gera ata de reuni√£o usando OpenAI
    """
    try:
        # Preparar contexto dos participantes
        speaker_context = ""
        if speaker_stats:
            speaker_context = "\n\n=== PARTICIPANTES IDENTIFICADOS ===\n"
            for speaker, stats in speaker_stats.items():
                speaker_context += f"- {speaker}: {stats['total_time']:.1f}s de fala, {stats['segments']} interven√ß√µes\n"
        
        system_prompt = """Voc√™ √© um assistente especializado em gerar atas de reuni√£o para o contexto universit√°rio brasileiro.
        
        Sua tarefa √© analisar a transcri√ß√£o de uma reuni√£o e criar uma ata formal e estruturada seguindo os padr√µes acad√™micos.
        
        A ata deve conter:
        1. CABE√áALHO - Data, participantes, tipo de reuni√£o
        2. PAUTA - Principais t√≥picos discutidos
        3. DELIBERA√á√ïES - Decis√µes tomadas e vota√ß√µes
        4. ENCAMINHAMENTOS - A√ß√µes futuras e respons√°veis
        5. OBSERVA√á√ïES - Informa√ß√µes adicionais relevantes
        
        Use linguagem formal, objetiva e organize as informa√ß√µes de forma clara e hier√°rquica.
        Identifique decis√µes importantes, pontos de consenso e discord√¢ncia quando aplic√°vel."""
        
        user_prompt = f"""TRANSCRI√á√ÉO DA REUNI√ÉO:
        {transcription}
        {speaker_context}
        
        Por favor, gere uma ata completa, formal e bem estruturada baseada nesta transcri√ß√£o.
        Organize as informa√ß√µes de forma profissional adequada para o ambiente universit√°rio."""
        
        response = client.chat.completions.create(
            model="gpt-4o-mini",
            messages=[
                {"role": "system", "content": system_prompt},
                {"role": "user", "content": user_prompt}
            ],
            temperature=0.2,
            max_tokens=3000
        )
        
        return response.choices[0].message.content
    
    except Exception as e:
        return f"Erro na gera√ß√£o da ata: {str(e)}"

In [None]:
def process_audio_file(audio_file, progress=gr.Progress()):
    """
    Fun√ß√£o principal que processa o arquivo de √°udio
    """
    if audio_file is None:
        return "‚ùå Nenhum arquivo de √°udio foi enviado.", "", "", ""
    
    try:
        progress(0, desc="üéµ Carregando arquivo de √°udio...")
        
        # Etapa 1: Diariza√ß√£o
        progress(0.1, desc="üé≠ Identificando participantes (diariza√ß√£o)...")
        speakers_info = perform_diarization(audio_file)
        
        num_speakers = len(set([s['speaker'] for s in speakers_info])) if speakers_info else 1
        
        # Etapa 2: Transcri√ß√£o
        progress(0.4, desc="üé§ Transcrevendo √°udio...")
        speaker_transcriptions, full_transcription = transcribe_with_diarization(audio_file, speakers_info)
        
        if not full_transcription:
            return "‚ùå Erro na transcri√ß√£o do √°udio.", "", "", ""
        
        # Etapa 3: Estat√≠sticas
        progress(0.6, desc="üìä Calculando estat√≠sticas...")
        speaker_stats = generate_speaker_stats(speaker_transcriptions)
        
        # Etapa 4: Gera√ß√£o da ata
        progress(0.8, desc="üìù Gerando ata de reuni√£o...")
        meeting_minutes = generate_meeting_minutes(full_transcription, speaker_stats)
        
        progress(1.0, desc="‚úÖ Processamento conclu√≠do!")
        
        # Formata√ß√£o dos resultados
        stats_text = f"""## üìä Estat√≠sticas da Reuni√£o

**Participantes identificados:** {num_speakers}
**Dura√ß√£o da transcri√ß√£o:** {len(full_transcription)} caracteres
**Processado em:** {datetime.now().strftime('%d/%m/%Y √†s %H:%M:%S')}

### Participa√ß√£o por Speaker:
"""
        
        if speaker_stats:
            for speaker, stats in sorted(speaker_stats.items()):
                stats_text += f"\n- **{speaker}**: {stats['total_time']:.1f}s ({stats['segments']} interven√ß√µes, {stats['words']} palavras)"
        else:
            stats_text += "\n- N√£o foi poss√≠vel separar por participantes"
        
        # Transcri√ß√£o formatada
        transcription_display = f"""## üé§ Transcri√ß√£o Completa

{full_transcription[:2000]}{'...' if len(full_transcription) > 2000 else ''}
"""
        
        # Ata formatada
        ata_display = f"""## üìã Ata de Reuni√£o Gerada

{meeting_minutes}
"""
        
        success_msg = f"""‚úÖ **Processamento conclu√≠do com sucesso!**

üéØ **Arquivo processado:** {os.path.basename(audio_file)}
üïí **Hor√°rio:** {datetime.now().strftime('%d/%m/%Y √†s %H:%M:%S')}
üë• **Participantes:** {num_speakers} identificados
üìÑ **Transcri√ß√£o:** {len(full_transcription)} caracteres
"""
        
        return success_msg, stats_text, transcription_display, ata_display
    
    except Exception as e:
        error_msg = f"‚ùå **Erro no processamento:** {str(e)}"
        return error_msg, "", "", ""

## üé® Interface Gradio

In [None]:
def create_interface():
    """
    Cria a interface Gradio
    """
    
    # CSS personalizado
    css = """
    .gradio-container {
        max-width: 1200px !important;
    }
    .header {
        text-align: center;
        background: linear-gradient(90deg, #1f4e79, #2e7d32);
        color: white;
        padding: 20px;
        border-radius: 10px;
        margin-bottom: 20px;
    }
    .status-success {
        background-color: #e8f5e8;
        border: 1px solid #4caf50;
        border-radius: 5px;
        padding: 10px;
    }
    """
    
    with gr.Blocks(css=css, title="Sistema de Atas UFS") as interface:
        
        # Cabe√ßalho
        gr.HTML("""
        <div class="header">
            <h1>üéØ Sistema de Gera√ß√£o Autom√°tica de Atas</h1>
            <h2>Universidade Federal de Sergipe - UFS</h2>
            <p><strong>Demonstra√ß√£o para Conselho Universit√°rio</strong></p>
        </div>
        """)
        
        gr.Markdown("""
        ### üìã Como usar:
        1. **Fa√ßa upload** de um arquivo de √°udio (.mp3, .wav, .m4a)
        2. **Clique em "Processar √Åudio"** e aguarde
        3. **Visualize os resultados** nas abas abaixo
        
        > ‚ö° O processamento pode levar alguns minutos dependendo do tamanho do arquivo
        """)
        
        # Input de √°udio
        with gr.Row():
            audio_input = gr.Audio(
                label="üìÅ Upload do Arquivo de √Åudio",
                type="filepath",
                format="wav"
            )
        
        # Bot√£o de processamento
        process_btn = gr.Button(
            "üöÄ Processar √Åudio",
            variant="primary",
            size="lg"
        )
        
        # Outputs organizados em abas
        with gr.Tabs():
            
            with gr.TabItem("üìä Status & Estat√≠sticas"):
                status_output = gr.Markdown(label="Status")
                stats_output = gr.Markdown(label="Estat√≠sticas")
            
            with gr.TabItem("üé§ Transcri√ß√£o"):
                transcription_output = gr.Markdown(label="Transcri√ß√£o Completa")
            
            with gr.TabItem("üìã Ata Gerada"):
                ata_output = gr.Markdown(label="Ata de Reuni√£o")
        
        # Conectar o bot√£o com a fun√ß√£o
        process_btn.click(
            fn=process_audio_file,
            inputs=[audio_input],
            outputs=[status_output, stats_output, transcription_output, ata_output],
            show_progress=True
        )
        
        # Rodap√©
        gr.HTML("""
        <div style="text-align: center; margin-top: 30px; padding: 20px; background-color: #f5f5f5; border-radius: 10px;">
            <p><strong>üéì Sistema desenvolvido para a UFS</strong></p>
            <p>Tecnologias: Whisper AI + PyAnnote + OpenAI GPT + Gradio</p>
            <p><em>Demonstra√ß√£o t√©cnica - TCC Engenharia de Computa√ß√£o</em></p>
        </div>
        """)
    
    return interface

## üöÄ Executar a Aplica√ß√£o

In [None]:
# Verificar se tudo est√° configurado
def check_setup():
    status = []
    
    # Verificar Whisper
    if 'whisper_model' in globals():
        status.append("‚úÖ Whisper: Configurado")
    else:
        status.append("‚ùå Whisper: N√£o configurado")
    
    # Verificar OpenAI
    if 'client' in globals():
        status.append("‚úÖ OpenAI: Configurado")
    else:
        status.append("‚ùå OpenAI: N√£o configurado")
    
    # Verificar Diariza√ß√£o
    if DIARIZATION_AVAILABLE:
        status.append("‚úÖ Diariza√ß√£o: Dispon√≠vel")
    else:
        status.append("‚ö†Ô∏è Diariza√ß√£o: N√£o dispon√≠vel (sistema funcionar√° sem separa√ß√£o de speakers)")
    
    print("\n".join(status))
    return all("‚úÖ" in s or "‚ö†Ô∏è" in s for s in status)

setup_ok = check_setup()

In [None]:
# Executar a interface
if setup_ok:
    print("üéØ Iniciando Sistema de Gera√ß√£o de Atas - UFS")
    print("üì± A interface ser√° aberta em uma nova aba/janela")
    print("üîó Ou acesse o link que ser√° exibido abaixo")
    print("\n" + "="*50)
    
    # Criar e executar a interface
    demo = create_interface()
    demo.launch(
        server_name="0.0.0.0",  # Permite acesso externo
        server_port=7860,       # Porta padr√£o do Gradio
        share=True,             # Criar link p√∫blico tempor√°rio
        debug=False,            # Modo produ√ß√£o
        show_error=True         # Mostrar erros na interface
    )
else:
    print("‚ùå Sistema n√£o est√° completamente configurado.")
    print("   Verifique as configura√ß√µes acima antes de executar.")

## üìù Instru√ß√µes de Uso para Demonstra√ß√£o

### Para o Representante da UFS:

1. **Execute todas as c√©lulas acima** na ordem apresentada
2. **Configure sua chave da OpenAI** na c√©lula de configura√ß√£o
3. **Execute a √∫ltima c√©lula** para abrir a interface
4. **Acesse o link** que ser√° gerado (p√∫blico tempor√°rio)

### Recursos da Interface:

- ‚úÖ **Upload simples** - Arraste e solte arquivos de √°udio
- ‚úÖ **Processamento visual** - Barra de progresso em tempo real
- ‚úÖ **Resultados organizados** - Abas para cada tipo de informa√ß√£o
- ‚úÖ **Estat√≠sticas detalhadas** - Tempo de fala por participante
- ‚úÖ **Ata profissional** - Formata√ß√£o adequada para uso oficial

### Formatos de √Åudio Suportados:
- `.mp3` - Mais comum
- `.wav` - Melhor qualidade
- `.m4a` - iOS/iPhone

---

**üéØ Esta √© uma demonstra√ß√£o t√©cnica do sistema proposto para automatiza√ß√£o das atas de reuni√£o do Conselho Universit√°rio da UFS.**