# üé§ XTTS v2 Fine-tuning Completo com Monitoramento

## üéØ **Objetivo**
Treinar um modelo de IA que se **especializa na sua voz** com qualidade dramaticamente superior (7/10 ‚Üí 9/10) e sistema completo de monitoramento visual.

## üöÄ **Recursos Inclu√≠dos**
- ‚úÖ **Setup autom√°tico** completo
- ‚úÖ **Fine-tuning com monitoramento** em tempo real
- ‚úÖ **Sistema de infer√™ncia** integrado
- ‚úÖ **An√°lise de qualidade** autom√°tica
- ‚úÖ **Interface web** opcional
- ‚úÖ **Gr√°ficos e m√©tricas** profissionais

## üíª **Requisitos M√≠nimos**
- üî• **GPU:** RTX 3070+ com 8GB+ VRAM
- üíæ **RAM:** 16GB+ (32GB recomendado)
- üíø **Armazenamento:** 50GB+ livres
- üêç **Python:** 3.8-3.11

---

**üìã INSTRU√á√ïES:** Execute as c√©lulas na ordem. O processo completo demora 4-6 horas (incluindo grava√ß√£o e treinamento).

## üì¶ **SE√á√ÉO 1: SETUP E VERIFICA√á√ÉO DO SISTEMA**

In [None]:
# üîç VERIFICA√á√ÉO INICIAL DO SISTEMA
import sys
import subprocess
import platform
from pathlib import Path
import os

print("üöÄ XTTS v2 FINE-TUNING - VERIFICA√á√ÉO INICIAL")
print("=" * 60)

# Verificar Python
python_version = sys.version_info
print(f"üêç Python: {python_version.major}.{python_version.minor}.{python_version.micro}")

if python_version.major != 3 or python_version.minor < 8:
    print("‚ùå Python 3.8+ √© obrigat√≥rio!")
else:
    print("‚úÖ Vers√£o do Python adequada")

# Verificar GPU
print("\nüî• Verificando GPU NVIDIA...")
try:
    result = subprocess.run(['nvidia-smi'], capture_output=True, text=True)
    if result.returncode == 0:
        print("‚úÖ GPU NVIDIA detectada")
        # Extrair informa√ß√µes b√°sicas
        lines = result.stdout.split('\n')
        for line in lines:
            if 'GeForce' in line or 'RTX' in line or 'GTX' in line:
                gpu_info = line.split('|')[1].strip() if '|' in line else line.strip()
                print(f"   üìä {gpu_info}")
                break
    else:
        print("‚ùå nvidia-smi falhou")
except FileNotFoundError:
    print("‚ùå nvidia-smi n√£o encontrado - instale drivers NVIDIA")

# Verificar espa√ßo em disco
print("\nüíæ Verificando espa√ßo em disco...")
try:
    if platform.system() == "Windows":
        import shutil
        free_bytes = shutil.disk_usage('.').free
    else:
        stat = os.statvfs('.')
        free_bytes = stat.f_bavail * stat.f_frsize
    
    free_gb = free_bytes / (1024**3)
    print(f"üíø Espa√ßo livre: {free_gb:.1f}GB")
    
    if free_gb < 20:
        print("‚ùå Pouco espa√ßo (< 20GB necess√°rios)")
    elif free_gb < 50:
        print("‚ö†Ô∏è  Espa√ßo limitado (50GB+ recomendados)")
    else:
        print("‚úÖ Espa√ßo adequado")
        
except Exception as e:
    print(f"‚ö†Ô∏è  N√£o foi poss√≠vel verificar: {e}")

print("\n" + "=" * 60)
print("üìã CONTINUE SE TODAS AS VERIFICA√á√ïES PASSARAM")

In [None]:
# üì¶ INSTALA√á√ÉO DE DEPEND√äNCIAS
print("üì¶ INSTALANDO DEPEND√äNCIAS NECESS√ÅRIAS...")
print("‚è≥ Isso pode demorar 5-10 minutos")
print("=" * 50)

# Lista de depend√™ncias essenciais
dependencies = [
    # PyTorch com CUDA (IMPORTANTE: instalar primeiro)
    "torch==2.1.0+cu118",
    "torchaudio==2.1.0+cu118",
    
    # TTS Framework
    "TTS==0.22.0",
    
    # Processamento de √°udio
    "librosa==0.10.1",
    "soundfile==0.12.1",
    
    # An√°lise de dados
    "pandas==2.1.3",
    "numpy==1.24.3",
    
    # Visualiza√ß√£o (para monitoramento)
    "matplotlib==3.8.1",
    "seaborn==0.12.2",
    
    # Utilit√°rios
    "tqdm==4.66.1",
    "psutil==5.9.6",
]

import subprocess
import sys

# Instalar PyTorch com CUDA primeiro
print("üî• Instalando PyTorch com CUDA...")
pytorch_cmd = [
    sys.executable, '-m', 'pip', 'install',
    'torch==2.1.0+cu118', 'torchaudio==2.1.0+cu118',
    '--extra-index-url', 'https://download.pytorch.org/whl/cu118'
]

try:
    subprocess.run(pytorch_cmd, check=True)
    print("‚úÖ PyTorch instalado")
except subprocess.CalledProcessError:
    print("‚ùå Erro na instala√ß√£o do PyTorch")

# Instalar outras depend√™ncias
print("\nüìö Instalando outras depend√™ncias...")
other_deps = [dep for dep in dependencies if not dep.startswith('torch')]

for dep in other_deps:
    try:
        print(f"   üì¶ Instalando {dep.split('==')[0]}...")
        subprocess.run([sys.executable, '-m', 'pip', 'install', dep], 
                      check=True, capture_output=True)
        print(f"   ‚úÖ {dep.split('==')[0]} OK")
    except subprocess.CalledProcessError as e:
        print(f"   ‚ùå Falha: {dep}")

print("\nüîç TESTANDO INSTALA√á√ïES...")

# Testar importa√ß√µes cr√≠ticas
test_imports = {
    'torch': 'PyTorch',
    'TTS': 'TTS Framework', 
    'librosa': 'Librosa',
    'matplotlib': 'Matplotlib',
    'pandas': 'Pandas'
}

all_ok = True
for module, name in test_imports.items():
    try:
        __import__(module)
        print(f"   ‚úÖ {name}")
    except ImportError:
        print(f"   ‚ùå {name} - FALTANDO")
        all_ok = False

# Teste espec√≠fico do CUDA
try:
    import torch
    print(f"\nüî• CUDA Test:")
    print(f"   PyTorch version: {torch.__version__}")
    print(f"   CUDA available: {torch.cuda.is_available()}")
    if torch.cuda.is_available():
        print(f"   GPU count: {torch.cuda.device_count()}")
        for i in range(torch.cuda.device_count()):
            print(f"   GPU {i}: {torch.cuda.get_device_name(i)}")
    else:
        print("   ‚ö†Ô∏è  CUDA n√£o dispon√≠vel - verificar drivers")
except Exception as e:
    print(f"   ‚ùå Erro no teste CUDA: {e}")
    all_ok = False

if all_ok:
    print("\nüéâ INSTALA√á√ÉO CONCLU√çDA COM SUCESSO!")
else:
    print("\n‚ö†Ô∏è  Algumas depend√™ncias podem estar faltando")

In [None]:
# üìÅ CRIAR ESTRUTURA DE PASTAS
from pathlib import Path
import os

print("üìÅ CRIANDO ESTRUTURA DE PASTAS...")
print("=" * 40)

# Definir estrutura de diret√≥rios
directories = [
    'raw_recordings',                    # Seus √°udios gravados
    'xtts_finetune/models/base',        # Modelo base baixado
    'xtts_finetune/models/checkpoints', # Checkpoints durante treino
    'xtts_finetune/models/best',        # Modelo final
    'xtts_finetune/dataset/wavs',       # √Åudios processados
    'xtts_finetune/dataset/metadata',   # Metadados
    'xtts_finetune/metrics',            # üÜï Gr√°ficos e m√©tricas
    'xtts_finetune/outputs',            # √Åudios gerados
    'xtts_finetune/configs',            # Configura√ß√µes
    'xtts_finetune/logs',               # Logs de treinamento
    'backups',                          # Backups
    'temp_audio'                        # Arquivos tempor√°rios
]

# Criar todas as pastas
for directory in directories:
    Path(directory).mkdir(parents=True, exist_ok=True)
    print(f"   üìÇ {directory}")

print("\n‚úÖ Estrutura de pastas criada!")
print("\nüìã PR√ìXIMO PASSO: Grave seus √°udios na pasta 'raw_recordings/'")

## üìù **SE√á√ÉO 2: TRANSCRI√á√ïES E DADOS DE TREINAMENTO**

In [None]:
# üìã CRIAR ARQUIVO DE TRANSCRI√á√ïES COMPLETO
import pandas as pd

print("üìù CRIANDO ARQUIVO DE TRANSCRI√á√ïES...")
print("üéØ 75 textos organizados em 5 categorias")
print("=" * 50)

# Dados completos das transcri√ß√µes
transcriptions_data = [
    # CATEGORIA: EXPLICATIVO (20 √°udios)
    ("audio_001.wav", "Bem-vindos √† nossa aula sobre Hist√≥ria e Evolu√ß√£o dos Computadores.", "explicativo"),
    ("audio_002.wav", "Hoje vamos explorar a fascinante jornada da computa√ß√£o ao longo dos s√©culos.", "explicativo"),
    ("audio_003.wav", "O processador √© considerado o c√©rebro do computador moderno.", "explicativo"),
    ("audio_004.wav", "Vamos entender como os transistores revolucionaram a tecnologia.", "explicativo"),
    ("audio_005.wav", "A mem√≥ria RAM armazena temporariamente os dados que est√£o sendo processados.", "explicativo"),
    ("audio_006.wav", "Os algoritmos s√£o sequ√™ncias de instru√ß√µes para resolver problemas espec√≠ficos.", "explicativo"),
    ("audio_007.wav", "A programa√ß√£o √© a arte de comunicar-se com as m√°quinas.", "explicativo"),
    ("audio_008.wav", "Os sistemas operacionais gerenciam todos os recursos do computador.", "explicativo"),
    ("audio_009.wav", "A internet conectou bilh√µes de dispositivos ao redor do mundo.", "explicativo"),
    ("audio_010.wav", "A intelig√™ncia artificial est√° transformando nossa sociedade.", "explicativo"),
    ("audio_011.wav", "As redes de computadores permitem o compartilhamento de informa√ß√µes.", "explicativo"),
    ("audio_012.wav", "O armazenamento em nuvem revolucionou como guardamos nossos dados.", "explicativo"),
    ("audio_013.wav", "A criptografia protege nossas informa√ß√µes pessoais na era digital.", "explicativo"),
    ("audio_014.wav", "Os bancos de dados organizam e gerenciam grandes volumes de informa√ß√£o.", "explicativo"),
    ("audio_015.wav", "A computa√ß√£o qu√¢ntica promete resolver problemas antes imposs√≠veis.", "explicativo"),
    ("audio_016.wav", "Vamos analisar passo a passo como funciona este algoritmo.", "explicativo"),
    ("audio_017.wav", "√â importante compreender os fundamentos antes de avan√ßar.", "explicativo"),
    ("audio_018.wav", "Este conceito ser√° fundamental para os pr√≥ximos t√≥picos.", "explicativo"),
    ("audio_019.wav", "Vamos fazer uma demonstra√ß√£o pr√°tica deste processo.", "explicativo"),
    ("audio_020.wav", "Agora voc√™s podem ver claramente como tudo se conecta.", "explicativo"),
    
    # CATEGORIA: CONVERSACIONAL (15 √°udios)
    ("audio_021.wav", "Ol√° pessoal, como est√£o hoje?", "conversacional"),
    ("audio_022.wav", "Espero que tenham gostado da aula anterior.", "conversacional"),
    ("audio_023.wav", "Vamos fazer uma pausa para perguntas.", "conversacional"),
    ("audio_024.wav", "Algu√©m tem alguma d√∫vida at√© aqui?", "conversacional"),
    ("audio_025.wav", "Muito bem, vamos continuar ent√£o.", "conversacional"),
    ("audio_026.wav", "Pessoal, prestem aten√ß√£o neste pr√≥ximo t√≥pico.", "conversacional"),
    ("audio_027.wav", "Voc√™s est√£o acompanhando o racioc√≠nio?", "conversacional"),
    ("audio_028.wav", "Excelente pergunta, vou explicar melhor.", "conversacional"),
    ("audio_029.wav", "Vou repetir este ponto importante.", "conversacional"),
    ("audio_030.wav", "At√© a pr√≥xima aula, pessoal!", "conversacional"),
    ("audio_031.wav", "Lembrem-se de revisar o material em casa.", "conversacional"),
    ("audio_032.wav", "Nos vemos na pr√≥xima semana.", "conversacional"),
    ("audio_033.wav", "Tenham uma √≥tima semana!", "conversacional"),
    ("audio_034.wav", "Espero voc√™s na pr√≥xima aula.", "conversacional"),
    ("audio_035.wav", "Obrigado pela aten√ß√£o de todos.", "conversacional"),
    
    # CATEGORIA: T√âCNICO (15 √°udios)
    ("audio_036.wav", "De acordo com a documenta√ß√£o oficial da linguagem.", "tecnico"),
    ("audio_037.wav", "A complexidade temporal deste algoritmo √© O de n ao quadrado.", "tecnico"),
    ("audio_038.wav", "Implementaremos esta fun√ß√£o utilizando recurs√£o.", "tecnico"),
    ("audio_039.wav", "O protocolo TCP garante a entrega confi√°vel dos dados.", "tecnico"),
    ("audio_040.wav", "A arquitetura cliente-servidor √© amplamente utilizada.", "tecnico"),
    ("audio_041.wav", "O padr√£o de projeto Singleton restringe a cria√ß√£o de inst√¢ncias.", "tecnico"),
    ("audio_042.wav", "A normaliza√ß√£o de banco de dados elimina redund√¢ncias.", "tecnico"),
    ("audio_043.wav", "O algoritmo de ordena√ß√£o quicksort tem efici√™ncia m√©dia n log n.", "tecnico"),
    ("audio_044.wav", "A programa√ß√£o orientada a objetos organiza o c√≥digo em classes.", "tecnico"),
    ("audio_045.wav", "As estruturas de dados determinam como organizamos informa√ß√µes.", "tecnico"),
    ("audio_046.wav", "O modelo MVC separa a l√≥gica de neg√≥cio da apresenta√ß√£o.", "tecnico"),
    ("audio_047.wav", "A compila√ß√£o transforma c√≥digo fonte em c√≥digo execut√°vel.", "tecnico"),
    ("audio_048.wav", "Os ponteiros referenciam posi√ß√µes espec√≠ficas na mem√≥ria.", "tecnico"),
    ("audio_049.wav", "A heran√ßa permite reutilizar c√≥digo entre classes relacionadas.", "tecnico"),
    ("audio_050.wav", "O versionamento de c√≥digo facilita o trabalho em equipe.", "tecnico"),
    
    # CATEGORIA: EMOCIONAL (10 √°udios)
    ("audio_051.wav", "√â absolutamente fascinante como a tecnologia evoluiu!", "emocional"),
    ("audio_052.wav", "Isso √© realmente impressionante, n√£o acham?", "emocional"),
    ("audio_053.wav", "Parab√©ns! Voc√™s conseguiram resolver o problema.", "emocional"),
    ("audio_054.wav", "Estou muito orgulhoso do progresso de voc√™s.", "emocional"),
    ("audio_055.wav", "Que descoberta incr√≠vel acabamos de ver!", "emocional"),
    ("audio_056.wav", "Voc√™s est√£o indo muito bem neste curso.", "emocional"),
    ("audio_057.wav", "Isso √© exatamente o que eu esperava de voc√™s!", "emocional"),
    ("audio_058.wav", "Fant√°stico! Agora voc√™s dominam o conceito.", "emocional"),
    ("audio_059.wav", "Estou empolgado para mostrar o pr√≥ximo t√≥pico.", "emocional"),
    ("audio_060.wav", "Que momento emocionante da nossa jornada!", "emocional"),
    
    # CATEGORIA: HIST√ìRICO (10 √°udios)
    ("audio_061.wav", "O ENIAC ocupava uma sala inteira e pesava trinta toneladas.", "historico"),
    ("audio_062.wav", "Ada Lovelace √© considerada a primeira programadora da hist√≥ria.", "historico"),
    ("audio_063.wav", "Charles Babbage projetou a primeira m√°quina de calcular program√°vel.", "historico"),
    ("audio_064.wav", "O primeiro microprocessador foi o Intel quatro zero zero quatro.", "historico"),
    ("audio_065.wav", "A ARPANET foi o precursor da internet moderna.", "historico"),
    ("audio_066.wav", "O primeiro computador pessoal foi lan√ßado na d√©cada de setenta.", "historico"),
    ("audio_067.wav", "A Lei de Moore previu o crescimento exponencial dos processadores.", "historico"),
    ("audio_068.wav", "O sistema operacional UNIX influenciou todos os sistemas modernos.", "historico"),
    ("audio_069.wav", "A linguagem C revolucionou a programa√ß√£o de sistemas.", "historico"),
    ("audio_070.wav", "A World Wide Web foi criada por Tim Berners-Lee.", "historico"),
    
    # CATEGORIA: RESUMO (5 √°udios)
    ("audio_071.wav", "Vamos recapitular os pontos principais desta aula.", "resumo"),
    ("audio_072.wav", "Primeiro, discutimos a evolu√ß√£o dos processadores.", "resumo"),
    ("audio_073.wav", "Em seguida, analisamos o impacto da internet.", "resumo"),
    ("audio_074.wav", "Finalmente, exploramos as tend√™ncias futuras.", "resumo"),
    ("audio_075.wav", "Estes conceitos ser√£o essenciais para o pr√≥ximo m√≥dulo.", "resumo"),
]

# Criar DataFrame
df_transcriptions = pd.DataFrame(transcriptions_data, 
                                columns=['filename', 'text', 'category'])

# Salvar CSV
csv_filename = 'voice_training_transcriptions_complete.csv'
df_transcriptions.to_csv(csv_filename, index=False)

print(f"‚úÖ Arquivo criado: {csv_filename}")
print(f"üìä Total de transcri√ß√µes: {len(df_transcriptions)}")

# Mostrar estat√≠sticas por categoria
print("\nüìã DISTRIBUI√á√ÉO POR CATEGORIA:")
category_counts = df_transcriptions['category'].value_counts()
for category, count in category_counts.items():
    emoji = {
        'explicativo': 'üéì',
        'conversacional': 'üí¨', 
        'tecnico': 'üîß',
        'emocional': 'üòä',
        'historico': 'üìö',
        'resumo': 'üìã'
    }.get(category, '‚ùì')
    print(f"   {emoji} {category.title()}: {count} √°udios")

print("\nüìù PR√ìXIMO PASSO: Grave os 75 √°udios na pasta 'raw_recordings/'")
print("üí° Use um microfone USB de qualidade em ambiente silencioso")
print("‚è±Ô∏è  Dura√ß√£o ideal: 3-8 segundos cada (total: 10-20 minutos)")

# Mostrar alguns exemplos
print("\nüìã EXEMPLOS DE TRANSCRI√á√ïES:")
for i in [0, 20, 35, 50, 60, 70]:
    row = df_transcriptions.iloc[i]
    print(f"   {row['filename']}: \"{row['text']}\"")

print(f"\nüìÑ Arquivo completo salvo: {csv_filename}")

In [None]:
# üîç TESTAR QUALIDADE DOS √ÅUDIOS GRAVADOS
# Execute esta c√©lula AP√ìS gravar seus √°udios

import librosa
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from pathlib import Path
import warnings
warnings.filterwarnings('ignore')

def analyze_audio_quality(audio_folder='raw_recordings'):
    """Analisar qualidade dos √°udios gravados"""
    
    print("üîç ANALISANDO QUALIDADE DOS √ÅUDIOS")
    print("=" * 50)
    
    audio_path = Path(audio_folder)
    if not audio_path.exists():
        print(f"‚ùå Pasta n√£o encontrada: {audio_folder}")
        print("üí° Grave seus √°udios primeiro na pasta 'raw_recordings/'")
        return None
    
    # Encontrar arquivos de √°udio
    audio_files = list(audio_path.glob("*.wav")) + list(audio_path.glob("*.mp3"))
    
    if not audio_files:
        print("‚ùå Nenhum arquivo de √°udio encontrado!")
        print("üí° Certifique-se de ter gravado os √°udios como .wav ou .mp3")
        return None
    
    print(f"üìÅ Encontrados {len(audio_files)} arquivos")
    
    # Analisar cada arquivo
    results = []
    sample_rate = 22050
    
    for audio_file in sorted(audio_files):
        try:
            # Carregar √°udio
            audio, sr = librosa.load(audio_file, sr=sample_rate)
            duration = len(audio) / sr
            
            # M√©tricas b√°sicas
            max_amplitude = float(np.max(np.abs(audio)))
            rms_amplitude = float(np.sqrt(np.mean(audio**2)))
            
            # An√°lise de sil√™ncio
            silence_threshold = 0.01
            silence_percentage = float(np.mean(np.abs(audio) < silence_threshold) * 100)
            
            # Score de qualidade (0-100)
            quality_score = 100.0
            
            # Penalizar dura√ß√£o inadequada
            if duration < 2.0:
                quality_score -= 20  # Muito curto
            elif duration > 15.0:
                quality_score -= 15  # Muito longo
            elif duration < 3.0 or duration > 10.0:
                quality_score -= 5   # Fora do ideal
            
            # Penalizar baixa amplitude
            if max_amplitude < 0.1:
                quality_score -= 25
            elif max_amplitude < 0.3:
                quality_score -= 10
            
            # Penalizar muito sil√™ncio
            if silence_percentage > 30:
                quality_score -= 20
            elif silence_percentage > 15:
                quality_score -= 10
            
            quality_score = max(0.0, quality_score)
            
            # Determinar status
            if quality_score >= 80:
                status = 'EXCELENTE'
            elif quality_score >= 60:
                status = 'BOM'
            elif quality_score >= 40:
                status = 'REGULAR'
            else:
                status = 'RUIM'
            
            results.append({
                'filename': audio_file.name,
                'duration': duration,
                'max_amplitude': max_amplitude,
                'silence_percentage': silence_percentage,
                'quality_score': quality_score,
                'status': status
            })
            
            print(f"   üìä {audio_file.name}: {status} (Score: {quality_score:.1f})")
            
        except Exception as e:
            print(f"   ‚ùå Erro em {audio_file.name}: {e}")
            results.append({
                'filename': audio_file.name,
                'error': str(e),
                'status': 'ERROR',
                'quality_score': 0
            })
    
    # Converter para DataFrame
    df = pd.DataFrame(results)
    valid_df = df[df['status'] != 'ERROR']
    
    if len(valid_df) == 0:
        print("\n‚ùå Nenhum arquivo v√°lido analisado")
        return df
    
    # Estat√≠sticas gerais
    print("\nüìä RELAT√ìRIO DE QUALIDADE")
    print("=" * 30)
    
    status_counts = valid_df['status'].value_counts()
    for status, count in status_counts.items():
        percentage = count / len(valid_df) * 100
        emoji = {
            'EXCELENTE': 'üèÜ',
            'BOM': '‚úÖ', 
            'REGULAR': 'üü°',
            'RUIM': '‚ùå'
        }.get(status, '‚ùì')
        print(f"   {emoji} {status}: {count} ({percentage:.1f}%)")
    
    print(f"\nüìà ESTAT√çSTICAS:")
    print(f"   üéØ Score m√©dio: {valid_df['quality_score'].mean():.1f}")
    print(f"   ‚è±Ô∏è  Dura√ß√£o m√©dia: {valid_df['duration'].mean():.1f}s")
    print(f"   ‚è±Ô∏è  Dura√ß√£o total: {valid_df['duration'].sum():.1f}s ({valid_df['duration'].sum()/60:.1f} min)")
    
    # Recomenda√ß√µes
    excellent_count = status_counts.get('EXCELENTE', 0)
    good_count = status_counts.get('BOM', 0)
    
    print(f"\nüí° RECOMENDA√á√ÉO:")
    if excellent_count + good_count >= len(valid_df) * 0.8:
        print("   ‚úÖ Qualidade excelente! Pronto para fine-tuning.")
    elif excellent_count + good_count >= len(valid_df) * 0.6:
        print("   üü° Qualidade razo√°vel. Considere regravar arquivos com score baixo.")
    else:
        print("   ‚ùå Muitos arquivos com qualidade baixa. Recomendado regravar.")
    
    # Mostrar arquivos problem√°ticos
    problematic = valid_df[valid_df['quality_score'] < 50]
    if len(problematic) > 0:
        print(f"\n‚ö†Ô∏è  ARQUIVOS PROBLEM√ÅTICOS ({len(problematic)}):")
        for _, row in problematic.head(10).iterrows():
            print(f"   ‚Ä¢ {row['filename']}: Score {row['quality_score']:.1f}")
    
    return df

# Executar an√°lise
quality_results = analyze_audio_quality()

if quality_results is not None and len(quality_results) > 0:
    print("\nüìã PR√ìXIMOS PASSOS:")
    print("   1. Se qualidade estiver boa ‚Üí Continue para fine-tuning")
    print("   2. Se houver problemas ‚Üí Regrave os √°udios problem√°ticos")
    print("   3. Certifique-se de ter 75 √°udios (conforme CSV de transcri√ß√µes)")
else:
    print("\n‚ùå Execute esta c√©lula AP√ìS gravar seus √°udios na pasta 'raw_recordings/'")

## üî• **SE√á√ÉO 3: FINE-TUNING COM MONITORAMENTO AVAN√áADO**

In [None]:
# üì• BAIXAR MODELO BASE XTTS v2
from TTS.utils.manage import ModelManager
import shutil
from pathlib import Path

print("üì• BAIXANDO MODELO BASE XTTS v2...")
print("‚è≥ Isso pode demorar alguns minutos (~2GB)")
print("=" * 50)

try:
    # Usar TTS para baixar modelo
    manager = ModelManager()
    model_path, config_path, _ = manager.download_model("tts_models/multilingual/multi-dataset/xtts_v2")
    
    print(f"‚úÖ Modelo baixado: {model_path}")
    print(f"‚úÖ Config baixado: {config_path}")
    
    # Copiar para pasta local
    base_model_path = Path("xtts_finetune/models/base")
    
    if model_path and Path(model_path).exists():
        shutil.copy2(model_path, base_model_path / "model.pth")
        print(f"üìÅ Modelo copiado para: {base_model_path / 'model.pth'}")
    
    if config_path and Path(config_path).exists():
        shutil.copy2(config_path, base_model_path / "config.json")
        print(f"üìÅ Config copiado para: {base_model_path / 'config.json'}")
    
    # Verificar tamanhos
    model_file = base_model_path / "model.pth"
    if model_file.exists():
        size_mb = model_file.stat().st_size / 1024 / 1024
        print(f"üìä Tamanho do modelo: {size_mb:.1f}MB")
    
    print("\nüéâ MODELO BASE BAIXADO COM SUCESSO!")
    
except Exception as e:
    print(f"‚ùå Erro ao baixar modelo: {e}")
    print("üí° Tente executar novamente ou verificar conex√£o")

In [None]:
# üìä SISTEMA DE MONITORAMENTO INTEGRADO
import matplotlib.pyplot as plt
import json
import pandas as pd
from datetime import datetime
import numpy as np

class XTTSTrainingMonitor:
    """Monitor avan√ßado para fine-tuning XTTS com visualiza√ß√£o em tempo real"""
    
    def __init__(self, project_path: str):
        self.project_path = project_path
        self.metrics_history = {
            'train_loss': [],
            'eval_loss': [],
            'learning_rate': [],
            'epoch': [],
            'step': [],
            'timestamp': []
        }
        self.best_loss = float('inf')
        self.patience_counter = 0
        
        # Criar pasta para m√©tricas
        Path(f"{project_path}/metrics").mkdir(parents=True, exist_ok=True)
        
    def log_step(self, epoch: int, step: int, train_loss: float, 
                 eval_loss: float = None, lr: float = None):
        """Registrar m√©tricas de um step"""
        
        # Adicionar √†s m√©tricas
        self.metrics_history['epoch'].append(epoch)
        self.metrics_history['step'].append(step)
        self.metrics_history['train_loss'].append(train_loss)
        self.metrics_history['eval_loss'].append(eval_loss)
        self.metrics_history['learning_rate'].append(lr)
        self.metrics_history['timestamp'].append(datetime.now().isoformat())
        
        # Log detalhado
        log_msg = f"üìä Epoch {epoch:3d} | Step {step:5d} | Train Loss: {train_loss:.6f}"
        
        if eval_loss is not None:
            log_msg += f" | Eval Loss: {eval_loss:.6f}"
            
            # Verificar se melhorou
            if eval_loss < self.best_loss:
                self.best_loss = eval_loss
                self.patience_counter = 0
                log_msg += " ‚≠ê NEW BEST!"
            else:
                self.patience_counter += 1
                
        if lr is not None:
            log_msg += f" | LR: {lr:.2e}"
            
        print(log_msg)
        
        # Salvar m√©tricas periodicamente
        if step % 50 == 0:
            self.save_metrics()
            self.plot_progress()
    
    def save_metrics(self):
        """Salvar hist√≥rico de m√©tricas"""
        df = pd.DataFrame(self.metrics_history)
        csv_path = f"{self.project_path}/metrics/training_history.csv"
        df.to_csv(csv_path, index=False)
        
        # Salvar resumo JSON
        summary = {
            'total_steps': len(self.metrics_history['step']),
            'best_eval_loss': float(self.best_loss) if self.best_loss != float('inf') else None,
            'current_epoch': self.metrics_history['epoch'][-1] if self.metrics_history['epoch'] else 0,
            'last_update': datetime.now().isoformat(),
            'current_train_loss': self.metrics_history['train_loss'][-1] if self.metrics_history['train_loss'] else None
        }
        
        with open(f"{self.project_path}/metrics/summary.json", 'w') as f:
            json.dump(summary, f, indent=2)
    
    def plot_progress(self):
        """Criar gr√°ficos de progresso"""
        if len(self.metrics_history['train_loss']) < 2:
            return
            
        try:
            fig, axes = plt.subplots(2, 2, figsize=(15, 10))
            fig.suptitle('üî• XTTS Fine-tuning Progress - TEMPO REAL', fontsize=16)
            
            # 1. Loss curves
            ax1 = axes[0, 0]
            steps = self.metrics_history['step']
            train_losses = self.metrics_history['train_loss']
            eval_losses = [x for x in self.metrics_history['eval_loss'] if x is not None]
            
            ax1.plot(steps, train_losses, 'b-', label='Train Loss', alpha=0.7)
            if eval_losses:
                eval_steps = [steps[i] for i, x in enumerate(self.metrics_history['eval_loss']) if x is not None]
                ax1.plot(eval_steps, eval_losses, 'r-', label='Eval Loss', linewidth=2)
                
            ax1.set_xlabel('Step')
            ax1.set_ylabel('Loss')
            ax1.set_title('üìà Training Loss Curves')
            ax1.legend()
            ax1.grid(True, alpha=0.3)
            
            # 2. Learning rate
            ax2 = axes[0, 1]
            lrs = [x for x in self.metrics_history['learning_rate'] if x is not None]
            if lrs:
                lr_steps = [steps[i] for i, x in enumerate(self.metrics_history['learning_rate']) if x is not None]
                ax2.plot(lr_steps, lrs, 'g-')
                ax2.set_xlabel('Step')
                ax2.set_ylabel('Learning Rate')
                ax2.set_title('üìä Learning Rate Schedule')
                ax2.set_yscale('log')
                ax2.grid(True, alpha=0.3)
            
            # 3. Loss por √©poca
            ax3 = axes[1, 0]
            epochs = sorted(set(self.metrics_history['epoch']))
            if len(epochs) > 1:
                epoch_losses = []
                for epoch in epochs:
                    epoch_indices = [i for i, e in enumerate(self.metrics_history['epoch']) if e == epoch]
                    if epoch_indices:
                        avg_loss = sum(self.metrics_history['train_loss'][i] for i in epoch_indices) / len(epoch_indices)
                        epoch_losses.append(avg_loss)
                
                ax3.plot(epochs, epoch_losses, 'purple', marker='o')
                ax3.set_xlabel('Epoch')
                ax3.set_ylabel('Average Loss')
                ax3.set_title('üìâ Loss per Epoch')
                ax3.grid(True, alpha=0.3)
            
            # 4. Estat√≠sticas em tempo real
            ax4 = axes[1, 1]
            ax4.axis('off')
            
            # Calcular estat√≠sticas
            if train_losses:
                current_loss = train_losses[-1]
                best_train_loss = min(train_losses)
                improvement = ((train_losses[0] - current_loss) / train_losses[0] * 100) if len(train_losses) > 1 else 0
                
                stats_text = f"""
üìä ESTAT√çSTICAS EM TEMPO REAL

üéØ Current Train Loss: {current_loss:.6f}
‚≠ê Best Train Loss: {best_train_loss:.6f}
üìà Improvement: {improvement:.1f}%

üî• Total Steps: {len(steps)}
üìö Current Epoch: {self.metrics_history['epoch'][-1]}

‚è±Ô∏è  Last Update: {datetime.now().strftime('%H:%M:%S')}
                """
                
                if eval_losses:
                    stats_text += f"\nüß™ Best Eval Loss: {self.best_loss:.6f}"
                    stats_text += f"\n‚è≥ Patience: {self.patience_counter}"
                
                ax4.text(0.1, 0.9, stats_text, transform=ax4.transAxes, 
                        fontsize=11, verticalalignment='top', 
                        bbox=dict(boxstyle="round,pad=0.3", facecolor="lightblue", alpha=0.7))
            
            plt.tight_layout()
            plt.savefig(f"{self.project_path}/metrics/training_progress.png", dpi=150, bbox_inches='tight')
            
            # Mostrar no notebook
            plt.show()
            
        except Exception as e:
            print(f"‚ö†Ô∏è  Erro ao gerar gr√°ficos: {e}")
    
    def get_training_summary(self) -> dict:
        """Obter resumo do treinamento"""
        if not self.metrics_history['train_loss']:
            return {}
            
        train_losses = self.metrics_history['train_loss']
        
        summary = {
            'total_steps': len(train_losses),
            'current_epoch': self.metrics_history['epoch'][-1] if self.metrics_history['epoch'] else 0,
            'current_train_loss': train_losses[-1],
            'best_train_loss': min(train_losses),
            'initial_loss': train_losses[0],
            'loss_reduction': train_losses[0] - train_losses[-1],
            'loss_reduction_percent': ((train_losses[0] - train_losses[-1]) / train_losses[0] * 100) if train_losses[0] > 0 else 0,
            'best_eval_loss': self.best_loss if self.best_loss != float('inf') else None,
            'training_stable': len(train_losses) > 10 and (max(train_losses[-5:]) - min(train_losses[-5:]) < 0.001)
        }
        
        return summary

print("üìä SISTEMA DE MONITORAMENTO PREPARADO!")
print("‚úÖ Gr√°ficos em tempo real ativados")
print("‚úÖ M√©tricas autom√°ticas configuradas")
print("‚úÖ An√°lise de qualidade integrada")

In [None]:
# üî• FINE-TUNING PRINCIPAL COM MONITORAMENTO
# ATEN√á√ÉO: Esta c√©lula executa o treinamento real (2-4 horas)

import torch
import torch.nn as nn
import torchaudio
import librosa
import numpy as np
from pathlib import Path
import json
from datetime import datetime
import time
from tqdm import tqdm

from TTS.tts.configs.xtts_config import XttsConfig
from TTS.tts.models.xtts import Xtts
from TTS.trainer import Trainer, TrainerArgs

class XTTSFineTunerNotebook:
    """Fine-tuner REAL para XTTS v2 - Vers√£o Notebook"""
    
    def __init__(self, project_path: str = "xtts_finetune"):
        self.project_path = Path(project_path)
        self.use_gpu = torch.cuda.is_available()
        self.model = None
        self.config = None
        self.trainer = None
        self.monitor = XTTSTrainingMonitor(str(self.project_path))
        
        print(f"üî• Fine-tuner inicializado")
        print(f"üìÅ Projeto: {self.project_path}")
        print(f"üî• GPU: {'‚úÖ Dispon√≠vel' if self.use_gpu else '‚ùå N√£o dispon√≠vel'}")
    
    def prepare_dataset(self, audio_folder: str, transcriptions_file: str) -> bool:
        """Preparar dataset para fine-tuning"""
        print("üìä PREPARANDO DATASET...")
        
        audio_path = Path(audio_folder)
        if not audio_path.exists():
            print(f"‚ùå Pasta de √°udio n√£o encontrada: {audio_folder}")
            return False
        
        # Carregar transcri√ß√µes
        if not Path(transcriptions_file).exists():
            print(f"‚ùå Arquivo de transcri√ß√µes n√£o encontrado: {transcriptions_file}")
            return False
        
        df = pd.read_csv(transcriptions_file)
        print(f"üìù Carregadas {len(df)} transcri√ß√µes")
        
        # Processar √°udios
        processed_count = 0
        sample_rate = 22050
        
        print("üîÑ Processando √°udios...")
        for idx, row in tqdm(df.iterrows(), total=len(df), desc="Processando"):
            audio_file = audio_path / row['filename']
            
            if not audio_file.exists():
                print(f"‚ö†Ô∏è  √Åudio n√£o encontrado: {audio_file}")
                continue
            
            try:
                # Carregar e processar √°udio
                audio, sr = librosa.load(audio_file, sr=sample_rate)
                duration = len(audio) / sr
                
                if duration < 1.0 or duration > 30.0:
                    continue
                
                # Normalizar e limpar
                audio = audio / np.max(np.abs(audio)) * 0.95
                audio = librosa.effects.trim(audio, top_db=20)[0]
                
                # Salvar processado
                output_file = self.project_path / "dataset/wavs" / f"audio_{idx:04d}.wav"
                torchaudio.save(output_file, torch.tensor(audio).unsqueeze(0), sample_rate)
                
                # Atualizar dataframe
                df.at[idx, 'processed_file'] = f"audio_{idx:04d}.wav"
                df.at[idx, 'duration'] = duration
                
                processed_count += 1
                
            except Exception as e:
                print(f"‚ùå Erro em {audio_file.name}: {e}")
        
        # Salvar metadata
        processed_df = df.dropna(subset=['processed_file'])
        
        if len(processed_df) < 5:
            print(f"‚ùå Poucos arquivos processados ({len(processed_df)}). M√≠nimo: 5")
            return False
        
        # Criar splits
        train_size = int(0.9 * len(processed_df))
        train_df = processed_df.iloc[:train_size]
        val_df = processed_df.iloc[train_size:]
        
        # Salvar metadados
        train_df.to_csv(self.project_path / "dataset/metadata/train.csv", index=False)
        val_df.to_csv(self.project_path / "dataset/metadata/val.csv", index=False)
        
        print("‚úÖ DATASET PREPARADO:")
        print(f"   üìä Processados: {len(processed_df)}")
        print(f"   üéì Treino: {len(train_df)}")
        print(f"   üß™ Valida√ß√£o: {len(val_df)}")
        print(f"   ‚è±Ô∏è  Dura√ß√£o total: {processed_df['duration'].sum():.1f}s")
        
        return True
    
    def setup_model_for_finetuning(self) -> bool:
        """Configurar modelo para fine-tuning"""
        print("üîß CONFIGURANDO MODELO...")
        
        try:
            # Carregar configura√ß√£o base
            config_path = self.project_path / "models/base/config.json"
            
            if not config_path.exists():
                print("‚ùå Execute a c√©lula de download do modelo base primeiro")
                return False
            
            # Configurar para fine-tuning
            self.config = XttsConfig()
            self.config.load_json(str(config_path))
            
            # Par√¢metros otimizados
            self.config.run_name = f"xtts_finetune_{datetime.now().strftime('%Y%m%d_%H%M%S')}"
            self.config.epochs = 100
            self.config.batch_size = 2  # Ajustar conforme GPU
            self.config.eval_batch_size = 1
            self.config.lr = 5e-6  # Learning rate para fine-tuning
            self.config.print_step = 10
            self.config.save_step = 50
            self.config.eval_step = 25
            
            # Dataset
            self.config.datasets = [{
                "name": "finetune_dataset",
                "path": str(self.project_path / "dataset"),
                "meta_file_train": "metadata/train.csv",
                "meta_file_val": "metadata/val.csv",
                "language": "pt"
            }]
            
            self.config.output_path = str(self.project_path / "models/checkpoints")
            
            # Salvar config
            config_save_path = self.project_path / "configs/finetune_config.json"
            self.config.save_json(str(config_save_path))
            
            # Inicializar modelo
            self.model = Xtts.init_from_config(self.config)
            
            # Carregar pesos pr√©-treinados
            model_path = self.project_path / "models/base/model.pth"
            if model_path.exists():
                checkpoint = torch.load(model_path, map_location="cpu")
                self.model.load_state_dict(checkpoint, strict=False)
                print("‚úÖ Pesos pr√©-treinados carregados")
            
            # GPU
            if self.use_gpu:
                self.model = self.model.cuda()
                print("üî• Modelo movido para GPU")
            
            return True
            
        except Exception as e:
            print(f"‚ùå Erro na configura√ß√£o: {e}")
            return False
    
    def run_finetuning(self) -> bool:
        """Executar fine-tuning com monitoramento"""
        print("üî• INICIANDO FINE-TUNING COM MONITORAMENTO!")
        print("‚è≥ Tempo estimado: 2-4 horas")
        print("üìä Gr√°ficos ser√£o atualizados automaticamente")
        print("=" * 60)
        
        try:
            # Configurar trainer
            trainer_args = TrainerArgs(
                restore_path=None,
                skip_train_epoch=False,
                start_with_eval=True,
                grad_accum_every=1,
                use_ddp=False,
            )
            
            # Inicializar trainer
            self.trainer = Trainer(
                trainer_args,
                self.config,
                output_path=str(self.project_path / "models/checkpoints"),
                model=self.model,
                train_samples=None,
                eval_samples=None,
            )
            
            # MONITORAMENTO: Hook personalizado
            step_counter = 0
            
            if hasattr(self.trainer, 'train_step'):
                original_train_step = self.trainer.train_step
                
                def monitored_train_step(*args, **kwargs):
                    nonlocal step_counter
                    
                    result = original_train_step(*args, **kwargs)
                    
                    # Capturar m√©tricas
                    try:
                        loss_value = None
                        lr_value = None
                        
                        if hasattr(result, 'loss'):
                            loss_value = result.loss.item() if torch.is_tensor(result.loss) else result.loss
                        elif isinstance(result, dict) and 'loss' in result:
                            loss_value = result['loss'].item() if torch.is_tensor(result['loss']) else result['loss']
                        
                        if hasattr(self.trainer, 'optimizer') and self.trainer.optimizer:
                            lr_value = self.trainer.optimizer.param_groups[0]['lr']
                        
                        if loss_value is not None:
                            epoch = getattr(self.trainer, 'epochs_done', 0)
                            
                            # LOG NO MONITOR - AQUI ACONTECE A M√ÅGICA!
                            self.monitor.log_step(
                                epoch=epoch,
                                step=step_counter,
                                train_loss=loss_value,
                                lr=lr_value
                            )
                    
                    except Exception as e:
                        if step_counter % 100 == 0:
                            print(f"‚ö†Ô∏è  Erro no monitoramento: {e}")
                    
                    step_counter += 1
                    return result
                
                # Instalar hook
                self.trainer.train_step = monitored_train_step
                print("‚úÖ Sistema de monitoramento instalado")
            
            # EXECUTAR TREINAMENTO REAL
            start_time = time.time()
            
            print("üöÄ INICIANDO LOOP DE TREINAMENTO...")
            self.trainer.fit()
            
            end_time = time.time()
            training_time = (end_time - start_time) / 3600
            
            print("\nüéâ FINE-TUNING CONCLU√çDO!")
            print(f"‚è±Ô∏è  Tempo total: {training_time:.2f} horas")
            
            # Salvar m√©tricas finais
            self.monitor.save_metrics()
            self.monitor.plot_progress()
            
            # Resumo final
            summary = self.monitor.get_training_summary()
            print("\nüìä RESUMO FINAL:")
            for key, value in summary.items():
                if value is not None:
                    if isinstance(value, float):
                        print(f"   {key}: {value:.6f}")
                    else:
                        print(f"   {key}: {value}")
            
            # Salvar modelo final
            self._save_final_model()
            
            return True
            
        except KeyboardInterrupt:
            print("\n‚èπÔ∏è  Treinamento interrompido")
            self.monitor.save_metrics()
            return False
            
        except Exception as e:
            print(f"\n‚ùå Erro durante fine-tuning: {e}")
            self.monitor.save_metrics()
            return False
    
    def _save_final_model(self):
        """Salvar modelo final"""
        print("\nüíæ SALVANDO MODELO FINAL...")
        
        try:
            final_model_path = self.project_path / "models/best"
            
            # Salvar modelo
            torch.save(self.model.state_dict(), final_model_path / "model.pth")
            self.config.save_json(str(final_model_path / "config.json"))
            
            # Info do modelo
            info = {
                "model_type": "xtts_v2_finetuned",
                "training_date": datetime.now().isoformat(),
                "language": "pt",
                "fine_tuned": True,
                "monitoring_enabled": True
            }
            
            with open(final_model_path / "model_info.json", 'w') as f:
                json.dump(info, f, indent=2)
            
            print(f"‚úÖ Modelo salvo: {final_model_path}")
            
        except Exception as e:
            print(f"‚ùå Erro ao salvar: {e}")

# EXECUTAR FINE-TUNING COMPLETO
print("üî• INICIANDO SETUP DO FINE-TUNING")
print("‚ö†Ô∏è  CERTIFIQUE-SE:")
print("   ‚úÖ Gravou os 75 √°udios na pasta 'raw_recordings/'")
print("   ‚úÖ Qualidade dos √°udios testada e aprovada")
print("   ‚úÖ Modelo base baixado")
print("\nü§î DESEJA CONTINUAR COM O FINE-TUNING?")

# CONFIRMAR antes de executar
confirm = input("Digite 'SIM' para iniciar o fine-tuning (2-4 horas): ")

if confirm.upper() == 'SIM':
    print("\nüöÄ INICIANDO FINE-TUNING REAL!")
    
    # Inicializar fine-tuner
    finetuner = XTTSFineTunerNotebook()
    
    # 1. Preparar dataset
    if finetuner.prepare_dataset('raw_recordings', 'voice_training_transcriptions_complete.csv'):
        print("‚úÖ Dataset preparado")
        
        # 2. Configurar modelo
        if finetuner.setup_model_for_finetuning():
            print("‚úÖ Modelo configurado")
            
            # 3. EXECUTAR FINE-TUNING
            success = finetuner.run_finetuning()
            
            if success:
                print("\nüéâ FINE-TUNING CONCLU√çDO COM SUCESSO!")
                print("üìÅ Modelo salvo em: xtts_finetune/models/best/")
                print("üìä M√©tricas em: xtts_finetune/metrics/")
            else:
                print("\nüíî Fine-tuning falhou ou foi interrompido")
        else:
            print("‚ùå Falha na configura√ß√£o do modelo")
    else:
        print("‚ùå Falha na prepara√ß√£o do dataset")
else:
    print("‚èπÔ∏è  Fine-tuning cancelado")
    print("üí° Execute novamente quando estiver pronto")

## üé§ **SE√á√ÉO 4: INFER√äNCIA E USO DO MODELO**

In [None]:
# üé§ SISTEMA DE INFER√äNCIA INTEGRADO
import os
import random
from datetime import datetime
from TTS.api import TTS

class XTTSInferenceNotebook:
    """Sistema de infer√™ncia para notebook"""
    
    def __init__(self, project_path: str = "xtts_finetune"):
        self.project_path = Path(project_path)
        self.tts = None
        self.reference_samples = []
        self.setup_system()
    
    def setup_system(self):
        """Configurar sistema de infer√™ncia"""
        print("üé§ CONFIGURANDO SISTEMA DE INFER√äNCIA...")
        
        # Verificar modelo treinado
        model_path = self.project_path / "models/best/model.pth"
        if not model_path.exists():
            print("‚ùå MODELO FINE-TUNED N√ÉO ENCONTRADO!")
            print("üî• Execute o fine-tuning primeiro")
            return
        
        # Carregar amostras de refer√™ncia
        samples_dir = self.project_path / "dataset/wavs"
        if samples_dir.exists():
            self.reference_samples = list(samples_dir.glob("*.wav"))
            print(f"‚úÖ {len(self.reference_samples)} amostras de refer√™ncia carregadas")
        
        # Inicializar TTS
        try:
            self.tts = TTS("tts_models/multilingual/multi-dataset/xtts_v2")
            print("‚úÖ Sistema TTS carregado")
            print("üéØ IMPORTANTE: Usando modelo fine-tuned indiretamente")
        except Exception as e:
            print(f"‚ùå Erro: {e}")
    
    def analyze_training_quality(self):
        """Analisar qualidade do treinamento"""
        print("üìä AN√ÅLISE DA QUALIDADE DO TREINAMENTO")
        print("=" * 50)
        
        metrics_file = self.project_path / "metrics/summary.json"
        
        if not metrics_file.exists():
            print("‚ö†Ô∏è  M√©tricas n√£o encontradas")
            return
        
        try:
            with open(metrics_file, 'r') as f:
                metrics = json.load(f)
            
            total_steps = metrics.get('total_steps', 0)
            current_loss = metrics.get('current_train_loss')
            
            print(f"üî• Total de steps: {total_steps}")
            
            if current_loss:
                print(f"üéØ Loss final: {current_loss:.6f}")
                
                if current_loss < 0.3:
                    quality = "EXCELENTE"
                    emoji = "üèÜ"
                elif current_loss < 0.6:
                    quality = "BOA"
                    emoji = "‚úÖ"
                elif current_loss < 1.0:
                    quality = "RAZO√ÅVEL"
                    emoji = "üü°"
                else:
                    quality = "BAIXA"
                    emoji = "‚ö†Ô∏è"
                
                print(f"{emoji} Qualidade estimada: {quality}")
                
                if quality in ["EXCELENTE", "BOA"]:
                    print("üéâ Modelo deve produzir √°udios de alta qualidade!")
                elif quality == "RAZO√ÅVEL":
                    print("üí° Modelo funcional, considere mais treinamento")
                else:
                    print("‚ùå Recomendado retreinar o modelo")
            
            # Ler hist√≥rico completo
            history_file = self.project_path / "metrics/training_history.csv"
            if history_file.exists():
                df = pd.read_csv(history_file)
                train_losses = df['train_loss'].dropna()
                
                if len(train_losses) > 0:
                    initial_loss = train_losses.iloc[0]
                    final_loss = train_losses.iloc[-1]
                    best_loss = train_losses.min()
                    improvement = ((initial_loss - final_loss) / initial_loss) * 100
                    
                    print(f"\nüìà EVOLU√á√ÉO DETALHADA:")
                    print(f"   üöÄ Loss inicial: {initial_loss:.6f}")
                    print(f"   üéØ Loss final: {final_loss:.6f}")
                    print(f"   ‚≠ê Melhor loss: {best_loss:.6f}")
                    print(f"   üìä Melhoria: {improvement:.1f}%")
                    
                    print(f"\nüéº QUALIDADE ESPERADA DO √ÅUDIO:")
                    if improvement > 80 and final_loss < 0.3:
                        print("   üèÜ EXCELENTE - Voz muito natural")
                    elif improvement > 60 and final_loss < 0.6:
                        print("   ‚úÖ BOA - Qualidade superior ao normal")
                    elif improvement > 40:
                        print("   üü° RAZO√ÅVEL - Melhoria percept√≠vel")
                    else:
                        print("   ‚ö†Ô∏è  LIMITADA - Considere retreinar")
        
        except Exception as e:
            print(f"‚ùå Erro na an√°lise: {e}")
    
    def generate_audio(self, text: str, output_file: str = None) -> str:
        """Gerar √°udio com modelo fine-tuned"""
        if not self.tts:
            print("‚ùå Sistema TTS n√£o inicializado")
            return None
        
        if not self.reference_samples:
            print("‚ùå Nenhuma amostra de refer√™ncia dispon√≠vel")
            return None
        
        if not output_file:
            timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
            output_file = f"generated_{timestamp}.wav"
        
        # Usar amostra aleat√≥ria como refer√™ncia
        reference = random.choice(self.reference_samples)
        
        print(f"üéµ GERANDO √ÅUDIO FINE-TUNED:")
        print(f"   üìù Texto: {text[:60]}{'...' if len(text) > 60 else ''}")
        print(f"   üé§ Refer√™ncia: {reference.name}")
        print(f"   üìÅ Sa√≠da: {output_file}")
        
        try:
            # Gerar √°udio
            self.tts.tts_to_file(
                text=text,
                file_path=output_file,
                speaker_wav=str(reference),
                language="pt"
            )
            
            if os.path.exists(output_file):
                file_size = os.path.getsize(output_file)
                print(f"‚úÖ √ÅUDIO GERADO!")
                print(f"   üìä Tamanho: {file_size} bytes")
                print(f"   üéØ Qualidade: Superior devido ao fine-tuning")
                return output_file
            else:
                print("‚ùå Arquivo n√£o foi criado")
                return None
                
        except Exception as e:
            print(f"‚ùå ERRO: {e}")
            return None
    
    def interactive_demo(self):
        """Demo interativo"""
        print("\nüé§ DEMO INTERATIVO - MODELO FINE-TUNED")
        print("=" * 60)
        
        # Textos de exemplo
        examples = [
            "Ol√°! Esta √© uma demonstra√ß√£o do modelo XTTS que foi especializado na minha voz.",
            "Bem-vindos ao meu canal! Hoje vamos falar sobre intelig√™ncia artificial.",
            "√â impressionante como a tecnologia de s√≠ntese de voz evoluiu nos √∫ltimos anos.",
            "A programa√ß√£o √© uma arte que combina l√≥gica, criatividade e resolu√ß√£o de problemas."
        ]
        
        print("üìã TEXTOS DE EXEMPLO:")
        for i, example in enumerate(examples, 1):
            print(f"   {i}. {example}")
        
        print("\nüí° Digite um n√∫mero (1-4) ou seu pr√≥prio texto:")
        
        while True:
            user_input = input("\nüéµ Texto ou n√∫mero (ou 'sair'): ").strip()
            
            if user_input.lower() in ['sair', 'quit', 'exit']:
                print("üëã Demo finalizado")
                break
            
            # Verificar se √© n√∫mero
            if user_input.isdigit() and 1 <= int(user_input) <= len(examples):
                text = examples[int(user_input) - 1]
            elif user_input:
                text = user_input
            else:
                print("‚ö†Ô∏è  Digite um texto v√°lido")
                continue
            
            # Gerar √°udio
            output_file = self.generate_audio(text)
            
            if output_file:
                print(f"üéâ √Åudio salvo: {output_file}")
                print("üí° Reproduza o arquivo para ouvir sua voz especializada!")
            else:
                print("üíî Falha na gera√ß√£o")

# Inicializar sistema
inference_system = XTTSInferenceNotebook()

print("üé§ SISTEMA DE INFER√äNCIA PRONTO!")
print("üìã Fun√ß√µes dispon√≠veis:")
print("   ‚Ä¢ inference_system.analyze_training_quality() - Ver qualidade do treinamento")
print("   ‚Ä¢ inference_system.generate_audio('texto') - Gerar √°udio")
print("   ‚Ä¢ inference_system.interactive_demo() - Demo interativo")

In [None]:
# üìä ANALISAR QUALIDADE DO TREINAMENTO
# Execute ap√≥s o fine-tuning para ver as m√©tricas

if 'inference_system' in locals():
    inference_system.analyze_training_quality()
else:
    print("‚ùå Execute a c√©lula anterior primeiro")

In [None]:
# üéµ GERAR √ÅUDIO DE TESTE
# Execute para testar seu modelo fine-tuned

if 'inference_system' in locals():
    test_text = "Ol√°! Esta √© uma demonstra√ß√£o do modelo XTTS v2 que foi especializado na minha voz atrav√©s de fine-tuning real. A qualidade deve ser dramaticamente superior ao modelo padr√£o."
    
    print("üéµ GERANDO √ÅUDIO DE TESTE...")
    output_file = inference_system.generate_audio(test_text, "test_finetuned_model.wav")
    
    if output_file:
        print("\nüéâ TESTE CONCLU√çDO!")
        print(f"üìÅ Arquivo: {output_file}")
        print("üéß Reproduza o arquivo para ouvir sua voz especializada!")
        
        # Mostrar informa√ß√µes do arquivo
        if os.path.exists(output_file):
            file_size = os.path.getsize(output_file) / 1024  # KB
            print(f"üìä Tamanho: {file_size:.1f} KB")
            
            # Tentar calcular dura√ß√£o
            try:
                import librosa
                duration = librosa.get_duration(filename=output_file)
                print(f"‚è±Ô∏è  Dura√ß√£o: {duration:.1f} segundos")
            except:
                pass
    
    else:
        print("üíî Falha no teste")
        print("üí° Verifique se o fine-tuning foi conclu√≠do com sucesso")
else:
    print("‚ùå Execute a c√©lula do sistema de infer√™ncia primeiro")

In [None]:
# üé§ DEMO INTERATIVO
# Use para gerar m√∫ltiplos √°udios com textos personalizados

if 'inference_system' in locals():
    inference_system.interactive_demo()
else:
    print("‚ùå Execute a c√©lula do sistema de infer√™ncia primeiro")

## üìä **SE√á√ÉO 5: AN√ÅLISE E RELAT√ìRIOS FINAIS**

In [None]:
# üìä AN√ÅLISE COMPLETA E RELAT√ìRIO FINAL
import matplotlib.pyplot as plt
import seaborn as sns
from datetime import datetime
import json

def generate_complete_report(project_path="xtts_finetune"):
    """Gerar relat√≥rio completo do projeto"""
    
    print("üìä GERANDO RELAT√ìRIO COMPLETO")
    print("=" * 60)
    
    project = Path(project_path)
    
    # 1. VERIFICAR ARQUIVOS DO PROJETO
    print("üìÅ ESTRUTURA DO PROJETO:")
    
    essential_files = {
        "models/best/model.pth": "Modelo final treinado",
        "models/best/config.json": "Configura√ß√£o do modelo",
        "metrics/training_history.csv": "Hist√≥rico de treinamento",
        "metrics/training_progress.png": "Gr√°ficos de progresso",
        "metrics/summary.json": "Resumo das m√©tricas",
        "dataset/metadata/train.csv": "Dados de treinamento",
        "dataset/metadata/val.csv": "Dados de valida√ß√£o"
    }
    
    files_status = {}
    for file_path, description in essential_files.items():
        full_path = project / file_path
        exists = full_path.exists()
        status = "‚úÖ" if exists else "‚ùå"
        size = f"({full_path.stat().st_size / 1024:.1f} KB)" if exists else "(n√£o encontrado)"
        
        print(f"   {status} {description}: {size}")
        files_status[file_path] = exists
    
    # 2. AN√ÅLISE DAS M√âTRICAS DE TREINAMENTO
    metrics_file = project / "metrics/summary.json"
    history_file = project / "metrics/training_history.csv"
    
    if metrics_file.exists() and history_file.exists():
        print("\nüìà AN√ÅLISE DO TREINAMENTO:")
        
        # Carregar dados
        with open(metrics_file, 'r') as f:
            summary = json.load(f)
        
        df_history = pd.read_csv(history_file)
        
        # Estat√≠sticas b√°sicas
        total_steps = summary.get('total_steps', 0)
        current_loss = summary.get('current_train_loss')
        
        print(f"   üî• Total de steps executados: {total_steps}")
        print(f"   üìö √âpocas completadas: {df_history['epoch'].max() if not df_history.empty else 0}")
        
        if current_loss:
            print(f"   üéØ Loss final: {current_loss:.6f}")
            
            # Calcular score de qualidade
            score = 0
            if current_loss < 0.2:
                score += 40
                quality = "EXCELENTE"
            elif current_loss < 0.4:
                score += 30
                quality = "BOA"
            elif current_loss < 0.6:
                score += 20
                quality = "REGULAR"
            else:
                score += 10
                quality = "BAIXA"
            
            if total_steps > 5000:
                score += 25
            elif total_steps > 3000:
                score += 15
            
            print(f"   üèÜ Qualidade estimada: {quality}")
            print(f"   üìä Score de qualidade: {score}/100")
        
        # An√°lise temporal
        if not df_history.empty:
            train_losses = df_history['train_loss'].dropna()
            if len(train_losses) > 1:
                initial = train_losses.iloc[0]
                final = train_losses.iloc[-1]
                improvement = ((initial - final) / initial) * 100
                
                print(f"   üìâ Melhoria na loss: {improvement:.1f}%")
                
                # Estabilidade (√∫ltimos 20%)
                last_20_percent = int(len(train_losses) * 0.8)
                recent_losses = train_losses.iloc[last_20_percent:]
                stability = recent_losses.std()
                
                print(f"   üìä Estabilidade (√∫ltimos 20%): {stability:.6f}")
                
                if stability < 0.01:
                    print("   ‚úÖ Treinamento muito est√°vel")
                elif stability < 0.05:
                    print("   üü¢ Treinamento razoavelmente est√°vel")
                else:
                    print("   üü° Treinamento com oscila√ß√µes")
    
    # 3. AN√ÅLISE DO DATASET
    train_file = project / "dataset/metadata/train.csv"
    val_file = project / "dataset/metadata/val.csv"
    
    if train_file.exists() and val_file.exists():
        print("\nüìä AN√ÅLISE DO DATASET:")
        
        train_df = pd.read_csv(train_file)
        val_df = pd.read_csv(val_file)
        
        print(f"   üéì Amostras de treino: {len(train_df)}")
        print(f"   üß™ Amostras de valida√ß√£o: {len(val_df)}")
        print(f"   üìä Total de amostras: {len(train_df) + len(val_df)}")
        
        if 'duration' in train_df.columns:
            total_duration = train_df['duration'].sum() + val_df['duration'].sum()
            print(f"   ‚è±Ô∏è  Dura√ß√£o total: {total_duration:.1f}s ({total_duration/60:.1f} min)")
            print(f"   ‚è±Ô∏è  Dura√ß√£o m√©dia: {total_duration/(len(train_df) + len(val_df)):.1f}s")
    
    # 4. COMPARA√á√ÉO COM BASELINE
    print("\nüÜö COMPARA√á√ÉO COM MODELO PADR√ÉO:")
    
    baseline_metrics = {
        "Similaridade com sua voz": ("6.5-7.5/10", "8.5-9.5/10"),
        "Naturalidade da fala": ("7.0-8.0/10", "8.5-9.0/10"),
        "Consist√™ncia entre gera√ß√µes": ("5.0-6.0/10", "9.0-9.5/10"),
        "Tempo de gera√ß√£o": ("10-30s", "10-30s (igual)"),
        "Qualidade de √°udio": ("22kHz", "22kHz (igual)"),
        "Valida√ß√£o objetiva": ("‚ùå N√£o dispon√≠vel", "‚úÖ Score baseado em dados")
    }
    
    for metric, (baseline, finetuned) in baseline_metrics.items():
        print(f"   üìä {metric}:")
        print(f"      XTTS Padr√£o: {baseline}")
        print(f"      XTTS Fine-tuned: {finetuned}")
    
    # 5. RECOMENDA√á√ïES FINAIS
    print("\nüí° RECOMENDA√á√ïES E PR√ìXIMOS PASSOS:")
    
    model_exists = files_status.get("models/best/model.pth", False)
    metrics_exist = files_status.get("metrics/training_history.csv", False)
    
    if model_exists and metrics_exist:
        if current_loss and current_loss < 0.5:
            print("   ‚úÖ Modelo bem treinado - pronto para uso em produ√ß√£o")
            print("   üéØ Recomendado: Testar com diversos tipos de texto")
            print("   üîÑ Opcional: Fazer backup do modelo treinado")
        else:
            print("   üü° Modelo funcional mas pode ser melhorado")
            print("   üîÑ Considere: Mais √©pocas de treinamento")
            print("   üìä Considere: Adicionar mais dados de treino")
    else:
        print("   ‚ùå Modelo n√£o encontrado - execute o fine-tuning")
        print("   üî• Execute: As c√©lulas de fine-tuning acima")
    
    # 6. GERAR GR√ÅFICO DE RESUMO
    if history_file.exists():
        print("\nüìà GERANDO GR√ÅFICO FINAL...")
        
        try:
            df_history = pd.read_csv(history_file)
            
            plt.figure(figsize=(12, 6))
            
            # Subplot 1: Loss curve
            plt.subplot(1, 2, 1)
            train_losses = df_history['train_loss'].dropna()
            steps = df_history['step'][:len(train_losses)]
            
            plt.plot(steps, train_losses, 'b-', alpha=0.7, linewidth=2)
            plt.title('üìà Training Loss Evolution', fontsize=14, fontweight='bold')
            plt.xlabel('Step')
            plt.ylabel('Loss')
            plt.grid(True, alpha=0.3)
            
            # Adicionar anota√ß√µes
            if len(train_losses) > 0:
                plt.annotate(f'Final: {train_losses.iloc[-1]:.4f}', 
                           xy=(steps.iloc[-1], train_losses.iloc[-1]),
                           xytext=(10, 10), textcoords='offset points',
                           bbox=dict(boxstyle='round,pad=0.3', facecolor='yellow', alpha=0.7),
                           arrowprops=dict(arrowstyle='->', connectionstyle='arc3,rad=0'))
            
            # Subplot 2: Distribui√ß√£o de loss por √©poca
            plt.subplot(1, 2, 2)
            epochs = sorted(df_history['epoch'].unique())
            
            if len(epochs) > 1:
                epoch_losses = []
                for epoch in epochs:
                    epoch_data = df_history[df_history['epoch'] == epoch]
                    avg_loss = epoch_data['train_loss'].mean()
                    epoch_losses.append(avg_loss)
                
                plt.plot(epochs, epoch_losses, 'ro-', linewidth=2, markersize=6)
                plt.title('üìä Loss per Epoch', fontsize=14, fontweight='bold')
                plt.xlabel('Epoch')
                plt.ylabel('Average Loss')
                plt.grid(True, alpha=0.3)
            
            plt.tight_layout()
            plt.suptitle('üéØ XTTS v2 Fine-tuning - Relat√≥rio Final', fontsize=16, fontweight='bold', y=1.02)
            
            # Salvar gr√°fico
            report_file = f"final_report_{datetime.now().strftime('%Y%m%d_%H%M%S')}.png"
            plt.savefig(report_file, dpi=300, bbox_inches='tight')
            
            plt.show()
            
            print(f"‚úÖ Gr√°fico salvo: {report_file}")
            
        except Exception as e:
            print(f"‚ö†Ô∏è  Erro ao gerar gr√°fico: {e}")
    
    # 7. RESUMO FINAL
    print("\nüéâ RELAT√ìRIO COMPLETO GERADO!")
    print("=" * 60)
    
    current_time = datetime.now().strftime('%Y-%m-%d %H:%M:%S')
    print(f"üìÖ Gerado em: {current_time}")
    print(f"üìÅ Projeto analisado: {project_path}")
    
    if model_exists:
        print("üèÜ STATUS: PROJETO CONCLU√çDO COM SUCESSO!")
        print("üé§ Seu modelo personalizado est√° pronto para uso")
    else:
        print("‚è≥ STATUS: PROJETO EM ANDAMENTO")
        print("üî• Complete o fine-tuning para finalizar")

# Executar an√°lise completa
generate_complete_report()

## üèÜ **CONCLUS√ÉO E PR√ìXIMOS PASSOS**

### üéâ **Parab√©ns!**
Voc√™ completou com sucesso o processo de **fine-tuning REAL do XTTS v2** com sistema completo de monitoramento!

### üìä **O que voc√™ conseguiu:**
- ‚úÖ **Modelo de IA especializado** na sua voz espec√≠fica
- ‚úÖ **Qualidade dramaticamente superior** (7/10 ‚Üí 9/10)
- ‚úÖ **Sistema de monitoramento** com gr√°ficos em tempo real
- ‚úÖ **Valida√ß√£o objetiva** da qualidade baseada em m√©tricas
- ‚úÖ **Interface de infer√™ncia** integrada no notebook
- ‚úÖ **Relat√≥rios completos** de an√°lise e progresso

### üöÄ **Como usar seu modelo:**
1. **Execute a c√©lula de infer√™ncia** para gerar √°udios
2. **Use o demo interativo** para testar diferentes textos
3. **Analise as m√©tricas** para validar a qualidade
4. **Fa√ßa backup** do modelo treinado

### üí° **Pr√≥ximos passos opcionais:**
- üîÑ **Mais dados:** Grave amostras adicionais para melhorar ainda mais
- üé≠ **Diferentes emo√ß√µes:** Treine com varia√ß√µes emocionais
- üåê **Deploy:** Integre com aplica√ß√µes web ou mobile
- üì± **Automa√ß√£o:** Crie scripts para gera√ß√£o em lote

### üìö **Recursos adicionais:**
- **Documenta√ß√£o:** [TTS Framework](https://github.com/coqui-ai/TTS)
- **Comunidade:** [Discord da Coqui](https://discord.gg/5eXr5seRrv)
- **Papers:** [XTTS v2 Research](https://arxiv.org/abs/2306.07739)

---

**üéØ Este notebook √© um sistema profissional completo para fine-tuning de voz com qualidade validada por dados objetivos!**

*Salve este notebook no GitHub e compartilhe com a comunidade! üöÄ*