<a href="https://colab.research.google.com/github/luizfernandosant/Cadastro/blob/main/Untitled0.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [19]:
import os
import whisper
from moviepy.editor import VideoFileClip, TextClip, CompositeVideoClip
from moviepy.video.fx.all import crop
from datetime import timedelta
import numpy as np # Importar numpy

# --- CONFIGURAÇÕES ---
VIDEO_PATH = "/content/drive/My Drive/133OjAM8lr3cwjjZ1o9JnT-U-eHk0U8wo/NÃO ENTRE 2025 SEM ASSISTIR ESSA ENTREVISTA! - PR. JACKSON MARQUES NO IANG CAST - IANG TV (1080p, h264, youtube) (1).mp4"  # <--- COLOQUE O CAMINHO DO SEU ARQUIVO DE VÍDEO AQUI (EX: '/content/drive/My Drive/Videos/MeuVideo.mp4')
OUTPUT_DIR = "/content/drive/My Drive/Colab Notebooks/PASTE_YOUR_GOOGLE_DRIVE_DESTINATION_PATH_HERE" # <--- COLOQUE O NOME DA PASTA DE SAÍDA AQUI (USE O MESMO NOME NA CÉLULA DE COPIAR PARA O DRIVE)
MIN_CLIP_DURATION = 15  # Duração mínima do clipe em segundos
MAX_CLIP_DURATION = 60  # Duração máxima do clipe em segundos
MODEL_SIZE = "base"     # Tamanho do modelo Whisper ("tiny", "base", "small", "medium", "large")
                          # Modelos maiores são mais precisos, mas exigem mais VRAM e são mais lentos.

def format_time(seconds):
    """Converte segundos para o formato H:M:S,ms usado por moviepy."""
    return str(timedelta(seconds=seconds))

def create_captions(transcription_result, clip_duration):
    """Cria uma lista de TextClips (legendas) para o vídeo."""
    captions = []

    # Estilo das legendas
    font = "Arial-Bold"
    fontsize = 48  # Ajuste conforme necessário
    color = 'white'
    stroke_color = 'black'
    stroke_width = 2

    for segment in transcription_result['segments']:
        # Verifica se a chave 'words' existe e não está vazia
        if 'words' in segment and segment['words']:
            for word_info in segment['words']:
                start_time = word_info['start']
                end_time = word_info['end']
                text = word_info['word'].upper()

                # Cria um clipe de texto para cada palavra
                txt_clip = TextClip(text, fontsize=fontsize, font=font, color=color,
                                    stroke_color=stroke_color, stroke_width=stroke_width)

                txt_clip = txt_clip.set_start(start_time).set_duration(end_time - start_time)
                txt_clip = txt_clip.set_position(('center', 'center')) # Posição inicial

                captions.append(txt_clip)
        else:
             # Se não houver 'words', usa o texto do segmento inteiro (less dynamic)
             start_time = segment['start']
             end_time = segment['end']
             text = segment['text'].upper()

             txt_clip = TextClip(text, fontsize=fontsize, font=font, color=color,
                                stroke_color=stroke_color, stroke_width=stroke_width)

             txt_clip = txt_clip.set_start(start_time).set_duration(end_time - start_time)
             txt_clip = txt_clip.set_position(('center', 'center'))

             captions.append(txt_clip)


    return captions

def main():
    """Função principal que executa todo o processo."""

    # --- NOVO PASSO: CARREGAR VÍDEO COM MOVIEPY E EXTRAIR ÁUDIO ---
    print(f"Carregando vídeo com MoviePy para extrair áudio: {VIDEO_PATH}...")
    try:
        original_video = VideoFileClip(VIDEO_PATH)
        audio_clip = original_video.audio
        temp_audio_path = "/content/temp_audio.wav" # Salva áudio temporariamente
        audio_clip.write_audiofile(temp_audio_path, codec='pcm_s16le')
        print(f"Áudio extraído e salvo em: {temp_audio_path}")
    except Exception as e:
        print(f"Erro ao carregar vídeo com MoviePy ou extrair áudio: {e}")
        return
    # --- FIM DO NOVO PASSO ---


    # 1. Carregar o modelo de IA e transcrever o áudio
    print("Carregando o modelo Whisper...")
    model = whisper.load_model(MODEL_SIZE)

    print(f"Transcrevendo o áudio: {temp_audio_path}...")
    # Precisamos do word_timestamps=True para as legendas dinâmicas
    # Usamos o áudio temporário para a transcrição
    transcription = model.transcribe(temp_audio_path, word_timestamps=True)

    # 2. Identificar segmentos interessantes (lógica simplificada)
    print("Identificando segmentos para clipes...")
    potential_clips = []
    for segment in transcription['segments']:
        start = segment['start']
        end = segment['end']
        duration = end - start

        # Nossa "IA" aqui é simples: pegamos qualquer segmento de fala contínua
        # que se encaixe na duração desejada.
        if MIN_CLIP_DURATION <= duration <= MAX_CLIP_DURATION:
            potential_clips.append({
                'start': start,
                'end': end,
                'duration': duration,
                'text': segment['text']
            })
            print(f"  - Segmento encontrado: {format_time(start)} -> {format_time(end)} ({duration:.2f}s)")

    if not potential_clips:
        print("Nenhum clipe com a duração desejada foi encontrado.")
        # Fechar o vídeo original mesmo que não haja clipes
        original_video.close()
        # Remover o arquivo de áudio temporário
        if os.path.exists(temp_audio_path):
            os.remove(temp_audio_path)
            print(f"Arquivo de áudio temporário removido: {temp_audio_path}")
        return

    # 3. Criar e salvar os clipes
    if not os.path.exists(OUTPUT_DIR):
        os.makedirs(OUTPUT_DIR)

    print(f"\nCriando {len(potential_clips)} clipe(s)...")
    # O video_clip original já foi carregado no início

    for i, clip_data in enumerate(potential_clips):
        start_time = clip_data['start']
        end_time = clip_data['end']
        output_filename = os.path.join(OUTPUT_DIR, f"clip_{i+1}.mp4")

        print(f"Processando clipe {i+1}/{len(potential_clips)} -> {output_filename}")

        # Corta o segmento de vídeo
        clip = original_video.subclip(start_time, end_time)

        # Redimensiona para formato vertical (9:16)
        (w, h) = clip.size
        target_aspect_ratio = 9.0 / 16.0

        # Calcula o corte para manter o centro do vídeo
        new_w = int(h * target_aspect_ratio)
        new_h = h

        # Garante que o corte não seja maior que a largura original
        if new_w > w:
            new_w = w
            new_h = int(w / target_aspect_ratio)

        # Corta o vídeo (crop)
        cropped_clip = crop(clip, width=new_w, height=new_h, x_center=w/2, y_center=h/2)

        # Redimensiona para 1080x1920 (Full HD Vertical)
        final_clip = cropped_clip.resize(width=1080)

        # Adiciona as legendas
        # Passamos a transcrição completa e a duração do clipe cortado
        # Filtra as legendas para o intervalo de tempo do clipe atual
        transcription_for_clip = {
            'segments': [
                s for s in transcription['segments']
                if (s['start'] >= start_time and s['start'] < end_time) or
                   (s['end'] > start_time and s['end'] <= end_time) or
                   (s['start'] < start_time and s['end'] > end_time)
            ]
        }
        captions = create_captions(transcription_for_clip, final_clip.duration)
        # Ajusta o tempo das legendas para o início do clipe (subtrai o start_time do clipe)
        captions_positioned = [c.set_start(max(0, c.start - start_time)) for c in captions]


        final_video_with_captions = CompositeVideoClip([final_clip] + captions_positioned)

        # Salva o arquivo final
        final_video_with_captions.write_videofile(
            output_filename,
            codec='libx264',
            audio_codec='aac',
            temp_audiofile='temp-audio-write.m4a', # Usar nome diferente para evitar conflito
            remove_temp=True
        )

        clip.close()

    original_video.close()
    # Remover o arquivo de áudio temporário
    if os.path.exists(temp_audio_path):
        os.remove(temp_audio_path)
        print(f"Arquivo de áudio temporário removido: {temp_audio_path}")

    print("\nProcesso concluído!")


if __name__ == "__main__":
    main()

Carregando vídeo com MoviePy para extrair áudio: /content/drive/My Drive/133OjAM8lr3cwjjZ1o9JnT-U-eHk0U8wo/NÃO ENTRE 2025 SEM ASSISTIR ESSA ENTREVISTA! - PR. JACKSON MARQUES NO IANG CAST - IANG TV (1080p, h264, youtube) (1).mp4...
Erro ao carregar vídeo com MoviePy ou extrair áudio: MoviePy error: the file /content/drive/My Drive/133OjAM8lr3cwjjZ1o9JnT-U-eHk0U8wo/NÃO ENTRE 2025 SEM ASSISTIR ESSA ENTREVISTA! - PR. JACKSON MARQUES NO IANG CAST - IANG TV (1080p, h264, youtube) (1).mp4 could not be found!
Please check that you entered the correct path.


In [20]:
import os

# List the contents of the /content/ directory
print(os.listdir('/content/'))

['.config', 'drive', 'sample_data']


In [21]:
import shutil
import os

# Replace with the actual path to your video file in Google Drive
source_path = "PASTE_YOUR_GOOGLE_DRIVE_FILE_PATH_HERE"
destination_path = "/content/your_video_file_name.mp4" # You can change the destination filename if you like

try:
    shutil.copy(source_path, destination_path)
    print(f"File copied successfully to: {destination_path}")
except FileNotFoundError:
    print(f"Error: The source file was not found at {source_path}. Please double-check the path.")
except Exception as e:
    print(f"An error occurred while copying the file: {e}")

Error: The source file was not found at PASTE_YOUR_GOOGLE_DRIVE_FILE_PATH_HERE. Please double-check the path.


In [22]:
import shutil
import os

# Replace with the actual path to your video file in Google Drive
source_path = "PASTE_THE_FILE_PATH_FROM_GOOGLE_DRIVE_HERE"
destination_path = "/content/your_video_file_name.mp4" # You can change the destination filename if you like

try:
    shutil.copy(source_path, destination_path)
    print(f"File copied successfully to: {destination_path}")
except FileNotFoundError:
    print(f"Error: The source file was not found at {source_path}. Please double-check the path.")
except Exception as e:
    print(f"An error occurred while copying the file: {e}")

Error: The source file was not found at PASTE_THE_FILE_PATH_FROM_GOOGLE_DRIVE_HERE. Please double-check the path.


In [23]:
# Replace with the actual path to the destination directory in your Google Drive
!ls "PASTE_YOUR_GOOGLE_DRIVE_DESTINATION_PATH_HERE"

ls: cannot access 'PASTE_YOUR_GOOGLE_DRIVE_DESTINATION_PATH_HERE': No such file or directory


In [24]:
import shutil
import os

# Nome da pasta de saída onde os clipes foram salvos (do código anterior)
# !!! IMPORTANTE: SUBSTITUA "USE_THE_SAME_NAME_AS_OUTPUT_DIR_IN_CELL_cAaQoduhokk6_HERE" PELO NOME REAL DA PASTA DE SAÍDA DEFINIDO EM OUTPUT_DIR NA CÉLULA cAaQoduhokk6 !!!
output_folder_name = "ENTER_YOUR_DESIRED_OUTPUT_DIRECTORY_NAME_HERE"
source_directory = os.path.join("/content/", output_folder_name)

# Caminho para a pasta de destino no seu Google Drive
# Exemplo: "/content/drive/My Drive/Pasta_dos_Videos_Editados"
# !!! IMPORTANTE: SUBSTITUA "PASTE_YOUR_GOOGLE_DRIVE_DESTINATION_PATH_HERE" PELO CAMINHO COMPLETO NO SEU GOOGLE DRIVE ONDE VOCÊ QUER SALVAR A PASTA !!!
destination_directory = "/content/drive/My Drive/133OjAM8lr3cwjjZ1o9JnT-U-eHk0U8wo" # Usando o ID da pasta fornecido pelo usuário

try:
    # Verifica se a pasta de saída existe
    if os.path.exists(source_directory):
        # Copia a pasta inteira para o Google Drive
        # Certifique-se de que o destino existe e é um diretório acessível pelo Colab
        shutil.copytree(source_directory, destination_directory)
        print(f"Pasta '{output_folder_name}' copiada com sucesso para: {PASTE_YOUR_GOOGLE_DRIVE_DESTINATION_PATH_HERE}")
    else:
        print(f"Erro: A pasta de origem '{source_directory}' não foi encontrada em /content/. Certifique-se de que o código foi executado e gerou os clipes.")
except FileExistsError:
    print(f"Erro: A pasta de destino '{destination_directory}' já existe no Google Drive.")
    print("Por favor, remova a pasta existente ou escolha um nome de pasta diferente para a cópia.")
except Exception as e:
    print(f"Ocorreu um erro ao copiar a pasta: {e}")

Erro: A pasta de origem '/content/ENTER_YOUR_DESIRED_OUTPUT_DIRECTORY_NAME_HERE' não foi encontrada em /content/. Certifique-se de que o código foi executado e gerou os clipes.


In [25]:
# Replace with the actual path to the destination directory in your Google Drive
!ls "PASTE_YOUR_GOOGLE_DRIVE_DESTINATION_PATH_HERE"

ls: cannot access 'PASTE_YOUR_GOOGLE_DRIVE_DESTINATION_PATH_HERE': No such file or directory


In [26]:
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [27]:
!pip install -q openai-whisper