<a href="https://colab.research.google.com/github/abnersantana00/video-to-text/blob/main/main.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [2]:
!pip install moviepy SpeechRecognition pydub
import os
from moviepy.editor import VideoFileClip
import speech_recognition as sr
from google.colab import drive
drive.mount('/content/drive')

def adjust_path(path):
    """
    Remove aspas e corrige barras no caminho do arquivo.
    """
    return path.strip().strip('"').replace("\\", "/")

def extract_audio_from_video(video_path, audio_output_path):
    """
    Extrai o áudio de um arquivo de vídeo MP4.
    :param video_path: Caminho do arquivo de vídeo.
    :param audio_output_path: Caminho para salvar o áudio extraído.
    """
    clip = VideoFileClip(video_path)
    clip.audio.write_audiofile(audio_output_path)
    print(f"Áudio extraído para: {audio_output_path}")

def transcribe_audio_to_text(audio_path):
    """
    Transcreve o áudio para texto.
    :param audio_path: Caminho do arquivo de áudio (.wav).
    :return: Texto transcrito.
    """
    recognizer = sr.Recognizer()
    with sr.AudioFile(audio_path) as source:
        audio_data = recognizer.record(source)
        try:
            return recognizer.recognize_google(audio_data, language="pt-BR")
        except sr.UnknownValueError:
            return "Não foi possível reconhecer o áudio."
        except sr.RequestError as e:
            return f"Erro no serviço de reconhecimento: {e}"

def main():
    video_path = input("Informe o caminho do arquivo MP4: ").strip()
    video_path = adjust_path(video_path)  # Ajusta o caminho do arquivo
    audio_output_path = "extracted_audio.wav"

    if not os.path.exists(video_path):
        print("O arquivo de vídeo não foi encontrado.")
        return

    # Extrai o áudio do vídeo
    extract_audio_from_video(video_path, audio_output_path)

    # Transcreve o áudio para texto
    print("Transcrevendo o áudio...")
    transcription = transcribe_audio_to_text(audio_output_path)

    # Exibe a transcrição no terminal
    print("\nTranscrição do áudio:")
    print(transcription)

    # Remove o arquivo de áudio extraído (opcional)
    if os.path.exists(audio_output_path):
        os.remove(audio_output_path)

    print("\nProcesso concluído.")

if __name__ == "__main__":
    main()


Collecting SpeechRecognition
  Downloading SpeechRecognition-3.11.0-py2.py3-none-any.whl.metadata (28 kB)
Collecting pydub
  Downloading pydub-0.25.1-py2.py3-none-any.whl.metadata (1.4 kB)
Downloading SpeechRecognition-3.11.0-py2.py3-none-any.whl (32.8 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m32.8/32.8 MB[0m [31m46.6 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading pydub-0.25.1-py2.py3-none-any.whl (32 kB)
Installing collected packages: pydub, SpeechRecognition
Successfully installed SpeechRecognition-3.11.0 pydub-0.25.1


KeyboardInterrupt: Interrupted by user

In [None]:
from google.colab import drive
drive.mount('/content/drive')