# Extract & postprocessing transcribe with whisper model
## File uploads are currently limited to 25 MB and the following input file types are supported: mp3, mp4, mpeg, mpga, m4a, wav, and webm.

In [None]:
#%pip install openai --upgrade
#%pip install dotenv
#%pip install datetime
#%pip install pydub
%pip install moviepy

In [14]:
import datetime
import os,sys, openai
from openai import OpenAI
from dotenv import load_dotenv
from pydub import AudioSegment #in case you need to decrease audio files/cut
from moviepy.editor import AudioFileClip

In [15]:
load_dotenv("secrets.env")

# Import Key and Base from .env
openai.api_key = os.getenv("OPENAI_API_KEY")
openai.api_base = os.getenv("OPENAI_API_BASE") #not relevant with the new library
openai.whisper_model = "whisper-1"
openai.organization = os.getenv("OPENAI_ORGANIZATION")

print("OpenAI API Organization : " + openai.organization)


OpenAI API Organization : org-s2vfZ66mFlueBZk17Rl7dhRU


In [16]:
# We create a client instance for openAI
client = OpenAI(
    api_key=openai.api_key,
    organization=openai.organization
)


# if your file video is higher than 25 mo - launch this cell

In [18]:

def extract_audio_from_mp4(video_path, output_path):
    video = AudioFileClip(video_path)
    video.write_audiofile(output_path, bitrate="64k")

# Usage
extract_audio_from_mp4("../vids/interview.mp4", "../vids/output.mp3")

MoviePy - Writing audio in ../vids/output.mp3


                                                                      

MoviePy - Done.




## If you want a transcribe in current language use this cell

In [22]:

filepath = "../vids/output.mp3"
audio_file= open(filepath, "rb")
transcript = client.audio.transcriptions.create(
  model=openai.whisper_model, 
  file=audio_file,
  response_format="text"
)

print(transcript)

Καλησπέρα όλοι και καλώς ήρθατε στο νέο ΜΒΑ Ελεκτρικό Επιτροπή Προϊόντας Gen.AI Προϊόντας και επιχειρήσεις. Είμαι ο Θεός Ευγενίου και ελπίζομαι να σας δω την επόμενη εβδομάδα σε αυτό το σχόλιο. Αυτό είναι μόνο ένα βίντεο που θα κάνουμε όλοι. Πρέπει να είναι λιγότερο από ένα λεπτό και να περάσω μερικές ερωτήσεις που σας έδωσα μέσω e-mail. Θα σας δώσω ένα παράδειγμα, θα περάσω τις ερωτήσεις μόνος μου. Η πρώτη ερώτηση είναι το όνομα, το κεφάλαιο, το σημαντικό ρόλο πριν στο ΙΝΣΙΑΔ. Ονομάζομαι ο Θεός Ευγενίου, το κεφάλαιο μου είναι τεχνολογία και κοινωνική επιχειρήματα και είμαι στο ΙΝΣΙΑΔ από το 2001. Η δεύτερη ερώτηση είναι, τι είναι οι δύο δυνατό ρόλοι, εργασίες που θέλω να δουλέψω στο επόμενο ή αν έχω ήδη εργασία, τι ρόλο θα συμμετέχω στο επόμενο. Σε αυτό το περίπτωσο, θα παραμείνω δέντρος στο ΙΝΣΙΑΔ. Τι είναι οι δύο δυνατό ρόλοι που θέλω να δουλέψω στο επόμενο. Ας ελπίζουμε να έχουμε πάνω από δύο. Στην πλευρά μου, η κυρίαρη επιτυχία θα είναι, αν συλλογικά, με την συμμετοχή μαζί, θα έχο

## If you want a translate in english text use this cell
For the languages possibles to translate check this link in openAi page [page](https://platform.openai.com/docs/guides/speech-to-text/supported-languages)

In [21]:
filepath = "../vids/output.mp3"
audio_file= open(filepath, "rb")
translation = client.audio.translations.create(
  model=openai.whisper_model,
  file=audio_file,
  response_format="text"
)

print(transcript)

Καλησπέρα όλοι και καλώς ήρθατε στο νέο ΜΒΑ Ελεκτρικό Επιτροπή Προϊόντας Gen.AI Προϊόντας και επιχειρήσεις. Είμαι ο Θεός Ευγενίου και ελπίζομαι να σας δω την επόμενη εβδομάδα σε αυτό το δρόμο. Αυτό είναι μόνο ένα πρόγραμμα βίντεο που θα κάνουμε όλοι. Πρέπει να είναι λιγότερο από ένα λεπτό και να περάσω μερικές ερωτήσεις που σας έδωσα μέσω e-mail. Θα σας δώσω ένα παράδειγμα, θα περάσω τις ερωτήσεις μόνος μου. Το όνομά μου είναι Θεός Ευγενίου, τα κυριαρχικά δίκαια μου είναι τεχνογραφία και τεχνογραφία, και είμαι στο ΙΣΙΑΔ από το 2001. Δεύτερη ερώτηση. Ποια είναι οι δύο σημαντικές ρόλες, εργασίες, εργασίες που θέλω να δουλέψω στο επόμενο ή αν έχω ήδη εργασία, ποιο ρόλο θα συμμετέχω στο επόμενο. Σε αυτό το περίπτωσέ μου θα παραμείνω προφητείς στο ΙΣΙΑΔ στο επόμενο. Ποια είναι οι δύο σημαντικές ρόλες που θέλω να δουλέψω στο επόμενο. Ας ελπίζουμε να έχουμε περισσότερα από τα δύο. Στην πλευρά μου, το κομμάτι της επιτυχίας θα είναι αν συλλογικά, με την συμμετοχή, θα έχουμε μια καλύτερη, πιο πρ

## Now we can process directly the result for the transcription / translation with Gpt