In this tutorial you will learn how to use Whisper to transcribe text from audio files as well translate it into English.

If you **haven't set up your OpenAI API key** as a global system variable you can set it up now by pasting it into the **.env** file and running the following code:

In [8]:
import os
from dotenv import load_dotenv
from openai import OpenAI

load_dotenv()

api_key = os.getenv("OPENAI_API_KEY")

client = OpenAI(api_key=api_key)

Otherwise, just runs this code:

In [7]:
client = OpenAI()

**Load the audio file**

Feel free to try different audio files as well as add/record your own. Files must be of one of these types: mp3, mp4, mpeg, mpga, m4a, wav, and webm.

**Note that files greater than 25MB will need to be segmented using [additional libraries](https://platform.openai.com/docs/guides/speech-to-text/longer-inputs).**

In [9]:
audio_file = open("audio.wav", "rb")

**1 - Transcribe an audio file**

The transcription endpoint will take the input audio and transcribe it into text.

In [10]:
transcription = client.audio.transcriptions.create(
    model="whisper-1", 
    file=audio_file,
    response_format="text"
)

print(transcription)

Amor é um fogo que arde sem se ver. É a ferida que dói e não se sente. É um contentamento descontente. É dor que desatina sem doer. É um não querer mais que bem querer. É solitário andar por entre a gente. É um não contentar-se de contente. É cuidar que se ganha em se perder. É um estar-se preso por vontade. É servir a quem vence, o vencedor. É ter com quem nos mata, lealdade. Mas como causar pode o seu favor nos mortais corações conformidade, sendo a si tão contrário o mesmo amor?



Notice how **response_format=\"text\"**? To get additional information to get additional information try changing it to **verbose_json**.



You should now receive a json response with additional parameters. One of which, the **language** parameter, includes the detected language from the input file.

**Note:** If the language is not being properly detected, which may negatively impact transcription, you can add an additional parameter stating it according to the  [ISO-639-1 format](https://en.wikipedia.org/wiki/List_of_ISO_639_language_codes).

```
(
    model="whisper-1", 
    file=audio_file,
    response_format="text"
    language="..."
)
```

We can modify our code to reflect this:

In [11]:
transcription = client.audio.transcriptions.create(
    model="whisper-1", 
    file=audio_file,
    response_format="verbose_json"
)
print(f"Detected language: {transcription.language}")
print(transcription.text)

Detected language: portuguese
Amor é um fogo que arde sem se ver. É a ferida que dói e não se sente. É um contentamento descontente. É dor que desatina sem doer. É um não querer mais que bem querer. É solitário andar por entre a gente. É um não contentar-se de contente. É cuidar que se ganha em se perder. É um estar-se preso por vontade. É servir a quem vence, o vencedor. É ter com quem nos mata, lealdade. Mas como causar pode o seu favor nos mortais corações conformidade, sendo a si tão contrário o mesmo amor?


**2 - Translation**

Using the translation endpoint we can translate the contents of the audio file to English (currently this the only available language for translation).

In [None]:
translation = client.audio.translations.create(
    model = "whisper-1", 
    file = audio_file,
    response_format="text"
)
print(translation)