# Speech recognition

How exciting to start our AI speech recognition journey! 🚀

The neccessary steps are as follows:
1) Install and import all necessary packages
2) Specify and load the wanted model from HuggingFace via their package "transformers"
3) Specify which audio files to run through the model
4) Voila, the magic is done!
5) (optional) save the output wherever you want

## 1) Install and import all necessary packages

In [3]:
# We start by checking that our virtual environment is up and running. 
# The correct path should end with /env/bin/python
!which python

/Users/mariekristiansen/Documents/Permittering/projects/SpeechRecognitionLocal/env/bin/python


In [4]:
# Then we need to install all required packages
# Most likely this is already done and you can skip this part
!pip install -r requirements.txt



In [5]:
# Importing necessary packages

from transformers import pipeline

  from .autonotebook import tqdm as notebook_tqdm


In [6]:
# Set model
# This can be any suitable model from Hugging Face
model_name = "NbAiLab/nb-whisper-small-beta"

In [21]:
# Load the model from hugging face
speech_recognition = pipeline("automatic-speech-recognition", model_name)


In [22]:
# Choose audio file
audio_file = "audio/king.mp3"

In [23]:
# Transcribe

output = speech_recognition(audio_file, return_timestamps=True, generate_kwargs={'task': 'transcribe', 'language': 'no'})



In [24]:
# Check output
print(output)

{'text': ' Nordmenn er nordlendinger, trøndere, sørlendinger og folk fra alle andre regioner. Nordmenn er også innvandrere fra Afghanistan, Pakistan, Polen, Sverige, Somalia og Syria. Det er ikke alltid så lett å si hvor vi er fra. Det er rett vi tilhører. Det vi kaller hjem, er der hjertet vårt er. Det kan ikke alltid plasseres innenfor landegrenser. Nordmenn er jenter som er glad i jenter, gutter som er glad i gutter, og jenter og gutter som er glad i hverandre. Nordmenn tror på Gud, Allah, altet og ingenting. Nordmenn liker Grieg, Kygo, Hellbillies og Kari Bremnes. Med andre ord, Norge er dere. Norge er oss. Mitt største håp for Norge er at vi skal klare å ta vare på hverandre. At vi skal bygge dette landet videre på tillit, fellesskap og raushet.', 'chunks': [{'timestamp': (0.0, 5.5), 'text': ' Nordmenn er nordlendinger, trøndere, sørlendinger'}, {'timestamp': (5.52, 8.68), 'text': ' og folk fra alle andre regioner.'}, {'timestamp': (8.68, 15.08), 'text': ' Nordmenn er også innvand

In [26]:
# Save output to text file

output_filename = 'output.txt'

with open(output_filename, 'w') as f:
    f.write(str(output))

In [27]:
# Save output to json file
import json

output_filename = 'output.json'

with open(output_filename, 'w') as f:
    f.write(json.dumps(output))