# Speech-To-Text Translator

#### This code implements a speech-to-text translator using IBM Watson Speech-To-Text API and automatically translates it to a foreign language using IBM Watson Translator API

In [55]:
from ibm_watson import SpeechToTextV1
from ibm_watson import LanguageTranslatorV3
from ibm_cloud_sdk_core.authenticators import IAMAuthenticator
import json

#### Create Speech-to-Text adapter using authenticator from api key and set the url service

In [2]:
url_s2t = "https://api.jp-tok.speech-to-text.watson.cloud.ibm.com/instances/9f1f30e6-978b-4180-b87a-1ee3a27a80db"
iam_apikey_s2t = "_KsJe_QRH-z2ZQnwvLkwuA5NAQ4k56tmOZcBepxEbD3A"

authenticator = IAMAuthenticator(iam_apikey_s2t)
s2t = SpeechToTextV1(authenticator)
s2t.set_service_url(url_s2t)

#### Download sample audio file

In [3]:
!curl -o PolynomialRegressionandPipelines.mp3  https://s3-api.us-geo.objectstorage.softlayer.net/cf-courses-data/CognitiveClass/PY0101EN/labs/PolynomialRegressionandPipelines.mp3

  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed

  0     0    0     0    0     0      0      0 --:--:-- --:--:-- --:--:--     0
  0     0    0     0    0     0      0      0 --:--:--  0:00:01 --:--:--     0
  3 4134k    3  144k    0     0   144k      0  0:00:28  0:00:01  0:00:27 74322
  5 4134k    5  224k    0     0  76458      0  0:00:55  0:00:03  0:00:52 74521
  6 4134k    6  288k    0     0  98304      0  0:00:43  0:00:03  0:00:40 74024
  8 4134k    8  368k    0     0  94208      0  0:00:44  0:00:04  0:00:40 75836
 10 4134k   10  448k    0     0  76458      0  0:00:55  0:00:06  0:00:49 93795
 11 4134k   11  496k    0     0  72557      0  0:00:58  0:00:07  0:00:51 71645
 14 4134k   14  592k    0     0  86601      0  0:00:48  0:00:07  0:00:41 77046
 16 4134k   16  672k    0     0  86016      0  0:00:49  0:00:08  0:00:41 78643
 18 4134k   18  768k    0     0  78643      0  0:00

path = 'PolynomialRegressionandPipelines.mp3'

#### Open audio file and call API to convert it to text

In [6]:
with open(path, mode = 'rb') as audiofile:
    response = s2t.recognize(audio = audiofile, content_type = 'audio/mp3')

In [9]:
response.result

{'result_index': 0,
 'results': [{'final': True,
   'alternatives': [{'transcript': 'in this video we will cover polynomial regression and pipelines ',
     'confidence': 0.94}]},
  {'final': True,
   'alternatives': [{'transcript': "what do we do when a linear model is not the best fit for our data let's look into another type of regression model the polynomial regression we transform our data into a polynomial then use linear regression to fit the parameters that we will discuss pipelines pipelines are way to simplify your code ",
     'confidence': 0.9}]},
  {'final': True,
   'alternatives': [{'transcript': "polynomial regression is a special case of the general linear regression this method is beneficial for describing curvilinear relationships what is a curvilinear relationship it's what you get by squaring or setting higher order terms of the predictor variables in the model transforming the data the model can be quadratic which means the predictor variable in the model is squar

#### Convert json object into a paragraph of translated text

In [22]:
from pandas import json_normalize

In [53]:
text = '. '.join([sentence.strip().capitalize() for sentence in list(json_normalize(response.result['results'],'alternatives')['transcript'])]) + '.'
text

"In this video we will cover polynomial regression and pipelines. What do we do when a linear model is not the best fit for our data let's look into another type of regression model the polynomial regression we transform our data into a polynomial then use linear regression to fit the parameters that we will discuss pipelines pipelines are way to simplify your code. Polynomial regression is a special case of the general linear regression this method is beneficial for describing curvilinear relationships what is a curvilinear relationship it's what you get by squaring or setting higher order terms of the predictor variables in the model transforming the data the model can be quadratic which means the predictor variable in the model is squared we use a bracket to indicated as an exponent this is the second order polynomial regression with a figure representing the function. The model can be cubic which means the predictor variable is cute this is the third order polynomial regression we 

#### Create Language Translator adapter using authenticator from api key and set the url service

In [59]:
url_lt = "https://api.jp-tok.language-translator.watson.cloud.ibm.com/instances/fb4e3475-c43e-4c47-8827-2235446d15f6"
iam_apikey_lt = "xemLAe6Lkf2sJFh5R1_tPZJP3QBTeu6yL18ExyCrFhma"
version_lt='2018-05-01'

authenticator = IAMAuthenticator(iam_apikey_lt)
lt = LanguageTranslatorV3(version = version_lt, authenticator = authenticator)
lt.set_service_url(url_lt)

#### Show supported languages

In [61]:
supported_languages = json_normalize(lt.list_identifiable_languages().get_result(), "languages")

#### Search for Italian XD

In [62]:
supported_languages

Unnamed: 0,language,name
0,af,Afrikaans
1,ar,Arabic
2,az,Azerbaijani
3,ba,Bashkir
4,be,Belarusian
...,...,...
71,uk,Ukrainian
72,ur,Urdu
73,vi,Vietnamese
74,zh,Simplified Chinese


In [70]:
supported_languages[supported_languages['name'] == 'Italian']

Unnamed: 0,language,name
31,it,Italian


#### Call API and translate text into target language

In [71]:
translated = lt.translate(text = text, model_id = 'en-it')
translated.get_result()

{'translations': [{'translation': "In questo video copriremo la regressione polinomiale e i gasdotti. Cosa facciamo quando un modello lineare non è il migliore adatto per i nostri dati, analizziamo un altro tipo di regressione modello la regressione polinomiale che trasformiamo i nostri dati in un polinomio poi usa la regressione lineare per adattarsi ai parametri che discuteremo di pipeline pipeline sono in grado di semplificare il tuo codice. La regressione polinomiale è un caso particolare della regressione lineare generale questo metodo è benefico per descrivere le relazioni curvilinee ciò che è un rapporto curvilineo è ciò che si ottiene per quadratura o impostazione di termini di ordine superiore delle variabili predittiva nel modello che trasforma il dato il modello può essere quadratico che significa la variabile predittiva nel modello è quadrante usiamo una staffa per indicare come esponente questa è la regressione polinomiale di secondo ordine con una figura che rappresenta l

#### Convert json object into a paragraph of translated text

In [88]:
final = ''.join(list(json_normalize(translated.get_result()['translations'])['translation']))
final

"In questo video copriremo la regressione polinomiale e i gasdotti. Cosa facciamo quando un modello lineare non è il migliore adatto per i nostri dati, analizziamo un altro tipo di regressione modello la regressione polinomiale che trasformiamo i nostri dati in un polinomio poi usa la regressione lineare per adattarsi ai parametri che discuteremo di pipeline pipeline sono in grado di semplificare il tuo codice. La regressione polinomiale è un caso particolare della regressione lineare generale questo metodo è benefico per descrivere le relazioni curvilinee ciò che è un rapporto curvilineo è ciò che si ottiene per quadratura o impostazione di termini di ordine superiore delle variabili predittiva nel modello che trasforma il dato il modello può essere quadratico che significa la variabile predittiva nel modello è quadrante usiamo una staffa per indicare come esponente questa è la regressione polinomiale di secondo ordine con una figura che rappresenta la funzione. Il modello può essere 