# ¡Polly habla¡ 🦜
 

Un notebook donde podrás, identificar el idioma de un trexto ingresado, traducirlo a otro idioma y repoducir un audio con la pronunciación del idioma destino. 

![Make Polly Talk"](../images/make-polly-talk.png)

## Este ejemplo vas a usar 3 servicios de AI/ML que puedes emplear como llamadas de API: 

- [Amazon Comprehend](https://aws.amazon.com/comprehend/): Utiliza el procesamiento del lenguaje natural (NLP) para extraer información sobre el contenido de los documentos. Desarrolla información mediante el reconocimiento de las entidades, las frases clave, el **idioma**, los sentimientos y otros elementos comunes de un documento. Utilice Amazon Comprehend para crear nuevos productos basándose en la comprensión de la estructura de los documentos. Por ejemplo, con Amazon Comprehend puedes buscar menciones de productos en las redes sociales o escanear todo un repositorio de documentos en busca de frases clave. [Más información](https://docs.aws.amazon.com/comprehend/latest/dg/what-is.html)
- [Amazon Translate](https://aws.amazon.com/translate/): un servicio de traducción de textos que utiliza tecnologías avanzadas de aprendizaje automático para ofrecer traducciones de alta calidad a pedido. Puede usar Amazon Translate para traducir documentos de texto no estructurados o para crear aplicaciones que funcionen en varios idiomas. ConsulteIdiomas y códigos de idioma admitidospara obtener información sobre los idiomas que admite Amazon Translate. [Más información](https://docs.aws.amazon.com/es_es/translate/latest/dg/what-is.html)
- [Amazon Polly](https://aws.amazon.com/polly/) un servicio en la nube que convierte el texto en un segmento hablado muy realista. Puede utilizar Amazon Polly para desarrollar aplicaciones que aumenten la participación y la accesibilidad. Amazon Polly admite varios idiomas e incluye una variedad de voces realistas, de modo que puede crear aplicaciones con función de voz que funcionen en múltiples ubicaciones y utilicen la voz ideal para sus clientes. Con Amazon Polly, solo paga por el texto que sintetice. También puede almacenar en caché y reproducir el discurso generado por Amazon Polly sin coste adicional.[Más información](https://docs.aws.amazon.com/polly/latest/dg/what-is.html)

### Requisitos:
- [Una cuenta de AWS](https://aws.amazon.com/es/free/)
- [Foundational knowledge of Python](https://community.aws/tutorials/build-a-knowledge-base-with-multilingual-q-and-a-gen-ai)

### Configuración previa:
- [Uso de AWS Command Line Interface CLI](https://docs.aws.amazon.com/es_es/cli/latest/userguide/cli-chap-welcome.html)
- [Instalar CLI](https://docs.aws.amazon.com/es_es/cli/latest/userguide/getting-started-install.html)
- [Configurar credenciales de AWS para uso local](https://docs.aws.amazon.com/es_es/cli/latest/userguide/cli-configure-files.html)

## 🦜 🚀 Empecemos!! 

### Paso 0: [Instala Boto3](https://boto3.amazonaws.com/v1/documentation/api/latest/guide/quickstart.html#install-boto3) [Más información de Boto3](https://aws.amazon.com/es/sdk-for-python/)
Es una librería de python para facilitar la integración con los servicios de AWS (Amazon Web Services)

In [None]:
### Instala la ultima version de Boto3 via pip: 

!pip install boto3

In [None]:
# Boto3 session with credentials taken from environtment
import boto3
import os

AWS_ACCESS_KEY_ID = YOU_AWS_ACCESS_KEY_ID
AWS_SECRET_ACCESS_KEY = YOU_AWS_SECRET_ACCESS_KEY
AWS_SESSION_TOKEN= YOU_AWS_SESSION_TOKEN
REGION_NAME = YOU_REGION

my_session = boto3.Session(
    aws_access_key_id     = AWS_ACCESS_KEY_ID,
    aws_secret_access_key = AWS_SECRET_ACCESS_KEY,
    aws_session_token     = AWS_SESSION_TOKEN,
    region_name=REGION_NAME
)


### Paso 1: Detecta el lenguage dominante en el texto. 

> 🚨Nota: Cada servicio tiene un cliente que debes inicializar antes de hacer cada llamada de API. 

Este paso lo realizamos empleando la llamda de API [DetectDominantLanguage](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/comprehend/client/detect_dominant_language.html#detect-dominant-language?) de [Boto3 Comprehend client](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/comprehend.html).


In [None]:
comprehend_client = my_session.client('comprehend')

comprehend_response = comprehend_client.detect_dominant_language(
    Text='hola mundo'
)
comprehend_response

In [None]:
code_idioma_dominante = comprehend_response['Languages'][0]['LanguageCode']
code_idioma_dominante

### Paso 2: Realiza la traducción. 


Este paso lo realizamos empleando la llamda de API [TranslateText](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/comprehend/client/detect_dominant_language.html#detect-dominant-language) de [Boto3 Translate client](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/comprehend.html). 

[supported language codes](https://docs.aws.amazon.com/translate/latest/dg/what-is-languages.html) 



> 👩🏻‍💻**Truco:** Si en SourceLanguageCode colocas *auto* Amazon Translate empleará a Amazon Comprehend automaticamente para dectectar el lenguaje dominante por ti. 

In [None]:
translate_client = my_session.client('translate')

def TranslateText (text,language):
    response = translate_client.translate_text(
    Text=text,
    SourceLanguageCode="auto",
    TargetLanguageCode=language  
) 
    return response

In [None]:
text = "Hola mundo"
language = "en"
translate_response = TranslateText (text,language)
translate_response

> 👩🏻‍💻 **Tips:** Aprende más Amazon Translate con estos Amazon Translate [Code Samples](https://github.com/aws-samples/document-translation).. [more code samples](https://docs.aws.amazon.com/translate/latest/dg/examples.html)


### Paso 3: 🦜 ¡Polly habla!. 

Este paso lo realizamos empleando la llamda de API [SynthesizeSpeech](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/polly/client/synthesize_speech.html) de [Boto3 Polly client](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/polly.html). 


[supported language codes](https://docs.aws.amazon.com/translate/latest/dg/what-is-languages.html) 
[Voice ID](https://docs.aws.amazon.com/polly/latest/dg/voicelist.html) to use for the synthesis



> 👩🏻‍💻**Nota:** Tambien puedes emplear invocar las llamdas de API [StartSpeechSynthesisTask](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/polly/client/start_speech_synthesis_task.html) para ejecutar un trabajo de texto a audio y guardarlo en un [Amazon S3 Bucket](https://aws.amazon.com/s3/), y [GetSpeechSynthesisTask](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/polly/client/get_speech_synthesis_task.html) que extrae el audio.

Amazon Polly admite [varios idiomas](https://docs.aws.amazon.com/polly/latest/dg/voicelist.html) y voces que permiten sintetizar sonidos de voz muy naturales y parecidos a los humanos. Para generar el mejor audio debemos elegir la voz adecuada para cada idioma, para ello utilizamos los siguientes diccionarios de Python:

In [None]:
#Haga coincidir el código de idioma de Amazon Translate con la voz correcta de Amazon Polly.

def get_target_voice(language):
    to_polly_voice = dict( [ ('en', 'Amy'), ('es', 'Conchita'), ('fr', 'Chantal'), ('pt-PT', 'Cristiano'),('it', 'Giorgio'),("sr","Carmen"),("zh","Hiujin") ] )
    target_voice = to_polly_voice[language]
    return target_voice

In [None]:
polly_client = my_session.client('polly')

def HablaPolly (text,engine,target_voice):
    response = polly_client.synthesize_speech(
    Engine= engine,
    OutputFormat='mp3',
    Text= text,
    VoiceId = target_voice
)
    return response

In [None]:
engine = 'standard' #'standard'|'neural'
language_code = "es"
text = "Hola Mundo"
target_voice = get_target_voice(language_code)
polly_response = HablaPolly(text,engine,target_voice)
polly_response

> 👩🏻‍💻 **Tips:** Aprende más Amazon Polly con estos [Code Samples](https://docs.aws.amazon.com/polly/latest/dg/sample-code-overall.html)


In [None]:
## Convertir AudioStream en mp3
def audiostream_to_mp3(file_namme,polly_response):
    file = open(file_namme, 'wb')
    file.write(polly_response['AudioStream'].read())
    file.close()

### APP para traducir texto y reporducir el audio con la traducción adecuada. 

In [None]:
texto = "Hola a todos por aca"
file_namme = "speech_2.mp3"
language_code = "en"
text_out = TranslateText (texto,language_code)['TranslatedText']
target_voice = get_target_voice(language_code)
polly_response = HablaPolly(text_out,engine,target_voice)
audiostream_to_mp3(file_namme,polly_response)

> Aprende más de Amazon Translate [Code Samples](https://github.com/aws-samples/document-translation).. [more code samples](https://docs.aws.amazon.com/translate/latest/dg/examples.html)

## ¡Gracias!

Te dejo mis redes: 
🇻🇪🇨🇱 [Dev.to](https://dev.to/elizabethfuentes12) [Linkedin](https://www.linkedin.com/in/lizfue/) [GitHub](https://github.com/elizabethfuentes12/) [Twitter](https://twitter.com/elizabethfue12) [Instagram](https://www.instagram.com/elifue.tech) [Youtube](https://www.youtube.com/channel/UCr0Gnc-t30m4xyrvsQpNp2Q)
[linktr](https://linktr.ee/elizabethfuentesleone)