# Guía Completa de la Librería gTTS (Google Text-to-Speech)

Esta guía es un recurso exhaustivo para aprender a utilizar la librería `gTTS` en Python. Cubriremos desde la instalación y uso básico hasta características avanzadas como el manejo de streams en memoria y la personalización de acentos.

## ¿Qué es gTTS?

**gTTS** (Google Text-to-Speech) es una librería de Python y una herramienta de línea de comandos (CLI) para interactuar con la API de conversión de texto a voz de Google Translate.

**Características principales:**
*   Convierte texto a audio (mp3).
*   Soporta múltiples idiomas y acentos localizados.
*   Permite ajustar la velocidad del habla.
*   Fácil de usar y muy popular para proyectos de automatización, asistentes virtuales y accesibilidad.

---
**Nota:** gTTS requiere una conexión a internet activa para funcionar, ya que envía el texto a los servidores de Google para generar el audio.

## 1. Instalación e Importación

Para comenzar, necesitamos instalar la librería `gTTS`. Si estás ejecutando este notebook localmente, puedes usar `pip`.

También importaremos `os` para manejar rutas de archivos y `IPython.display` para reproducir audio directamente en el notebook.

In [None]:
# Instalación de la librería (descomenta la línea si no la tienes instalada)
# !pip install gTTS

# Importaciones necesarias
from gtts import gTTS
import os
from IPython.display import Audio, display

print("Librerías importadas correctamente.")

## 2. Conversión Básica de Texto a Voz

El uso más simple de `gTTS` implica crear una instancia de la clase `gTTS` pasando el texto que queremos convertir y luego guardar el resultado en un archivo de audio.

**Sintaxis básica:**
```python
tts = gTTS(text='Hola mundo', lang='es')
tts.save('archivo.mp3')
```

In [None]:
# Texto que queremos convertir
texto_basico = "¡Hola! Bienvenido al curso de Python. Esta es una prueba básica de gTTS."

# Crear el objeto gTTS
# lang='es' especifica que el idioma es español
tts_basico = gTTS(text=texto_basico, lang='es')

# Guardar el archivo de audio
archivo_salida = "saludo_basico.mp3"
tts_basico.save(archivo_salida)

print(f"Audio guardado como '{archivo_salida}'")

# Reproducir el audio en el notebook
display(Audio(archivo_salida))

## 3. Manejo de Idiomas y Acentos

`gTTS` soporta una gran variedad de idiomas. Además, para ciertos idiomas como el español o el inglés, podemos especificar el acento regional utilizando el parámetro `tld` (Top Level Domain).

Por ejemplo:
*   `lang='es', tld='es'` -> Español de España.
*   `lang='es', tld='com.mx'` -> Español de México.
*   `lang='en', tld='com.au'` -> Inglés de Australia.

Podemos ver la lista completa de idiomas soportados usando `gtts.lang.tts_langs()`.

In [None]:
import gtts.lang

# Listar todos los idiomas disponibles
idiomas = gtts.lang.tts_langs()
print("Algunos idiomas soportados:")
for codigo, nombre in list(idiomas.items())[:10]: # Mostramos solo los primeros 10
    print(f"{codigo}: {nombre}")

print("...\n")

# Ejemplo de acentos en Español
texto_acento = "Hola, ¿cómo estás? Esto es una prueba de acento."

# Español de España
tts_es = gTTS(text=texto_acento, lang='es', tld='es')
tts_es.save('acento_espana.mp3')
print("Generado: Español de España")
display(Audio('acento_espana.mp3'))

# Español de México
tts_mx = gTTS(text=texto_acento, lang='es', tld='com.mx')
tts_mx.save('acento_mexico.mp3')
print("Generado: Español de México")
display(Audio('acento_mexico.mp3'))

# Inglés Australiano
tts_au = gTTS(text="Hello mate, how are you doing?", lang='en', tld='com.au')
tts_au.save('acento_australia.mp3')
print("Generado: Inglés Australiano")
display(Audio('acento_australia.mp3'))

## 4. Ajuste de la Velocidad de Reproducción

A veces es útil generar audio más lento, por ejemplo, para dictados o para estudiantes de idiomas. El parámetro `slow=True` permite esto. Por defecto es `False`.

In [None]:
texto_velocidad = "Esta oración se leerá muy despacio para que puedas entender cada palabra."

# Velocidad normal (por defecto)
tts_normal = gTTS(text=texto_velocidad, lang='es', slow=False)
tts_normal.save('velocidad_normal.mp3')

# Velocidad lenta
tts_lento = gTTS(text=texto_velocidad, lang='es', slow=True)
tts_lento.save('velocidad_lenta.mp3')

print("Normal:")
display(Audio('velocidad_normal.mp3'))

print("Lento:")
display(Audio('velocidad_lenta.mp3'))

## 5. Reproducción Externa (Fuera de Jupyter)

Si estás ejecutando un script de Python (.py) en lugar de un notebook, `IPython.display` no funcionará. En su lugar, puedes usar comandos del sistema operativo para abrir el reproductor predeterminado.

```python
import os

# En Windows
os.system("start saludo_basico.mp3")

# En macOS
# os.system("afplay saludo_basico.mp3")

# En Linux
# os.system("mpg321 saludo_basico.mp3")
```

## 6. Lectura desde Archivos de Texto

Para proyectos más grandes, como convertir un libro o un artículo, es mejor leer el texto desde un archivo externo.

Primero, crearemos un archivo de ejemplo:

In [None]:
# Crear un archivo de texto de prueba
contenido_libro = """
Capítulo 1: El comienzo.
En un lugar de la Mancha, de cuyo nombre no quiero acordarme, no ha mucho tiempo que vivía un hidalgo de los de lanza en astillero, adarga antigua, rocín flaco y galgo corredor.
"""

with open('quijote_breve.txt', 'w', encoding='utf-8') as f:
    f.write(contenido_libro)

# Leer el archivo y convertirlo a audio
with open('quijote_breve.txt', 'r', encoding='utf-8') as f:
    texto_leido = f.read()

# Reemplazar saltos de línea para que la lectura sea más fluida si es necesario
texto_leido = texto_leido.replace('\n', ' ')

tts_libro = gTTS(text=texto_leido, lang='es', tld='es')
tts_libro.save('audiolibro.mp3')

print("Audiolibro generado.")
display(Audio('audiolibro.mp3'))

## 7. Manejo de Errores

Es importante manejar posibles errores, como la falta de conexión a internet o texto vacío. `gTTS` lanza una excepción `gTTSError` cuando algo falla en la comunicación con Google.

In [None]:
from gtts import gTTSError

try:
    # Intentamos convertir un texto vacío para provocar un error (o simular falta de red)
    # Nota: gTTS a veces valida el texto antes de enviar, así que texto vacío puede lanzar AssertionError o ValueError
    # Probaremos con un texto válido pero imaginando que no hay red
    tts_error = gTTS(text="Probando errores", lang='es')
    tts_error.save('prueba_error.mp3')
    print("Conversión exitosa.")

except gTTSError as e:
    print(f"Error de conexión con Google TTS: {e}")
except AssertionError as e:
    print(f"Error en los argumentos: {e}")
except Exception as e:
    print(f"Ocurrió un error inesperado: {e}")

## 8. Uso Avanzado: Streams en Memoria

Si estás creando una aplicación web o un bot (como en Discord o Telegram), a menudo no quieres guardar el archivo mp3 en el disco, sino mantenerlo en la memoria RAM. Para esto usamos `io.BytesIO`.

Esto es útil para no llenar el disco de archivos temporales.

In [None]:
import io

# Texto a convertir
texto_memoria = "Este audio se generó directamente en la memoria RAM, sin tocar el disco duro."

# Crear objeto gTTS
tts_memoria = gTTS(text=texto_memoria, lang='es')

# Crear un buffer de bytes
mp3_fp = io.BytesIO()

# Escribir el audio en el buffer
tts_memoria.write_to_fp(mp3_fp)

# Mover el puntero al inicio del buffer para leerlo
mp3_fp.seek(0)

# Reproducir desde la memoria (IPython acepta datos binarios)
print("Reproduciendo desde memoria RAM:")
display(Audio(mp3_fp.read()))

## 9. Proyecto Final: Generador de Frases Multilingüe

Vamos a combinar todo lo aprendido en un pequeño script que toma una lista de frases en diferentes idiomas y genera un archivo de audio único para cada una, organizándolos automáticamente.

In [None]:
# Lista de frases con su configuración de idioma y acento
frases = [
    {"texto": "Hola amigo, ¿cómo estás?", "lang": "es", "tld": "com.mx", "archivo": "saludo_mx.mp3"},
    {"texto": "Good morning, have a nice day.", "lang": "en", "tld": "us", "archivo": "saludo_us.mp3"},
    {"texto": "Bonjour tout le monde.", "lang": "fr", "tld": "fr", "archivo": "saludo_fr.mp3"},
    {"texto": "Guten Tag! Wie geht es Ihnen?", "lang": "de", "tld": "de", "archivo": "saludo_de.mp3"}
]

# Crear carpeta de salida si no existe
carpeta_salida = "audios_multilingues"
if not os.path.exists(carpeta_salida):
    os.makedirs(carpeta_salida)

print(f"Generando audios en la carpeta '{carpeta_salida}'...\n")

for item in frases:
    try:
        print(f"Procesando: {item['texto']} ({item['lang']})")
        
        # Crear objeto gTTS
        tts = gTTS(text=item['texto'], lang=item['lang'], tld=item['tld'])
        
        # Ruta completa
        ruta_archivo = os.path.join(carpeta_salida, item['archivo'])
        
        # Guardar
        tts.save(ruta_archivo)
        print(f" -> Guardado en: {ruta_archivo}")
        
        # Opcional: Reproducir el último generado para verificar
        # display(Audio(ruta_archivo)) 
        
    except Exception as e:
        print(f" -> Error procesando '{item['texto']}': {e}")

print("\n¡Proceso completado!")