# üìå Laboratorio: Speech-to-Text API - Inicio R√°pido

## üåê Descripci√≥n General
La **Speech-to-Text API** de Google Cloud convierte audio en texto escrito utilizando tecnolog√≠a de reconocimiento de voz avanzada. Esta herramienta es √∫til en m√∫ltiples industrias, incluyendo la contabilidad, para transcribir reuniones, dictados o entrevistas, mejorando la eficiencia y reduciendo tareas administrativas.

üí° **Contexto empresarial**: Similar a transcribir autom√°ticamente notas de reuniones financieras o dictados de reportes contables, ahorrando tiempo y minimizando errores manuales.

### Objetivos del Laboratorio
- Crear una **API Key** para autenticar el acceso.
- Elaborar una solicitud (**request**) en formato JSON.
- Ejecutar una llamada a la **Speech-to-Text API** para transcribir un archivo de audio.

üí° **Beneficio empresarial**: Automatiza la captura de datos de audios, como actas de reuniones o notas contables, optimizando procesos administrativos.

Para m√°s informaci√≥n, consulta la [Documentaci√≥n de Speech-to-Text API](https://cloud.google.com/speech-to-text/docs).

## üîß Requisitos y Preparaci√≥n

Antes de comenzar:
- **Duraci√≥n**: 30 minutos.
- Usa un navegador moderno (recomendado: Google Chrome en modo inc√≥gnito).
- No uses cuentas personales de Google Cloud para evitar cargos.
- Utiliza las credenciales temporales proporcionadas.
- No pauses el laboratorio una vez iniciado.

### Iniciar Sesi√≥n en Google Cloud Console
1. Haz clic en **Start Lab**.
2. Copia el **Username** y **Password** proporcionados.
3. Acepta los t√©rminos y condiciones.
4. No configures autenticaci√≥n en dos pasos ni pruebas gratuitas.
5. Accede a los servicios desde el **Men√∫ de Navegaci√≥n** o la barra de b√∫squeda.

üí° **Prop√≥sito**: Garantiza un entorno seguro y controlado, como preparar un sistema contable antes de procesar transacciones.

Para m√°s informaci√≥n, consulta la [Documentaci√≥n de Google Cloud Console](https://cloud.google.com/docs/overview).

## üîë Tarea 1: Crear una API Key

### Pasos
1. Ve a **Navigation menu > APIs & services > Credentials**.
2. Haz clic en **Create credentials** y selecciona **API key**.
3. Copia la clave generada.
4. Ve a **Compute Engine** y con√©ctate a la instancia `linux-instance` mediante **SSH**.
5. Guarda la API Key como variable de entorno:


In [None]:
export API_KEY=<TU_API_KEY>

üí° **Prop√≥sito**: Configura la autenticaci√≥n para la **Speech-to-Text API**, como asignar una contrase√±a segura a un sistema contable.

üí° **Beneficio empresarial**: Garantiza acceso seguro a herramientas de transcripci√≥n, como para procesar audios de reuniones financieras.

Para m√°s informaci√≥n, consulta la [Documentaci√≥n de Compute Engine](https://cloud.google.com/compute/docs).

## üìù Tarea 2: Crear una Solicitud a la API

Usaremos un archivo de audio de ejemplo alojado en **Cloud Storage**:
`gs://cloud-samples-tests/speech/brooklyn.flac`

### Pasos
1. Crea un archivo JSON llamado `request.json`:


In [None]:
touch request.json
nano request.json

2. Ingresa el siguiente contenido en `request.json`:


In [None]:
{
  "config": {
    "encoding": "FLAC",
    "languageCode": "en-US"
  },
  "audio": {
    "uri": "gs://cloud-samples-tests/speech/brooklyn.flac"
  }
}

3. Guarda y cierra el archivo (Ctrl + X, Y, Enter).

| Campo | Descripci√≥n |
|-------|-------------|
| `config.encoding` | Formato del audio (FLAC). |
| `config.languageCode` | Idioma del audio (en-US). |
| `audio.uri` | Ubicaci√≥n del archivo en Cloud Storage. |

üí° **Prop√≥sito**: Define la configuraci√≥n para procesar el audio, como completar un formulario contable con los detalles de una transacci√≥n.

üí° **Analog√≠a contable**: Similar a preparar un archivo con instrucciones para procesar registros financieros.

Para m√°s informaci√≥n, consulta la [Documentaci√≥n de Cloud Storage](https://cloud.google.com/storage/docs).

## üéôÔ∏è Tarea 3: Llamar a la Speech-to-Text API

### Paso 1: Ejecutar la Llamada a la API
Env√≠a la solicitud a la **Speech-to-Text API**:


In [None]:
curl -s -X POST -H "Content-Type: application/json" --data-binary @request.json \
"https://speech.googleapis.com/v1/speech:recognize?key=${API_KEY}"

üí° **Prop√≥sito**: Procesa el audio y genera una transcripci√≥n, como convertir notas habladas en un informe escrito.

#### Ejemplo de Salida JSON


In [None]:
{
  "results": [
    {
      "alternatives": [
        {
          "transcript": "how old is the Brooklyn Bridge",
          "confidence": 0.98267895
        }
      ]
    }
  ]
}

| Campo | Descripci√≥n |
|-------|-------------|
| `transcript` | Texto transcrito del audio. |
| `confidence` | Nivel de confianza en la transcripci√≥n (0 a 1). |

üí° **Beneficio empresarial**: Automatiza la transcripci√≥n de reuniones o dictados, como actas financieras, con alta precisi√≥n.

### Paso 2: Guardar el Resultado
Guarda la respuesta en un archivo JSON:


In [None]:
curl -s -X POST -H "Content-Type: application/json" --data-binary @request.json \
"https://speech.googleapis.com/v1/speech:recognize?key=${API_KEY}" > result.json

üí° **Prop√≥sito**: Almacena la transcripci√≥n para revisi√≥n, como guardar un informe contable para auditor√≠as.

üí° **Beneficio empresarial**: Facilita la documentaci√≥n y el archivo de registros transcritos, como notas de reuniones financieras.

## üìã Cuadro Resumen Final

| Elemento | Descripci√≥n |
|----------|-------------|
| **Nombre del laboratorio** | Speech-to-Text API: Qwik Start |
| **Duraci√≥n** | 30 minutos |
| **Objetivo principal** | Transcribir un archivo de audio a texto usando la API |
| **Tareas realizadas** | Crear API key, generar `request.json`, llamar a la API con `curl` |
| **Herramientas usadas** | Google Cloud Console, Compute Engine, SSH, JSON, curl |
| **Archivo de audio** | `gs://cloud-samples-tests/speech/brooklyn.flac` |
| **Resultado esperado** | Texto: ‚Äúhow old is the Brooklyn Bridge‚Äù |
| **Nivel de confianza** | 0.98267895 |
| **Aplicaci√≥n contable** | Transcripci√≥n autom√°tica de audios para registro de reuniones o notas |

üí° **Conclusi√≥n empresarial**: La **Speech-to-Text API** automatiza la transcripci√≥n de audios, como actas de reuniones financieras, reduciendo tiempo y errores en la documentaci√≥n.

## üöÄ Conclusi√≥n

Este laboratorio te permiti√≥:
1. Crear una **API Key** para autenticar la **Speech-to-Text API**.
2. Elaborar una solicitud JSON para procesar un archivo de audio.
3. Transcribir un audio y guardar los resultados en un archivo JSON.

üí° **Beneficio empresarial**: Simplifica la captura de datos de audios, como reuniones financieras o dictados contables, optimizando procesos administrativos y auditor√≠as.

Para m√°s informaci√≥n, consulta la [Documentaci√≥n de Speech-to-Text API](https://cloud.google.com/speech-to-text/docs), [Documentaci√≥n de Cloud Storage](https://cloud.google.com/storage/docs), y [Documentaci√≥n de Compute Engine](https://cloud.google.com/compute/docs).