# üéôÔ∏è Laboratorio: Inicio R√°pido con la API Speech-to-Text

**Google Cloud Speech-to-Text API** es un servicio que convierte audio en texto mediante t√©cnicas avanzadas de reconocimiento de voz. Este laboratorio te guiar√° a trav√©s de la creaci√≥n de una clave de API y el uso de la API para transcribir un archivo de audio alojado en **Cloud Storage**.

üí° **Beneficio empresarial**: La **Speech-to-Text API** permite a las empresas transcribir autom√°ticamente grabaciones de reuniones, entrevistas o comunicaciones con clientes, agilizando procesos como auditor√≠as, an√°lisis de interacciones o documentaci√≥n, lo que reduce costos y mejora la eficiencia.

Para m√°s informaci√≥n, consulta la [Documentaci√≥n de Google Cloud Speech-to-Text](https://cloud.google.com/speech-to-text/docs).

## üìö Objetivos
- ‚úîÔ∏è Crear una clave de API.
- ‚úîÔ∏è Hacer una solicitud a la **Speech-to-Text API**.
- ‚úîÔ∏è Obtener y analizar el resultado de la transcripci√≥n.

## üõ†Ô∏è Tarea 1: Crear una clave de API

En esta tarea, generar√°s una clave de API para autenticar solicitudes a la **Speech-to-Text API** y te conectar√°s a una m√°quina virtual mediante SSH.

### Paso 1.1: Crear la clave de API

1. Ve a **Navigation menu** ‚ò∞ > **APIs & Services** > **Credentials**.
2. Haz clic en **Create Credentials** > selecciona **API Key**.
3. Copia la clave generada.

**Explicaci√≥n**:
- La clave de API permite autenticar solicitudes a la **Speech-to-Text API**.

üí° **Contexto empresarial**: Crear una clave es como generar una contrase√±a para acceder a un sistema contable que procesa grabaciones financieras.

### Paso 1.2: Conectarse por SSH

1. Ve a **Navigation menu** ‚ò∞ > **Compute Engine** > **VM Instances**.
2. Haz clic en **SSH** junto a la instancia para abrir una terminal interactiva.

**Explicaci√≥n**:
- La conexi√≥n SSH te permite ejecutar comandos en una m√°quina virtual en la nube.

üí° **Contexto empresarial**: Esto es como acceder a un servidor remoto para procesar documentos o grabaciones.

### Paso 1.3: Guardar la clave como variable de entorno

1. En la terminal SSH, ejecuta:

In [None]:
export API_KEY=<TU_API_KEY>

**Desglose del comando**:
- `export`: Crea una variable de entorno temporal.
- `API_KEY`: Nombre de la variable.
- `<TU_API_KEY>`: Reemplaza con la clave de API copiada.

**Explicaci√≥n**:
- Almacena la clave para usarla en solicitudes posteriores sin necesidad de pegarla manualmente.

üí° **Contexto empresarial**: Esto es como guardar las credenciales de un sistema contable para un acceso r√°pido y seguro.

## üõ†Ô∏è Tarea 2: Crear la solicitud a la API

En esta tarea, crear√°s un archivo JSON con la configuraci√≥n para enviar un archivo de audio a la **Speech-to-Text API**.

### Paso 2.1: Crear el archivo de solicitud

1. En la terminal SSH, crea el archivo:

In [None]:
touch request.json

2. Abre el archivo para editar:

In [None]:
nano request.json

3. Pega el siguiente contenido:

In [None]:
{
  "config": {
    "encoding": "FLAC",
    "languageCode": "en-US"
  },
  "audio": {
    "uri": "gs://cloud-samples-tests/speech/brooklyn.flac"
  }
}

4. Guarda el archivo:
   - Presiona **Ctrl + X**, luego **Y**, y finalmente **Enter**.

**Desglose del archivo JSON**:
| **Objeto** | **Descripci√≥n** |
|------------|-----------------|
| `config` | Configuraci√≥n para interpretar el audio: <br> - `encoding`: Tipo de compresi√≥n del audio (`FLAC`). <br> - `languageCode`: Idioma hablado (`en-US` para ingl√©s estadounidense). |
| `audio` | URL del archivo de audio en **Cloud Storage** (`gs://cloud-samples-tests/speech/brooklyn.flac`). |

**Explicaci√≥n**:
- El archivo `request.json` define c√≥mo la API debe procesar el audio y la ubicaci√≥n del archivo a transcribir.

üí° **Contexto empresarial**: Esto es como preparar un formulario con instrucciones para transcribir una grabaci√≥n de una reuni√≥n financiera.

## üõ†Ô∏è Tarea 3: Llamar a la API de Speech-to-Text

En esta tarea, enviar√°s la solicitud a la API y guardar√°s la transcripci√≥n.

### Paso 3.1: Ejecutar la solicitud

1. En la terminal SSH, ejecuta:

In [None]:
curl -s -X POST -H "Content-Type: application/json" --data-binary @request.json \
"https://speech.googleapis.com/v1/speech:recognize?key=${API_KEY}"

**Desglose del comando**:
| **Componente** | **Significado** |
|---------------|-----------------|
| `curl` | Herramienta para hacer solicitudes a URLs desde la terminal. |
| `-s` | Ejecuta en modo silencioso (sin mostrar progreso). |
| `-X POST` | Indica una solicitud de tipo POST. |
| `-H "Content-Type: application/json"` | Especifica que el contenido es JSON. |
| `--data-binary @request.json` | Env√≠a el contenido del archivo `request.json`. |
| `"https://speech.googleapis.com/v1/speech:recognize?key=${API_KEY}"` | Endpoint de la API con la clave de autenticaci√≥n. |

**Explicaci√≥n**:
- Env√≠a el archivo de audio a la API para su transcripci√≥n.

**Resultado esperado**:
```json
{
  "results": [
    {
      "alternatives": [
        {
          "transcript": "how old is the Brooklyn Bridge",
          "confidence": 0.98267895
        }
      ]
    }
  ]
}
```

**Desglose del resultado**:
| **Campo** | **Significado** |
|-----------|-----------------|
| `transcript` | Transcripci√≥n en texto del audio. |
| `confidence` | Nivel de confianza (0 a 1) de la precisi√≥n de la transcripci√≥n. |

üí° **Contexto empresarial**: Esto es como recibir un informe que transcribe una grabaci√≥n de una reuni√≥n financiera, con un indicador de precisi√≥n.

### Paso 3.2: Guardar la respuesta en un archivo

1. Ejecuta:

In [None]:
curl -s -X POST -H "Content-Type: application/json" --data-binary @request.json \
"https://speech.googleapis.com/v1/speech:recognize?key=${API_KEY}" > result.json

**Explicaci√≥n**:
- Guarda la respuesta de la API en un archivo `result.json` para su posterior an√°lisis.

üí° **Contexto empresarial**: Esto es como archivar un informe financiero transcrito para auditor√≠as o revisiones futuras.

## üöÄ Resumen

| **Concepto** | **Explicaci√≥n contable simplificada** |
|--------------|--------------------------------------|
| **Speech-to-Text API** | Herramienta que convierte grabaciones de reuniones o entrevistas en texto, facilitando la documentaci√≥n. |
| **Clave de API** | Credencial para acceder de forma segura al sistema de transcripci√≥n. |
| **Transcripci√≥n** | Proceso que transforma audio en texto, como convertir una reuni√≥n financiera en un informe escrito. |
| **Cloud Storage** | Almac√©n digital para guardar archivos de audio o resultados de transcripciones. |

üí° **Conclusi√≥n empresarial**: La **Speech-to-Text API** automatiza la transcripci√≥n de grabaciones, como reuniones financieras o interacciones con clientes, reduciendo el tiempo de documentaci√≥n manual, mejorando la precisi√≥n y optimizando costos operativos.

Para m√°s informaci√≥n, consulta la [Documentaci√≥n de Google Cloud Speech-to-Text](https://cloud.google.com/speech-to-text/docs).