# M√≥dulo 5: IA Generativa con Amazon Bedrock

**Duraci√≥n**: 30 minutos  
**Objetivo**: Dominar la IA generativa para crear contenido cient√≠fico y c√≥digo usando Amazon Bedrock

## ¬øQu√© aprender√°s?
- **Parte A - Generaci√≥n de Texto**: Crear reportes cient√≠ficos, res√∫menes e informes t√©cnicos
- **Parte B - Generaci√≥n de C√≥digo**: Desarrollar scripts de an√°lisis de datos y funciones cient√≠ficas
- Usar diferentes modelos de IA generativa (Claude, Titan)
- Aplicar prompting efectivo para casos cient√≠ficos
- Configurar par√°metros avanzados (temperatura, top-p)
- Comparar resultados entre modelos

## Configuraci√≥n Inicial

In [None]:
# Instalar dependencias
import sys
!{sys.executable} -m pip install boto3 ipywidgets matplotlib pandas numpy --quiet

print("‚úÖ Dependencias instaladas")

In [None]:
# Importar librer√≠as
import boto3
import json
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from datetime import datetime
import ipywidgets as widgets
from IPython.display import display, Markdown, Code

# Configurar estilo
plt.style.use('seaborn-v0_8')
plt.rcParams['figure.figsize'] = (10, 6)

print("‚úÖ Librer√≠as importadas")

In [None]:
# Configurar cliente de Amazon Bedrock
try:
    bedrock = boto3.client('bedrock-runtime', region_name='us-east-1')
    print("‚úÖ Cliente Bedrock configurado correctamente")
    print("‚úÖ Usando credenciales IAM autom√°ticas de SageMaker")
except Exception as e:
    print("‚ùå Error: Verificar permisos IAM para Bedrock")
    print(f"Error: {e}")

## Modelos Disponibles en Bedrock

Configuraremos diferentes modelos para comparar sus capacidades.

In [None]:
# Modelos disponibles en Bedrock
MODELOS_BEDROCK = {
    "claude_haiku": {
        "id": "anthropic.claude-3-haiku-20240307-v1:0",
        "nombre": "Claude 3 Haiku",
        "fortaleza": "R√°pido y eficiente",
        "uso": "Tareas simples, c√≥digo b√°sico"
    },
    "claude_sonnet": {
        "id": "anthropic.claude-3-sonnet-20240229-v1:0",
        "nombre": "Claude 3 Sonnet",
        "fortaleza": "Balance velocidad/calidad",
        "uso": "An√°lisis complejo, reportes"
    },
    "titan_text": {
        "id": "amazon.titan-text-express-v1",
        "nombre": "Amazon Titan Text",
        "fortaleza": "Optimizado para AWS",
        "uso": "Res√∫menes, clasificaci√≥n"
    }
}

print("Modelos configurados para el laboratorio:")
for key, modelo in MODELOS_BEDROCK.items():
    print(f"  ‚Ä¢ {modelo['nombre']}: {modelo['fortaleza']}")

# PARTE A: GENERACI√ìN DE CONTENIDO CIENT√çFICO

## Casos de Uso para Generaci√≥n de Texto

In [None]:
# Casos de uso para generaci√≥n de texto cient√≠fico
CASOS_TEXTO = {
    "reporte_sismico": {
        "prompt": "Genera un reporte t√©cnico sobre un sismo de magnitud 6.2 ocurrido en la regi√≥n de Ica, Per√∫. Incluye: ubicaci√≥n exacta, profundidad, intensidad, da√±os preliminares y recomendaciones.",
        "tipo": "reporte_t√©cnico",
        "longitud": "500-700 palabras"
    },
    "resumen_investigacion": {
        "prompt": "Crea un resumen ejecutivo sobre los avances en predicci√≥n s√≠smica usando machine learning. Enf√≥cate en: metodolog√≠as actuales, precisi√≥n alcanzada, limitaciones y futuras direcciones de investigaci√≥n.",
        "tipo": "resumen_ejecutivo",
        "longitud": "300-400 palabras"
    },
    "protocolo_emergencia": {
        "prompt": "Desarrolla un protocolo de emergencia para instituciones cient√≠ficas durante eventos s√≠smicos. Incluye: procedimientos de evacuaci√≥n, protecci√≥n de equipos, comunicaciones y continuidad operativa.",
        "tipo": "protocolo_operativo",
        "longitud": "400-500 palabras"
    }
}

print("Casos de uso para generaci√≥n de texto cient√≠fico:")
for nombre, caso in CASOS_TEXTO.items():
    print(f"  ‚Ä¢ {nombre.replace('_', ' ').title()}: {caso['tipo']}")

## Motor de Generaci√≥n de Texto

In [None]:
def generar_contenido_cientifico(prompt, modelo_key="claude_haiku", temperatura=0.7, max_tokens=1000):
    """
    Genera contenido cient√≠fico usando diferentes modelos de Bedrock
    """
    modelo = MODELOS_BEDROCK[modelo_key]
    print(f"\nü§ñ Generando con {modelo['nombre']}...")
    
    try:
        if "claude" in modelo_key:
            # Formato para modelos Claude
            body = json.dumps({
                "anthropic_version": "bedrock-2023-05-31",
                "max_tokens": max_tokens,
                "temperature": temperatura,
                "messages": [
                    {
                        "role": "user",
                        "content": prompt
                    }
                ]
            })
        else:
            # Formato para Titan
            body = json.dumps({
                "inputText": prompt,
                "textGenerationConfig": {
                    "maxTokenCount": max_tokens,
                    "temperature": temperatura,
                    "topP": 0.9
                }
            })
        
        response = bedrock.invoke_model(
            modelId=modelo["id"],
            body=body
        )
        
        response_body = json.loads(response['body'].read())
        
        if "claude" in modelo_key:
            contenido = response_body['content'][0]['text']
        else:
            contenido = response_body['results'][0]['outputText']
        
        print(f"‚úì Contenido generado: {len(contenido)} caracteres")
        
        return {
            'contenido': contenido,
            'modelo': modelo['nombre'],
            'parametros': {'temperatura': temperatura, 'max_tokens': max_tokens},
            'timestamp': datetime.now().strftime('%Y-%m-%d %H:%M:%S')
        }
        
    except Exception as e:
        print(f"‚úó Error: {e}")
        return None

print("‚úÖ Motor de generaci√≥n de texto configurado")

## Ejercicio A1: Generar Reporte S√≠smico

In [None]:
# Generar reporte s√≠smico
caso_reporte = CASOS_TEXTO['reporte_sismico']
reporte_resultado = generar_contenido_cientifico(
    caso_reporte['prompt'],
    modelo_key="claude_sonnet",
    temperatura=0.3,  # M√°s conservador para reportes t√©cnicos
    max_tokens=800
)

if reporte_resultado:
    print("\nüìÑ REPORTE S√çSMICO GENERADO:")
    print("=" * 50)
    display(Markdown(reporte_resultado['contenido']))
    
    print(f"\nüìä Detalles de generaci√≥n:")
    print(f"‚Ä¢ Modelo: {reporte_resultado['modelo']}")
    print(f"‚Ä¢ Temperatura: {reporte_resultado['parametros']['temperatura']}")
    print(f"‚Ä¢ Caracteres: {len(reporte_resultado['contenido'])}")
else:
    print("No se pudo generar el reporte")

## Ejercicio A2: Generar Resumen de Investigaci√≥n

In [None]:
# Generar resumen de investigaci√≥n
caso_resumen = CASOS_TEXTO['resumen_investigacion']
resumen_resultado = generar_contenido_cientifico(
    caso_resumen['prompt'],
    modelo_key="claude_haiku",
    temperatura=0.5,
    max_tokens=600
)

if resumen_resultado:
    print("\nüìã RESUMEN DE INVESTIGACI√ìN GENERADO:")
    print("=" * 50)
    display(Markdown(resumen_resultado['contenido']))
    
    print(f"\nüìä Detalles de generaci√≥n:")
    print(f"‚Ä¢ Modelo: {resumen_resultado['modelo']}")
    print(f"‚Ä¢ Temperatura: {resumen_resultado['parametros']['temperatura']}")
    print(f"‚Ä¢ Caracteres: {len(resumen_resultado['contenido'])}")
else:
    print("No se pudo generar el resumen")

# PARTE B: GENERACI√ìN DE C√ìDIGO

## Casos de Uso para Generaci√≥n de C√≥digo

In [None]:
# Casos de uso para generaci√≥n de c√≥digo cient√≠fico
CASOS_CODIGO = {
    "analisis_sismico": {
        "descripcion": "Crear una funci√≥n que analice datos s√≠smicos y calcule la magnitud promedio, desviaci√≥n est√°ndar y identifique eventos an√≥malos (magnitud > 5.0)",
        "datos_ejemplo": "Lista de magnitudes s√≠smicas: [3.2, 4.1, 2.8, 5.5, 3.7, 4.2, 6.1, 3.9, 4.5, 3.1]",
        "tipo": "an√°lisis_estad√≠stico"
    },
    "visualizacion_geologica": {
        "descripcion": "Generar c√≥digo para crear un gr√°fico de dispersi√≥n que muestre la relaci√≥n entre profundidad y magnitud de sismos, con colores seg√∫n la intensidad",
        "datos_ejemplo": "DataFrame con columnas: profundidad, magnitud, intensidad",
        "tipo": "visualizaci√≥n"
    },
    "procesamiento_se√±ales": {
        "descripcion": "Crear una funci√≥n que aplique un filtro pasa-bajas a se√±ales s√≠smicas para eliminar ruido de alta frecuencia usando scipy",
        "datos_ejemplo": "Array numpy con datos de aceleraci√≥n en el tiempo",
        "tipo": "procesamiento_se√±ales"
    }
}

print("Casos de uso para generaci√≥n de c√≥digo cient√≠fico:")
for nombre, info in CASOS_CODIGO.items():
    print(f"  ‚Ä¢ {nombre.replace('_', ' ').title()}: {info['tipo']}")

## Motor de Generaci√≥n de C√≥digo

In [None]:
def generar_codigo_cientifico(descripcion_tarea, tipo_codigo, datos_ejemplo=""):
    """
    Genera c√≥digo Python para tareas cient√≠ficas usando IA
    """
    print(f"\nü§ñ Generando c√≥digo para: {descripcion_tarea[:50]}...")
    print(f"Tipo: {tipo_codigo}")
    
    # Crear prompt especializado para c√≥digo cient√≠fico
    prompt = f"""Eres un experto en programaci√≥n cient√≠fica con Python. 
    
Tarea: {descripcion_tarea}
Tipo de c√≥digo: {tipo_codigo}
Datos de ejemplo: {datos_ejemplo}

Genera c√≥digo Python que:
1. Sea funcional y ejecutable
2. Incluya comentarios explicativos
3. Use librer√≠as cient√≠ficas apropiadas (numpy, pandas, matplotlib, scipy)
4. Maneje errores b√°sicos
5. Incluya un ejemplo de uso con los datos proporcionados

Responde SOLO con el c√≥digo Python, sin explicaciones adicionales:"""
    
    try:
        # Usar Claude 3 Haiku para generaci√≥n de c√≥digo
        body = json.dumps({
            "anthropic_version": "bedrock-2023-05-31",
            "max_tokens": 1000,
            "temperature": 0.2,  # M√°s determin√≠stico para c√≥digo
            "messages": [
                {
                    "role": "user",
                    "content": prompt
                }
            ]
        })
        
        response = bedrock.invoke_model(
            modelId="anthropic.claude-3-haiku-20240307-v1:0",
            body=body
        )
        
        response_body = json.loads(response['body'].read())
        codigo_generado = response_body['content'][0]['text']
        
        print(f"‚úì C√≥digo generado exitosamente")
        print(f"‚úì L√≠neas de c√≥digo: {len(codigo_generado.split())}")
        
        return {
            'codigo': codigo_generado,
            'descripcion': descripcion_tarea,
            'tipo': tipo_codigo,
            'timestamp': datetime.now().strftime('%Y-%m-%d %H:%M:%S')
        }
        
    except Exception as e:
        print(f"‚úó Error en generaci√≥n: {e}")
        return None

def ejecutar_codigo_generado(codigo_resultado):
    """
    Ejecuta el c√≥digo generado de manera segura
    """
    if not codigo_resultado:
        print("‚ùå No hay c√≥digo para ejecutar")
        return False
    
    print(f"\nüöÄ Ejecutando c√≥digo generado...")
    
    try:
        # Ejecutar el c√≥digo en el contexto actual
        exec(codigo_resultado['codigo'], globals())
        print(f"‚úÖ C√≥digo ejecutado exitosamente")
        return True
    except Exception as e:
        print(f"‚ùå Error en ejecuci√≥n: {e}")
        return False

print("‚úÖ Motor de generaci√≥n de c√≥digo configurado")

## Ejercicio B1: Generar An√°lisis Estad√≠stico de Datos S√≠smicos

In [None]:
# Generar c√≥digo para an√°lisis s√≠smico
caso_sismico = CASOS_CODIGO['analisis_sismico']
codigo_sismico = generar_codigo_cientifico(
    caso_sismico['descripcion'],
    caso_sismico['tipo'],
    caso_sismico['datos_ejemplo']
)

if codigo_sismico:
    print("\nüìù C√ìDIGO GENERADO:")
    print("=" * 50)
    display(Code(codigo_sismico['codigo'], language='python'))
    
    # Ejecutar el c√≥digo generado
    ejecutar_codigo_generado(codigo_sismico)
else:
    print("No se pudo generar el c√≥digo")

## Ejercicio B2: Generar Visualizaci√≥n Geol√≥gica

In [None]:
# Generar c√≥digo para visualizaci√≥n
caso_viz = CASOS_CODIGO['visualizacion_geologica']
codigo_viz = generar_codigo_cientifico(
    caso_viz['descripcion'],
    caso_viz['tipo'],
    caso_viz['datos_ejemplo']
)

if codigo_viz:
    print("\nüìä C√ìDIGO DE VISUALIZACI√ìN GENERADO:")
    print("=" * 50)
    display(Code(codigo_viz['codigo'], language='python'))
    
    # Ejecutar el c√≥digo generado
    ejecutar_codigo_generado(codigo_viz)
else:
    print("No se pudo generar el c√≥digo de visualizaci√≥n")

## Comparaci√≥n de Modelos

In [None]:
# Comparar diferentes modelos para la misma tarea
prompt_comparacion = "Explica en 100 palabras qu√© es la sismolog√≠a y su importancia para la sociedad."

print("üîÑ COMPARANDO MODELOS DE BEDROCK")
print("=" * 50)

modelos_comparar = ['claude_haiku', 'claude_sonnet']
resultados_comparacion = {}

for modelo_key in modelos_comparar:
    print(f"\nü§ñ Generando con {MODELOS_BEDROCK[modelo_key]['nombre']}...")
    resultado = generar_contenido_cientifico(
        prompt_comparacion,
        modelo_key=modelo_key,
        temperatura=0.5,
        max_tokens=200
    )
    
    if resultado:
        resultados_comparacion[modelo_key] = resultado
        print(f"\n**{resultado['modelo']}:**")
        display(Markdown(resultado['contenido']))
        print(f"Caracteres: {len(resultado['contenido'])}")

print("\n‚úÖ Comparaci√≥n completada")

## Resumen del Laboratorio Bedrock

In [None]:
# Resumen completo del laboratorio
print("üìà RESUMEN COMPLETO - AMAZON BEDROCK")
print("=" * 60)

# Parte A - Contenido generado
contenidos_generados = []
if 'reporte_resultado' in globals() and reporte_resultado:
    contenidos_generados.append(('Reporte S√≠smico', reporte_resultado))
if 'resumen_resultado' in globals() and resumen_resultado:
    contenidos_generados.append(('Resumen Investigaci√≥n', resumen_resultado))

print(f"\nüìÑ PARTE A - GENERACI√ìN DE TEXTO:")
total_caracteres_texto = 0
for nombre, resultado in contenidos_generados:
    caracteres = len(resultado['contenido'])
    total_caracteres_texto += caracteres
    print(f"‚Ä¢ {nombre}: {caracteres} caracteres ({resultado['modelo']})")

# Parte B - C√≥digo generado
codigos_generados = []
if 'codigo_sismico' in globals() and codigo_sismico:
    codigos_generados.append(('An√°lisis S√≠smico', codigo_sismico))
if 'codigo_viz' in globals() and codigo_viz:
    codigos_generados.append(('Visualizaci√≥n Geol√≥gica', codigo_viz))

print(f"\nüíª PARTE B - GENERACI√ìN DE C√ìDIGO:")
total_lineas_codigo = 0
for nombre, codigo in codigos_generados:
    lineas = len(codigo['codigo'].split('\n'))
    total_lineas_codigo += lineas
    print(f"‚Ä¢ {nombre}: {lineas} l√≠neas de c√≥digo ({codigo['tipo']})")

print(f"\nüéØ TOTALES:")
print(f"‚Ä¢ Contenido cient√≠fico generado: {len(contenidos_generados)} documentos")
print(f"‚Ä¢ C√≥digo cient√≠fico generado: {len(codigos_generados)} scripts")
print(f"‚Ä¢ Total caracteres de texto: {total_caracteres_texto}")
print(f"‚Ä¢ Total l√≠neas de c√≥digo: {total_lineas_codigo}")
print(f"‚Ä¢ Modelos utilizados: Claude 3 Haiku, Claude 3 Sonnet")

print(f"\nüîß CAPACIDADES DEMOSTRADAS:")
capacidades = [
    'Generaci√≥n de reportes t√©cnicos',
    'Creaci√≥n de res√∫menes ejecutivos',
    'Desarrollo de c√≥digo de an√°lisis estad√≠stico',
    'Generaci√≥n de scripts de visualizaci√≥n',
    'Comparaci√≥n entre modelos de IA',
    'Configuraci√≥n de par√°metros avanzados'
]

for capacidad in capacidades:
    print(f"‚Ä¢ {capacidad}")

print("\n‚úì Laboratorio Amazon Bedrock completado exitosamente")

## Casos de Uso en Investigaci√≥n Cient√≠fica

### Amazon Bedrock para Ciencias:
- **Generaci√≥n de reportes**: Crear informes t√©cnicos y documentaci√≥n cient√≠fica
- **Res√∫menes de literatura**: Sintetizar papers y estudios de investigaci√≥n
- **Traducci√≥n t√©cnica**: Adaptar contenido cient√≠fico entre idiomas
- **Generaci√≥n de c√≥digo**: Crear scripts de an√°lisis y procesamiento de datos
- **Documentaci√≥n autom√°tica**: Generar comentarios y documentaci√≥n de c√≥digo
- **An√°lisis de datos**: Desarrollar algoritmos de procesamiento cient√≠fico
- **Protocolos operativos**: Crear procedimientos y gu√≠as t√©cnicas
- **Comunicaci√≥n cient√≠fica**: Adaptar contenido t√©cnico para diferentes audiencias

## Validaci√≥n del M√≥dulo

In [None]:
def validar_modulo_bedrock():
    verificaciones = {
        "Bedrock configurado": 'bedrock' in globals(),
        "Contenido cient√≠fico generado": False,
        "C√≥digo cient√≠fico generado": False,
        "Comparaci√≥n de modelos realizada": False
    }
    
    # Verificar generaci√≥n de contenido
    if 'reporte_resultado' in globals() and reporte_resultado:
        verificaciones["Contenido cient√≠fico generado"] = len(reporte_resultado.get('contenido', '')) > 0
    
    # Verificar generaci√≥n de c√≥digo
    if 'codigo_sismico' in globals() and codigo_sismico:
        verificaciones["C√≥digo cient√≠fico generado"] = len(codigo_sismico.get('codigo', '')) > 0
    
    # Verificar comparaci√≥n de modelos
    if 'resultados_comparacion' in globals() and resultados_comparacion:
        verificaciones["Comparaci√≥n de modelos realizada"] = len(resultados_comparacion) > 1
    
    print("VALIDACI√ìN M√ìDULO 5 - AMAZON BEDROCK")
    print("=" * 45)
    
    for verificacion, estado in verificaciones.items():
        icono = "‚úì" if estado else "‚úó"
        print(f"{icono} {verificacion}")
    
    completadas = sum(verificaciones.values())
    total = len(verificaciones)
    porcentaje = (completadas/total)*100
    
    print(f"\nProgreso: {completadas}/{total} ({porcentaje:.0f}%)")
    
    if completadas >= 3:
        print("\nüéâ ¬°M√ìDULO BEDROCK COMPLETADO!")
        print("Has dominado la IA generativa para contenido y c√≥digo cient√≠fico")
        print("üèÅ ¬°LABORATORIO COMPLETO! Has explorado todos los servicios de AWS AI/ML")
    else:
        print("\n‚ö†Ô∏è Completa m√°s ejercicios de IA generativa")
    
    return completadas >= 3

modulo_completado = validar_modulo_bedrock()

---

## ¬°Laboratorio Completado!

**Has explorado 5 servicios de AWS AI/ML:**
1. **Amazon Rekognition** - An√°lisis de im√°genes satelitales
2. **Amazon Comprehend** - Procesamiento de texto cient√≠fico
3. **Amazon Textract** - OCR inteligente de documentos
4. **Amazon Polly** - S√≠ntesis de voz para alertas
5. **Amazon Bedrock** - IA generativa para contenido y c√≥digo cient√≠fico

### üéØ Logros Alcanzados:
- Procesamiento de im√°genes geol√≥gicas
- An√°lisis de documentos cient√≠ficos
- Digitalizaci√≥n de formularios y tablas
- Creaci√≥n de alertas de audio
- Generaci√≥n de reportes t√©cnicos
- Desarrollo de c√≥digo cient√≠fico con IA

---

*M√≥dulo 5 de 5 completado*