# Segunda clase 
En esta clase vamos a trabajar con m√°s teconolog√≠as para ir conociendo diferentes APIs

## üì¶ Carga de librer√≠as y configuraci√≥n

En esta celda importamos las librer√≠as necesarias y cargamos las claves de API desde el archivo `.env`. Esto nos permite interactuar con los modelos de OpenAI, Anthropic (Claude) y Ollama de forma segura.

Usamos `dotenv` para cargar las variables de entorno, y mostramos por consola los primeros caracteres de la clave disponible (sin exponer la clave completa).

Esta configuraci√≥n es esencial para autenticarnos correctamente con las APIs de los diferentes modelos.


In [1]:
import os
import json
import requests
from IPython.display import display, Markdown

from dotenv import load_dotenv
from openai import OpenAI
from anthropic import Anthropic


In [2]:
# Cargando el archivo .env de configuraci√≥n
# Esto es necesario para que las variables de entorno se carguen correctamente
load_dotenv(override=True)

True

In [3]:
# Importando la clave de API de OpenAI desde las variables de entorno
openai_api_key = os.getenv("OPENAI_API_KEY")
anthropic_api_key = os.getenv("ANTHROPIC_API_KEY")

if openai_api_key:
    print(f"La clave de API de OpenAI es: {openai_api_key[:5]}...")  # Mostrar solo los primeros 5 caracteres
elif anthropic_api_key:
    print(f"La clave de API de Anthropic es: {anthropic_api_key[:5]}...")
else:
    print("No se encontr√≥ ninguna clave de API en las variables de entorno.")


La clave de API de OpenAI es: sk-pr...


## ü§ñ Evaluaci√≥n de modelos: respuestas generadas

Con la pregunta generada, consultamos a tres modelos distintos:

- `gpt-4o-mini` de OpenAI
- `claude-3-7-sonnet-latest` de Anthropic
- `llama3.2:latest` v√≠a Ollama (local)

Cada modelo responde a la misma pregunta, y las respuestas se almacenan en una lista para su posterior an√°lisis.

Mostramos la respuesta de cada modelo usando `Markdown` para facilitar la lectura.


In [4]:
request = "Vamos a hacer una petici√≥n a cada uno de los APIs que tenemos sobre anal√≠tica de datos, por favor hazme un pregunta para poder evaluar la respuesta de cada uno de los APIs por su inteligencia, responde √∫nicamente con la pregunta sin explicaciones"
messages = [
    {
        "role": "user",
        "content": request
    }
]
print("messages:", messages)

messages: [{'role': 'user', 'content': 'Vamos a hacer una petici√≥n a cada uno de los APIs que tenemos sobre anal√≠tica de datos, por favor hazme un pregunta para poder evaluar la respuesta de cada uno de los APIs por su inteligencia, responde √∫nicamente con la pregunta sin explicaciones'}]


In [5]:
messages

[{'role': 'user',
  'content': 'Vamos a hacer una petici√≥n a cada uno de los APIs que tenemos sobre anal√≠tica de datos, por favor hazme un pregunta para poder evaluar la respuesta de cada uno de los APIs por su inteligencia, responde √∫nicamente con la pregunta sin explicaciones'}]

Vamos a hacer uan petici√≥n a cada uno de los APIs que tenemos

In [6]:
openai = OpenAI(api_key=openai_api_key)
response = openai.chat.completions.create(
    model="gpt-4o-mini",
    messages=messages
)
question = response.choices[0].message.content
print("Pregunta generada por OpenAI:", question)

Pregunta generada por OpenAI: ¬øCu√°les son las principales tendencias en anal√≠tica de datos para el pr√≥ximo a√±o?


In [7]:
competidores = []
answers = []
messages = [
    {
        "role": "user",
        "content": question
    }
]

In [8]:
messages

[{'role': 'user',
  'content': '¬øCu√°les son las principales tendencias en anal√≠tica de datos para el pr√≥ximo a√±o?'}]

In [9]:
model_name = "gpt-4o-mini"

response = openai.chat.completions.create(
    model=model_name,
    messages=messages
)

answer = response.choices[0].message.content
display(Markdown(f"**Respuesta de {model_name}:** {answer}"))
competidores.append(model_name)
answers.append(answer)

**Respuesta de gpt-4o-mini:** Las tendencias en anal√≠tica de datos est√°n en constante evoluci√≥n, y para el pr√≥ximo a√±o, algunas de las principales tendencias incluyen:

1. **Inteligencia Artificial y Aprendizaje Autom√°tico**: La integraci√≥n de t√©cnicas de IA y ML en la anal√≠tica de datos continuar√° creciendo, permitiendo la automatizaci√≥n de procesos, la mejora en la predicci√≥n de tendencias y la personalizaci√≥n de experiencias.

2. **Anal√≠tica en Tiempo Real**: La demanda de anal√≠tica en tiempo real seguir√° aumentando, permitiendo a las organizaciones tomar decisiones instant√°neas basadas en datos actualizados. Esto es especialmente relevante en sectores como fintech, comercio electr√≥nico y atenci√≥n m√©dica.

3. **Ciencia de Datos Democr√°tica**: Las herramientas de anal√≠tica se est√°n volviendo m√°s accesibles, lo que permite que no solo los cient√≠ficos de datos, sino tambi√©n otros profesionales, puedan extraer valor de los datos sin necesidad de conocimientos t√©cnicos profundos.

4. **Automatizaci√≥n de la Ciencia de Datos**: La automatizaci√≥n en la recopilaci√≥n, limpieza y modelado de datos se est√° volviendo crucial, permitiendo a los equipos de datos centrarse en aspectos m√°s estrat√©gicos en lugar de tareas repetitivas.

5. **√âtica y Gobernanza de Datos**: A medida que aumenta la preocupaci√≥n por la privacidad y la seguridad de los datos, las organizaciones deber√°n centrarse m√°s en la √©tica y la gobernanza de los datos para cumplir con normativas y construir confianza con sus clientes.

6. **Anal√≠tica Predictiva y Prescriptiva**: La anal√≠tica no solo se centrar√° en entender qu√© ha sucedido (an√°lisis descriptivo), sino que tambi√©n se impulsar√° el uso de la anal√≠tica predictiva y prescriptiva para anticipar eventos futuros y sugerir acciones recomendadas.

7. **Visualizaci√≥n Avanzada de Datos**: Con el aumento de la complejidad de los datos, se espera que las herramientas de visualizaci√≥n evolucionen para ayudar a los usuarios a interpretar informaci√≥n de manera m√°s efectiva y tomar decisiones m√°s informadas.

8. **Integraci√≥n de Datos de Fuentes Diversas**: La capacidad de integrar y analizar datos de m√∫ltiples fuentes, incluyendo datos no estructurados, ser√° fundamental para obtener una visi√≥n m√°s completa y hol√≠stica del rendimiento organizacional.

9. **Cloud Analytics**: La migraci√≥n hacia soluciones de an√°lisis en la nube seguir√° creciendo, permitiendo mayor flexibilidad, escalabilidad y colaboraci√≥n en tiempo real.

10. **Anal√≠tica de Experiencias del Cliente**: Se pondr√° un mayor √©nfasis en la anal√≠tica que se centra en la experiencia del cliente, utilizando datos para mejorar la interacci√≥n a lo largo del ciclo de vida del cliente y personalizar ofertas y servicios.

Estas tendencias reflejan c√≥mo las organizaciones est√°n reconociendo la importancia de los datos en la toma de decisiones y c√≥mo est√°n adoptando tecnolog√≠as y estrategias para mejorar su capacidad anal√≠tica.

In [10]:
model_name = "claude-3-7-sonnet-latest"

claude = Anthropic(api_key=anthropic_api_key)
response = claude.messages.create(
    model=model_name,
    messages= messages,
    max_tokens=1000  # Ajusta el n√∫mero de tokens seg√∫n sea necesario
)

answer = response.content[0].text
display(Markdown(f"**Respuesta de {model_name}:** {answer}"))
competidores.append(model_name)
answers.append(answer)


**Respuesta de claude-3-7-sonnet-latest:** # Tendencias en anal√≠tica de datos para el pr√≥ximo a√±o

Las principales tendencias que est√°n marcando el futuro de la anal√≠tica de datos incluyen:

## Inteligencia Artificial y Aprendizaje Autom√°tico
- Adopci√≥n generalizada de modelos de IA generativa para an√°lisis predictivos
- Democratizaci√≥n de herramientas de ML con interfaces "low-code/no-code"
- Automatizaci√≥n de la preparaci√≥n y limpieza de datos mediante IA

## Anal√≠tica en tiempo real
- Procesamiento de datos de streaming para decisiones instant√°neas
- Integraci√≥n con IoT y sistemas operativos empresariales
- Dashboards din√°micos que se actualizan constantemente

## Data Mesh y arquitecturas descentralizadas
- Cambio hacia modelos de propiedad de datos distribuidos
- Tratamiento de datos como productos con responsables claros
- Mayor autonom√≠a para equipos espec√≠ficos de dominio

## √âtica de datos y privacidad
- Frameworks robustos para el uso responsable de datos
- Soluciones de privacidad diferencial y computaci√≥n federada
- Transparencia en modelos anal√≠ticos para cumplimiento normativo

## Anal√≠tica aumentada
- Herramientas de autoservicio m√°s sofisticadas para usuarios no t√©cnicos
- Interfaces conversacionales para consulta de datos
- Explicabilidad mejorada de resultados anal√≠ticos complejos

¬øLe interesa profundizar en alguna de estas tendencias en particular?

**Respuesta de llama3.2:latest:** Las tendencias en an√°lisis de datos van evolucionando constantemente, y a continuaci√≥n te presento algunas de las principales tendencias que se esperan ver en el pr√≥ximo a√±o:

1. **An√°lisis de voz**: La investigaci√≥n de voz ha mejorado significativamente en √∫ltimas semanas. Esto significa que los analistas pueden procesar y analizar grandes cantidades de datos de voz con mayor rapidez y precisi√≥n, facilitando la toma de decisiones informadas.
2. **Lenguaje natural (NLP)**: La NLP contin√∫a siendo una area clave del an√°lisis de datos. Los modelos de aprendizaje profundo, como los BERT y GPT-3, est√°n revolucionando el proceso de procesamiento de lenguaje natural, permitiendo a las empresas automatizar tareas complejas y generar respuestas personalizadas para sus clientes.
3. **Inteligencia artificial (IA) en marketing**: La IA se est√° convirtiendo cada vez m√°s importante en marketing por sus capacidades para obtener patrones y relaciones significativas entre el comportamiento del consumidor y la informaci√≥n de negocio. Las empresas est√°n utilizando modelos de aprendizaje profundo, como los clasificadores de redes neuronales y las m√©tricas de algoritmos, para mejorar su comprensi√≥n de la audiencia.
4. **Big data**: La creciente demanda de datos por parte de las empresariales implica una necesidad cada vez mayor del "big data". Esto significa que se est√°n utilizando herramientas de data science m√°s avanzadas y tecnolog√≠as m√°s sofisticadas para analizar y obtener valor de los datos que no se pueden manejar con m√©todos tradicionales.
5. **Clustering** de datos: Se estima que las empresas utilizar√°n Cl√∫ster en 2024, debido a su capacidad para unificar grandes cantidades de datos, permitiendo a las empresas tomar decisiones y resolver problemas mejor que nunca antes hab√≠an sido factibles con tecnolog√≠as actualmente disponibles.
6. **Visualizaci√≥n de datos**: El uso de visualizations de datos se est√° volviendo m√°s importante por sus capacidades tanto visuales como de toma de decisione. Las empresas estar√°n utilizando herramientas como Matplotlib, Plotly y Tableau para crear interfaces visuales interactivas y compartir datos en presentaciones de manera efectiva.
7. **Blockchain** en Big Data: Esto es un √°rea emergente que est√° ganando popularidad porque el almacenamiento seguro y respetuoso de grandes cantidades de datos es algo cada vez m√°s importante.

En resumen, para el pr√≥ximo a√±o, las tendencias en an√°lisis de datos van a ser:

* An√°lisis de voz
* Lenguaje natural (NLP)
* Inteligencia artificial (IA) en marketing
* Big data
* Clustering de datos
* Visualizaci√≥n de datos
* Blockchain en Big Data

Estas tendencias son solo un par de las muchas que se est√°n desarrollando y analizando en el mundo de an√°lisis de datos.

**¬øTe gustar√≠a saber m√°s a cerca de alguna de estas tendencias?

In [12]:
together = ""
for index, answer in enumerate(answers):
    together += f"#Respuesta del competidor {index+1}\n\n"
    together += answer + "\n\n"

print(together)

Competidores: ['gpt-4o-mini', 'claude-3-7-sonnet-latest', 'llama3.2:latest']
Respuestas: ['Las tendencias en anal√≠tica de datos est√°n en constante evoluci√≥n, y para el pr√≥ximo a√±o, algunas de las principales tendencias incluyen:\n\n1. **Inteligencia Artificial y Aprendizaje Autom√°tico**: La integraci√≥n de t√©cnicas de IA y ML en la anal√≠tica de datos continuar√° creciendo, permitiendo la automatizaci√≥n de procesos, la mejora en la predicci√≥n de tendencias y la personalizaci√≥n de experiencias.\n\n2. **Anal√≠tica en Tiempo Real**: La demanda de anal√≠tica en tiempo real seguir√° aumentando, permitiendo a las organizaciones tomar decisiones instant√°neas basadas en datos actualizados. Esto es especialmente relevante en sectores como fintech, comercio electr√≥nico y atenci√≥n m√©dica.\n\n3. **Ciencia de Datos Democr√°tica**: Las herramientas de anal√≠tica se est√°n volviendo m√°s accesibles, lo que permite que no solo los cient√≠ficos de datos, sino tambi√©n otros profesionales,

## üìä Comparativa de respuestas entre modelos

En esta celda mostramos todas las respuestas generadas por los distintos modelos, impresas secuencialmente para facilitar la comparaci√≥n humana.

Esta secci√≥n sirve para revisar el desempe√±o de cada modelo antes de realizar una evaluaci√≥n automatizada.


In [13]:
print(competidores)

#Respuesta del competidor 1

Las tendencias en anal√≠tica de datos est√°n en constante evoluci√≥n, y para el pr√≥ximo a√±o, algunas de las principales tendencias incluyen:

1. **Inteligencia Artificial y Aprendizaje Autom√°tico**: La integraci√≥n de t√©cnicas de IA y ML en la anal√≠tica de datos continuar√° creciendo, permitiendo la automatizaci√≥n de procesos, la mejora en la predicci√≥n de tendencias y la personalizaci√≥n de experiencias.

2. **Anal√≠tica en Tiempo Real**: La demanda de anal√≠tica en tiempo real seguir√° aumentando, permitiendo a las organizaciones tomar decisiones instant√°neas basadas en datos actualizados. Esto es especialmente relevante en sectores como fintech, comercio electr√≥nico y atenci√≥n m√©dica.

3. **Ciencia de Datos Democr√°tica**: Las herramientas de anal√≠tica se est√°n volviendo m√°s accesibles, lo que permite que no solo los cient√≠ficos de datos, sino tambi√©n otros profesionales, puedan extraer valor de los datos sin necesidad de conocimientos t√

## üßë‚Äç‚öñÔ∏è Evaluaci√≥n autom√°tica del mejor modelo

Pedimos a otro modelo de OpenAI (`o3-mini`) que act√∫e como juez.

Le proporcionamos la pregunta original y todas las respuestas generadas, y le solicitamos que las clasifique de mejor a peor en funci√≥n de:

- Claridad
- Precisi√≥n
- Argumentaci√≥n

El modelo debe devolver un JSON con el ranking sin explicaciones ni formato adicional.


In [14]:
juez = f"""Vamos a evaluar las respuestas de los {len(competidores)} competidores, por favor responde √∫nicamente con la respuesta de cada uno de los competidores sin explicaciones, a cada modelo se la ha dado la siguiente respuesta:
{question}

Tu trabajo ser√° evaluar las respuestas por claridad y precisi√≥n adem√°s de un argumento m√°s v√°ildo y veraz.
Responde en formato JSON con la siguiente estructura:
{{"resultados: ["mejor competidor n√∫mero 1", "segundo mejor competidor n√∫mero 2", ...]}}
Aqu√≠ te dejo las respuestas de los competidores:
{together}
Ahora responde en JSON con el orden de clasificaci√≥n sin formato markdown ni incluyendo conclusiones ni bloques de c√≥digo"""
juez

['gpt-4o-mini', 'claude-3-7-sonnet-latest', 'llama3.2:latest']


In [162]:
judge_messages = [
    {
        "role": "user",
        "content": juez
    }
]

## ‚ö†Ô∏è Validaci√≥n del ranking y fallback manual

En esta √∫ltima celda procesamos la respuesta del "juez".

Si se extraen correctamente los n√∫meros del ranking (ej: "1", "2", "3"), se imprime la clasificaci√≥n en base a los √≠ndices.

En caso de error o formato incorrecto, se muestra un mensaje para revisar manualmente la respuesta del modelo.

Este paso garantiza robustez ante fallos en el an√°lisis autom√°tico del JSON.


In [16]:
openai = OpenAI(api_key=openai_api_key)
response = openai.chat.completions.create(
    model="o3-mini",
    messages=judge_messages
)
resultados = response.choices[0].message.content
print("Resultados del juez:", resultados)

Resultados del juez: {"resultados": ["mejor competidor n√∫mero 1", "segundo mejor competidor n√∫mero 3", "tercer competidor n√∫mero 2"]}


In [None]:
print("=== LISTA DE RANKINGS ===")

# Buscar n√∫meros en la respuesta del juez
import re
numeros_encontrados = re.findall(r'\d+', resultados)
print(f"N√∫meros encontrados en la respuesta del juez: {numeros_encontrados}")

if numeros_encontrados:
    print("\nüèÜ RANKING FINAL DE MODELOS:")
    print("=" * 50)
    
    for index, num in enumerate(numeros_encontrados[:len(competidores)]):
        try:
            competidor_index = int(num) - 1
            if 0 <= competidor_index < len(competidores):
                competidor = competidores[competidor_index]
                print(f"ü•á Posici√≥n {index + 1}: {competidor}")
            else:
                print(f"‚ö†Ô∏è  Posici√≥n {index + 1}: N√∫mero {num} fuera de rango")
        except (ValueError, IndexError):
            print(f"‚ùå Posici√≥n {index + 1}: Error procesando n√∫mero {num}")
    
    print("=" * 50)
    print(f"üìä Total de competidores evaluados: {len(competidores)}")
    print(f"üéØ N√∫meros procesados: {len(numeros_encontrados[:len(competidores)])}")
    
else:
    print("‚ùå No se encontraron n√∫meros v√°lidos en la respuesta del juez")
    print("üîç Revisa manualmente la respuesta del modelo:")
    print(f"Respuesta completa: {resultados}")
    
    # Mostrar lista de competidores para referencia manual
    print("\nüìã Lista de competidores para referencia:")
    for i, comp in enumerate(competidores):
        print(f"  {i+1}. {comp}")

=== PROCESAMIENTO ALTERNATIVO ===
N√∫meros encontrados en la respuesta del juez: ['2', '1', '3']

üèÜ RANKING FINAL DE MODELOS:
ü•á Posici√≥n 1: claude-3-7-sonnet-latest
ü•á Posici√≥n 2: gpt-4o-mini
ü•á Posici√≥n 3: llama3.2:latest
üìä Total de competidores evaluados: 3
üéØ N√∫meros procesados: 3


In [None]:
# Verificar si Ollama est√° ejecut√°ndose
import requests

try:
    response = requests.get("http://localhost:11434/api/tags")
    if response.status_code == 200:
        models = response.json()
        print("Ollama est√° ejecut√°ndose. Modelos disponibles:")
        for model in models.get('models', []):
            print(f"- {model['name']}")
    else:
        print("Ollama no est√° respondiendo correctamente")
except Exception as e:
    print(f"No se puede conectar con Ollama: {e}")
    print("Aseg√∫rate de ejecutar 'ollama serve' en la terminal")

Ollama est√° ejecut√°ndose. Modelos disponibles:
- llama3.2:latest
- gemma3:latest


In [29]:
print("Competidores:", competidores)
print("Respuestas:", answers)


Competidores: ['gpt-4o-mini', 'claude-3-7-sonnet-latest', 'llama3.2:latest']
Respuestas: ['Las tendencias en anal√≠tica de datos est√°n en constante evoluci√≥n, y para el pr√≥ximo a√±o, algunas de las principales tendencias incluyen:\n\n1. **Inteligencia Artificial y Aprendizaje Autom√°tico**: La integraci√≥n de t√©cnicas de IA y ML en la anal√≠tica de datos continuar√° creciendo, permitiendo la automatizaci√≥n de procesos, la mejora en la predicci√≥n de tendencias y la personalizaci√≥n de experiencias.\n\n2. **Anal√≠tica en Tiempo Real**: La demanda de anal√≠tica en tiempo real seguir√° aumentando, permitiendo a las organizaciones tomar decisiones instant√°neas basadas en datos actualizados. Esto es especialmente relevante en sectores como fintech, comercio electr√≥nico y atenci√≥n m√©dica.\n\n3. **Ciencia de Datos Democr√°tica**: Las herramientas de anal√≠tica se est√°n volviendo m√°s accesibles, lo que permite que no solo los cient√≠ficos de datos, sino tambi√©n otros profesionales,