# 🧠 IA + Oracle: Hola mundo con Gemini API Key

Este notebook muestra cómo conectar una base de datos Oracle y generar consultas SQL desde lenguaje natural usando el modelo Gemini de Google vía su librería oficial `google.generativeai`.

🔑 Solo necesitas una clave API (`GOOGLE_API_KEY`).  
❌ No se requiere `project_id`, `region` ni cuenta de servicio.

Ideal para prototipos rápidos y prácticas educativas.

## 🔍 Comparativa: Vertex AI vs Gemini API Key

| Característica              | Vertex AI (AISuite)         | Gemini API Key (`google.generativeai`) |
|----------------------------|-----------------------------|----------------------------------------|
| Requiere `project_id`      | ✅ Sí                        | ❌ No                                   |
| Requiere `region`          | ✅ Sí                        | ❌ No                                   |
| Requiere cuenta de servicio| ✅ Sí                        | ❌ No                                   |
| Ideal para producción      | ✅                           | 🔸 Solo para prototipos y pruebas       |
| Simplicidad de uso         | 🔸 Más compleja              | ✅ Muy sencilla                         |

In [2]:
# 🔐 Configurar Gemini con API Key
from dotenv import load_dotenv
import os
import google.generativeai as genai

load_dotenv()
GOOGLE_API_KEY = os.getenv("GOOGLE_API_KEY")

genai.configure(api_key=GOOGLE_API_KEY)
model = genai.GenerativeModel("gemini-2.5-flash")

In [3]:
# 🔗 Conexión a Oracle
import oracledb

def get_connection():
    user = os.getenv("DB_USER")
    password = os.getenv("DB_PASSWORD")
    dsn = os.getenv("DB_DSN")
    wallet_location = os.getenv("WALLET_LOCATION")
    wallet_password = os.getenv("WALLET_PASSWORD")
    
    missing = [name for name, val in (("DB_USER", user), ("DB_PASSWORD", password), ("DB_DSN", dsn)) if not val]
    if missing:
        raise RuntimeError(f"Missing environment variables: {', '.join(missing)}")
    
    return oracledb.connect(
        user=user,
        password=password,
        dsn=dsn,
        wallet_location=wallet_location,
        wallet_password=wallet_password
    )

connection = get_connection()

cursor = connection.cursor()

ORACLE_USER = os.getenv("DB_USER")

cursor.execute("SELECT USER FROM dual")
print("Conectado como:", cursor.fetchone()[0])

Conectado como: MALACKATHON


In [4]:
# 🗂️ Descubrimiento del esquema
cursor.execute(f"""
    SELECT table_name, column_name
    FROM all_tab_columns
    WHERE owner = UPPER('{ORACLE_USER}')
    ORDER BY table_name, column_id
""")

esquema = {}
for table, column in cursor:
    esquema.setdefault(table, []).append(column)

print("Esquema de la base de datos:")
for tabla, columnas in esquema.items():
    print(f"{tabla}({', '.join(columnas)})")

Esquema de la base de datos:
CATEGORIAS_DIAGNOSTICO(ID_CATEGORIA, NOMBRE_CATEGORIA, FECHA_CREACION)
CENTROS(ID_CENTRO, CODIGO_CENTRO, FECHA_CREACION)
COMUNIDADES(ID_COMUNIDAD, NOMBRE_COMUNIDAD, FECHA_CREACION)
DBTOOLS$EXECUTION_HISTORY(ID, HASH, CREATED_BY, CREATED_ON, UPDATED_BY, UPDATED_ON, STATEMENT, TIMES)
DIAGNOSTICOS(ID_DIAGNOSTICO, NOMBRE_DIAGNOSTICO, ID_CATEGORIA, CODIGO_CIE, FECHA_CREACION)
INGRESOS(ID_INGRESO, CIP_SNS_RECODIFICADO, SEXO, EDAD_EN_INGRESO, ID_COMUNIDAD_ATENCION, ID_COMUNIDAD_RESIDENCIA, FECHA_INGRESO, MES_INGRESO, CIRCUNSTANCIA_CONTACTO, TIPO_ALTA, ESTANCIA_DIAS, ID_CENTRO, ID_SERVICIO, REGIMEN_FINANCIACION, PROCEDENCIA, ID_DIAGNOSTICO_PRINCIPAL, ID_CATEGORIA, PROCEDIMIENTO_1, PROCEDIMIENTO_2, PROCEDIMIENTO_3, GDR_AP, CDM_AP, GRD_APR, CDM_APR, NIVEL_SEVERIDAD_APR, RIESGO_MORTALIDAD_APR, CIE, REINGRESO, COSTE_APR, INGRESO_EN_UCI, DIAS_UCI, FECHA_CREACION)
PAISES(ID_PAIS, NOMBRE_PAIS, FECHA_CREACION)
PROCEDIMIENTOS(ID_PROCEDIMIENTO, CODIGO_PROCEDIMIENTO, DESCRIPC

In [6]:
# 🧠 Pregunta en lenguaje natural
pregunta = "Análisis descriptivo inicial: estudio estadístico elemental de las variables, tipos de datos (fecha, carácter, categóricos, numéricos, etc), valores nulos o desconocidos, outliers, etc."

In [None]:
# 🤖 Generación de SQL con Gemini
esquema_texto = "\n".join(
    f"{tabla}({', '.join(columnas)})" for tabla, columnas in esquema.items()
)

prompt_sql = f"""
Eres un asistente experto en SQL para Oracle. Genera solo la consulta SQL compatible con Oracle.
Usa este esquema de base de datos:
{esquema_texto}

Pregunta del usuario:
{pregunta}
"""

raw_sql = model.generate_content(prompt_sql)
sql_generado = raw_sql.text.strip().strip("```sql").strip("```")
sql_generado = sql_generado.replace(";", "")  # Elimina el punto y coma si está presente
#eliminar saltos de línea y tabulaciones pues dan error en Oracle
sql_generado = sql_generado.replace("\n", " ").replace("\t", " ")


print("Consulta generada por IA:")
print(sql_generado)

Consulta generada por IA:
response:
GenerateContentResponse(
    done=True,
    iterator=None,
    result=protos.GenerateContentResponse({
      "candidates": [
        {
          "content": {
            "parts": [
              {
                "text": "A continuaci\u00f3n, se presenta un an\u00e1lisis descriptivo inicial de la estructura de la base de datos, detallando los tipos de datos, la naturaleza de las variables, la potencial presencia de valores nulos y posibles consideraciones sobre outliers para cada tabla y columna:\n\n---\n\n### An\u00e1lisis Descriptivo Inicial de la Base de Datos\n\nLa base de datos se estructura en torno a informaci\u00f3n sobre ingresos hospitalarios (`INGRESOS`), complementada con tablas dimensionales (`CATEGORIAS_DIAGNOSTICO`, `CENTROS`, `COMUNIDADES`, `DIAGNOSTICOS`, `PAISES`, `PROCEDIMIENTOS`, `SERVICIOS`) que proporcionan contexto. Adicionalmente, cuenta con vistas pre-agregadas y enriquecidas (`VISTA_DASHBOARD`, `VISTA_MUY_INTERESANTE`) dise\

In [11]:
# 🧪 Ejecutar SQL y mostrar resultados
cursor.execute(sql_generado)
resultados = cursor.fetchall()
columnas = [col[0] for col in cursor.description]

import pandas as pd
df = pd.DataFrame(resultados, columns=columnas)
texto_resultado = df.to_markdown(index=False)
df.head()

Unnamed: 0,COUNT(*)
0,21210


In [12]:
# 🧠 Interpretación con Gemini
prompt_explicacion = f"""
Eres un experto en análisis de datos. Resume e interpreta los resultados de una consulta SQL.
La pregunta original fue: {pregunta}
Los resultados fueron:

{texto_resultado}
"""

response = model.generate_content(prompt_explicacion)
print("🧠 Respuesta interpretada por IA:")
print(response.text.strip())

🧠 Respuesta interpretada por IA:
¡Excelente! Como experto en análisis de datos, procedo a resumir e interpretar los resultados de esta consulta SQL.

---

### Resumen e Interpretación de Resultados de Consulta SQL

**1. Pregunta Original de la Consulta:**
La pregunta formulada a la base de datos fue: "¿Cuántas filas tiene la tabla de enfermos mentales?"
El objetivo era obtener el conteo total de registros en una tabla específica, presumiblemente identificada como `tabla de enfermos mentales`.

**2. Resultados Obtenidos:**
La consulta ejecutada (`COUNT(*)`) devolvió el siguiente resultado:
`21210`

**3. Interpretación de los Resultados:**

*   **Conteo Total de Registros:** El número `21.210` representa el **número exacto de filas** presentes en la tabla que fue consultada.
*   **Volumen de Datos:** Esto significa que, en el momento de la ejecución de la consulta, existen **21.210 registros individuales** en la tabla de "enfermos mentales". Asumiendo que cada fila representa un caso úni

## 🧠 Reflexión

- ¿Qué ventajas tiene usar Gemini con API Key?
- ¿Qué limitaciones presenta frente a Vertex AI?
- ¿Cómo podrías extender este flujo para validar o visualizar los resultados?

Este notebook es ideal para prácticas rápidas, pero recuerda que para entornos profesionales, Vertex AI ofrece mayor control y seguridad.