# üìä Introducci√≥n a Atoti y Consultas MDX

Bienvenido a este tutorial completo sobre **Atoti** y las consultas **MDX** (MultiDimensional eXpressions). Este notebook est√° dise√±ado para usuarios de diferentes niveles de experiencia.

## üéØ Objetivos del Notebook
- Comprender qu√© es Atoti y c√≥mo funciona el an√°lisis multidimensional
- Aprender los fundamentos de las consultas MDX
- Crear cubos OLAP con datos acad√©micos reales
- Realizar visualizaciones interactivas

## üìö Estructura por Niveles
- **üî∞ NIVEL B√ÅSICO**: Conceptos fundamentales con explicaciones detalladas
- **üöÄ NIVEL AVANZADO**: T√©cnicas complejas y optimizaciones

---

## üî∞ ¬øQu√© es MDX?
**MDX** es un lenguaje de consulta para bases de datos multidimensionales (cubos OLAP). Piensa en √©l como "SQL para cubos":

- **SQL**: Trabaja con tablas planas (filas y columnas)
- **MDX**: Trabaja con cubos multidimensionales (dimensiones, jerarqu√≠as, medidas)

**Analog√≠a**: Si SQL es como buscar informaci√≥n en una hoja de Excel, MDX es como analizar datos en una tabla din√°mica 3D.

## ‚öôÔ∏è Configuraci√≥n Inicial

Configuraremos la conexi√≥n a nuestra base de datos Oracle con el esquema `DM_ACADEMICO`.

In [1]:
# Importaciones necesarias
import atoti as tt
from atoti_jdbc import JdbcLoad
import os
import pandas as pd

# üî∞ B√ÅSICO: Configuraci√≥n de conexi√≥n a Oracle
ORACLE_USER = os.getenv('ORACLE_USER', 'C##DM_ACADEMICO')
ORACLE_PASSWORD = os.getenv('ORACLE_PASSWORD', 'YourPassword123')
ORACLE_HOST = os.getenv('ORACLE_HOST', 'localhost')
ORACLE_PORT = os.getenv('ORACLE_PORT', '1521')
ORACLE_SERVICE = os.getenv('ORACLE_SERVICE', 'XEPDB1')

# Crear URL de conexi√≥n JDBC
jdbc_url = f"jdbc:oracle:thin:{ORACLE_USER}/{ORACLE_PASSWORD}@//{ORACLE_HOST}:{ORACLE_PORT}/{ORACLE_SERVICE}"

print("‚úÖ Configuraci√≥n de conexi√≥n completada")
print(f"üîó Conectando a: {ORACLE_HOST}:{ORACLE_PORT}/{ORACLE_SERVICE}")

Welcome to Atoti 0.9.5!

By using this community edition, you agree with the license available at https://docs.atoti.io/latest/eula.html.
Browse the official documentation at https://docs.atoti.io.
Join the community at https://www.atoti.io/register.

Atoti collects telemetry data, which is used to help understand how to improve the product.
If you don't wish to send usage data, you can request a trial license at https://www.atoti.io/evaluation-license-request.

You can hide this message by setting the `ATOTI_HIDE_EULA_MESSAGE` environment variable to True.
‚úÖ Configuraci√≥n de conexi√≥n completada
üîó Conectando a: localhost:1521/XEPDB1


In [108]:
# Cerrar todas las sesiones
try:
    if 'session' in globals():
        session.close()
        del globals
        print("‚úÖ Sesi√≥n anterior cerrada")
except:
    pass


# Iniciar sesi√≥n de Atoti
session = tt.Session.start()
print("üöÄ Sesi√≥n de Atoti iniciada correctamente")
print(f"üìç URL del servidor: {session.url}")

üöÄ Sesi√≥n de Atoti iniciada correctamente
üìç URL del servidor: http://localhost:52478


## üî∞ NIVEL B√ÅSICO - Primeros Pasos

### üìñ Conceptos Fundamentales

Antes de crear nuestro primer cubo, entendamos los conceptos b√°sicos:

- **üéØ Medidas**: Valores num√©ricos que queremos analizar (ej: n√∫mero de estudiantes, promedio de notas)
- **üìä Dimensiones**: Categor√≠as para agrupar datos (ej: carrera, a√±o acad√©mico, g√©nero)
- **üèóÔ∏è Jerarqu√≠as**: Niveles dentro de una dimensi√≥n (ej: A√±o > Semestre > Mes)
- **üßä Cubo**: Estructura que organiza medidas y dimensiones para an√°lisis

In [109]:
# üî∞ FUNCI√ìN AUXILIAR CORREGIDA: Cargar tablas de forma segura
def cargar_tabla_academica(nombre_tabla, query_sql, claves_primarias):
    """
    Carga una tabla desde Oracle con validaciones autom√°ticas.
    
    Args:
        nombre_tabla (str): Nombre para la tabla en Atoti
        query_sql (str): Consulta SQL para obtener los datos
        claves_primarias (set): Conjunto de columnas que forman la clave primaria
    
    Returns:
        Tabla de Atoti con los datos cargados
    """
    try:
        # Crear carga JDBC
        jdbc_load = JdbcLoad(query_sql, url=jdbc_url)
        
        # Inferir tipos de datos autom√°ticamente
        data_types = session.tables.infer_data_types(jdbc_load)
        print(f"üìã Tipos de datos inferidos para {nombre_tabla}")
        
        # Crear tabla en Atoti
        tabla = session.create_table(
            nombre_tabla, 
            data_types=data_types, 
            keys=claves_primarias
        )
        
        # Cargar datos
        tabla.load(jdbc_load)
        
        print(f"‚úÖ Tabla {nombre_tabla} cargada exitosamente")
        
        # üîß CORRECCI√ìN: Usar len() en lugar de shape
        try:
            num_registros = len(tabla)
            print(f"üìä Registros cargados: {num_registros}")
        except:
            # Alternativa si len() no funciona
            print("üìä Datos cargados (conteo no disponible)")
        
        return tabla
        
    except Exception as e:
        print(f"‚ùå Error cargando {nombre_tabla}: {str(e)}")
        return None

### üìö Cargando Nuestros Primeros Datos

Comenzaremos con las tablas m√°s importantes del esquema acad√©mico:

In [110]:
# üî∞ CARGAR TABLA DE HECHOS: Matr√≠culas
print("üìö Cargando tabla de matr√≠culas (hechos principales)...")
tabla_matriculas = cargar_tabla_academica(
    "Matriculas",
    "SELECT * FROM F_MATRICULA WHERE ROWNUM <= 1000",  # Limitamos para el ejemplo
    {"ID_ALUMNO", "ID_CURSO_ACADEMICO", "ID_ASIGNATURA"}
)

# üî∞ CARGAR DIMENSI√ìN: Cursos Acad√©micos
print("\nüìÖ Cargando dimensi√≥n de cursos acad√©micos...")
tabla_cursos = cargar_tabla_academica(
    "CursosAcademicos",
    "SELECT * FROM D_CURSO_ACADEMICO",
    {"ID_CURSO_ACADEMICO"}
)

# üî∞ CARGAR DIMENSI√ìN: Sexo
print("\nüë§ Cargando dimensi√≥n de sexo...")
tabla_sexo = cargar_tabla_academica(
    "Sexo",
    "SELECT * FROM D_SEXO",
    {"ID_SEXO"}
)

# Verificar que las tablas se cargaron correctamente
if tabla_matriculas and tabla_cursos and tabla_sexo:
    print("\nüéâ ¬°Todas las tablas b√°sicas cargadas exitosamente!")
else:
    print("\n‚ö†Ô∏è Algunas tablas no se pudieron cargar. Verificar conexi√≥n y esquema.")

üìö Cargando tabla de matr√≠culas (hechos principales)...
üìã Tipos de datos inferidos para Matriculas
‚úÖ Tabla Matriculas cargada exitosamente
üìä Datos cargados (conteo no disponible)

üìÖ Cargando dimensi√≥n de cursos acad√©micos...
üìã Tipos de datos inferidos para CursosAcademicos
‚úÖ Tabla CursosAcademicos cargada exitosamente
üìä Datos cargados (conteo no disponible)

üë§ Cargando dimensi√≥n de sexo...
üìã Tipos de datos inferidos para Sexo
‚úÖ Tabla Sexo cargada exitosamente
üìä Datos cargados (conteo no disponible)

üéâ ¬°Todas las tablas b√°sicas cargadas exitosamente!


### üßä Creando Nuestro Primer Cubo

Un cubo es como una "tabla din√°mica super potente" que nos permite analizar datos desde m√∫ltiples perspectivas.

In [111]:
# üî∞ CREAR CUBO B√ÅSICO 
if tabla_matriculas:
    # Unir tabla de hechos con dimensiones usando la sintaxis correcta
    if tabla_cursos:
        tabla_matriculas.join(
            tabla_cursos,
            tabla_matriculas["ID_CURSO_ACADEMICO"] == tabla_cursos["ID_CURSO_ACADEMICO"]
        )
        print("üîó Uni√≥n con cursos acad√©micos realizada")
    
    if tabla_sexo:
        tabla_matriculas.join(
            tabla_sexo,
            tabla_matriculas["ID_SEXO"] == tabla_sexo["ID_SEXO"]
        )
        print("üîó Uni√≥n con dimensi√≥n sexo realizada")
    
    # Crear el cubo
    cubo_academico = session.create_cube(tabla_matriculas, "CuboAcademico")
    
    print("\nüßä ¬°Cubo acad√©mico creado exitosamente!")
    
    # Obtener referencias a jerarqu√≠as, niveles y medidas
    h = cubo_academico.hierarchies  # Jerarqu√≠as
    l = cubo_academico.levels      # Niveles
    m = cubo_academico.measures    # Medidas
    
    print(f"üìä Jerarqu√≠as disponibles: {len(h)}")
    print(f"üìà Medidas autom√°ticas: {len(m)}")

üîó Uni√≥n con cursos acad√©micos realizada
üîó Uni√≥n con dimensi√≥n sexo realizada

üßä ¬°Cubo acad√©mico creado exitosamente!
üìä Jerarqu√≠as disponibles: 37
üìà Medidas autom√°ticas: 134


In [22]:
# üî∞ EXPLORAR LA ESTRUCTURA DEL CUBO
if 'cubo_academico' in locals():
    print("üîç EXPLORANDO NUESTRO CUBO:")
    print("\nüìä JERARQU√çAS DISPONIBLES:")
    for nombre_jerarquia in sorted(h.keys())[:5]:  # Mostramos solo las primeras 5
        print(f"  üìÅ {nombre_jerarquia}")
    
    print("\nüìà MEDIDAS AUTOM√ÅTICAS:")
    for nombre_medida in sorted(m.keys())[:5]:  # Mostramos solo las primeras 5
        print(f"  üìä {nombre_medida}")
    
    # Crear medidas personalizadas m√°s comprensibles
    print("\nüéØ CREANDO MEDIDAS PERSONALIZADAS:")
    
    # Medida: N√∫mero total de estudiantes √∫nicos
    m["Total_Estudiantes"] = tt.agg.count_distinct(tabla_matriculas["ID_ALUMNO"])
    print("  ‚úÖ Total_Estudiantes: Cuenta estudiantes √∫nicos")
    
    # Medida: Promedio de estudiantes por curso (medida calculada)
    m["Avg_Estudiantes_Por_Curso"] = m["Total_Estudiantes"] / tt.agg.count_distinct(tabla_matriculas["ID_CURSO_ACADEMICO"])
    print("  ‚úÖ Avg_Estudiantes_Por_Curso: Promedio de estudiantes por curso")
    
    print("\nüéâ ¬°Cubo listo para consultas!")
    
    # Mostrar todas las medidas disponibles
    print(f"\nüìã Total de medidas en el cubo: {len(m)}")
    print("üî¢ Medidas principales:")
    for medida in ["Total_Estudiantes", "Total_Matriculas", "contributors.COUNT"]:
        if medida in m:
            print(f"  ‚úì {medida}")

üîç EXPLORANDO NUESTRO CUBO:

üìä JERARQU√çAS DISPONIBLES:
  üìÅ ('CursosAcademicos', 'NOMBRE_CURSO_ACADEMICO')
  üìÅ ('Matriculas', 'COD_POSTAL_CURSO')
  üìÅ ('Matriculas', 'COD_POSTAL_FAMILIAR')
  üìÅ ('Matriculas', 'CURSO_IMPARTICION_ASIG')
  üìÅ ('Matriculas', 'CURSO_ORDEN')

üìà MEDIDAS AUTOM√ÅTICAS:
  üìä ANYO_ACCESO_SUE.MEAN
  üìä ANYO_ACCESO_SUE.SUM
  üìä CREDITOS.MEAN
  üìä CREDITOS.SUM
  üìä CURSO_MAS_ALTO_MATRICULADO.MEAN

üéØ CREANDO MEDIDAS PERSONALIZADAS:
  ‚úÖ Total_Estudiantes: Cuenta estudiantes √∫nicos
  ‚úÖ Avg_Estudiantes_Por_Curso: Promedio de estudiantes por curso

üéâ ¬°Cubo listo para consultas!

üìã Total de medidas en el cubo: 137
üî¢ Medidas principales:
  ‚úì Total_Estudiantes
  ‚úì contributors.COUNT


### üîç Nuestras Primeras Consultas MDX

Una consulta MDX b√°sica tiene esta estructura:
```python
cubo.query(
    medida_que_queremos,           # ¬øQu√© queremos medir?
    levels=[dimensi√≥n_para_agrupar] # ¬øC√≥mo queremos agrupar?
)
```

In [23]:
# üî∞ CONSULTA 1: ¬øCu√°ntos estudiantes tenemos en total?
if 'cubo_academico' in locals():
    print("üîç CONSULTA 1: Total de estudiantes")
    print("üìù Pregunta: ¬øCu√°ntos estudiantes √∫nicos hay en total?")
    
    try:
        resultado1 = cubo_academico.query(m["Total_Estudiantes"])
        print("‚úÖ Resultado:")
        display(resultado1)
        
        print("\nüí° Explicaci√≥n:")
        print("   - Usamos la medida 'Total_Estudiantes'")
        print("   - No especificamos niveles, as√≠ que obtenemos el total general")
        print("   - count_distinct() evita contar el mismo estudiante varias veces")
        
    except Exception as e:
        print(f"‚ùå Error en consulta: {e}")

üîç CONSULTA 1: Total de estudiantes
üìù Pregunta: ¬øCu√°ntos estudiantes √∫nicos hay en total?
‚úÖ Resultado:


Unnamed: 0,Total_Estudiantes
0,99



üí° Explicaci√≥n:
   - Usamos la medida 'Total_Estudiantes'
   - No especificamos niveles, as√≠ que obtenemos el total general
   - count_distinct() evita contar el mismo estudiante varias veces


In [29]:
# üî∞ CONSULTA 2: ¬øCu√°ntos estudiantes hay por sexo? - CORREGIDO
if 'cubo_academico' in locals():
    print("üîç CONSULTA 2: Estudiantes por sexo")
    print("üìù Pregunta: ¬øC√≥mo se distribuyen los estudiantes por g√©nero?")
    
    try:
        # Obtener el nivel de sexo directamente
        nivel_sexo_key = ('Sexo', 'NOMBRE_SEXO', 'NOMBRE_SEXO')
        
        # CORRECCI√ìN: No usar if nivel_sexo directamente, sino verificar si la key existe
        if nivel_sexo_key in l:
            nivel_sexo = l[nivel_sexo_key]
            print(f"üéØ Usando nivel de sexo: {nivel_sexo_key}")
            
            # Realizar la consulta
            resultado2 = cubo_academico.query(
                m["Total_Estudiantes"],
                levels=[nivel_sexo]
            )
            
            print("‚úÖ Resultado - Estudiantes por sexo:")
            display(resultado2)
            
            print("\nüí° Explicaci√≥n:")
            print("   - levels=[nivel_sexo]: Agrupa los resultados por g√©nero")
            print("   - Cada fila muestra el total de estudiantes para ese g√©nero")
            print("   - Esta es la base del an√°lisis dimensional")
            
        else:
            print("‚ö†Ô∏è Nivel NOMBRE_SEXO no disponible, probando alternativas...")
            
            # Alternativa 1: Campo SEXO de Matriculas
            nivel_sexo_alt_key = ('Matriculas', 'SEXO', 'SEXO')
            if nivel_sexo_alt_key in l:
                nivel_sexo_alt = l[nivel_sexo_alt_key]
                print(f"üîÑ Usando nivel alternativo: {nivel_sexo_alt_key}")
                
                resultado2_alt = cubo_academico.query(
                    m["Total_Estudiantes"],
                    levels=[nivel_sexo_alt]
                )
                
                print("‚úÖ Resultado alternativo - Estudiantes por sexo:")
                display(resultado2_alt)
                
            else:
                # Alternativa 2: Agrupar por curso acad√©mico
                nivel_curso_key = ('CursosAcademicos', 'NOMBRE_CURSO_ACADEMICO', 'NOMBRE_CURSO_ACADEMICO')
                if nivel_curso_key in l:
                    nivel_curso = l[nivel_curso_key]
                    print(f"üîÑ Agrupando por curso acad√©mico: {nivel_curso_key}")
                    
                    resultado_curso = cubo_academico.query(
                        m["Total_Estudiantes"],
                        levels=[nivel_curso]
                    )
                    
                    print("‚úÖ Resultado - Estudiantes por curso acad√©mico:")
                    display(resultado_curso)
                else:
                    print("‚ùå No se encontraron niveles v√°lidos para agrupar")
        
    except Exception as e:
        print(f"‚ùå Error en consulta: {str(e)}")
        
        # Consulta de respaldo m√°s simple
        print("\nüÜò Intentando consulta m√°s simple...")
        try:
            resultado_backup = cubo_academico.query(m["Total_Estudiantes"])
            print("‚úÖ Total general de estudiantes:")
            display(resultado_backup)
        except Exception as e2:
            print(f"‚ùå Error en consulta de respaldo: {str(e2)}")

üîç CONSULTA 2: Estudiantes por sexo
üìù Pregunta: ¬øC√≥mo se distribuyen los estudiantes por g√©nero?
üéØ Usando nivel de sexo: ('Sexo', 'NOMBRE_SEXO', 'NOMBRE_SEXO')
‚úÖ Resultado - Estudiantes por sexo:


Unnamed: 0_level_0,Total_Estudiantes
NOMBRE_SEXO,Unnamed: 1_level_1
Hombre,52
Mujer,47



üí° Explicaci√≥n:
   - levels=[nivel_sexo]: Agrupa los resultados por g√©nero
   - Cada fila muestra el total de estudiantes para ese g√©nero
   - Esta es la base del an√°lisis dimensional


### üìä Visualizaci√≥n Interactiva B√°sica

Atoti incluye widgets interactivos que nos permiten explorar datos de forma visual.

In [30]:
# üî∞ WIDGET INTERACTIVO B√ÅSICO
print("üé® Creando visualizaci√≥n interactiva...")
print("\nüìñ INSTRUCCIONES:")
print("  1. Arrastra medidas desde el panel izquierdo")
print("  2. Arrastra dimensiones para crear gr√°ficos")
print("  3. Experimenta con diferentes combinaciones")

# Mostrar widget interactivo
session.widget

üé® Creando visualizaci√≥n interactiva...

üìñ INSTRUCCIONES:
  1. Arrastra medidas desde el panel izquierdo
  2. Arrastra dimensiones para crear gr√°ficos
  3. Experimenta con diferentes combinaciones


---

## üöÄ NIVEL AVANZADO - T√©cnicas Especializadas

### üèóÔ∏è Cubos Complejos con M√∫ltiples Dimensiones

Para usuarios avanzados, crearemos un cubo m√°s sofisticado que integre m√∫ltiples tablas de hechos y dimensiones.

In [72]:
# Cerrar todas las sesiones
try:
    if 'session' in globals():
        session.close()
        del globals
        print("‚úÖ Sesi√≥n anterior cerrada")
except:
    pass


# Iniciar sesi√≥n de Atoti
session = tt.Session.start()
print("üöÄ Sesi√≥n de Atoti iniciada correctamente")
print(f"üìç URL del servidor: {session.url}")

üîÑ Realizando reinicio completo del entorno...
‚úÖ Sesi√≥n anterior cerrada
üöÄ Nueva sesi√≥n iniciada en: http://localhost:51679


In [73]:
# üöÄ CARGAR DATOS ADICIONALES PARA AN√ÅLISIS AVANZADO
print("üöÄ NIVEL AVANZADO: Cargando datos adicionales...")

# Cargar tabla de rendimiento acad√©mico
tabla_rendimiento = cargar_tabla_academica(
    "Rendimiento",
    "SELECT * FROM F_RENDIMIENTO WHERE ROWNUM <= 1000",
    {"ID_ALUMNO", "ID_ASIGNATURA", "ID_CURSO_ACADEMICO"}
)

# Cargar dimensi√≥n de asignaturas
tabla_asignaturas = cargar_tabla_academica(
    "Asignaturas",
    "SELECT * FROM D_ASIGNATURA",
    {"ID_ASIGNATURA"}
)

# Cargar dimensi√≥n de calificaciones
tabla_calificaciones = cargar_tabla_academica(
    "Calificaciones",
    "SELECT * FROM D_CALIFICACION",
    {"ID_CALIFICACION"}
)


# Cargar dimensi√≥n de cursos
tabla_cursos = cargar_tabla_academica(
    "CursosAcademicos",
    "SELECT * FROM D_CURSO_ACADEMICO",
    {"ID_CURSO_ACADEMICO"}
)

print("\n‚úÖ Datos avanzados cargados para an√°lisis de rendimiento")

üöÄ NIVEL AVANZADO: Cargando datos adicionales...
üìã Tipos de datos inferidos para Rendimiento
‚úÖ Tabla Rendimiento cargada exitosamente
üìä Datos cargados (conteo no disponible)
üìã Tipos de datos inferidos para Asignaturas
‚úÖ Tabla Asignaturas cargada exitosamente
üìä Datos cargados (conteo no disponible)
üìã Tipos de datos inferidos para Calificaciones
‚úÖ Tabla Calificaciones cargada exitosamente
üìä Datos cargados (conteo no disponible)
üìã Tipos de datos inferidos para CursosAcademicos
‚úÖ Tabla CursosAcademicos cargada exitosamente
üìä Datos cargados (conteo no disponible)

‚úÖ Datos avanzados cargados para an√°lisis de rendimiento


In [74]:
# üöÄ CREAR CUBO AVANZADO DE RENDIMIENTO
if tabla_rendimiento:
    print("üöÄ Creando cubo avanzado de rendimiento acad√©mico...")
    
    # Unir con dimensiones relacionadas usando la sintaxis correcta
    if tabla_asignaturas:
        tabla_rendimiento.join(
            tabla_asignaturas,
            tabla_rendimiento["ID_ASIGNATURA"] == tabla_asignaturas["ID_ASIGNATURA"]
        )
        print("üîó Dimensi√≥n de asignaturas vinculada")
    
    if tabla_calificaciones:
        tabla_rendimiento.join(
            tabla_calificaciones,
            tabla_rendimiento["ID_CALIFICACION"] == tabla_calificaciones["ID_CALIFICACION"]
        )
        print("üîó Dimensi√≥n de calificaciones vinculada")
    
    if tabla_cursos:
        tabla_rendimiento.join(
            tabla_cursos,
            tabla_rendimiento["ID_CURSO_ACADEMICO"] == tabla_cursos["ID_CURSO_ACADEMICO"]
        )
        print("üîó Dimensi√≥n temporal vinculada")
    
    # Crear cubo avanzado
    cubo_rendimiento = session.create_cube(tabla_rendimiento, "CuboRendimiento")
    
    # Referencias para el cubo avanzado
    h_adv = cubo_rendimiento.hierarchies
    l_adv = cubo_rendimiento.levels
    m_adv = cubo_rendimiento.measures
    
    print("\nüßä Cubo avanzado de rendimiento creado")
    print(f"üìä Jerarqu√≠as: {len(h_adv)}")
    print(f"üìà Medidas: {len(m_adv)}")

üöÄ Creando cubo avanzado de rendimiento acad√©mico...
üîó Dimensi√≥n de asignaturas vinculada
üîó Dimensi√≥n de calificaciones vinculada
üîó Dimensi√≥n temporal vinculada

üßä Cubo avanzado de rendimiento creado
üìä Jerarqu√≠as: 19
üìà Medidas: 124


In [94]:
# üöÄ MEDIDAS CALCULADAS AVANZADAS
if 'cubo_rendimiento' in locals():
    print("üöÄ Creando medidas calculadas avanzadas...")
    
    try:
        # Obtener lista de columnas usando la forma recomendada
        columnas_tabla = list(tabla_rendimiento)
        
        # Medida: Promedio de notas (si existe campo NOTA_NUMERICA)
        if "NOTA_NUMERICA" in columnas_tabla:
            m_adv["Promedio_Notas"] = tt.agg.mean(tabla_rendimiento["NOTA_NUMERICA"])
            print("  ‚úÖ Promedio_Notas: Calcula nota promedio")
            
            # Medida: Tasa de aprobaci√≥n (notas >= 5.0)
            m_adv["Tasa_Aprobacion"] = tt.agg.mean(
                tt.where(tabla_rendimiento["NOTA_NUMERICA"] >= 5.0, 1.0, 0.0)
            )
            print("  ‚úÖ Tasa_Aprobacion: Porcentaje de aprobados")
            
            # Medida: Estudiantes con excelencia (notas >= 9.0)
            m_adv["Excelencia_Academica"] = tt.agg.mean(
                tt.where(tabla_rendimiento["NOTA_NUMERICA"] >= 9.0, 1.0, 0.0)
            )
            print("  ‚úÖ Excelencia_Academica: Porcentaje con notas >= 9.0")
            
            # Medida: Total de evaluaciones (contando registros con notas no nulas)
            m_adv["Total_Evaluaciones"] = tt.agg.count_distinct(tabla_rendimiento["ID_EXPEDIENTE_ACADEMICO"])
            print("  ‚úÖ Total_Evaluaciones: Cuenta todas las evaluaciones")
        
        # Medida: Estudiantes √∫nicos evaluados
        m_adv["Estudiantes_Evaluados"] = tt.agg.count_distinct(tabla_rendimiento["ID_ALUMNO"])
        print("  ‚úÖ Estudiantes_Evaluados: Cuenta estudiantes √∫nicos")
        
        # Medidas adicionales basadas en las columnas disponibles
        m_adv["Total_Creditos"] = tt.agg.sum(tabla_rendimiento["CREDITOS"])
        print("  ‚úÖ Total_Creditos: Suma total de cr√©ditos")
        
        m_adv["Promedio_Creditos"] = tt.agg.mean(tabla_rendimiento["CREDITOS"])
        print("  ‚úÖ Promedio_Creditos: Promedio de cr√©ditos por evaluaci√≥n")
        
        m_adv["Edad_Promedio"] = tt.agg.mean(tabla_rendimiento["EDAD"])
        print("  ‚úÖ Edad_Promedio: Edad promedio de estudiantes")
        
        print("\nüéØ Medidas avanzadas configuradas exitosamente")
        
    except Exception as e:
        print(f"‚ö†Ô∏è Algunas medidas no se pudieron crear: {e}")
        print("üí° Esto puede deberse a problemas de sintaxis en atoti")

üöÄ Creando medidas calculadas avanzadas...
  ‚úÖ Promedio_Notas: Calcula nota promedio
  ‚úÖ Tasa_Aprobacion: Porcentaje de aprobados
  ‚úÖ Excelencia_Academica: Porcentaje con notas >= 9.0
  ‚úÖ Total_Evaluaciones: Cuenta todas las evaluaciones
  ‚úÖ Estudiantes_Evaluados: Cuenta estudiantes √∫nicos
  ‚úÖ Total_Creditos: Suma total de cr√©ditos
  ‚úÖ Promedio_Creditos: Promedio de cr√©ditos por evaluaci√≥n
  ‚úÖ Edad_Promedio: Edad promedio de estudiantes

üéØ Medidas avanzadas configuradas exitosamente


### üî¨ Consultas MDX Avanzadas

Realizaremos consultas complejas que combinen m√∫ltiples dimensiones y apliquen filtros sofisticados.

In [95]:
# üöÄ CONSULTA AVANZADA 1: An√°lisis multi-dimensional
if 'cubo_rendimiento' in locals():
    print("üöÄ CONSULTA AVANZADA: An√°lisis de rendimiento por m√∫ltiples dimensiones")
    
    try:
        # Buscar niveles relevantes autom√°ticamente
        nivel_curso = None
        nivel_asignatura = None
        
        for nivel_key in l_adv.keys():
            if 'CURSO' in str(nivel_key).upper() and nivel_curso is None:
                nivel_curso = l_adv[nivel_key]
                print(f"üéØ Nivel temporal: {nivel_key}")
            elif 'ASIGNATURA' in str(nivel_key).upper() and nivel_asignatura is None:
                nivel_asignatura = l_adv[nivel_key]
                print(f"üéØ Nivel asignatura: {nivel_key}")
        
        if nivel_curso is not None and nivel_asignatura is not None:
            # Consulta con m√∫ltiples dimensiones
            resultado_avanzado = cubo_rendimiento.query(
                m_adv["Estudiantes_Evaluados"],
                m_adv["Total_Evaluaciones"],
                levels=[nivel_curso, nivel_asignatura],
                include_totals=True
            )
            
            print("\n‚úÖ Resultado del an√°lisis multi-dimensional:")
            display(resultado_avanzado.head(10))  # Mostrar solo primeros 10 resultados
            
            print("\nüîç Interpretaci√≥n:")
            print("  - Filas: Combinaciones de curso acad√©mico y asignatura")
            print("  - Columnas: Diferentes medidas calculadas")
            print("  - Total: Agregaciones generales")
            
        else:
            print("‚ö†Ô∏è No se encontraron niveles adecuados para la consulta avanzada")
            print(f"Nivel curso encontrado: {nivel_curso is not None}")
            print(f"Nivel asignatura encontrado: {nivel_asignatura is not None}")
            
    except Exception as e:
        print(f"‚ùå Error en consulta avanzada: {e}")
        print(f"Tipo de error: {type(e)}")
        import traceback
        traceback.print_exc()

üöÄ CONSULTA AVANZADA: An√°lisis de rendimiento por m√∫ltiples dimensiones
üéØ Nivel asignatura: ('Asignaturas', 'NOMBRE_ASIGNATURA', 'NOMBRE_ASIGNATURA')
üéØ Nivel temporal: ('CursosAcademicos', 'NOMBRE_CURSO_ACADEMICO', 'NOMBRE_CURSO_ACADEMICO')

‚úÖ Resultado del an√°lisis multi-dimensional:


Unnamed: 0_level_0,Unnamed: 1_level_0,Estudiantes_Evaluados,Total_Evaluaciones
NOMBRE_CURSO_ACADEMICO,NOMBRE_ASIGNATURA,Unnamed: 2_level_1,Unnamed: 3_level_1
,,100,1000
2010/2011,,47,61
2010/2011,Algoritmos Avanzada,1,1
2010/2011,Algoritmos General,1,1
2010/2011,Anal√≠tica General Computacional,1,1
2010/2011,Arqueolog√≠a II,1,1
2010/2011,Bases de Datos,1,1
2010/2011,Bioqu√≠mica Fundamental Computacional,1,1
2010/2011,Bot√°nica,1,1
2010/2011,Cirug√≠a,1,1



üîç Interpretaci√≥n:
  - Filas: Combinaciones de curso acad√©mico y asignatura
  - Columnas: Diferentes medidas calculadas
  - Total: Agregaciones generales


In [96]:
# üöÄ CONSULTA AVANZADA 2: Con filtros y ordenamiento
if 'cubo_rendimiento' in locals() and 'Promedio_Notas' in m_adv:
    print("üöÄ CONSULTA CON FILTROS AVANZADOS")
    
    try:
        # Consulta filtrada para asignaturas con buen rendimiento
        resultado_filtrado = cubo_rendimiento.query(
            m_adv["Promedio_Notas"],
            m_adv["Tasa_Aprobacion"],
            m_adv["Estudiantes_Evaluados"],
            levels=[nivel_asignatura] if 'nivel_asignatura' in locals() else [],
            filter=(
                (m_adv["Estudiantes_Evaluados"] >= 5) &  # Solo asignaturas con suficientes estudiantes
                (m_adv["Promedio_Notas"] >= 6.0)         # Solo asignaturas con buen rendimiento
            ),
            include_totals=False
        )
        
        print("\n‚úÖ Asignaturas con buen rendimiento (promedio ‚â• 6.0 y ‚â• 5 estudiantes):")
        display(resultado_filtrado)
        
        print("\nüéØ T√©cnicas avanzadas aplicadas:")
        print("  - Filtros compuestos con operadores l√≥gicos (&)")
        print("  - Criterios m√∫ltiples de selecci√≥n")
        print("  - Exclusi√≥n de totales para focus en detalles")
        
    except Exception as e:
        print(f"‚ùå Error en consulta filtrada: {e}")
        print("üí° Posible causa: Medidas calculadas no disponibles")

üöÄ CONSULTA CON FILTROS AVANZADOS

‚úÖ Asignaturas con buen rendimiento (promedio ‚â• 6.0 y ‚â• 5 estudiantes):


Unnamed: 0_level_0,Promedio_Notas,Tasa_Aprobacion,Estudiantes_Evaluados
NOMBRE_ASIGNATURA,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Contabilidad Especial,6.11,0.67,9
Derecho Administrativo,7.33,1.0,6
Derecho Penal,6.33,0.83,12
Farmacolog√≠a,7.17,0.67,6
Finanzas Avanzada,6.33,0.67,6
Fisicoqu√≠mica,6.29,1.0,7
Gram√°tica Aplicada,6.4,0.6,5
Ling√º√≠stica II para Cient√≠ficos,6.0,0.83,5
Programaci√≥n,6.5,0.62,8
Sem√°ntica III,6.4,0.8,5



üéØ T√©cnicas avanzadas aplicadas:
  - Filtros compuestos con operadores l√≥gicos (&)
  - Criterios m√∫ltiples de selecci√≥n
  - Exclusi√≥n de totales para focus en detalles


## üõ†Ô∏è Troubleshooting y Optimizaci√≥n

### ‚ùå Errores Comunes y Soluciones

1. **Error de conexi√≥n**: Verificar credenciales y conectividad
2. **Tablas vac√≠as**: Confirmar que existen datos en el esquema
3. **Referencias incorrectas**: Validar nombres de columnas
4. **Consultas lentas**: Aplicar filtros para reducir volumen de datos

### üîß Optimizaciones para Producci√≥n

- **Indexaci√≥n**: Crear √≠ndices en columnas de uni√≥n
- **Particionamiento**: Dividir tablas grandes por per√≠odos
- **Caching**: Configurar cach√© para consultas frecuentes
- **Agregaciones**: Pre-calcular m√©tricas comunes

In [None]:
# üîß FUNCI√ìN DE DIAGN√ìSTICO
def diagnosticar_cubo(cubo, nombre_cubo):
    """
    Funci√≥n de diagn√≥stico para validar la configuraci√≥n del cubo.
    """
    print(f"üîç DIAGN√ìSTICO DE {nombre_cubo}:")
    print(f"  üìä Jerarqu√≠as: {len(cubo.hierarchies)}")
    print(f"  üìà Medidas: {len(cubo.measures)}")
    print(f"  üßÆ Niveles: {len(cubo.levels)}")
    
    # Verificar si hay datos
    try:
        total_registros = cubo.query(cubo.measures["contributors.COUNT"])
        print(f"  üìã Registros totales: {total_registros.iloc[0, 0]}")
    except:
        print("  ‚ö†Ô∏è No se pudo determinar el n√∫mero de registros")
    
    print("  ‚úÖ Cubo operativo\n")

# Diagnosticar cubos creados
if 'cubo_academico' in locals():
    diagnosticar_cubo(cubo_academico, "CUBO ACAD√âMICO B√ÅSICO")

if 'cubo_rendimiento' in locals():
    diagnosticar_cubo(cubo_rendimiento, "CUBO DE RENDIMIENTO AVANZADO")

## üéì Resumen y Pr√≥ximos Pasos

### ‚úÖ Lo que Aprendiste

**üî∞ Nivel B√°sico:**
- Qu√© es Atoti y el an√°lisis multidimensional
- Conceptos de cubos, dimensiones y medidas
- Consultas MDX b√°sicas
- Visualizaciones interactivas simples

**üöÄ Nivel Avanzado:**
- Integraci√≥n de m√∫ltiples tablas
- Medidas calculadas complejas
- Consultas con filtros avanzados
- Troubleshooting y optimizaci√≥n

### üîú Siguientes Notebooks
1. **Consultas MDX B√°sicas**: Profundizar en sintaxis MDX
2. **Cubos Multidimensionales**: Dise√±o avanzado de cubos
3. **Consultas MDX Avanzadas**: Funciones especializadas
4. **Dashboards Interactivos**: Visualizaciones empresariales

### üèÉ‚Äç‚ôÇÔ∏è Ejercicios Pr√°cticos

**Para Practicar:**
1. Crear una consulta que muestre estudiantes por a√±o acad√©mico
2. Implementar una medida de "estudiantes en riesgo" (promedio < 5.0)
3. Dise√±ar un dashboard para el decano de una facultad
4. Optimizar consultas para grandes vol√∫menes de datos

---

**¬°Felicitaciones! üéâ Has completado la introducci√≥n a Atoti y MDX.**