# **Introdução à Linguagem MDX**

**O que é MDX e para que serve?**

MDX (Multidimensional Expressions) é uma linguagem de consulta projetada especificamente para manipular e recuperar dados em bancos de dados multidimensionais, como cubos OLAP (Online Analytical Processing). Diferente do SQL, que trabalha com bases de dados relacionais, MDX permite a análise de grandes volumes de informações organizadas em dimensões e medidas, facilitando a extração de insights complexos.

Os principais usos de MDX incluem:
-	Recuperação de dados em bancos OLAP.
-	Criação de relatórios dinâmicos.
-	Cálculos personalizados sobre medidas.
-	Agregação de informações baseadas em hierarquias de dimensão.


In [None]:
### Aula Prática de MDX no Google Colab com Python

import pandas as pd

# Criar um exemplo de cubo OLAP em formato de DataFrame
dados = {
    'Categoria': ['Eletrônicos', 'Móveis', 'Roupas', 'Alimentos', 'Brinquedos', 'Automóveis'],
    'Receita': [10000, 5000, 7000, 3000, 4000, 12000],
    'Custo': [6000, 3000, 4000, 2000, 2500, 8000],
    'Quantidade_Vendida': [50, 30, 40, 20, 25, 60]
}
df = pd.DataFrame(dados)

# Simular a recuperação de dados (equivalente a um SELECT MDX)
def recuperar_dados(df):
    return df[['Categoria', 'Receita', 'Quantidade_Vendida']]

df_recuperacao = recuperar_dados(df)
display(df_recuperacao)

# Simular um cálculo personalizado (Margem de Lucro)
def calcular_margem(df):
    df['Margem_Lucro'] = (df['Receita'] - df['Custo']) / df['Receita']
    return df[['Categoria', 'Receita', 'Custo', 'Margem_Lucro']]

df_calculo = calcular_margem(df)
display(df_calculo)

# Criar um cálculo adicional - Ticket Médio
def calcular_ticket_medio(df):
    df['Ticket_Medio'] = df['Receita'] / df['Quantidade_Vendida']
    return df[['Categoria', 'Receita', 'Quantidade_Vendida', 'Ticket_Medio']]

df_ticket_medio = calcular_ticket_medio(df)
display(df_ticket_medio)

# Criar uma análise comparativa entre categorias
def analisar_categorias(df):
    df['Lucro_Liquido'] = df['Receita'] - df['Custo']
    df_sorted = df.sort_values(by='Lucro_Liquido', ascending=False)
    return df_sorted[['Categoria', 'Receita', 'Custo', 'Lucro_Liquido']]

df_analise = analisar_categorias(df)
display(df_analise)