# ETAPA 5: An√°lise das Vari√°veis de M√∫ltipla Escolha

## Consulta √† Comunidade UFPE sobre o Uso de Intelig√™ncia Artificial

---

**Objetivo:** Identificar prioridades e prefer√™ncias da comunidade.

**Vari√°veis analisadas:**
- Contextos de uso de IA (7 op√ß√µes predefinidas)
- Temas priorit√°rios para o Plano Institucional (8 op√ß√µes)
- Tipos de forma√ß√£o/suporte necess√°rios (5 op√ß√µes)

**Procedimentos:**
1. Separar respostas m√∫ltiplas (delimiter: v√≠rgula ou ponto e v√≠rgula) em categorias individuais
2. Calcular frequ√™ncia de men√ß√£o de cada categoria
3. Ordenar categorias por frequ√™ncia (ranking)
4. Estratificar por v√≠nculo para identificar diferen√ßas de prioridades
5. Gerar visualiza√ß√µes (gr√°ficos de barras horizontais, nuvens de palavras)

**Produto:** Rankings de prioridades; tabelas estratificadas; visualiza√ß√µes comparativas.

**Crit√©rio de Valida√ß√£o:** Cobertura de todas as categorias predefinidas; identifica√ß√£o clara das top 3-5 prioridades.

---

## Requisitos T√©cnicos

### Kernel Python
- **Python:** 3.9 ou superior
- **Kernel recomendado:** `python3` ou ambiente virtual com as depend√™ncias instaladas

### Dados de Entrada

| Arquivo | Descri√ß√£o | Origem |
|---------|-----------|--------|
| `dados_limpos_etapa1.xlsx` | Base de dados limpa com 2.164 registros | Etapa 1 |

### Dados de Sa√≠da

| Arquivo | Descri√ß√£o |
|---------|----------|
| `multipla_escolha_etapa5.xlsx` | Tabelas de frequ√™ncia e rankings |
| `grafico_contextos_uso_etapa5.png` | Ranking dos contextos de uso de IA |
| `grafico_temas_prioritarios_etapa5.png` | Ranking dos temas priorit√°rios |
| `grafico_tipos_formacao_etapa5.png` | Ranking dos tipos de forma√ß√£o |
| `grafico_comparativo_vinculo_etapa5.png` | Compara√ß√£o entre v√≠nculos |
| `relatorio_multipla_escolha_etapa5.md` | Relat√≥rio com rankings e an√°lises |

---

## 1. Instala√ß√£o de Depend√™ncias

In [None]:
# ============================================================================
# INSTALA√á√ÉO DE DEPEND√äNCIAS
# Execute esta c√©lula apenas uma vez para instalar os pacotes necess√°rios
# ============================================================================

!pip install pandas openpyxl matplotlib seaborn numpy wordcloud --quiet

print("‚úÖ Depend√™ncias instaladas com sucesso!")

## 2. Configura√ß√£o Inicial

In [None]:
# ============================================================================
# IMPORTA√á√ÉO DE BIBLIOTECAS
# ============================================================================

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from collections import Counter
from datetime import datetime
import warnings
warnings.filterwarnings('ignore')

# Tentar importar wordcloud (opcional)
try:
    from wordcloud import WordCloud
    WORDCLOUD_DISPONIVEL = True
except ImportError:
    WORDCLOUD_DISPONIVEL = False
    print("‚ö†Ô∏è Biblioteca 'wordcloud' n√£o dispon√≠vel. Nuvens de palavras ser√£o omitidas.")

# Configura√ß√µes de exibi√ß√£o
pd.set_option('display.max_columns', None)
pd.set_option('display.max_colwidth', 100)
pd.set_option('display.width', None)
pd.set_option('display.max_rows', 100)

# Configura√ß√µes de visualiza√ß√£o
plt.rcParams['figure.figsize'] = (12, 6)
plt.rcParams['font.size'] = 10
plt.rcParams['axes.titlesize'] = 12
plt.rcParams['axes.labelsize'] = 10
sns.set_style("whitegrid")

# Verificar vers√µes
print("Bibliotecas carregadas com sucesso!")
print(f"  ‚Ä¢ Pandas: {pd.__version__}")
print(f"  ‚Ä¢ Matplotlib: {plt.matplotlib.__version__}")
print(f"  ‚Ä¢ Seaborn: {sns.__version__}")
print(f"  ‚Ä¢ WordCloud: {'Dispon√≠vel' if WORDCLOUD_DISPONIVEL else 'N√£o dispon√≠vel'}")

In [None]:
# ============================================================================
# CONFIGURA√á√ÉO DE ARQUIVOS DE ENTRADA E SA√çDA
# ============================================================================

# Arquivo de entrada (gerado na Etapa 1)
ARQUIVO_ENTRADA = "data/dados_limpos_etapa1.xlsx"

# Arquivos de sa√≠da
ARQUIVO_SAIDA_EXCEL = "data/multipla_escolha_etapa5.xlsx"
ARQUIVO_SAIDA_RELATORIO = "data/relatorio_multipla_escolha_etapa5.md"

print("Configura√ß√£o de arquivos:")
print(f"  üì• Entrada: {ARQUIVO_ENTRADA}")
print(f"  üì§ Sa√≠das:  {ARQUIVO_SAIDA_EXCEL}")
print(f"            {ARQUIVO_SAIDA_RELATORIO}")

## 3. Carregamento dos Dados

In [None]:
# Carregar dados limpos da Etapa 1
try:
    df = pd.read_excel(ARQUIVO_ENTRADA)
    print(f"‚úÖ Dados carregados com sucesso!")
    print(f"   Registros: {len(df)}")
    print(f"   Vari√°veis: {len(df.columns)}")
except FileNotFoundError:
    print(f"‚ùå ERRO: Arquivo '{ARQUIVO_ENTRADA}' n√£o encontrado!")
    print(f"   Certifique-se de que a Etapa 1 foi executada e o arquivo est√° no diret√≥rio correto.")
    raise

In [None]:
# ============================================================================
# IDENTIFICA√á√ÉO DAS VARI√ÅVEIS DE M√öLTIPLA ESCOLHA
# ============================================================================

# Dicion√°rio com as vari√°veis de m√∫ltipla escolha e suas descri√ß√µes
variaveis_multipla = {
    'Contextos_Uso': {
        'descricao': 'Em quais contextos voc√™ utiliza ferramentas de IA?',
        'nome_curto': 'Contextos de Uso'
    },
    'Temas_Prioritarios': {
        'descricao': 'Quais temas devem ser priorit√°rios no Plano Institucional de IA?',
        'nome_curto': 'Temas Priorit√°rios'
    },
    'Tipos_Formacao': {
        'descricao': 'Quais tipos de forma√ß√£o/suporte s√£o necess√°rios?',
        'nome_curto': 'Tipos de Forma√ß√£o'
    }
}

print("=" * 80)
print("VARI√ÅVEIS DE M√öLTIPLA ESCOLHA PARA AN√ÅLISE")
print("=" * 80)

for var, info in variaveis_multipla.items():
    n_respostas = df[var].notna().sum()
    print(f"\nüìå {var}")
    print(f"   Descri√ß√£o: {info['descricao']}")
    print(f"   Respostas v√°lidas: {n_respostas} ({n_respostas/len(df)*100:.1f}%)")
    
    # Mostrar exemplo de resposta
    exemplo = df[var].dropna().iloc[0] if n_respostas > 0 else 'N/A'
    print(f"   Exemplo: {exemplo[:100]}..." if len(str(exemplo)) > 100 else f"   Exemplo: {exemplo}")

---

## 4. Fun√ß√µes Auxiliares

In [None]:
# ============================================================================
# FUN√á√ïES AUXILIARES PARA AN√ÅLISE DE M√öLTIPLA ESCOLHA
# ============================================================================

def separar_respostas_multiplas(serie, delimitadores=[';', ',']):
    """
    Separa respostas m√∫ltiplas em itens individuais.
    Retorna uma lista com todos os itens mencionados.
    """
    todas_respostas = []
    
    for resposta in serie.dropna():
        resposta_str = str(resposta)
        
        # Tentar separar por cada delimitador
        itens = [resposta_str]
        for delim in delimitadores:
            novos_itens = []
            for item in itens:
                novos_itens.extend(item.split(delim))
            itens = novos_itens
        
        # Limpar e adicionar
        for item in itens:
            item_limpo = item.strip()
            if item_limpo and item_limpo.lower() not in ['nan', 'none', '']:
                todas_respostas.append(item_limpo)
    
    return todas_respostas


def calcular_frequencia_mencoes(serie, n_respondentes=None):
    """
    Calcula frequ√™ncia de men√ß√£o de cada categoria.
    Retorna DataFrame com ranking.
    """
    todas_respostas = separar_respostas_multiplas(serie)
    contagem = Counter(todas_respostas)
    
    # Criar DataFrame
    df_freq = pd.DataFrame(contagem.items(), columns=['Categoria', 'Men√ß√µes'])
    df_freq = df_freq.sort_values('Men√ß√µes', ascending=False).reset_index(drop=True)
    
    # Calcular percentuais
    total_mencoes = df_freq['Men√ß√µes'].sum()
    n_resp = n_respondentes or serie.notna().sum()
    
    df_freq['% Men√ß√µes'] = (df_freq['Men√ß√µes'] / total_mencoes * 100).round(1)
    df_freq['% Respondentes'] = (df_freq['Men√ß√µes'] / n_resp * 100).round(1)
    df_freq['Ranking'] = range(1, len(df_freq) + 1)
    
    # Reordenar colunas
    df_freq = df_freq[['Ranking', 'Categoria', 'Men√ß√µes', '% Men√ß√µes', '% Respondentes']]
    
    return df_freq, total_mencoes, n_resp


def calcular_frequencia_por_vinculo(df, variavel, variavel_vinculo='Vinculo_Padronizado'):
    """
    Calcula frequ√™ncia de men√ß√£o estratificada por v√≠nculo.
    Retorna DataFrame com percentuais por grupo.
    """
    resultados = {}
    
    for vinculo in df[variavel_vinculo].dropna().unique():
        df_vinculo = df[df[variavel_vinculo] == vinculo]
        respostas = separar_respostas_multiplas(df_vinculo[variavel])
        contagem = Counter(respostas)
        n_resp = df_vinculo[variavel].notna().sum()
        
        # Calcular percentual sobre respondentes do grupo
        for categoria, mencoes in contagem.items():
            if categoria not in resultados:
                resultados[categoria] = {}
            resultados[categoria][vinculo] = round(mencoes / n_resp * 100, 1)
    
    # Criar DataFrame
    df_vinculo = pd.DataFrame(resultados).T
    
    # Ordenar por total de men√ß√µes
    df_vinculo['Total'] = df_vinculo.sum(axis=1)
    df_vinculo = df_vinculo.sort_values('Total', ascending=False)
    df_vinculo = df_vinculo.drop('Total', axis=1)
    
    return df_vinculo


def criar_grafico_ranking(df_freq, titulo, arquivo_saida, top_n=None, cor='steelblue'):
    """
    Cria gr√°fico de barras horizontais com ranking.
    """
    dados = df_freq.head(top_n) if top_n else df_freq
    
    fig, ax = plt.subplots(figsize=(12, max(6, len(dados) * 0.4)))
    
    # Criar gradiente de cores
    cores = plt.cm.Blues(np.linspace(0.3, 0.9, len(dados)))[::-1]
    
    # Plotar barras
    y_pos = range(len(dados))
    bars = ax.barh(y_pos, dados['% Respondentes'], color=cores, edgecolor='white')
    
    # Configurar eixo y
    ax.set_yticks(y_pos)
    ax.set_yticklabels(dados['Categoria'])
    ax.invert_yaxis()
    
    # Labels nas barras
    for bar, mencoes, pct in zip(bars, dados['Men√ß√µes'], dados['% Respondentes']):
        ax.text(bar.get_width() + 0.5, bar.get_y() + bar.get_height()/2,
                f'{pct}% ({mencoes})', va='center', fontsize=9)
    
    ax.set_xlabel('% dos Respondentes')
    ax.set_title(titulo, fontsize=14, fontweight='bold')
    
    # Ajustar limite x
    ax.set_xlim(0, dados['% Respondentes'].max() * 1.2)
    
    plt.tight_layout()
    plt.savefig(arquivo_saida, dpi=150, bbox_inches='tight')
    plt.show()
    print(f"\nGr√°fico salvo como: {arquivo_saida}")


print("‚úÖ Fun√ß√µes auxiliares carregadas com sucesso!")

---

## 5. An√°lise: Contextos de Uso de IA

In [None]:
# ============================================================================
# AN√ÅLISE DOS CONTEXTOS DE USO
# ============================================================================

print("=" * 80)
print("CONTEXTOS DE USO DE FERRAMENTAS DE IA")
print("=" * 80)

# Calcular frequ√™ncias
freq_contextos, total_mencoes_ctx, n_resp_ctx = calcular_frequencia_mencoes(df['Contextos_Uso'])

print(f"\nTotal de respondentes: {n_resp_ctx}")
print(f"Total de men√ß√µes: {total_mencoes_ctx}")
print(f"M√©dia de contextos por respondente: {total_mencoes_ctx/n_resp_ctx:.1f}")
print(f"\nRanking de contextos de uso:\n")
print(freq_contextos.to_string(index=False))

In [None]:
# Gr√°fico de ranking - Contextos de Uso
criar_grafico_ranking(
    freq_contextos,
    'Contextos de Uso de Ferramentas de IA',
    'grafico_contextos_uso_etapa5.png'
)

In [None]:
# Estratifica√ß√£o por v√≠nculo - Contextos de Uso
freq_contextos_vinculo = calcular_frequencia_por_vinculo(df, 'Contextos_Uso')

print("\n" + "=" * 100)
print("CONTEXTOS DE USO POR V√çNCULO INSTITUCIONAL (% de cada grupo)")
print("=" * 100)
print(freq_contextos_vinculo.round(1))

---

## 6. An√°lise: Temas Priorit√°rios

In [None]:
# ============================================================================
# AN√ÅLISE DOS TEMAS PRIORIT√ÅRIOS
# ============================================================================

print("=" * 80)
print("TEMAS PRIORIT√ÅRIOS PARA O PLANO INSTITUCIONAL DE IA")
print("=" * 80)

# Calcular frequ√™ncias
freq_temas, total_mencoes_temas, n_resp_temas = calcular_frequencia_mencoes(df['Temas_Prioritarios'])

print(f"\nTotal de respondentes: {n_resp_temas}")
print(f"Total de men√ß√µes: {total_mencoes_temas}")
print(f"M√©dia de temas por respondente: {total_mencoes_temas/n_resp_temas:.1f}")
print(f"\nRanking de temas priorit√°rios:\n")
print(freq_temas.to_string(index=False))

In [None]:
# Gr√°fico de ranking - Temas Priorit√°rios
criar_grafico_ranking(
    freq_temas,
    'Temas Priorit√°rios para o Plano Institucional de IA',
    'grafico_temas_prioritarios_etapa5.png'
)

In [None]:
# Estratifica√ß√£o por v√≠nculo - Temas Priorit√°rios
freq_temas_vinculo = calcular_frequencia_por_vinculo(df, 'Temas_Prioritarios')

print("\n" + "=" * 100)
print("TEMAS PRIORIT√ÅRIOS POR V√çNCULO INSTITUCIONAL (% de cada grupo)")
print("=" * 100)
print(freq_temas_vinculo.round(1))

---

## 7. An√°lise: Tipos de Forma√ß√£o/Suporte

In [None]:
# ============================================================================
# AN√ÅLISE DOS TIPOS DE FORMA√á√ÉO/SUPORTE
# ============================================================================

print("=" * 80)
print("TIPOS DE FORMA√á√ÉO/SUPORTE NECESS√ÅRIOS")
print("=" * 80)

# Calcular frequ√™ncias
freq_formacao, total_mencoes_form, n_resp_form = calcular_frequencia_mencoes(df['Tipos_Formacao'])

print(f"\nTotal de respondentes: {n_resp_form}")
print(f"Total de men√ß√µes: {total_mencoes_form}")
print(f"M√©dia de tipos por respondente: {total_mencoes_form/n_resp_form:.1f}")
print(f"\nRanking de tipos de forma√ß√£o:\n")
print(freq_formacao.to_string(index=False))

In [None]:
# Gr√°fico de ranking - Tipos de Forma√ß√£o
criar_grafico_ranking(
    freq_formacao,
    'Tipos de Forma√ß√£o/Suporte Necess√°rios',
    'grafico_tipos_formacao_etapa5.png'
)

In [None]:
# Estratifica√ß√£o por v√≠nculo - Tipos de Forma√ß√£o
freq_formacao_vinculo = calcular_frequencia_por_vinculo(df, 'Tipos_Formacao')

print("\n" + "=" * 100)
print("TIPOS DE FORMA√á√ÉO POR V√çNCULO INSTITUCIONAL (% de cada grupo)")
print("=" * 100)
print(freq_formacao_vinculo.round(1))

---

## 8. Visualiza√ß√µes Comparativas

In [None]:
# ============================================================================
# GR√ÅFICO COMPARATIVO POR V√çNCULO - TOP 5 DE CADA VARI√ÅVEL
# ============================================================================

fig, axes = plt.subplots(1, 3, figsize=(18, 8))

# Dados para plotar (top 5 de cada)
dados_plot = [
    (freq_contextos_vinculo.head(5), 'Contextos de Uso\n(Top 5)'),
    (freq_temas_vinculo.head(5), 'Temas Priorit√°rios\n(Top 5)'),
    (freq_formacao_vinculo.head(5), 'Tipos de Forma√ß√£o\n(Top 5)')
]

for idx, (dados, titulo) in enumerate(dados_plot):
    ax = axes[idx]
    
    # Plotar heatmap
    sns.heatmap(dados, annot=True, fmt='.0f', cmap='YlGnBu', 
                cbar_kws={'label': '% do grupo'}, ax=ax,
                linewidths=0.5, linecolor='white')
    
    ax.set_title(titulo, fontsize=12, fontweight='bold')
    ax.set_xlabel('V√≠nculo Institucional')
    ax.set_ylabel('')
    
    # Rotacionar labels do eixo x
    ax.set_xticklabels(ax.get_xticklabels(), rotation=45, ha='right', fontsize=9)
    ax.set_yticklabels(ax.get_yticklabels(), fontsize=9)

plt.suptitle('Compara√ß√£o das Prioridades por V√≠nculo Institucional', 
             fontsize=14, fontweight='bold', y=1.02)
plt.tight_layout()
plt.savefig('grafico_comparativo_vinculo_etapa5.png', dpi=150, bbox_inches='tight')
plt.show()
print("\nGr√°fico salvo como: grafico_comparativo_vinculo_etapa5.png")

In [None]:
# ============================================================================
# PAINEL CONSOLIDADO - TOP 5 DE CADA VARI√ÅVEL
# ============================================================================

fig, axes = plt.subplots(1, 3, figsize=(18, 6))

# Dados para plotar
dados_barras = [
    (freq_contextos.head(5), 'Contextos de Uso', 'Blues'),
    (freq_temas.head(5), 'Temas Priorit√°rios', 'Greens'),
    (freq_formacao.head(5), 'Tipos de Forma√ß√£o', 'Oranges')
]

for idx, (dados, titulo, cmap) in enumerate(dados_barras):
    ax = axes[idx]
    
    cores = plt.cm.get_cmap(cmap)(np.linspace(0.3, 0.8, len(dados)))[::-1]
    
    bars = ax.barh(range(len(dados)), dados['% Respondentes'], color=cores)
    
    ax.set_yticks(range(len(dados)))
    ax.set_yticklabels(dados['Categoria'], fontsize=9)
    ax.invert_yaxis()
    ax.set_xlabel('% dos Respondentes')
    ax.set_title(f'Top 5 - {titulo}', fontsize=11, fontweight='bold')
    
    # Labels nas barras
    for bar, pct in zip(bars, dados['% Respondentes']):
        ax.text(bar.get_width() + 0.5, bar.get_y() + bar.get_height()/2,
                f'{pct}%', va='center', fontsize=9)
    
    ax.set_xlim(0, dados['% Respondentes'].max() * 1.15)

plt.suptitle('Ranking das Prioridades da Comunidade UFPE', fontsize=14, fontweight='bold', y=1.02)
plt.tight_layout()
plt.savefig('grafico_painel_ranking_etapa5.png', dpi=150, bbox_inches='tight')
plt.show()
print("\nGr√°fico salvo como: grafico_painel_ranking_etapa5.png")

In [None]:
# ============================================================================
# NUVENS DE PALAVRAS (se biblioteca dispon√≠vel)
# ============================================================================

if WORDCLOUD_DISPONIVEL:
    fig, axes = plt.subplots(1, 3, figsize=(18, 5))
    
    variaveis_wc = [
        ('Contextos_Uso', 'Contextos de Uso', 'Blues'),
        ('Temas_Prioritarios', 'Temas Priorit√°rios', 'Greens'),
        ('Tipos_Formacao', 'Tipos de Forma√ß√£o', 'Oranges')
    ]
    
    for idx, (var, titulo, colormap) in enumerate(variaveis_wc):
        ax = axes[idx]
        
        # Obter todas as respostas
        respostas = separar_respostas_multiplas(df[var])
        texto = ' '.join(respostas)
        
        # Gerar nuvem de palavras
        wordcloud = WordCloud(
            width=800, height=400,
            background_color='white',
            colormap=colormap,
            max_words=50,
            min_font_size=10
        ).generate(texto)
        
        ax.imshow(wordcloud, interpolation='bilinear')
        ax.axis('off')
        ax.set_title(titulo, fontsize=12, fontweight='bold')
    
    plt.suptitle('Nuvens de Palavras - Prioridades da Comunidade', fontsize=14, fontweight='bold', y=1.02)
    plt.tight_layout()
    plt.savefig('grafico_nuvens_palavras_etapa5.png', dpi=150, bbox_inches='tight')
    plt.show()
    print("\nGr√°fico salvo como: grafico_nuvens_palavras_etapa5.png")
else:
    print("‚ö†Ô∏è Nuvens de palavras n√£o geradas (biblioteca 'wordcloud' n√£o dispon√≠vel).")

---

## 9. An√°lise de Diferen√ßas entre V√≠nculos

In [None]:
# ============================================================================
# IDENTIFICA√á√ÉO DE DIFEREN√áAS NOT√ÅVEIS ENTRE V√çNCULOS
# ============================================================================

def identificar_diferencas(df_vinculo, limiar=10):
    """
    Identifica categorias com diferen√ßas not√°veis entre v√≠nculos.
    Limiar: diferen√ßa m√≠nima em pontos percentuais.
    """
    diferencas = []
    
    for categoria in df_vinculo.index:
        valores = df_vinculo.loc[categoria].dropna()
        if len(valores) > 1:
            diff = valores.max() - valores.min()
            if diff >= limiar:
                diferencas.append({
                    'Categoria': categoria,
                    'Maior': f"{valores.idxmax()} ({valores.max():.1f}%)",
                    'Menor': f"{valores.idxmin()} ({valores.min():.1f}%)",
                    'Diferen√ßa (pp)': round(diff, 1)
                })
    
    return pd.DataFrame(diferencas).sort_values('Diferen√ßa (pp)', ascending=False)


print("=" * 90)
print("DIFEREN√áAS NOT√ÅVEIS ENTRE V√çNCULOS (‚â• 10 pontos percentuais)")
print("=" * 90)

print("\nüìå CONTEXTOS DE USO")
diff_contextos = identificar_diferencas(freq_contextos_vinculo)
if len(diff_contextos) > 0:
    print(diff_contextos.to_string(index=False))
else:
    print("   Nenhuma diferen√ßa ‚â• 10pp identificada.")

print("\nüìå TEMAS PRIORIT√ÅRIOS")
diff_temas = identificar_diferencas(freq_temas_vinculo)
if len(diff_temas) > 0:
    print(diff_temas.to_string(index=False))
else:
    print("   Nenhuma diferen√ßa ‚â• 10pp identificada.")

print("\nüìå TIPOS DE FORMA√á√ÉO")
diff_formacao = identificar_diferencas(freq_formacao_vinculo)
if len(diff_formacao) > 0:
    print(diff_formacao.to_string(index=False))
else:
    print("   Nenhuma diferen√ßa ‚â• 10pp identificada.")

---

## 10. Resumo Executivo

In [None]:
print("=" * 80)
print("RESUMO EXECUTIVO - ETAPA 5")
print("=" * 80)

print(f"""
üìä PRINCIPAIS ACHADOS

1. CONTEXTOS DE USO DE IA (Top 5)
""")
for _, row in freq_contextos.head(5).iterrows():
    print(f"   {row['Ranking']}. {row['Categoria']}: {row['% Respondentes']}%")

print(f"""
2. TEMAS PRIORIT√ÅRIOS PARA O PLANO INSTITUCIONAL (Top 5)
""")
for _, row in freq_temas.head(5).iterrows():
    print(f"   {row['Ranking']}. {row['Categoria']}: {row['% Respondentes']}%")

print(f"""
3. TIPOS DE FORMA√á√ÉO/SUPORTE NECESS√ÅRIOS (Top 5)
""")
for _, row in freq_formacao.head(5).iterrows():
    print(f"   {row['Ranking']}. {row['Categoria']}: {row['% Respondentes']}%")

print(f"""
üìå ESTAT√çSTICAS GERAIS

   ‚Ä¢ Contextos de uso: {len(freq_contextos)} categorias identificadas
   ‚Ä¢ Temas priorit√°rios: {len(freq_temas)} categorias identificadas
   ‚Ä¢ Tipos de forma√ß√£o: {len(freq_formacao)} categorias identificadas

üìå DIFEREN√áAS ENTRE V√çNCULOS

   ‚Ä¢ Contextos de uso: {len(diff_contextos)} diferen√ßas not√°veis (‚â•10pp)
   ‚Ä¢ Temas priorit√°rios: {len(diff_temas)} diferen√ßas not√°veis (‚â•10pp)
   ‚Ä¢ Tipos de forma√ß√£o: {len(diff_formacao)} diferen√ßas not√°veis (‚â•10pp)
""")

---

## 11. Salvar Resultados

In [None]:
# Salvar todas as tabelas em um arquivo Excel com m√∫ltiplas abas
with pd.ExcelWriter(ARQUIVO_SAIDA_EXCEL, engine='openpyxl') as writer:
    # Rankings gerais
    freq_contextos.to_excel(writer, sheet_name='Ranking_Contextos', index=False)
    freq_temas.to_excel(writer, sheet_name='Ranking_Temas', index=False)
    freq_formacao.to_excel(writer, sheet_name='Ranking_Formacao', index=False)
    
    # Estratifica√ß√£o por v√≠nculo
    freq_contextos_vinculo.to_excel(writer, sheet_name='Contextos_por_Vinculo')
    freq_temas_vinculo.to_excel(writer, sheet_name='Temas_por_Vinculo')
    freq_formacao_vinculo.to_excel(writer, sheet_name='Formacao_por_Vinculo')
    
    # Diferen√ßas not√°veis
    if len(diff_contextos) > 0:
        diff_contextos.to_excel(writer, sheet_name='Diff_Contextos', index=False)
    if len(diff_temas) > 0:
        diff_temas.to_excel(writer, sheet_name='Diff_Temas', index=False)
    if len(diff_formacao) > 0:
        diff_formacao.to_excel(writer, sheet_name='Diff_Formacao', index=False)

print(f"‚úÖ Tabelas salvas em: {ARQUIVO_SAIDA_EXCEL}")

In [None]:
# Gerar relat√≥rio em Markdown
relatorio = f"""# RELAT√ìRIO DE AN√ÅLISE DAS VARI√ÅVEIS DE M√öLTIPLA ESCOLHA
## Etapa 5 ‚Äî Consulta √† Comunidade UFPE sobre o Uso de IA

**Data de execu√ß√£o:** {datetime.now().strftime("%d/%m/%Y √†s %H:%M")}

---

## 1. CONTEXTOS DE USO DE FERRAMENTAS DE IA

**Respondentes:** {n_resp_ctx} | **Total de men√ß√µes:** {total_mencoes_ctx} | **M√©dia por respondente:** {total_mencoes_ctx/n_resp_ctx:.1f}

### Ranking Completo

| # | Categoria | Men√ß√µes | % Respondentes |
|---|-----------|---------|----------------|
"""

for _, row in freq_contextos.iterrows():
    relatorio += f"| {row['Ranking']} | {row['Categoria']} | {row['Men√ß√µes']} | {row['% Respondentes']}% |\n"

relatorio += f"""
---

## 2. TEMAS PRIORIT√ÅRIOS PARA O PLANO INSTITUCIONAL

**Respondentes:** {n_resp_temas} | **Total de men√ß√µes:** {total_mencoes_temas} | **M√©dia por respondente:** {total_mencoes_temas/n_resp_temas:.1f}

### Ranking Completo

| # | Categoria | Men√ß√µes | % Respondentes |
|---|-----------|---------|----------------|
"""

for _, row in freq_temas.iterrows():
    relatorio += f"| {row['Ranking']} | {row['Categoria']} | {row['Men√ß√µes']} | {row['% Respondentes']}% |\n"

relatorio += f"""
---

## 3. TIPOS DE FORMA√á√ÉO/SUPORTE NECESS√ÅRIOS

**Respondentes:** {n_resp_form} | **Total de men√ß√µes:** {total_mencoes_form} | **M√©dia por respondente:** {total_mencoes_form/n_resp_form:.1f}

### Ranking Completo

| # | Categoria | Men√ß√µes | % Respondentes |
|---|-----------|---------|----------------|
"""

for _, row in freq_formacao.iterrows():
    relatorio += f"| {row['Ranking']} | {row['Categoria']} | {row['Men√ß√µes']} | {row['% Respondentes']}% |\n"

relatorio += f"""
---

## 4. DIFEREN√áAS NOT√ÅVEIS ENTRE V√çNCULOS (‚â• 10pp)

### Contextos de Uso
"""

if len(diff_contextos) > 0:
    relatorio += "\n| Categoria | Maior | Menor | Diferen√ßa |\n|-----------|-------|-------|-----------|\n"
    for _, row in diff_contextos.iterrows():
        relatorio += f"| {row['Categoria']} | {row['Maior']} | {row['Menor']} | {row['Diferen√ßa (pp)']}pp |\n"
else:
    relatorio += "\nNenhuma diferen√ßa ‚â• 10pp identificada.\n"

relatorio += "\n### Temas Priorit√°rios\n"

if len(diff_temas) > 0:
    relatorio += "\n| Categoria | Maior | Menor | Diferen√ßa |\n|-----------|-------|-------|-----------|\n"
    for _, row in diff_temas.iterrows():
        relatorio += f"| {row['Categoria']} | {row['Maior']} | {row['Menor']} | {row['Diferen√ßa (pp)']}pp |\n"
else:
    relatorio += "\nNenhuma diferen√ßa ‚â• 10pp identificada.\n"

relatorio += "\n### Tipos de Forma√ß√£o\n"

if len(diff_formacao) > 0:
    relatorio += "\n| Categoria | Maior | Menor | Diferen√ßa |\n|-----------|-------|-------|-----------|\n"
    for _, row in diff_formacao.iterrows():
        relatorio += f"| {row['Categoria']} | {row['Maior']} | {row['Menor']} | {row['Diferen√ßa (pp)']}pp |\n"
else:
    relatorio += "\nNenhuma diferen√ßa ‚â• 10pp identificada.\n"

relatorio += f"""
---

## 5. PRINCIPAIS CONCLUS√ïES

1. **Contexto mais frequente:** "{freq_contextos.iloc[0]['Categoria']}" ({freq_contextos.iloc[0]['% Respondentes']}% dos respondentes).

2. **Tema priorit√°rio principal:** "{freq_temas.iloc[0]['Categoria']}" ({freq_temas.iloc[0]['% Respondentes']}% dos respondentes).

3. **Tipo de forma√ß√£o mais demandado:** "{freq_formacao.iloc[0]['Categoria']}" ({freq_formacao.iloc[0]['% Respondentes']}% dos respondentes).

4. **Consenso entre grupos:** A comunidade UFPE apresenta {'alto grau de alinhamento' if (len(diff_contextos) + len(diff_temas) + len(diff_formacao)) < 5 else 'algumas diverg√™ncias'} nas prioridades entre diferentes v√≠nculos institucionais.

---

## 6. ARQUIVOS GERADOS

| Arquivo | Descri√ß√£o |
|---------|----------|
| `{ARQUIVO_SAIDA_EXCEL}` | Tabelas de frequ√™ncia e rankings |
| `grafico_contextos_uso_etapa5.png` | Ranking dos contextos de uso |
| `grafico_temas_prioritarios_etapa5.png` | Ranking dos temas priorit√°rios |
| `grafico_tipos_formacao_etapa5.png` | Ranking dos tipos de forma√ß√£o |
| `grafico_comparativo_vinculo_etapa5.png` | Heatmaps comparativos por v√≠nculo |
| `grafico_painel_ranking_etapa5.png` | Painel consolidado Top 5 |
| `grafico_nuvens_palavras_etapa5.png` | Nuvens de palavras (se dispon√≠vel) |

---

*Relat√≥rio gerado automaticamente em {datetime.now().strftime("%d/%m/%Y √†s %H:%M")}*
"""

# Salvar relat√≥rio
with open(ARQUIVO_SAIDA_RELATORIO, "w", encoding='utf-8') as f:
    f.write(relatorio)

print(f"‚úÖ Relat√≥rio salvo em: {ARQUIVO_SAIDA_RELATORIO}")

In [None]:
print("\n" + "=" * 70)
print("ETAPA 5 CONCLU√çDA COM SUCESSO!")
print("=" * 70)
print(f"""
üìÅ ARQUIVOS GERADOS:

   üìä Dados:
      ‚Ä¢ {ARQUIVO_SAIDA_EXCEL}

   üìà Gr√°ficos:
      ‚Ä¢ grafico_contextos_uso_etapa5.png
      ‚Ä¢ grafico_temas_prioritarios_etapa5.png
      ‚Ä¢ grafico_tipos_formacao_etapa5.png
      ‚Ä¢ grafico_comparativo_vinculo_etapa5.png
      ‚Ä¢ grafico_painel_ranking_etapa5.png
      ‚Ä¢ grafico_nuvens_palavras_etapa5.png (se wordcloud dispon√≠vel)

   üìù Relat√≥rio:
      ‚Ä¢ {ARQUIVO_SAIDA_RELATORIO}

‚ñ∂Ô∏è  PR√ìXIMA ETAPA: Etapa 6 - An√°lise Qualitativa das Respostas Abertas
""")

---

## Resumo dos Arquivos

### Entrada
| Arquivo | Origem |
|---------|--------|
| `dados_limpos_etapa1.xlsx` | Etapa 1 |

### Sa√≠da
| Arquivo | Descri√ß√£o |
|---------|----------|
| `multipla_escolha_etapa5.xlsx` | Tabelas de frequ√™ncia e rankings (at√© 9 abas) |
| `grafico_contextos_uso_etapa5.png` | Ranking dos contextos de uso de IA |
| `grafico_temas_prioritarios_etapa5.png` | Ranking dos temas priorit√°rios |
| `grafico_tipos_formacao_etapa5.png` | Ranking dos tipos de forma√ß√£o |
| `grafico_comparativo_vinculo_etapa5.png` | Heatmaps comparativos por v√≠nculo |
| `grafico_painel_ranking_etapa5.png` | Painel consolidado com Top 5 |
| `grafico_nuvens_palavras_etapa5.png` | Nuvens de palavras (opcional) |
| `relatorio_multipla_escolha_etapa5.md` | Relat√≥rio completo com rankings |

---

**Pr√≥xima etapa:** Etapa 6 - An√°lise Qualitativa das Respostas Abertas