In [9]:
import json
import pandas as pd
from collections import defaultdict
from google.colab import files
import io

def carregar_dados():
    """Carrega os arquivos JSON necess√°rios para a an√°lise via upload no Google Colab"""

    print("üìÅ UPLOAD DOS ARQUIVOS JSON")
    print("=" * 50)
    print("Por favor, fa√ßa upload dos seguintes arquivos:")
    print("1. opinion_survey_users.json")
    print("2. opinion_survey_responses.json")
    print("3. metric-groups.json")
    print("\nüîÑ Iniciando upload...")

    # Upload dos arquivos
    uploaded = files.upload()

    print(f"\nüìã Arquivos recebidos: {list(uploaded.keys())}")

    # Fun√ß√£o para encontrar arquivo por padr√£o de nome
    def encontrar_arquivo(pattern, uploaded_files):
        for filename in uploaded_files.keys():
            if pattern in filename.lower():
                return filename
        return None

    # Buscar arquivos pelos padr√µes de nome (ignorando numera√ß√£o do Colab)
    users_file = encontrar_arquivo('opinion_survey_users', uploaded)
    responses_file = encontrar_arquivo('opinion_survey_responses', uploaded)
    metrics_file = encontrar_arquivo('metric-groups', uploaded) or encontrar_arquivo('metric_groups', uploaded)

    # Verificar se todos foram encontrados
    missing = []
    if not users_file:
        missing.append('opinion_survey_users.json')
    if not responses_file:
        missing.append('opinion_survey_responses.json')
    if not metrics_file:
        missing.append('metric-groups.json')

    if missing:
        print(f"‚ùå Arquivos n√£o encontrados: {missing}")
        print("üìã Arquivos dispon√≠veis:", list(uploaded.keys()))
        raise FileNotFoundError(f"Arquivos faltando: {missing}")

    print("‚úÖ Todos os arquivos foram identificados com sucesso!")
    print(f"‚úì Usu√°rios: {users_file}")
    print(f"‚úì Respostas: {responses_file}")
    print(f"‚úì M√©tricas: {metrics_file}")
    print("\nüìä Processando dados...")

    # Carregar e processar cada arquivo
    try:
        # Carregar dados dos usu√°rios
        users_content = uploaded[users_file]
        users = json.loads(users_content.decode('utf-8'))
        print(f"‚úì Usu√°rios carregados: {len(users)} registros")

        # Carregar respostas da pesquisa
        responses_content = uploaded[responses_file]
        responses = json.loads(responses_content.decode('utf-8'))
        print(f"‚úì Respostas carregadas: {len(responses)} registros")

        # Carregar grupos de m√©tricas
        metrics_content = uploaded[metrics_file]
        metric_groups = json.loads(metrics_content.decode('utf-8'))
        print(f"‚úì Grupos de m√©tricas carregados: {len(metric_groups)} grupos")

        print("\nüéâ Dados carregados com sucesso!\n")

        return users, responses, metric_groups

    except json.JSONDecodeError as e:
        raise ValueError(f"‚ùå Erro ao decodificar JSON: {e}")
    except Exception as e:
        raise Exception(f"‚ùå Erro inesperado ao carregar dados: {e}")

def criar_mapeamentos(metric_groups):
    """Cria mapeamentos necess√°rios para an√°lise"""

    # Mapeamento ID -> Nome da m√©trica
    metric_id_to_name = {}
    metric_id_to_dimension = {}
    metric_id_to_indicator = {}

    for index, group in enumerate(metric_groups):
        metric_id = index + 1  # IDs come√ßam em 1
        metric_id_to_name[metric_id] = group['Nome']
        metric_id_to_dimension[metric_id] = group['Tipo']
        metric_id_to_indicator[metric_id] = group['Classifica√ß√£o']

    return metric_id_to_name, metric_id_to_dimension, metric_id_to_indicator

def analisar_selecoes_metricas(responses, metric_id_to_name, metric_id_to_dimension, metric_id_to_indicator):
    """Analisa as sele√ß√µes de m√©tricas pelos especialistas"""

    # Contadores
    metric_selection_count = defaultdict(int)
    dimension_counts = defaultdict(int)
    indicator_counts = defaultdict(int)

    total_responses = len(responses)

    # Processar cada resposta
    for response in responses:
        try:
            # Parse das m√©tricas selecionadas
            selected_metrics = json.loads(response['value'])

            for metric_id in selected_metrics:
                metric_id = int(metric_id)

                # Contar sele√ß√£o da m√©trica
                if metric_id in metric_id_to_name:
                    metric_selection_count[metric_id] += 1

                    # Contar por dimens√£o
                    dimension = metric_id_to_dimension[metric_id]
                    dimension_counts[dimension] += 1

                    # Contar por indicador
                    indicator = metric_id_to_indicator[metric_id]
                    indicator_counts[indicator] += 1

        except (json.JSONDecodeError, ValueError, KeyError) as e:
            print(f"Erro ao processar resposta {response.get('id', 'unknown')}: {e}")
            continue

    return metric_selection_count, dimension_counts, indicator_counts, total_responses

def criar_ranking_metricas(metric_selection_count, metric_id_to_name, total_responses):
    """Cria ranking das m√©tricas por frequ√™ncia de sele√ß√£o"""

    ranking = []

    for metric_id, count in metric_selection_count.items():
        name = metric_id_to_name[metric_id]
        percentage = (count / total_responses) * 100

        ranking.append({
            'posicao': 0,  # Ser√° preenchido ap√≥s ordena√ß√£o
            'id': metric_id,
            'nome_metrica': name,
            'frequencia': count,
            'percentual': round(percentage, 2)
        })

    # Ordenar por frequ√™ncia (decrescente)
    ranking.sort(key=lambda x: x['frequencia'], reverse=True)

    # Adicionar posi√ß√µes
    for i, item in enumerate(ranking, 1):
        item['posicao'] = i

    return ranking

def main():
    """Fun√ß√£o principal que executa toda a an√°lise"""

    print("üöÄ AN√ÅLISE DA PESQUISA DE OPINI√ÉO")
    print("=" * 60)

    try:
        # 1. Carregar dados via upload
        users, responses, metric_groups = carregar_dados()

        # 2. Criar mapeamentos
        print("üîÑ Criando mapeamentos...")
        metric_id_to_name, metric_id_to_dimension, metric_id_to_indicator = criar_mapeamentos(metric_groups)
        print("‚úÖ Mapeamentos criados\n")

        # 3. Analisar sele√ß√µes
        print("üîç Analisando sele√ß√µes de m√©tricas...")
        metric_counts, dimension_counts, indicator_counts, total_responses = analisar_selecoes_metricas(
            responses, metric_id_to_name, metric_id_to_dimension, metric_id_to_indicator
        )
        print("‚úÖ An√°lise conclu√≠da\n")

        # 4. Criar ranking
        print("üìä Criando ranking de m√©tricas...")
        ranking = criar_ranking_metricas(metric_counts, metric_id_to_name, total_responses)
        print("‚úÖ Ranking criado\n")

        # 5. Criar DataFrames
        print("üìã Preparando resultados...")

        # DataFrame do ranking completo
        df_ranking = pd.DataFrame(ranking)

        # DataFrame de dimens√µes
        total_dimensions = sum(dimension_counts.values())
        df_dimensions = pd.DataFrame([
            {
                'dimensao': dim,
                'frequencia': count,
                'percentual': round((count/total_dimensions)*100, 2)
            }
            for dim, count in dimension_counts.items()
        ]).sort_values('frequencia', ascending=False)

        # DataFrame de indicadores
        total_indicators = sum(indicator_counts.values())
        df_indicators = pd.DataFrame([
            {
                'indicador': ind,
                'frequencia': count,
                'percentual': round((count/total_indicators)*100, 2)
            }
            for ind, count in indicator_counts.items()
        ]).sort_values('frequencia', ascending=False)

        print("‚úÖ DataFrames criados\n")

        # 6. Exibir resultados
        print("=" * 60)
        print("üìà RESULTADOS DA AN√ÅLISE")
        print("=" * 60)

        print(f"\nüìä RESUMO GERAL")
        print(f"Total de respostas v√°lidas: {total_responses}")
        print(f"Total de sele√ß√µes analisadas: {sum(metric_counts.values())}")

        print(f"\nüèÜ RANKING DE M√âTRICAS POR FREQU√äNCIA:")
        print(df_ranking[['posicao', 'nome_metrica', 'frequencia', 'percentual']].to_string(index=False))

        print(f"\nüìà DISTRIBUI√á√ÉO POR DIMENS√ïES:")
        print(df_dimensions.to_string(index=False))

        print(f"\nüìã DISTRIBUI√á√ÉO POR INDICADORES:")
        print(df_indicators.to_string(index=False))

        # Dados espec√≠ficos para disserta√ß√£o
        print(f"\n" + "=" * 60)
        print("üéØ DADOS PARA DISSERTA√á√ÉO")
        print("=" * 60)

        contributors_metric = ranking[0]
        social_data = df_dimensions[df_dimensions['dimensao'] == 'Social'].iloc[0]
        robustez_data = df_indicators[df_indicators['indicador'] == 'Robustez'].iloc[0]

        print(f"\nüéØ M√âTRICA PRIORIT√ÅRIA:")
        print(f"Contributors and Active Developers: {contributors_metric['frequencia']} sele√ß√µes ({contributors_metric['percentual']}%)")

        print(f"\nü§ù DIMENS√ÉO SOCIAL:")
        print(f"Social: {social_data['frequencia']} sele√ß√µes ({social_data['percentual']}%)")

        print(f"\nüõ°Ô∏è INDICADOR ROBUSTEZ:")
        print(f"Robustez: {robustez_data['frequencia']} sele√ß√µes ({robustez_data['percentual']}%)")

        return {
            'ranking_completo': df_ranking,
            'distribuicao_dimensoes': df_dimensions,
            'distribuicao_indicadores': df_indicators,
            'resumo': {
                'total_respostas': total_responses,
                'total_selecoes': sum(metric_counts.values()),
                'metrica_prioritaria': contributors_metric,
                'dimensao_social_pct': social_data['percentual'],
                'robustez_pct': robustez_data['percentual']
            }
        }

    except Exception as e:
        print(f"‚ùå ERRO DURANTE A AN√ÅLISE: {e}")
        print("\nüí° Dicas para resolver:")
        print("- Verifique se os arquivos JSON est√£o no formato correto")
        print("- Certifique-se de que enviou todos os 3 arquivos necess√°rios")
        print("- Tente executar novamente")
        return None

# Executar an√°lise
if __name__ == "__main__":
    # Instru√ß√£o de uso
    print("üéØ COMO USAR NO GOOGLE COLAB:")
    print("1. Execute esta c√©lula")
    print("2. Fa√ßa upload dos 3 arquivos JSON quando solicitado")
    print("3. Aguarde o processamento")
    print("4. Visualize os resultados\n")

    resultados = main()

    if resultados is not None:
        # Exemplos de como acessar os dados
        print(f"\n" + "=" * 60)
        print("üìö COMO USAR OS RESULTADOS")
        print("=" * 60)
        print("\n# Para acessar o ranking completo:")
        print("ranking = resultados['ranking_completo']")
        print("\n# Para acessar distribui√ß√£o por dimens√µes:")
        print("dimensoes = resultados['distribuicao_dimensoes']")
        print("\n# Para acessar top 5 m√©tricas:")
        print("top5 = resultados['ranking_completo'].head(5)")
        print("\n# Para ver apenas m√©tricas sociais:")
        print("# (voc√™ precisar√° cruzar com metric-groups.json)")
        print("\n# Para exportar resultados:")
        print("# resultados['ranking_completo'].to_csv('ranking_metricas.csv', index=False)")
        print("\n‚úÖ An√°lise conclu√≠da com sucesso!")
    else:
        print("\n‚ùå An√°lise n√£o p√¥de ser conclu√≠da. Tente novamente.")

üéØ COMO USAR NO GOOGLE COLAB:
1. Execute esta c√©lula
2. Fa√ßa upload dos 3 arquivos JSON quando solicitado
3. Aguarde o processamento
4. Visualize os resultados

üöÄ AN√ÅLISE DA PESQUISA DE OPINI√ÉO
üìÅ UPLOAD DOS ARQUIVOS JSON
Por favor, fa√ßa upload dos seguintes arquivos:
1. opinion_survey_users.json
2. opinion_survey_responses.json
3. metric-groups.json

üîÑ Iniciando upload...


Saving opinion_survey_responses.json to opinion_survey_responses (6).json
Saving opinion_survey_users.json to opinion_survey_users (6).json
Saving metric-groups.json to metric-groups (5).json

üìã Arquivos recebidos: ['opinion_survey_responses (6).json', 'opinion_survey_users (6).json', 'metric-groups (5).json']
‚úÖ Todos os arquivos foram identificados com sucesso!
‚úì Usu√°rios: opinion_survey_users (6).json
‚úì Respostas: opinion_survey_responses (6).json
‚úì M√©tricas: metric-groups (5).json

üìä Processando dados...
‚úì Usu√°rios carregados: 24 registros
‚úì Respostas carregadas: 316 registros
‚úì Grupos de m√©tricas carregados: 47 grupos

üéâ Dados carregados com sucesso!

üîÑ Criando mapeamentos...
‚úÖ Mapeamentos criados

üîç Analisando sele√ß√µes de m√©tricas...
‚úÖ An√°lise conclu√≠da

üìä Criando ranking de m√©tricas...
‚úÖ Ranking criado

üìã Preparando resultados...
‚úÖ DataFrames criados

üìà RESULTADOS DA AN√ÅLISE

üìä RESUMO GERAL
Total de respostas v√°lidas: 3