# Mineração de Regras de Associação do Dataset SAGE
_Refinamento e busca de padrões para desenvolvimento de experiências gamificadas_

Para o primeiro trabalho da disciplina de Inteligência Computacional, devemos selecionar um dataset público para mineração de dados resultando na coleta de regras de associação.

O dataset utilizado foi publicado através de uma pesquisa com o intuito de ampliar a base de dados ligadas a jogos gamificados com o propósito de analisar as preferências de usuários e como enchergam diversas características ligadas ao game design.

## Link para publicação
[SAGE: A dataset for Smart Adaptive Gamified Education](https://sol.sbc.org.br/index.php/sbie/article/view/26738/26557)

O [dataset original](https://github.com/ArmandoToda/Paper_SBIE2023) pode ser encontrado no repositório do autor no github.

__Essa documentação também está disponível no [documento jupyter](SAGEMining.ipynb)__

# Metodologia
Criei o repositório e arquivo jupyter para executar as etapas de mineração necessárias para busca de regras de associação:

## Definição de variáveis para operação do projeto

In [4]:
import os
import pandas as pd
import requests

csv_filename = "SAGEDataset.csv"
# URL do arquivo XLSX no GitHub
xlsx_url = "https://github.com/ArmandoToda/Paper_SBIE2023/raw/main/DATA.xlsx"
# Nome temporário para o arquivo XLSX baixado
xlsx_filename = "DATA.xlsx"

## Obtenção do dataset

In [7]:
if not os.path.exists("assets/"+csv_filename):
    print(f"{csv_filename} não encontrado. Baixando e convertendo...")
    
    # Baixa o arquivo XLSX
    response = requests.get(xlsx_url)
    if response.status_code == 200:
        with open(xlsx_filename, "wb") as file:
            file.write(response.content)
        print(f"Arquivo baixado: {xlsx_filename}")
    else:
        raise Exception(f"Falha ao baixar o arquivo. Status code: {response.status_code}")
    
    """Converte um arquivo XLSX para CSV."""
    try:
        data = pd.read_excel(xlsx_filename)
        data.to_csv("assets/"+csv_filename, index=False)
        print(f"Arquivo convertido para CSV: {csv_filename}")
    except Exception as e:
        raise Exception(f"Erro ao converter XLSX para CSV: {e}")
    
    # Remove o arquivo XLSX temporário
    if os.path.exists(xlsx_filename):
        os.remove(xlsx_filename)
        print(f"Arquivo temporário removido: {xlsx_filename}")
else:
    print(f"{csv_filename} já existe. Nenhuma ação necessária.")

SAGEDataset.csv não encontrado. Baixando e convertendo...
Arquivo baixado: DATA.xlsx
Arquivo convertido para CSV: SAGEDataset.csv
Arquivo temporário removido: DATA.xlsx


## Preparação dos dados (em desenvolvimento)

In [10]:
try:
    df = pd.read_csv("assets/"+csv_filename)  # Use csv_filename em vez de file_path
    print("Primeiras linhas do dataset:")
    print(df.head())  # Exibe as primeiras linhas do DataFrame
    print("\nInformações do dataset:")
    print(df.info())  # Exibe informações sobre o DataFrame
except Exception as e:
    print(f"Erro ao carregar o arquivo CSV: {e}")

Primeiras linhas do dataset:
   gender age_group  age_in_years         country  years_playing  \
0    Male   25 - 34            31  United Kingdom             25   
1    Male       <15            14   United States              6   
2  Female   15 - 24            23   United States             10   
3    Male   15 - 24            20          Brazil             18   
4    Male   15 - 24            20          Brazil             17   

   time_per_week                                         game_genre  \
0             30  Action: emphasizes physical challenges, includ...   
1             30  Action: emphasizes physical challenges, includ...   
2              5  Action: emphasizes physical challenges, includ...   
3             15  Action: emphasizes physical challenges, includ...   
4              4  Action: emphasizes physical challenges, includ...   

                              game_setting  points  levels  ...  \
0              Singleplayer (Playing solo)       4       5  ...   
1

## Execução do algoritmo apriori (em desenvolvimento)