<a href="https://colab.research.google.com/github/rafazardo/Projeto-Final-INF721/blob/main/Colab/game_quest_generator_neural_network_v3.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Depêndencias

In [3]:
import pandas as pd
import io
import requests
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import Dataset, DataLoader
from sklearn.model_selection import train_test_split
from nltk.tokenize import word_tokenize
import nltk
nltk.download('punkt')  # Make sure you have the necessary NLTK resources

 # Controle de Logs

**Classe Log**

A classe Log possui um método estático chamado upload_datasets. Esse método recebe um nome de arquivo e uma lista de objetos da classe Dataset. Ele cria um arquivo com o nome fornecido e registra informações sobre cada dataset nesse arquivo. Especificamente, para cada dataset na lista, o método escreve o nome do jogo e as primeiras linhas do DataFrame no arquivo.

In [16]:
#@title Classes da Secão

class Log:
    @staticmethod

    def upload_datasets(nome_arquivo, datasets):
      """
      Gera um log em um arquivo contendo informações sobre os datasets.

      Parâmetros:
      - nome_arquivo (str): Nome do arquivo para salvar o log.
      - datasets (list): Lista de objetos da classe Dataset.
      """

      with open(nome_arquivo, "w") as file:
        for dataset in datasets:
          file.write(f"Nome: {dataset.nome}\n")
          file.write("DataFrame:\n")
          file.write(f"{dataset.df.head()}\n\n")

    def tokenized_text(nome_arquivo, datasets):
      """
      Gera um log em um arquivo contendo informações sobre os textos tokenizados.

      Parâmetros:
      - nome_arquivo (str): Nome do arquivo para salvar o log.
      - datasets (list): Lista de objetos da classe Dataset.
      """

      with open(nome_arquivo, "w") as file:
        for dataset in datasets:
          file.write(f"Nome: {dataset.nome}\n")
          file.write("Tokenized Text:\n")
          tokenized_text = dataset.tokenize_text()

          for idx, tokens in enumerate(tokenized_text):
            file.write(f"Sample {idx + 1} - Tokens: {tokens}\n")
            file.write("\n")

# Upload Datasets


**Classe Dataset**

A classe Dataset tem um construtor (__init__) que recebe o nome do jogo e a URL do arquivo CSV contendo os dados do jogo. A função carregar_dataset na classe é responsável por realizar o download do dataset da URL fornecida e criar um DataFrame Pandas com esses dados.

**Criação de Instâncias e Geração de Log**

A célula continua criando uma lista de jogos e URLs correspondentes a arquivos CSV no GitHub. Em seguida, são criados objetos da classe Dataset para cada jogo na lista, associando o nome do jogo e a URL do dataset.

Finalmente, a função upload_datasets da classe Log é chamada para criar um log chamado "log_upload_dataset", registrando informações sobre os datasets recém-criados.

In [46]:
#@title Classes da Secão
class Dataset:
  def __init__(self, nome, url):
    """
    Classe para representar um conjunto de dados de um jogo.

    Parâmetros:
    - nome (str): Nome do jogo.
    - url (str): URL do arquivo CSV contendo os dados do jogo.
    """

    self.nome = nome
    self.url = url
    self.df = self.carregar_dataset()
    self.tokenized_text = self.tokenize_text()

  def carregar_dataset(self):
    """
    Carrega o conjunto de dados a partir da URL fornecida.

    Retorna:
    - pd.DataFrame: DataFrame contendo os dados do jogo.
    """

    response = requests.get(self.url)
    return pd.read_csv(io.StringIO(response.text))

  def tokenize_text(self):
    """
    Retorna o dataset tokenizado

    Retorna:
    - tokenized_text: Array com os textos tokenizados
    """

    return [word_tokenize(text.lower()) for text in self.df['Dialogue']]

In [47]:
#@title Main da Seção

# Lista de jogos e URLs dos arquivos CSV no GitHub
jogos = [
  "Chrono Trigger",
  "Final Fantasy",
  "Star Wars Knights of the Old Republic",
  "The Elder Scrolls",
  "Torchlight II"
]

urls = [
  "https://raw.githubusercontent.com/rafazardo/Projeto-Final-INF721/main/Datasets/Chrono%20Trigger/dataset1_v1.csv",
  "https://raw.githubusercontent.com/rafazardo/Projeto-Final-INF721/main/Datasets/Final%20Fantasy/dataset2_v1.csv",
  "https://raw.githubusercontent.com/rafazardo/Projeto-Final-INF721/main/Datasets/Star%20Wars%20Knights%20of%20the%20Old%20Republic/dataset3_v3.csv",
  "https://raw.githubusercontent.com/rafazardo/Projeto-Final-INF721/main/Datasets/The%20Elder%20Scrolls/dataset4_v2.csv",
  "https://raw.githubusercontent.com/rafazardo/Projeto-Final-INF721/main/Datasets/Torchlight%20II/dataset5_v3.csv"
]

# Criar objetos da classe JogoDataset
datasets = [Dataset(nome, url) for nome, url in zip(jogos, urls)]

# Cria log da aplicação para debug
Log.upload_datasets("log_upload_dataset", datasets)
Log.tokenized_text("log_tokenized_text", datasets)