<a href="https://colab.research.google.com/github/Bgalucio/fase1_prog_dados1/blob/main/Fase_1_Bruno_GalucioVF.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [2]:
import csv
import random
import math
import doctest

class SteamGamesDatabase:
    def __init__(self, file_path):
        self.file_path = file_path
        self.data = self.read_data()

    def read_data(self):
        with open(self.file_path, newline='', encoding='utf-8') as file:
            reader = csv.DictReader(file)
            return list(reader)

    def get_random_sample(self, sample_size=20):
        return random.sample(self.data, sample_size)

    def save_sample_to_csv(self, sample, file_path):
        with open(file_path, 'w', newline='', encoding='utf-8') as sample_file:
            headers = sample[0].keys()
            writer = csv.DictWriter(sample_file, fieldnames=headers)
            writer.writeheader()
            writer.writerows(sample)

    def calculate_metrics(self, sample):
        percentage_free_and_paid = self.percentage_free_and_paid(sample)
        most_common_years = self.most_common_release_year(sample)
        average_compatible_games = self.average_compatible_games(sample)

        return percentage_free_and_paid, most_common_years, average_compatible_games

    @staticmethod
    def percentage_free_and_paid(games):
        """
        Calculate the percentage of free and paid games.

        >>> games = [{'Price': '0.00'}, {'Price': '4.99'}, {'Price': '0.00'}, {'Price': '9.99'}]
        >>> SteamGamesDatabase.percentage_free_and_paid(games)
        {'free': 50.0, 'paid': 50.0}
        """
        total_games = len(games)
        free_to_play = sum(1 for game in games if float(game['Price'].replace(',', '.')) == 0)
        paid = total_games - free_to_play
        return {'free': (free_to_play / total_games) * 100, 'paid': (paid / total_games) * 100}

    @staticmethod
    def most_common_release_year(games):
        """
        Find the most common release year.

        >>> games = [{'Release date': '01/01/2022'}, {'Release date': '01/01/2021'}, {'Release date': '01/01/2022'}, {'Release date': '01/01/2020'}]
        >>> SteamGamesDatabase.most_common_release_year(games)
        ['2022']
        """
        years_count = {}
        max_count = 0

        for game in games:
            year = game['Release date'][-4:]
            years_count[year] = years_count.get(year, 0) + 1
            if years_count[year] > max_count:
                max_count = years_count[year]

        most_common_years = [year for year, count in years_count.items() if count == max_count]
        return most_common_years


    @staticmethod
    def average_compatible_games(games):
      """
      Calculates the average percentage of games compatible with Windows, Mac, and Linux.

      >>> games = [
      ...     {'Windows': 'True', 'Mac': 'False', 'Linux': 'True'},
      ...     {'Windows': 'True', 'Mac': 'True', 'Linux': 'False'},
      ...     {'Windows': 'False', 'Mac': 'True', 'Linux': 'True'}
      ... ]
      >>> result = SteamGamesDatabase.average_compatible_games(games)
      >>> result['Windows'] == 66.67 and result['Mac'] == 66.67 and result['Linux'] == 66.67
      True
      """
      total_games = len(games)
      total_compatible_windows = sum(1 for game in games if game['Windows'] == 'True')
      total_compatible_mac = sum(1 for game in games if game['Mac'] == 'True')
      total_compatible_linux = sum(1 for game in games if game['Linux'] == 'True')

      average_compatible_windows = (total_compatible_windows / total_games) * 100
      average_compatible_mac = (total_compatible_mac / total_games) * 100
      average_compatible_linux = (total_compatible_linux / total_games) * 100

      return {'Windows': average_compatible_windows, 'Mac': average_compatible_mac, 'Linux': average_compatible_linux}


# Exemplo de uso:
steam_games = SteamGamesDatabase('/content/sample_data/steam_games.csv')

# Base completa
full_data = steam_games.read_data()

# Amostra de 20 jogos aleatórios
sample = steam_games.get_random_sample()

# Salvar amostra em arquivo CSV
sample_file_path = '/content/sample_data/amostras.csv'
steam_games.save_sample_to_csv(sample, sample_file_path)

# Calcular as métricas para a amostra
percentage_free_and_paid_sample, most_common_years_sample, average_compatible_games_sample = steam_games.calculate_metrics(sample)

# Calcular as mesmas métricas para a base completa
percentage_free_and_paid, most_common_years, average_compatible_games = steam_games.calculate_metrics(full_data)

# Saída dos resultados da amostragem
print("Resultados sobre a amostragem:")
print("Percentual de jogos gratuitos na amostragem:", f"{percentage_free_and_paid_sample['free']:.2f}%")
print("Percentual de jogos pagos na amostragem:", f"{percentage_free_and_paid_sample['paid']:.2f}%")
print("Ano(s) com maior número de jogos na amostragem:", most_common_years_sample)
print("Média de jogos compatíveis com Windows na amostragem:", f"{average_compatible_games_sample['Windows']:.2f}%")
print("Média de jogos compatíveis com Mac na amostragem:", f"{average_compatible_games_sample['Mac']:.2f}%")
print("Média de jogos compatíveis com Linux na amostragem:", f"{average_compatible_games_sample['Linux']:.2f}%")

# Saída dos resultados da base completa
print("\nResultados sobre a base completa:")
print("Percentual de jogos gratuitos na base completa:", f"{percentage_free_and_paid['free']:.2f}%")
print("Percentual de jogos pagos na base completa:", f"{percentage_free_and_paid['paid']:.2f}%")
print("Ano(s) com maior número de jogos na base completa:", most_common_years)
print("Média de jogos compatíveis com Windows na base completa:", f"{average_compatible_games['Windows']:.2f}%")
print("Média de jogos compatíveis com Mac na base completa:", f"{average_compatible_games['Mac']:.2f}%")
print("Média de jogos compatíveis com Linux na base completa:", f"{average_compatible_games['Linux']:.2f}%")

Resultados sobre a amostragem:
Percentual de jogos gratuitos na amostragem: 15.00%
Percentual de jogos pagos na amostragem: 85.00%
Ano(s) com maior número de jogos na amostragem: ['2021']
Média de jogos compatíveis com Windows na amostragem: 100.00%
Média de jogos compatíveis com Mac na amostragem: 20.00%
Média de jogos compatíveis com Linux na amostragem: 15.00%

Resultados sobre a base completa:
Percentual de jogos gratuitos na base completa: 17.39%
Percentual de jogos pagos na base completa: 82.61%
Ano(s) com maior número de jogos na base completa: ['2022']
Média de jogos compatíveis com Windows na base completa: 99.96%
Média de jogos compatíveis com Mac na base completa: 20.16%
Média de jogos compatíveis com Linux na base completa: 13.82%
