<a href="https://colab.research.google.com/github/dudablancoo/dudablancoo.github.io/blob/main/jogosDigitaisEstudo.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Conexão

Conectando o meu notebook colab ao meu drive para acessar o arquivo steam_games.csv

In [87]:
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


#Importanto CSV e lendo o arquivo

Optei por ler as primeiras 5 linhas do arquivo para identificar os dados

In [96]:
import csv

arquivo_csv = '/content/drive/MyDrive/analiseExploratoriaJogos/steam_games.csv'

with open(arquivo_csv, newline='') as csvfile:
    reader = csv.reader(csvfile)

    for i, row in enumerate(reader):
        print(row)
        if i == 5:
            break

['AppID', 'Name', 'Release date', 'Estimated owners', 'Peak CCU', 'Required age', 'Price', 'DLC count', 'About the game', 'Supported languages', 'Full audio languages', 'Reviews', 'Header image', 'Website', 'Support url', 'Support email', 'Windows', 'Mac', 'Linux', 'Metacritic score', 'Metacritic url', 'User score', 'Positive', 'Negative', 'Score rank', 'Achievements', 'Recommendations', 'Notes', 'Average playtime forever', 'Average playtime two weeks', 'Median playtime forever', 'Median playtime two weeks', 'Developers', 'Publishers', 'Categories', 'Genres', 'Tags', 'Screenshots', 'Movies']
['20200', 'Galactic Bowling', 'Oct 21, 2008', '0 - 20000', '0', '0', '19.99', '0', 'Galactic Bowling is an exaggerated and stylized bowling game with an intergalactic twist. Players will engage in fast-paced single and multi-player competition while being submerged in a unique new universe filled with over-the-top humor, wild characters, unique levels, and addictive game play. The title is aimed at

#Respondendo as perguntas


1.  Qual o percentual de jogos gratuitos e pagos na plataforma?

2.   Qual o ano com o maior número de novos jogos? Em caso de empate, retorne uma lista com os anos empatados.

3. Qual a média de lançamentos de jogos por mês considerando todos os anos?




In [101]:
from collections import defaultdict
from datetime import datetime

class ContadorCSV:
    """Classe para contar linhas e calcular percentuais de
    jogos gratuitos e pagos."""

    def __init__(self, arquivo_csv):
        self.arquivo_csv = arquivo_csv

    def contar_linhas(self):
      """Conta o total de linhas no arquivo CSV. Uitilizei por
      curiosidade para ver o programa rodava do jeito que esperava"""

      with open(self.arquivo_csv, newline='') as csvfile:
            leitor = csv.reader(csvfile)
            return sum(1 for _ in leitor)

    def percentual_jogos_gratuitos_pagos(self):
        """Calcula o percentual de jogos gratuitos e pagos."""
        total_jogos = jogos_gratuitos = jogos_pagos = 0

        with open(self.arquivo_csv, newline='') as csvfile:
            leitor = csv.reader(csvfile)
            next(leitor)
            for linha in leitor:
                total_jogos += 1
                try:
                    preco = float(linha[7])
                    if preco == 0.0:
                        jogos_gratuitos += 1
                    elif preco > 0.0:
                        jogos_pagos += 1
                except (ValueError, IndexError):
                    continue

        if total_jogos == 0:
            return (0, 0)
        return (jogos_gratuitos / total_jogos * 100, jogos_pagos / total_jogos * 100)


class ContadorJogosPorAno:
    """Classe para contar jogos lançados por ano."""

    def __init__(self, arquivo_csv):
        self.arquivo_csv = arquivo_csv

    def contar_jogos_por_ano(self):
        """Conta jogos por ano a partir da data."""
        jogos_por_ano = defaultdict(int)

        with open(self.arquivo_csv, newline='') as csvfile:
            leitor = csv.reader(csvfile)
            next(leitor)
            for linha in leitor:
                try:
                    data = datetime.strptime(linha[2], '%b %d, %Y')
                    jogos_por_ano[data.year] += 1
                except (ValueError, IndexError):
                    continue

        return jogos_por_ano

    def ano_com_maior_numero_de_jogos(self):
        """Encontra o ano com mais jogos lançados."""
        jogos_por_ano = self.contar_jogos_por_ano()
        if not jogos_por_ano:
            return None

        maior_numero = max(jogos_por_ano.values())
        anos = [ano for ano, count in jogos_por_ano.items() if count == maior_numero]

        return anos, maior_numero


class ContadorJogosPorMes:
    """Classe para contar jogos lançados por mês."""

    def __init__(self, arquivo_csv):
        self.arquivo_csv = arquivo_csv

    def contar_jogos_por_mes(self):
        """Conta jogos lançados por mês."""
        jogos_por_mes = defaultdict(int)

        with open(self.arquivo_csv, newline='') as csvfile:
            leitor = csv.reader(csvfile)
            next(leitor)
            for linha in leitor:
                try:
                    data = datetime.strptime(linha[2], '%b %d, %Y')
                    jogos_por_mes[data.strftime('%Y-%m')] += 1
                except (ValueError, IndexError):
                    continue

        return jogos_por_mes

    def media_lancamentos_por_mes(self):
        """Calcula a média de lançamentos de jogos por mês."""
        jogos_por_mes = self.contar_jogos_por_mes()
        if not jogos_por_mes:
            return 0

        return sum(jogos_por_mes.values()) / len(jogos_por_mes)


if __name__ == "__main__":
    arquivo = arquivo_csv


    contador_csv = ContadorCSV(arquivo)
    numero_de_linhas = contador_csv.contar_linhas()
    percentuais = contador_csv.percentual_jogos_gratuitos_pagos()

    print(f'O arquivo contém {numero_de_linhas} linhas.')
    print(f'Percentual de jogos gratuitos: {percentuais[0]:.2f}%')
    print(f'Percentual de jogos pagos: {percentuais[1]:.2f}%')

    contador_ano = ContadorJogosPorAno(arquivo)
    anos_empate, numero_de_jogos = contador_ano.ano_com_maior_numero_de_jogos()
    if anos_empate:
        print(f'O(s) ano(s) com o maior número de novos jogos: {", ".join(map(str, anos_empate))} ({numero_de_jogos} jogos).')
    else:
        print('Nenhum jogo encontrado.')

    contador_mes = ContadorJogosPorMes(arquivo)
    media_lancamentos = contador_mes.media_lancamentos_por_mes()
    print(f'A média de lançamentos de jogos por mês é: {media_lancamentos:.0f} jogos.')


O arquivo contém 72935 linhas.
Percentual de jogos gratuitos: 84.99%
Percentual de jogos pagos: 15.01%
O(s) ano(s) com o maior número de novos jogos: 2022 (13951 jogos).
A média de lançamentos de jogos por mês é: 312 jogos.


#Testes

Realizando testes com amostras.


In [102]:
import csv
import random

arquivo_csv = '/content/drive/MyDrive/analiseExploratoriaJogos/steam_games.csv'

def criar_amostra(arquivo_csv, arquivo_amostra, tamanho_amostra=20):
    with open(arquivo_csv, newline='') as csvfile:
        leitor = list(csv.reader(csvfile))
        header = leitor[0]
        jogos = leitor[1:]


        jogos_selecionados = random.sample(jogos[20:], tamanho_amostra)

    with open(arquivo_amostra, 'w', newline='') as csvfile:
        escritor = csv.writer(csvfile)
        escritor.writerow(header)
        escritor.writerows(jogos_selecionados)


class ContadorCSV:
    """Classe para contar linhas e calcular percentuais de jogos gratuitos e pagos."""
    def __init__(self, arquivo_csv):
        self.arquivo_csv = arquivo_csv

    def contar_linhas(self):
        """Conta o total de linhas no arquivo CSV."""
        with open(self.arquivo_csv, newline='') as csvfile:
            leitor = csv.reader(csvfile)
            return sum(1 for _ in leitor)

    def percentual_jogos_gratuitos_pagos(self):
        """Calcula o percentual de jogos gratuitos e pagos."""
        total_jogos = jogos_gratuitos = jogos_pagos = 0

        with open(self.arquivo_csv, newline='') as csvfile:
            leitor = csv.reader(csvfile)
            next(leitor)
            for linha in leitor:
                total_jogos += 1
                try:
                    preco = float(linha[7])
                    if preco == 0:
                        jogos_gratuitos += 1
                    elif preco > 0:
                        jogos_pagos += 1
                except (ValueError, IndexError):
                    continue

        if total_jogos == 0:
            return (0, 0)
        return (jogos_gratuitos / total_jogos * 100, jogos_pagos / total_jogos * 100)

    def testar_percentual_jogos_gratuitos_pagos(self, jogos_gratuitos_esperado, jogos_pagos_esperado):
        percentuais = self.percentual_jogos_gratuitos_pagos()
        assert round(percentuais[0], 2) == round(jogos_gratuitos_esperado, 2), f"Esperado: {jogos_gratuitos_esperado}, Obtido: {percentuais[0]}"
        assert round(percentuais[1], 2) == round(jogos_pagos_esperado, 2), f"Esperado: {jogos_pagos_esperado}, Obtido: {percentuais[1]}"


if __name__ == "__main__":
    arquivo_amostra = 'amostra_jogos.csv'


    criar_amostra(arquivo_csv, arquivo_amostra)


    contador_csv = ContadorCSV(arquivo_amostra)


    numero_de_linhas = contador_csv.contar_linhas()
    percentuais = contador_csv.percentual_jogos_gratuitos_pagos()

    print(f'O arquivo contém {numero_de_linhas} linhas.')
    print(f'Percentual de jogos gratuitos: {percentuais[0]:.2f}%')
    print(f'Percentual de jogos pagos: {percentuais[1]:.2f}%')


    jogos_gratuitos_esperado = 80.0
    jogos_pagos_esperado = 20.0
    contador_csv.testar_percentual_jogos_gratuitos_pagos(jogos_gratuitos_esperado, jogos_pagos_esperado)



O arquivo contém 21 linhas.
Percentual de jogos gratuitos: 75.00%
Percentual de jogos pagos: 25.00%


AssertionError: Esperado: 80.0, Obtido: 75.0