In [26]:
import csv

# Função para converter os valores da coluna "Preço" de string para float.
# Isso é necessário para permitir cálculos numéricos, como o percentual de jogos gratuitos.
def converter_preco_para_float(preco):
    try:
        # Remove símbolos de moeda, como '$', e converte o valor "Free" para 0.
        return float(preco.replace('$', '').replace('Free', '0'))
    except ValueError:
        # Se houver algum problema na conversão, retorna null (ou none como preferir) para indicar a falha.
        return None

# Carrega os dados do arquivo CSV em uma lista de dicionários.
# Cada linha do CSV será um dicionário, com as chaves sendo os nomes das colunas.
with open(R'C:\Users\rodri\Desktop\codigos\puc\projeto1\steam_games.csv', newline='', encoding='utf-8') as csvfile:
    reader = csv.DictReader(csvfile)
    # Armazena todos os dados do CSV em uma lista chamada dados_steam.
    dados_steam = [row for row in reader]



In [None]:
# Converte os valores da coluna "Preço" para float usando a função definida anteriormente.
# Isso é feito para cada jogo (cada linha) nos dados carregados.
for jogo in dados_steam:
    jogo['Price'] = converter_preco_para_float(jogo['Price'])

# Classe para encapsular a lógica de análise dos dados dos jogos da Steam.
# Essa abordagem organiza o código e facilita o reuso e a manutenção.
class AnaliseDadosSteam:
    def __init__(self, dados): #conceito apresentado na Aula 02 parte 3 
        """
        Inicializa a classe AnaliseDadosSteam com os dados fornecidos.
        Parâmetros:
        - dados: Lista de dicionários contendo os dados dos jogos.
        """
        self.dados = dados
    
    def calcular_percentual_gratuitos_pagos(self):
        """ 
        Pergunta 1: Qual o percentual de jogos gratuitos e pagos?
        --
        Calcula o percentual de jogos gratuitos e pagos na plataforma.
        Retorna:
        - Uma tupla contendo o percentual de jogos gratuitos e o percentual de jogos pagos.
        """
        # Calcula o número total de jogos na lista de dados.
        total_jogos = len(self.dados)
        
        # Conta quantos jogos têm o preço igual a 0 (ou seja, são gratuitos).
        jogos_gratuitos = sum(1 for jogo in self.dados if jogo['Price'] == 0)
        
        # Calcula o percentual de jogos gratuitos.
        percentual_gratuitos = (jogos_gratuitos / total_jogos) * 100
        
        # Calcula o percentual de jogos pagos subtraindo o percentual de gratuitos de 100%.
        percentual_pagos = 100 - percentual_gratuitos
        
        # Retorna os percentuais calculados como uma tupla.
        return percentual_gratuitos, percentual_pagos

    def ano_mais_popular(self):
        """
        Pergunta 2: Qual o ano com maior número de lançamento de jogos?
        --
        Retorna o(s) ano(s) com o maior número de lançamentos de jogos.
        Em caso de empate, retorna uma lista com todos os anos empatados.
        """
        from collections import Counter
        
        # Extrai os anos de lançamento dos jogos.
        # O ano é obtido ao separar a data de lançamento (que é uma string) e pegar o último elemento.
        anos_lancamento = [jogo['Release date'].split()[-1] for jogo in self.dados if jogo['Release date']]
        
        # Conta a frequência de cada ano usando o Counter, que retorna um dicionário.
        contagem_anos = Counter(anos_lancamento)
        
        # Encontra o valor máximo de lançamentos em um ano.
        max_contagem = max(contagem_anos.values())
        
        # Cria uma lista dos anos que têm o mesmo número máximo de lançamentos.
        anos_mais_populares = [ano for ano, contagem in contagem_anos.items() if contagem == max_contagem]
        
        # Retorna a lista dos anos com o maior número de lançamentos.
        return anos_mais_populares

    def tempo_medio_jogo(self):
        """ 
        Pergunta: Qual o tempo médio de jogo em minutos para cada jogo?
        --
        Calcula o tempo médio de jogo (em minutos) para todos os jogos que têm esse dado disponível.
        Retorna:
        - O tempo médio de jogo em minutos.
        """
        tempo_total_jogo = 0  # Inicializa a soma do tempo de jogo.
        contagem = 0  # Inicializa a contagem de jogos com tempo de jogo disponível.
        
        # Itera por cada jogo nos dados.
        for jogo in self.dados:
            try:
                # Tenta converter o tempo de jogo para float.
                tempo_jogo = float(jogo['Average playtime forever'])
                tempo_total_jogo += tempo_jogo  # Adiciona o tempo de jogo ao total.
                contagem += 1  # Incrementa a contagem de jogos válidos.
            except ValueError:
                # Se o valor não for um número, ignora e continua.
                continue
        
        # Calcula a média de tempo de jogo dividindo o total pelo número de jogos válidos.
        # Se não houver jogos válidos (contagem = 0), retorna 0.
        tempo_medio_jogo = tempo_total_jogo / contagem if contagem > 0 else 0
        
        # Retorna o tempo médio de jogo em minutos.
        return tempo_medio_jogo

# Instancia a classe AnaliseDadosSteam com os dados carregados.
analista = AnaliseDadosSteam(dados_steam)

# Chama o método para calcular o percentual de jogos gratuitos e pagos.
percentual_gratuitos_pagos = analista.calcular_percentual_gratuitos_pagos()

# Chama o método para encontrar o(s) ano(s) com o maior número de lançamentos.
anos_mais_populares = analista.ano_mais_popular()

# Chama o método para calcular o tempo médio de jogo.
tempo_medio_jogo = analista.tempo_medio_jogo()

# Exibe os resultados no console.
print(f"Percentual de jogos gratuitos e pagos: {percentual_gratuitos_pagos}")
print(f"Ano(s) com o maior número de lançamentos: {anos_mais_populares}")
print(f"Tempo médio de jogo (em minutos): {tempo_medio_jogo:.2f}")


In [9]:
# Formatando resultados
percentual_gratuitos, percentual_pagos = percentual_gratuitos_pagos
percentual_gratuitos_formatado = round(percentual_gratuitos, 1)  # Arredonda para 1 casa decimal
percentual_pagos_formatado = round(percentual_pagos, 1)  # Arredonda para 1 casa decimal

print(f"Percentual de jogos gratuitos: {percentual_gratuitos_formatado}%")
print(f"Percentual de jogos pagos: {percentual_pagos_formatado}%")
print(f"Ano(s) com o maior número de lançamentos: {anos_mais_populares}")
print(f"Tempo médio de jogo (em minutos): {tempo_medio_jogo:.2f}")


Percentual de jogos gratuitos: 17.4%
Percentual de jogos pagos: 82.6%
Ano(s) com o maior número de lançamentos: ['2022']
Tempo médio de jogo (em minutos): 117.33


In [27]:
'''testes '''

'testes '

In [28]:
#importando demais bibliotecas sem uso do Pandas
import random
import pytest

In [17]:
#Como não utilizei o Pandas, tentei resolver o problema com contas e formulas simples já que estou acostumado a lidar com dataframes. Porém, não consegui
#neste caso, realizar os testes. Achei interessante manter esse código para entender minha lógica.

# Funções para análise dos dados
def converter_preco_para_float(preco):
    try:
        return float(preco.replace('$', '').replace('Free', '0'))
    except ValueError:
        return None

class AnaliseDadosSteam:
    def __init__(self, dados):
        self.dados = dados
    
    def calcular_percentual_jogos_gratuitos_e_pagos(self):
        total_jogos = len(self.dados)
        jogos_gratuitos = sum(1 for jogo in self.dados if jogo['Price'] == 'Free')
        percentual_gratuitos = (jogos_gratuitos / total_jogos) * 100
        percentual_pagos = 100 - percentual_gratuitos
        return percentual_gratuitos, percentual_pagos

    def ano_com_mais_lancamentos(self):
        from collections import Counter
        anos_lancamento = [jogo['Release date'].split()[-1] for jogo in self.dados if jogo['Release date']]
        contagem_anos = Counter(anos_lancamento)
        max_contagem = max(contagem_anos.values())
        anos_mais_populares = [ano for ano, contagem in contagem_anos.items() if contagem == max_contagem]
        return anos_mais_populares

    def tempo_medio_jogo(self):
        tempo_total = 0
        contagem = 0
        for jogo in self.dados:
            try:
                tempo = float(jogo['Average playtime forever'])
                tempo_total += tempo
                contagem += 1
            except ValueError:
                continue
        tempo_medio = tempo_total / contagem if contagem > 0 else 0
        return tempo_medio

# Função para gerar a amostra
def gerar_amostra(caminho_arquivo_completo, caminho_arquivo_amostra):
    with open(caminho_arquivo_completo, newline='', encoding='utf-8') as csvfile:
        reader = csv.DictReader(csvfile)
        dados_completos = [linha for linha in reader]

    amostra = random.sample(dados_completos, 20)

    with open(caminho_arquivo_amostra, 'w', newline='', encoding='utf-8') as csvfile:
        fieldnames = dados_completos[0].keys()
        writer = csv.DictWriter(csvfile, fieldnames=fieldnames)
        writer.writeheader()
        writer.writerows(amostra)

# Função para testar o código
def testar_analise_dados(caminho_arquivo_amostra):
    with open(caminho_arquivo_amostra, newline='', encoding='utf-8') as csvfile:
        reader = csv.DictReader(csvfile)
        dados_amostra = [linha for linha in reader]

    analise_amostra = AnaliseDadosSteam(dados_amostra)
    percentual_amostra = analise_amostra.calcular_percentual_jogos_gratuitos_e_pagos()
    ano_amostra = analise_amostra.ano_com_mais_lancamentos()
    tempo_medio_amostra = analise_amostra.tempo_medio_jogo()

    # Atualize os valores esperados com base nos resultados obtidos
    assert round(percentual_amostra[0], 1) == 17.4, "Percentual de jogos gratuitos incorreto."
    assert round(percentual_amostra[1], 1) == 82.6, "Percentual de jogos pagos incorreto."
    assert ano_amostra == ['2022'], "Ano com o maior número de lançamentos incorreto."
    assert round(tempo_medio_amostra, 2) == 117.33, "Tempo médio de jogo incorreto."

# Caminho dos arquivos
caminho_arquivo_completo = 'C:\\Users\\rodri\\Desktop\\codigos\\puc\\projeto1\\steam_games.csv'
caminho_arquivo_amostra = 'C:\\Users\\rodri\\Desktop\\codigos\\puc\\projeto1\\steam_games_amostra.csv'

# Gerar amostra
gerar_amostra(caminho_arquivo_completo, caminho_arquivo_amostra)

# Testar com a amostra
testar_analise_dados(caminho_arquivo_amostra)

print("Os testes passaram com sucesso!")


AssertionError: Percentual de jogos gratuitos incorreto.

In [29]:
''' não obtive sucesso com esse teste acima'''

' não obtive sucesso com esse teste'

In [34]:
#novo teste - sucesso 

import csv
import random
from collections import Counter

In [37]:


# 1. Carregar os dados do arquivo CSV
# Usamos a função `open` para abrir o arquivo CSV em modo de leitura ('r'), especificando o encoding como 'utf-8'.
# Em seguida, usamos `csv.DictReader` para ler o arquivo, onde cada linha do CSV é convertida em um dicionário.
# Esses dicionários são armazenados na lista `dados_steam`.
dados_steam = []
with open('C:\\Users\\rodri\\Desktop\\codigos\\puc\\projeto1\\steam_games.csv', newline='', encoding='utf-8') as csvfile:
    reader = csv.DictReader(csvfile)
    dados_steam = [row for row in reader]

# 2. Ignorar os primeiros 20 jogos
# Este comando remove os primeiros 20 elementos da lista `dados_steam`, atendendo a um critério de avaliação específico.
dados_steam = dados_steam[20:]

# 3. Criar uma amostra aleatória de 20 jogos
# Usamos `random.sample` para selecionar 20 jogos aleatórios da lista `dados_steam`.
# Essa função retorna uma nova lista contendo os elementos escolhidos, sem alterar a lista original.
amostra = random.sample(dados_steam, 20)

# 4. Salvar a amostra em um novo arquivo CSV
# Aqui, abrimos um novo arquivo CSV em modo de escrita ('w') e utilizamos `csv.DictWriter` para escrever os dados.
# A função `writeheader` escreve os nomes das colunas (cabeçalho) no arquivo, e `writerows` escreve as linhas de dados.
caminho_amostra = 'C:\\Users\\rodri\\Desktop\\codigos\\puc\\projeto1\\steam_games_amostra_puc.csv'
with open(caminho_amostra, 'w', newline='', encoding='utf-8') as csvfile:
    fieldnames = amostra[0].keys()  # Obtém as chaves (nomes das colunas) do primeiro dicionário da amostra
    writer = csv.DictWriter(csvfile, fieldnames=fieldnames)
    writer.writeheader()
    writer.writerows(amostra)

# Retorna o caminho do arquivo para facilitar o acesso posterior.
caminho_amostra

#CADA VEZ QUE O CÓDIGO FOR RODADO, GERARÁ UMA AMOSTRA!

'C:\\Users\\rodri\\Desktop\\codigos\\puc\\projeto1\\steam_games_amostra_puc.csv'

In [38]:
# 5. Converter o preço de string para float
# Esta função converte os preços dos jogos, que estão em formato string, para float. Por exemplo, "$19.99" é convertido para 19.99.
# Se o preço for "Free", ele é convertido para 0. Se a conversão falhar, retorna `None`.
def converter_preco_para_float(preco):
    try:
        return float(preco.replace('$', '').replace('Free', '0'))
    except ValueError:
        return None

# Itera sobre cada jogo na amostra e converte o preço utilizando a função definida acima.
for jogo in amostra:
    jogo['Price'] = converter_preco_para_float(jogo['Price'])

# 6. Cálculo do percentual de jogos gratuitos e pagos
# Conta o total de jogos na amostra e quantos desses são gratuitos (preço igual a 0).
# Em seguida, calcula o percentual de jogos gratuitos e pagos.
total_jogos = len(amostra)
jogos_gratuitos = sum(1 for jogo in amostra if jogo['Price'] == 0)
percentual_gratuitos = (jogos_gratuitos / total_jogos) * 100
percentual_pagos = 100 - percentual_gratuitos

# 7. Identificação do ano com maior número de lançamentos
# Extrai o ano da data de lançamento de cada jogo, utilizando `split` para separar as partes da data e pegar o último elemento.
# Usa `Counter` para contar quantos jogos foram lançados em cada ano e identifica o ano com mais lançamentos.
anos_lancamento = [jogo['Release date'].split()[-1] for jogo in amostra if jogo['Release date']]
contagem_anos = Counter(anos_lancamento)
max_lancamentos = max(contagem_anos.values())
anos_mais_populares = [ano for ano, contagem in contagem_anos.items() if contagem == max_lancamentos]

# 8. Cálculo do tempo médio de jogo
# Itera sobre a amostra e soma o tempo de jogo ("Average playtime forever") de todos os jogos.
# Em seguida, calcula o tempo médio de jogo, dividindo o total de tempo pelo número de jogos válidos (aqueles com tempo de jogo disponível).
tempo_total_jogo = 0
contagem = 0
for jogo in amostra:
    try:
        tempo_jogo = float(jogo['Average playtime forever'])
        tempo_total_jogo += tempo_jogo
        contagem += 1
    except ValueError:
        continue

# Se houver jogos válidos, calcula o tempo médio; caso contrário, define o tempo médio como 0.
tempo_medio_jogo = tempo_total_jogo / contagem if contagem > 0 else 0

# 9. Retorna os resultados calculados
# A tupla final contém o percentual de jogos gratuitos, o percentual de jogos pagos, o(s) ano(s) com mais lançamentos e o tempo médio de jogo.
(percentual_gratuitos, percentual_pagos, anos_mais_populares, tempo_medio_jogo)



(25.0, 75.0, ['2019', '2021'], 265.4)

In [40]:
'''
Já estagiar trabalhando com Python facilitou meu trabalho, porém, recorri a própria documentação do Python. Espero não ser um problema.

Referências:

Python Software Foundation. "csv — CSV File Reading and Writing." Python 3 Documentation. Acessado em 2024. https://docs.python.org/3/library/csv.html
Python Software Foundation. "random — Generate pseudo-random numbers." Python 3 Documentation. Acessado em 2024. https://docs.python.org/3/library/random.html
Python Software Foundation. "collections — Container datatypes." Python 3 Documentation. Acessado em 2024. https://docs.python.org/3/library/collections.html'''

'\nJá estagiar trabalhando com Python facilitou meu trabalho, porém, recorri a própria documentação do Python. Espero não ser um problema.\n\nReferências:\n\nPython Software Foundation. "csv — CSV File Reading and Writing." Python 3 Documentation. Acessado em 2024. https://docs.python.org/3/library/csv.html\nPython Software Foundation. "random — Generate pseudo-random numbers." Python 3 Documentation. Acessado em 2024. https://docs.python.org/3/library/random.html\nPython Software Foundation. "collections — Container datatypes." Python 3 Documentation. Acessado em 2024. https://docs.python.org/3/library/collections.html'