# Programação para Dados

## 1. Análise sobre o banco de dados completo

### Bibliotecas

In [31]:
import csv
import random 

### 1.1 Leitura

#### 1.1.2 Desenvolvimento

In [115]:
class Reader():
    def __init__(self, filename):
        self.filename = filename
        self.column_mapping = {}

    def readColumn(self, columns=None, random_sample=False):
        with open(self.filename, 'r', encoding='utf-8') as arquivo:
            reader = csv.reader(arquivo, delimiter=',')
            headers = next(reader) # ler a primeira linha do arquivo e armazenar seus valores na variável headers (cabeçalho)
            data = [] # lista vazia para armazenar os dados 
           

            if columns: 
                self._map_columns(headers)
                selected_columns = [self.column_mapping[col] for col in columns]
                
            else:
                selected_columns = range(len(headers))
                
            if random_sample: 
                rows = list(reader)
                random_rows = random.sample(rows, 20)
                for row in random_rows:
                    selected_data = [row[i] for i in selected_columns]
                    data.append(selected_data)
            else:
                for row in reader:  ## selecionar cada linha do arquivo e insere na lista da variável data
                    selected_data = [row[i] for i in selected_columns]
                    data.append(selected_data) 
            return data
            
    def _map_columns(self, headers):  # mapear os cabeçalhos das colunas para seus índices correspondentes
        self.column_mapping = {col: idx for idx, col in enumerate(headers)}

#### 1.1.2 Leitura do CSV

In [116]:
reader = Reader('steam_games.csv')

### 1.2 Qual o percentual de jogos gratuitos e pagos na plataforma? 

#### 1.2.1 Seleção das colunas

In [117]:
df_price = reader.readColumn(["AppID", "Price"], random_sample=False)

#### 1.2.2 Desenvolvimento

In [118]:
class TotalJogos:

    def __init__(self, data):
        self.data = data
        self.totalPagos = 0
        self.totalGratuitos = 0  
        
    def calcularJogos(self):
        for item in self.data:
            if item[1] == "0.0":
                self.totalGratuitos += 1
            else:
                self.totalPagos += 1
                
        self.totalJogos = self.totalGratuitos + self.totalPagos
        return self.totalGratuitos, self.totalPagos, self.totalJogos

    def porcentagem(self):
        self.porcentagemPagos = self.totalPagos/self.totalJogos * 100
        self.porcentagemGratuitos = self.totalGratuitos/self.totalJogos * 100
        
        return f'Até maio de 2023 a Steam tinha {self.totalJogos} jogos, onde {self.porcentagemGratuitos:.2f}% são jogos gratuitos e {self.porcentagemPagos:.2f}% são jogos pagos.'     

    def totalGratuitosPagos(self):
        self.calcularJogos()
        self.porcentagem()
        return self.porcentagem()
        

#### 1.2.3 Resposta

In [119]:
TotalJogos(df_price).totalGratuitosPagos()

'Até maio de 2023 a Steam tinha 72934 jogos, onde 17.39% são jogos gratuitos e 82.61% são jogos pagos.'

### 1.3 Qual o ano com o maior número de novos jogos? Em caso de empate, retorne uma lista com os anos empatados. 

#### 1.3.1 Seleção de colunas

In [100]:
df_date = reader.readColumn(['Release date'], random_sample=False)

#### 1.3.2 Desenvolvimento

In [101]:
class AnoFrequencia:
    def __init__(self, data):
        self.data = data
        
    def listaAnos(self):
        self.ano = []  
        for item in self.data: 
            self.ano.append(int(item[0][-4:]))
        return self.ano
  
    def contagem(self):
        self.contagem = {}
        for item in self.ano:
            if item in self.contagem:
                self.contagem[item] += 1
            else:
                self.contagem[item] = 1
        return self.contagem

    def empate(self):
        self.dic_ordenado = sorted(self.contagem.items(), key=lambda item: item[1], reverse=True)
        self.dois_primeiros = self.dic_ordenado[:2]
        if self.dois_primeiros[0][1] == self.dois_primeiros[1][1]:
            return f"Com {self.dois_primeiros[0][1]} jogos, {self.dois_primeiros[0][0]} e {self.dois_primeiros[1][0]} empataram e foram os anos com o maior número de novos jogos."
        else:
            return f"Com um total de {self.dois_primeiros[0][1]} jogos, {self.dois_primeiros[0][0]} foi o ano com o maior número de novos jogos."

    def anoMaiorFrequencia(self):
        self.listaAnos()
        self.contagem()
        self.empate()
        return self.empate()

#### 1.3.3 Resposta

In [102]:
AnoFrequencia(df_date).anoMaiorFrequencia()

'Com um total de 13961 jogos, 2022 foi o ano com o maior número de novos jogos.'

### 1.4 Quais são os 3 jogos com as melhores recomendações e que são compatíveis com o sistema Mac?

#### 1.4.1 Seleção das colunas

In [103]:
df_recommendations_mac = reader.readColumn(['Recommendations', 'Mac', 'Name'], random_sample=False)

#### 1.4.2 Desenvolvimento

In [104]:
class Recommendations_Mac:
    def __init__(self, data):
        self.data = data

    def recommendations_mac(self):
        self.recommendations_mac_int = []
        for item in self.data: 
            if item[1] == 'True':
                self.recommendations_mac_int.append([int(item[0]), item[1], item[2]])
        self.recommendations_mac_int.sort(reverse=True)
        return self.recommendations_mac_int

    def first_3(self):
        self.first_3 = self.recommendations_mac_int[:3]
        return self.first_3

    def names(self):
        self.names_lista = []
        for item in self.first_3:
            self.names_lista.append(item[2])
        return f'Os jogos {self.names_lista[0]}, {self.names_lista[1]} e {self.names_lista[2]} são as 3 melhores recomendações compatíveis com o sistema Mac.'

    def recommendations_mac_3(self):
        self.recommendations_mac()
        self.first_3()
        self.names()
        return self.names()
        

#### 1.4.3 Resposta

In [105]:
Recommendations_Mac(df_recommendations_mac).recommendations_mac_3()

"Os jogos Counter-Strike: Global Offensive, Terraria e Garry's Mod são as 3 melhores recomendações compatíveis com o sistema Mac."

## 2. Análise sobre 20 dados aleatórios do banco

### 2.1 Arquivo CSV 

#### 2.1.1 Lista com 20 dados aleatórios

In [121]:
dados_aleatorios = reader.readColumn(random_sample=True) 

#### 2.1.2 Criando arquivo CSV com os 20 dados aleatórios

In [122]:
cabecalho =['AppID', 'Name', 'Release date', 'Estimated owners', 'Peak CCU', 'Required age', 'Price', 'DLC count', 'About the game', 'Supported languages', 'Full audio languages', 'Reviews', 'Header image', 'Website', 'Support url', 'Support email', 'Windows', 'Mac', 'Linux', 'Metacritic score', 'Metacritic url', 'User score', 'Positive', 'Negative', 'Score rank', 'Achievements', 'Recommendations', 'Notes', 'Average playtime forever', 'Average playtime two weeks', 'Median playtime forever', 'Median playtime two weeks', 'Developers', 'Publishers', 'Categories', 'Genres', 'Tags', 'Screenshots', 'Movies']
caminho_arquivo = "aleatorios_steam_games.csv"
with open(caminho_arquivo, 'w', newline='', encoding='utf-8') as arquivo:
    writer = csv.writer(arquivo)
    writer.writerow(cabecalho)
    writer.writerows(dados_aleatorios)

print("Dados salvos com sucesso em", caminho_arquivo)

Dados salvos com sucesso em aleatorios_steam_games.csv


### 2.2 Leitura Arquivo CSV - Aleatório

In [126]:
reader_aleatorio = Reader('aleatorios_steam_games.csv')

### 2.3 Qual o percentual de jogos gratuitos e pagos na plataforma? 

#### 2.3.1 Seleção das colunas

In [129]:
df_price_aleatorio = reader_aleatorio.readColumn(["AppID", "Price"], random_sample=False)

#### 2.3.2 Resposta

In [130]:
TotalJogos(df_price_aleatorio).totalGratuitosPagos()

'Até maio de 2023 a Steam tinha 20 jogos, onde 10.00% são jogos gratuitos e 90.00% são jogos pagos.'

### 2.4 Qual o ano com o maior número de novos jogos? Em caso de empate, retorne uma lista com os anos empatados.

#### 2.4.1 Seleção das colunas

In [131]:
df_date_aleatorio = reader_aleatorio.readColumn(['Release date'], random_sample=False)

#### 2.4.2 Resposta

In [132]:
AnoFrequencia(df_date_aleatorio).anoMaiorFrequencia()

'Com 4 jogos, 2022 e 2019 empataram e foram os anos com o maior número de novos jogos.'

### 2.5 Quais são os 3 jogos com as melhores recomendações e que são compatíveis com o sistema Mac?

#### 2.5.1 Seleção das colunas

In [133]:
df_recommendations_mac_aleatorio = reader_aleatorio .readColumn(['Recommendations', 'Mac', 'Name'], random_sample=False)

#### 2.5.2 Resposta

In [134]:
Recommendations_Mac(df_recommendations_mac_aleatorio).recommendations_mac_3()

'Os jogos Viki Spotter: School, Captain 13 Beyond the Hero e Anoxemia são as 3 melhores recomendações compatíveis com o sistema Mac.'