# Dependencias:
O dataset utilizado se encontra tanto no colab quanto no link do drive:
https://drive.google.com/file/d/19WhU018HGdWJPk_R8f-yhu8x3REIAjeT/view?usp=sharing


Também é necessário baixar as dependencias a seguir para que seja possível realizar as visualizações

In [None]:
!pip install ipywidgets
!pip install matplotlib
!pip install pandas
!pip install altair
!pip install plotly
!pip install bokeh
!pip install ipywidgets
!jupyter nbextension enable --py widgetsnbextension

import pandas as pd
import altair as alt

# Carregar o conjunto de dados
steam_data = pd.read_csv('/content/steam.csv')  # Substitua com o caminho correto do arquivo

## Primeiro gráfico

>**Motivação para a Escolha da Visualização:** A visualização foi escolhida para analisar a diferença de avaliações (positivas e negativas) dos jogos na plataforma Steam. A diferença de avaliações é uma métrica importante que pode indicar a popularidade e a aceitação de um jogo pelos usuários. Além disso, a visualização também permite analisar essa métrica em relação aos diferentes gêneros de jogos. Isso pode fornecer insights sobre quais gêneros de jogos são mais bem recebidos pelos usuários.

>**Análise das Informações da Visualização:** A visualização fornece uma série de informações úteis. Para cada gênero de jogo, ela mostra os cinco principais jogos com a maior diferença de avaliações. Isso pode ajudar a identificar quais jogos são os mais populares em cada gênero. Além disso, a diferença absoluta de avaliações (avaliações positivas menos avaliações negativas) é usada como uma métrica de sucesso do jogo. Isso fornece uma medida mais equilibrada do sucesso, pois leva em consideração tanto as avaliações positivas quanto as negativas. Por fim, a visualização usa um gráfico de barras, que é uma escolha eficaz para comparar quantidades entre diferentes categorias. Neste caso, ele permite uma comparação clara da diferença de avaliações entre os cinco principais jogos de cada gênero.

In [8]:
import pandas as pd
import matplotlib.pyplot as plt
import ipywidgets as widgets

file_path = '/content/steam.csv'
steam_data = pd.read_csv(file_path)
steam_data['rating_difference'] = abs(steam_data['positive_ratings'] - steam_data['negative_ratings'])
genres_frequency = steam_data['genres'].str.split(';', expand=True).stack().value_counts()
top_10_genres = genres_frequency.head(10).index.tolist()
top_games_by_genres = {}
for genres in top_10_genres:
    genres_games = steam_data[steam_data['genres'].str.contains(genres)]
    top_games = genres_games.sort_values(by='rating_difference', ascending=False).head(5)
    top_games_by_genres[genres] = top_games[['name', 'rating_difference']]

def plot_genres(genres):
    games = top_games_by_genres[genres]
    plt.figure(figsize=(10, 6))
    plt.bar(games['name'], games['rating_difference'], color='skyblue')
    plt.xlabel('Nome do Jogo')
    plt.ylabel('Diferença de Avaliação (Absoluta)')
    plt.title(f'Top 5 Jogos Mais Bem Avaliados no Gênero {genres}')
    plt.xticks(rotation=45)
    plt.show()


genres_dropdown = widgets.Dropdown(options=top_10_genres)

widgets.interact(plot_genres, genres=genres_dropdown)

interactive(children=(Dropdown(description='genres', options=('Indie', 'Action', 'Casual', 'Adventure', 'Strat…

## Segundo gráfico

>**Motivação para a Escolha da Visualização:** Um gráfico de dispersão interativo que mostra a relação entre o preço e o tempo médio de jogo dos 50 jogos mais bem avaliados na plataforma Steam. A escolha dessa visualização foi motivada pela necessidade de entender como essas duas variáveis se relacionam entre os jogos mais populares. Os gráficos de dispersão são uma excelente ferramenta para visualizar a relação entre duas variáveis numéricas. Eles permitem identificar correlações, padrões e outliers nos dados. Além disso, a adição de interatividade (exibir o nome do jogo ao passar o mouse sobre um ponto) melhora a utilidade do gráfico, permitindo que os usuários obtenham mais detalhes sobre pontos específicos de interesse.

>**Análise das Informações da Visualização:** A visualização fornece várias informações úteis. Em primeiro lugar, ela mostra a distribuição dos preços e do tempo médio de jogo entre os 50 jogos mais bem avaliados. Isso pode ajudar a identificar se os jogos mais caros tendem a ter tempos de jogo mais longos, ou se não há uma correlação clara entre essas duas variáveis. Além disso, a visualização permite identificar quais jogos oferecem o melhor valor em termos de tempo de jogo pelo preço. Por exemplo, os jogos que estão mais à direita do gráfico (indicando um tempo de jogo mais longo) mas que não são muito caros podem ser considerados como tendo um bom valor. Finalmente, a visualização permite identificar quaisquer outliers nos dados. Por exemplo, se houver algum jogo que seja muito mais caro ou que tenha um tempo de jogo muito mais longo do que os outros jogos, isso será claramente visível no gráfico.

In [9]:
import pandas as pd
import altair as alt

steam_data = pd.read_csv('/content/steam.csv')

steam_data['rating_difference'] = steam_data['positive_ratings'] - steam_data['negative_ratings']

top_50_games = steam_data.nlargest(50, 'rating_difference')

scatter_plot = alt.Chart(top_50_games).mark_circle(size=60).encode(
    x=alt.X('price:Q', title='Preço'),
    y=alt.Y('average_playtime:Q', title='Tempo Médio de Jogo'),
    tooltip=['name:N', 'price:Q', 'average_playtime:Q']
).properties(
    width=700,
    height=400,
    title='Top 50 Jogos Mais Bem Avaliados: Preço vs Tempo Médio de Jogo'
).interactive()

scatter_plot

## Terceiro gráfico

>**Motivação para a Escolha da Visualização:** Um gráfico de área empilhado interativo que mostra a quantidade de jogos lançados ao longo do tempo para os 5 gêneros mais populares na plataforma Steam. A escolha dessa visualização foi motivada pela necessidade de entender como a popularidade dos gêneros de jogos mudou ao longo do tempo. Os gráficos de área empilhados são uma excelente ferramenta para visualizar a distribuição de categorias ao longo do tempo. Eles permitem ver não apenas a mudança total ao longo do tempo, mas também como a composição dessa totalidade mudou. Além disso, a adição de interatividade (exibir o gênero ao passar o mouse sobre uma área) melhora a utilidade do gráfico, permitindo que os usuários obtenham mais detalhes sobre áreas específicas de interesse.

>**Análise das Informações da Visualização:** A visualização fornece várias informações úteis. Em primeiro lugar, ela mostra a distribuição dos gêneros de jogos ao longo do tempo. Isso pode ajudar a identificar tendências, como se certos gêneros estão se tornando mais populares ou menos populares. Além disso, a visualização permite ver a proporção de jogos de cada gênero em qualquer ano. Isso pode fornecer insights sobre a diversidade de gêneros em diferentes períodos de tempo. Finalmente, a visualização permite identificar quaisquer picos ou quedas na quantidade total de jogos lançados. Por exemplo, se houver um pico em um determinado ano, isso pode indicar um ano particularmente bom para o lançamento de jogos.

In [12]:
import pandas as pd
import altair as alt

# Carregar os dados
steam_data = pd.read_csv('/content/steam.csv')

# Converter a data de lançamento para o formato datetime e extrair o ano
steam_data['release_date'] = pd.to_datetime(steam_data['release_date'])
steam_data['year'] = steam_data['release_date'].dt.year

# Obter os 5 gêneros mais populares
top_5_genres = steam_data['genres'].value_counts().nlargest(5).index.tolist()

# Filtrar os dados para incluir apenas os jogos dos 5 gêneros mais populares
filtered_data = steam_data[steam_data['genres'].isin(top_5_genres)]

# Agrupar os dados por gênero e ano e contar o número de jogos
grouped_data = filtered_data.groupby(['genres', 'year']).size().reset_index(name='count')

# Criar um gráfico de área empilhado
alt.Chart(grouped_data).mark_area().encode(
    x="year:T",
    y=alt.Y("count:Q", stack=True),
    color="genres:N",
    tooltip=['genres', 'year', 'count']
).interactive()