# Визуализация данных на основе Data Set'а Steam.

### Загрузка данных

In [None]:
%pip install pandas
%pip install seaborn

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

#загрузка данных
games = pd.read_csv('games.csv')
recommendations = pd.read_csv('recommendations.csv')
users = pd.read_csv('users.csv')

#просмотр первых строк
print("Games Data:")
print(games.head())

print("\nRecommendations Data:")
print(recommendations.head())

print("\nUsers Data:")
print(users.head())

### Предобработка данных

In [None]:
#проверка на пропущенные значения
print("Пропущенные значения в games.csv:")
print(games.isnull().sum())

print("\nПропущенные значения в recommendations.csv:")
print(recommendations.isnull().sum())

print("\nПропущенные значения в users.csv:")
print(users.isnull().sum())

#приведение даты выпуска к формату datetime
games['date_release'] = pd.to_datetime(games['date_release'], errors='coerce')

#объединение данных (games и recommendations)
merged_data = pd.merge(games, recommendations, on='app_id')

#просмотр объединенного датасета
print("\nОбъединенный датасет:")
print(merged_data.head())

### Анализ данных

##### Распределение игр по рейтингам

In [None]:
rating_counts = games['rating'].value_counts()
print("Распределение игр по рейтингам:")
print(rating_counts)

##### Изменение средних цен на игры по годам

In [None]:
yearly_prices = games.groupby('date_release')['price_final'].mean()
print("\nСредние цены на игры по годам:")
print(yearly_prices)

##### Соотношение рекомендаций

In [None]:
recommendation_counts = merged_data['is_recommended'].value_counts()
print("\nСоотношение рекомендаций:")
print(recommendation_counts)

##### Топ-10 самых популярных игр по количеству отзывов

In [None]:
top_games_by_reviews = merged_data.groupby('title')['review_id'].count().nlargest(10)
print("\nТоп-10 самых популярных игр по количеству отзывов:")
print(top_games_by_reviews)

##### Распределение игр по годам выпуска


In [None]:
games_per_year = games['date_release'].value_counts().sort_index()
print("\nРаспределение игр по годам выпуска:")
print(games_per_year)


### Визуализация данных

##### Настройка стиля Steam

In [None]:
#цветовая палитра Steam
steam_colors = ['#eeeeee', '#66c0f4', '#c6d4df', '#2a475e', '#171a21']

#настройка стиля
sns.set_style("whitegrid")
plt.style.use('seaborn')
plt.rcParams['font.family'] = 'Arial'
plt.rcParams['font.size'] = 12

##### Распределение игр по рейтингам

In [None]:
plt.figure(figsize=(10, 6))
sns.barplot(x=rating_counts.index, y=rating_counts.values, palette=steam_colors)
plt.title('Распределение игр по рейтингам', fontsize=16, color=steam_colors[0])
plt.xlabel('Рейтинг', fontsize=14, color=steam_colors[0])
plt.ylabel('Количество игр', fontsize=14, color=steam_colors[0])
plt.xticks(rotation=45, fontsize=12, color=steam_colors[0])
plt.yticks(fontsize=12, color=steam_colors[0])
plt.gca().set_facecolor(steam_colors[4])
plt.gcf().set_facecolor(steam_colors[4])
plt.show()

##### Изменение средних цен на игры по годам

In [None]:
plt.figure(figsize=(12, 6))
plt.plot(yearly_prices.index, yearly_prices.values, marker='o', color=steam_colors[1], linewidth=0)
plt.title('Изменение средних цен на игры по годам', fontsize=16, color=steam_colors[0])
plt.xlabel('Год', fontsize=14, color=steam_colors[0])
plt.ylabel('Средняя цена ($)', fontsize=14, color=steam_colors[0])
plt.xticks(fontsize=12, color=steam_colors[0])
plt.yticks(fontsize=12, color=steam_colors[0])
plt.grid(True, color=steam_colors[2], linestyle='--', alpha=0.7)
plt.gca().set_facecolor(steam_colors[4])
plt.gcf().set_facecolor(steam_colors[4])
plt.show()

##### Соотношение рекомендаций

In [None]:
plt.figure(figsize=(6, 6))
plt.pie(recommendation_counts, labels=['Рекомендуют', 'Не рекомендуют'], autopct='%1.1f%%', 
        colors=[steam_colors[1], steam_colors[3]], textprops={'color': steam_colors[0], 'fontsize': 12})
plt.title('Соотношение рекомендаций', fontsize=16, color=steam_colors[0])
plt.gcf().set_facecolor(steam_colors[4])
plt.show()

##### Топ-10 самых популярных игр по количеству отзывов

In [None]:
plt.figure(figsize=(10, 6))
sns.barplot(x=top_games_by_reviews.values, y=top_games_by_reviews.index, palette=steam_colors)
plt.title('Топ-10 игр по количеству отзывов', fontsize=16, color=steam_colors[0])
plt.xlabel('Количество отзывов', fontsize=14, color=steam_colors[0])
plt.ylabel('Название игры', fontsize=14, color=steam_colors[0])
plt.xticks(fontsize=12, color=steam_colors[0])
plt.yticks(fontsize=12, color=steam_colors[0])
plt.gca().set_facecolor(steam_colors[4])
plt.gcf().set_facecolor(steam_colors[4])
plt.show()

##### Зависимость цены от рейтинга игр

In [None]:
plt.figure(figsize=(10, 6))
sns.scatterplot(
    x=games['price_final'], 
    y=games['positive_ratio'], 
    hue=games['rating'], 
    palette=steam_colors, 
    alpha=0.7
)
plt.title('Зависимость цены от рейтинга игр', fontsize=16, color=steam_colors[0])
plt.xlabel('Цена ($)', fontsize=14, color=steam_colors[0])
plt.ylabel('Процент положительных отзывов', fontsize=14, color=steam_colors[0])
plt.xticks(fontsize=12, color=steam_colors[0])
plt.yticks(fontsize=12, color=steam_colors[0])
plt.gca().set_facecolor(steam_colors[4])
plt.gcf().set_facecolor(steam_colors[4])
plt.legend(title='Рейтинг', fontsize=12)
plt.show()

##### Распределение игр по годам выпуска

In [None]:
plt.figure(figsize=(12, 6))
plt.plot(games_per_year.index, games_per_year.values, marker='o', color=steam_colors[1], linewidth=0)
plt.title('Распределение игр по годам выпуска', fontsize=16, color=steam_colors[0])
plt.xlabel('Год', fontsize=14, color=steam_colors[0])
plt.ylabel('Количество игр', fontsize=14, color=steam_colors[0])
plt.xticks(fontsize=12, color=steam_colors[0])
plt.yticks(fontsize=12, color=steam_colors[0])
plt.grid(True, color=steam_colors[2], linestyle='--', alpha=0.7)
plt.gca().set_facecolor(steam_colors[4])
plt.gcf().set_facecolor(steam_colors[4])
plt.show()

### Сохранение результатов

In [None]:
#сохранение объединенного датасета
#merged_data.to_csv('merged_data.csv', index=False)

#сохранение графиков
plt.savefig('steam_visualization.png', dpi=300, bbox_inches='tight')