# ДАТАСЕТ ВИДЕОИГРЫ

<img src="https://consumer-view.ru/wp-content/uploads/2021/02/avtory-cyberpunk-2077-oglasili-sistemnye-trebovaniya-igry.jpg">

Всем привет! У нас здесь есть довольно интересный набор данных. У него есть приятные особенности, которые я хочу исследовать. Эти особенности заключаются в следующем:

1. Рейтинг общих продаж.
1. Название игры.
1. Платформа игры была выпущена.
1. Год выпуска игры.
1. Жанр игры.
1. Издатель игры.
1. Общий объем продаж в Северной Америке, Европе, Японии и по всему миру.

Вот некоторые вопросы, на которые я думаю, что смогу получить ответы:

1. Какой жанр является самым популярным во всем мире?
1. Влияет ли культура на тенденции игрового жанра?
1. Как технологическая эволюция влияет на продажи игр?
1. Какая компания превосходит других по рангу?
1. Есть ли у компаний тенденции к созданию игр одного жанра?
1. Какая игровая платформа является самой популярной?
1. Какая игровая платформа для какого жанра?

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

In [None]:
df = pd.read_csv('/kaggle/input/videogamesales/vgsales.csv')
print(df.shape)
df.head()

In [None]:
df.info()

# Какой жанр является самым популярным во всем мире, а также в разных культурах?

In [None]:
plt.rcParams["figure.figsize"] = (12,5)

In [None]:
sns.barplot(x='Genre', y='Global_Sales', data=df)
plt.title('Global')

* Похоже, что *платформенные* игры лидируют. За ними следуют *стрелялки* игры. Кроме того, кажется, что игры *advanture* - это наименее любимые игры, в которые можно играть.
* Давайте посмотрим на разные части мира с помощью этой игровой жанровой функции. Это тоже будет выглядеть так?

In [None]:
f, axes = plt.subplots(3, 1)
plt.rcParams["figure.figsize"] = (15,12)
sns.barplot(x='Genre', y='NA_Sales', data=df, ax=axes[0]).set(title='NORTH AMERICA, EUROPE and JAPAN')
sns.barplot(x='Genre', y='EU_Sales', data=df, ax=axes[1])
sns.barplot(x='Genre', y='JP_Sales', data=df, ax=axes[2])

In [None]:
na_to_world = (df['NA_Sales'].sum()/df['Global_Sales'].sum())*100
eu_to_world = (df['EU_Sales'].sum()/df['Global_Sales'].sum())*100
jp_to_world = (df['JP_Sales'].sum()/df['Global_Sales'].sum())*100
print('North America to Global sale ratio: ', na_to_world)
print('Europe to Global sale ratio: ', eu_to_world)
print('Japan to Global sale ratio: ', jp_to_world)

* Как вы можете видеть, на Северную Америку приходится почти половина мировых продаж. Таким образом, его влияние на жанр огромно. Вот почему мы наблюдаем очень похожие жанровые подходы между Северной Америкой и всем миром.
* Европа, с другой стороны, имеет несколько иные тенденции. Европа любит *стрелялки* игры больше, чем *платформенные* игры. Другие жанры похожи на глобальные.
* Япония здесь самая уникальная. *Ролевые игры* Игры огромны в Японии. Северная Америка и Европа не очень любят ролевые игры. Но я думаю, что более захватывающая вещь заключается в том, что очень немногие люди играют в игры *shooting* в Японии. Когда вы смотрите на другие континенты, вы ожидаете, что некоторые вещи должны иметь определенные пороги, но нет.

# Как технологические изменения на протяжении многих лет влияют на продажи?

In [None]:
sns.distplot(df['Year'])
plt.title('Number of Produced Games Over the Years')

* Это здесь очень интересно. Обычно вы думаете, что с годами продажи должны следовать за этим. *НО я думаю, что технология имела здесь обратный эффект. Поскольку технология позволяла создавать более детализированные и великолепные игры, разработчикам игр приходилось тратить свое время на разработку игры. Таким образом, по мере роста уровня технологий разрабатывать игры становилось все труднее и труднее. Кстати, это только мое мнение, я не нахожусь в этой области работы или что-то в этом роде.

# Какая компания является наиболее доминирующей на рынке?

In [None]:
df.head(20)

In [None]:
df_rank = df.head(500)

In [None]:
sns.barplot(x='Publisher', y='Global_Sales', data=df_rank)
plt.xticks(rotation=80)
plt.title('Number of Sales for TOP500 List')
plt.grid()

* Nintendo завоевывает рынок почти на миллион больше общего объема продаж в списке TOP500.
* Когда мы сначала смотрим на данные. Мы думаем, что Nintendo сильно доминирует на рынке, потому что 17 из первых 20 самых продаваемых игр-это ее игра, но когда мы смотрим на историю другого масштаба, мало что меняется.

# Каковы жанры игр доминирующих компаний?

In [None]:
df_rank.Genre = df_rank.Genre.astype(str)
df_rank.Publisher = df_rank.Publisher.astype(str)

In [None]:
plt.scatter(df_rank['Genre'], df_rank['Publisher'], color='red')
plt.title('Genres for TOP500 List')
plt.grid()

* Когда мы смотрим на жанры игр в разных компаниях. Мы видим, что *Nintendo* имеет игры в каждом жанре, и ни одна другая компания не имеет такого широкого спектра жанров в своих играх. Наконец, мы можем найти причины, по которым *Nintendos* лидирует на рынке.
* Кроме того, мы видим, что компании из списка TOP500 действительно сильно работают над играми *Action*, потому что люди хорошо реагируют на игры *action*.
* Наименее популярными жанрами в списке TOP500 являются Головоломки и Стратегии. Большинство людей обычно хотят расслабиться и немного расслабиться, когда они играют в игры, так что это неудивительно.

# Какая игровая платформа наиболее популярна в компаниях?

In [None]:
platform = df['Platform'].value_counts()

In [None]:
plt.plot(platform)
plt.title('Number of Games for Platforms')
plt.grid()

* Похоже, компании активно разрабатывают игры для платформ DS и PS2. Имейте в виду, что это общее количество игр за эти годы. Набор данных не содержит последних лет, поэтому я думаю, что это резко изменится в последующие годы.

# Какая игровая платформа наиболее популярна у людей?

In [None]:
df_rank_2 = df.head(5000)

In [None]:
sns.barplot(x='Platform', y='Global_Sales', data=df_rank_2)

* Здесь мы смотрим на глобальные цифры продаж ТОП-5000 игровых платформ. Несмотря на то, что PS2 и DS2 были наиболее развитыми платформами, эти цифры не переводились в продажи. Мы видим, что платформа GB имеет больше всего продаж в мире. Если бы я работал в игровой компании, когда этот набор данных был новым, я бы настоятельно рекомендовал нам делать игры на платформе GB.

# Какая игровая платформа для какого жанра?

In [None]:
plt.scatter(df_rank['Genre'], df_rank['Platform'], color='blue')
plt.title('Genres for TOP500 List')
plt.grid()

* Мы видим, что некоторые жанры подходят не для каждой платформы. Например, несмотря на то, что стрелялки более популярны, чем гоночные игры, они доступны на меньшем количестве платформ.
* Кроме того, мы видим, что стратегии и головоломки существуют не на многих платформах. Для этого могут быть две причины. Во-первых, уже не так много людей интересовались этими жанрами, так зачем же беспокоиться о том, чтобы сделать их доступными на нескольких платформах? Это обойдется компании в неоправданную сумму денег. А во-вторых, из-за характера игр, возможно, не было возможности разрабатывать их на многих разных платформах.