# Влияние компьютерных игр на счастье  
Данное исследование направлено на выявление зависимости (или отсутствия зависимости) компьютерных игр на счастье.  
Я собрал небольшую выборку (n=21) про помощи опроса для дальнейшего анализа.  
Данные о выборке находятся в файле data.csv.

## Очистка и подготовка данных
Прежде чем начать анализировать что-либо, наши данные нужно очистить и подговить.  
Сейчас мы займемся этим.

In [340]:
import pandas as pd


df = pd.read_csv("data.csv")
df.head(5)

Unnamed: 0,ID,Сколько Вам лет?,Укажите Ваш пол?,Сколько часов в сутки Вы тратите на компьютерные игры?,Сколько дней в неделю Вы играете в компьютерные игры?,Какой тип игр Вы предпочитаете?,Как часто Вы играете в игры с вашими друзьями?,Компьютерные игры играют значительную роль в Вашей жизни?,Вы зависимы от компьютерных игр?,Назовите Ваш любимый игровой жанр?,Назовите Вашу любимую игру?,Насколько Вы счастливы? / Общее счастье,Насколько Вы счастливы? / Личная жизнь,Насколько Вы счастливы? / Работа/Учеба,Как часто Вы испытываете следующие чувства? / Радость,Как часто Вы испытываете следующие чувства? / Стресс
0,1855465575,19,Мужчина,3,1,Одиночные,Чаще играю с друзьями,Да,Нет,Приключения,The Last Of Us,7,3,8,4,2
1,1856114803,20,Мужчина,4,6,Мультиплеер,Играю только с друзьями,Да,Да,Экшн,Deadlock,7,7,4,5,3
2,1856117571,19,Мужчина,0,1,Мультиплеер,Чаще играю с друзьями,Да,Нет,Экшн,valorant,7,4,7,4,3
3,1856208774,20,Мужчина,1,2,Мультиплеер,Играю только с друзьями,Да,Нет,Ролевые игры,тупик,7,10,3,4,2
4,1856316803,20,Мужчина,0,0,Одиночные,Не играю с друзьями,Нет,Нет,Приключения,The Witcher 3,8,9,7,4,1


Как можно заметить, названия колонок на русском языке. Поменяем это

In [341]:
df = df.rename(columns={
    "ID": "id",
    "Сколько Вам лет?": "age",
    "Укажите Ваш пол?": "gender",
    "Сколько часов в сутки Вы тратите на компьютерные игры?": "game_hours_per_day",
    "Сколько дней в неделю Вы играете в компьютерные игры?": "game_days_per_week",
    "Какой тип игр Вы предпочитаете?": "game_type",
    "Как часто Вы играете в игры с вашими друзьями?": "game_friends_activity",
    "Компьютерные игры играют значительную роль в Вашей жизни?": "game_importance",
    "Вы зависимы от компьютерных игр?": "game_addiction",
    "Назовите Ваш любимый игровой жанр?": "game_genre",
    "Назовите Вашу любимую игру?": "game_favorite",
    "Насколько Вы счастливы? / Общее счастье": "happiness_general",
    "Насколько Вы счастливы? / Личная жизнь": "happiness_personal",
    "Насколько Вы счастливы? / Работа/Учеба": "happiness_work",
    "Как часто Вы испытываете следующие чувства? / Радость": "happiness_joy",
    "Как часто Вы испытываете следующие чувства? / Стресс": "happiness_stress"})

df.columns

Index(['id', 'age', 'gender', 'game_hours_per_day', 'game_days_per_week',
       'game_type', 'game_friends_activity', 'game_importance',
       'game_addiction', 'game_genre', 'game_favorite', 'happiness_general',
       'happiness_personal', 'happiness_work', 'happiness_joy',
       'happiness_stress'],
      dtype='object')

Теперь поменяем местами некоторые столбцы для удобства

In [342]:
genre = df.game_genre
df = df.drop("game_genre", axis=1)
df.insert(6, "game_genre", genre)
df.head(5)

Unnamed: 0,id,age,gender,game_hours_per_day,game_days_per_week,game_type,game_genre,game_friends_activity,game_importance,game_addiction,game_favorite,happiness_general,happiness_personal,happiness_work,happiness_joy,happiness_stress
0,1855465575,19,Мужчина,3,1,Одиночные,Приключения,Чаще играю с друзьями,Да,Нет,The Last Of Us,7,3,8,4,2
1,1856114803,20,Мужчина,4,6,Мультиплеер,Экшн,Играю только с друзьями,Да,Да,Deadlock,7,7,4,5,3
2,1856117571,19,Мужчина,0,1,Мультиплеер,Экшн,Чаще играю с друзьями,Да,Нет,valorant,7,4,7,4,3
3,1856208774,20,Мужчина,1,2,Мультиплеер,Ролевые игры,Играю только с друзьями,Да,Нет,тупик,7,10,3,4,2
4,1856316803,20,Мужчина,0,0,Одиночные,Приключения,Не играю с друзьями,Нет,Нет,The Witcher 3,8,9,7,4,1


Теперь пройдемся по столбцам и проверим, все ли значения в корректном формате

In [343]:
df.dtypes

id                        int64
age                       int64
gender                   object
game_hours_per_day        int64
game_days_per_week        int64
game_type                object
game_genre               object
game_friends_activity    object
game_importance          object
game_addiction           object
game_favorite            object
happiness_general         int64
happiness_personal        int64
happiness_work            int64
happiness_joy             int64
happiness_stress          int64
dtype: object

In [344]:
df.age.value_counts()

age
20    10
19     5
21     5
1      1
Name: count, dtype: int64

In [345]:
df[df.age == 1].index
df.loc[15, "age"] = df[df.age != 1].age.mean()
df.age.value_counts()

age
20    11
19     5
21     5
Name: count, dtype: int64

In [346]:
df.gender = df.gender.map({"Мужчина": "M", "Женщина": "F"}, na_action='ignore')
df.gender.value_counts()

gender
M    17
F     4
Name: count, dtype: int64

In [347]:
df.game_type = df.game_type.map({"Одиночные": "Single", "Мультиплеер": "Multiplayer"})
df.game_type.value_counts()

game_type
Multiplayer    13
Single          8
Name: count, dtype: int64

In [348]:
df.game_genre.value_counts()

game_genre
Приключения     5
MOBA            5
Стратегии       5
Экшн            4
Ролевые игры    1
Головоломки     1
Name: count, dtype: int64

In [349]:
df.game_genre = df.game_genre.map({
    "Приключения": "Adventure",
    "MOBA": "MOBA",
    "Стратегии": "Strategy",
    "Экшн": "Action",
    "Ролевые игры": "Role-Play",
    "Головоломки": "Puzzles"})
df.game_genre.value_counts()

game_genre
Adventure    5
MOBA         5
Strategy     5
Action       4
Role-Play    1
Puzzles      1
Name: count, dtype: int64

In [350]:
df.game_importance = df.game_importance.map({"Да": "Y", "Нет": "N"})
df.game_addiction = df.game_addiction.map({"Да": "Y", "Нет": "N"})
df.head(5)

Unnamed: 0,id,age,gender,game_hours_per_day,game_days_per_week,game_type,game_genre,game_friends_activity,game_importance,game_addiction,game_favorite,happiness_general,happiness_personal,happiness_work,happiness_joy,happiness_stress
0,1855465575,19,M,3,1,Single,Adventure,Чаще играю с друзьями,Y,N,The Last Of Us,7,3,8,4,2
1,1856114803,20,M,4,6,Multiplayer,Action,Играю только с друзьями,Y,Y,Deadlock,7,7,4,5,3
2,1856117571,19,M,0,1,Multiplayer,Action,Чаще играю с друзьями,Y,N,valorant,7,4,7,4,3
3,1856208774,20,M,1,2,Multiplayer,Role-Play,Играю только с друзьями,Y,N,тупик,7,10,3,4,2
4,1856316803,20,M,0,0,Single,Adventure,Не играю с друзьями,N,N,The Witcher 3,8,9,7,4,1


Для колонки $game\_friends\_activity$ введем следующие обозначения:  
Не играю с друзьями - 0  
Чаще играю один	- 1  
Играю с друзьями и наедине поровну - 2  
Чаще играю с друзьями - 3  
Играю только с друзьями - 4  

In [351]:
df.game_friends_activity = df.game_friends_activity.map({
    "Не играю с друзьями": "0",
    "Чаще играю один": "1",
    "Играю с друзьями и наедине поровну": "2",
    "Чаще играю с друзьями": "3",
    "Играю только с друзьями": "4"})
df.game_friends_activity = df.game_friends_activity.astype("int64")
df

Unnamed: 0,id,age,gender,game_hours_per_day,game_days_per_week,game_type,game_genre,game_friends_activity,game_importance,game_addiction,game_favorite,happiness_general,happiness_personal,happiness_work,happiness_joy,happiness_stress
0,1855465575,19,M,3,1,Single,Adventure,3,Y,N,The Last Of Us,7,3,8,4,2
1,1856114803,20,M,4,6,Multiplayer,Action,4,Y,Y,Deadlock,7,7,4,5,3
2,1856117571,19,M,0,1,Multiplayer,Action,3,Y,N,valorant,7,4,7,4,3
3,1856208774,20,M,1,2,Multiplayer,Role-Play,4,Y,N,тупик,7,10,3,4,2
4,1856316803,20,M,0,0,Single,Adventure,0,N,N,The Witcher 3,8,9,7,4,1
5,1856323161,19,M,3,7,Multiplayer,MOBA,2,N,N,"SMITE, Minectaft",7,10,8,5,5
6,1856334638,20,M,3,4,Multiplayer,Action,3,Y,Y,CS,7,2,5,4,1
7,1856325289,21,F,5,7,Single,Adventure,1,Y,Y,Stardew valley,10,7,10,5,3
8,1856329943,19,M,3,4,Multiplayer,MOBA,4,Y,Y,Dora 2,6,6,6,3,3
9,1856330630,19,M,2,7,Single,Adventure,1,Y,N,Genshin Impact,8,9,8,3,3


Столбец $game\_favorite$ придется править вручную из-за частых ошибок ввода.

In [352]:
df.game_favorite = df.game_favorite.apply(str.title)
df.loc[:, ["id", "game_favorite"]]

Unnamed: 0,id,game_favorite
0,1855465575,The Last Of Us
1,1856114803,Deadlock
2,1856117571,Valorant
3,1856208774,Тупик
4,1856316803,The Witcher 3
5,1856323161,"Smite, Minectaft"
6,1856334638,Cs
7,1856325289,Stardew Valley
8,1856329943,Dora 2
9,1856330630,Genshin Impact


In [353]:
df.loc[5, "game_favorite"] = "Minecraft"
df.loc[6, "game_favorite"] = "Counter Strike 2"
df.loc[8, "game_favorite"] = "Dota 2"
df.loc[11, "game_favorite"] = "GTA 4"
df.loc[14, "game_favorite"] = "The Witcher 3"
df.loc[15, "game_favorite"] = "Solitaire"
df.loc[20, "game_favorite"] = "Dota 2"
df.loc[3, "game_favorite"] = df.game_favorite.mode().values[0]

df.game_favorite.value_counts()

game_favorite
Dota 2               5
The Witcher 3        2
The Last Of Us       1
Deadlock             1
Valorant             1
Minecraft            1
Counter Strike 2     1
Stardew Valley       1
Genshin Impact       1
Enderal              1
GTA 4                1
Pathalogic 2         1
Solitaire            1
Prototype 2          1
World Of Warcraft    1
Diablo 2             1
Name: count, dtype: int64

Теперь, когда все наши данные в порядке, мы можем сохранить файл и приступить к анализу

In [354]:
df.to_csv("data_prepared.csv", index=False)