Skip to content

onedayxzn/Game-Sales

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

GAME SALES ANALYSIS BY Sukma Ramadhan Asri

cara menjalankan program jupyter notebook

  1. buat virtual environment dengan cara
python -m venv venv
  1. aktifkan virtual environment
venv\Scripts\activate
  1. install requirements
pip install -r requirements.txt

Cara menjalankan streamlit

  1. buka terminal
  2. masuk ke dalam folder project
  3. jalankan perintah berikut
streamlit run Streamlit/dashboard.py

Latar Belakang

Dataset ini berisi tentang data penjualan game yang diambil dari tahun 1984 hingga 2021. Dataset ini memiliki 7 kolom yang berisi tentang data penjualan game di dunia. Pada data ini dicari informasi tentang game yang paling laris, dan genre game yang paling banyak digemari dan lain sebagainya.

Question Bussiness

Question Bussiness dibagi menjadi 2 bagian yaitu Specific dan Measurable Specific adalah pertanyaan yang spesifik yang ingin dijawab dari data yang ada dan Measurable adalah pertanyaan yang bisa diukur dari data yang ada.

  • Specific

    1. Game manakah yang paling laku terjual
    2. Publisher manakah yang paling banyak merilis game
    3. Developer manakah yang paling banyak membuat game
    4. Game yang paling terlama dan terbaru rilis di dalam data ini
  • Measurable

    1. Berapa banyak penjualan game terbanyak
    2. Berapa banyak game yang dirilis oleh publisher terbanyak
    3. Berapa banyak game yang dibuat oleh developer terbanyak
    4. Berapa banyak game yang dirilis setiap tahunnya
    5. Series game manakah yang paling banyak penjualannya
    6. Genre game manakah yang paling banyak dibuat/rilis
    7. Genre game manakah yang paling banyak penjualannya

Data Wrangling

  1. cek data
game_sales = pd.read_excel(DATA_DIR)
game_sales.head(10)

Output

Name Sales Series Release Genre Developer Publisher
0 PlayerUnknown's Battlegrounds 42.0 NaN 2017-12-01 Battle royale PUBG Studios Krafton
1 Minecraft 33.0 Minecraft 2011-11-01 Sandbox, survival Mojang Studios Mojang Studios
2 Diablo III 20.0 Diablo 2012-05-01 Action role-playing Blizzard Entertainment Blizzard Entertainment
3 Garry's Mod 20.0 NaN 2006-11-01 Sandbox Facepunch Studios Valve
4 Terraria 17.2 NaN 2011-05-01 Action-adventure Re-Logic Re-Logic
5 World of Warcraft 14.0 Warcraft 2004-11-01 MMORPG Blizzard Entertainment Blizzard Entertainment
6 Half-Life 2 12.0 Half-Life 2004-11-01 First-person shooter Valve Valve (digital)
7 The Witcher 3: Wild Hunt 12.0 The Witcher 2015-05-01 Action role-playing CD Projekt Red CD Projekt
8 StarCraft 11.0 StarCraft 1998-03-01 Real-time strategy Blizzard Entertainment Blizzard Entertainment
9 The Sims 11.0 The Sims 2000-02-01 Life simulation Maxis Electronic Arts
  1. cek info data
game_sales.info()

output

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 177 entries, 0 to 176
Data columns (total 7 columns):
 #   Column     Non-Null Count  Dtype
---  ------     --------------  -----
 0   Name       177 non-null    object
 1   Sales      177 non-null    float64
 2   Series     141 non-null    object
 3   Release    177 non-null    datetime64[ns]
 4   Genre      177 non-null    object
 5   Developer  177 non-null    object
 6   Publisher  177 non-null    object
dtypes: datetime64[ns](1), float64(1), object(5)
memory usage: 9.8+ KB

Dari data diatas, terdapat 177 baris dan 7 kolom. Kolom tersebut adalah:

  • Name: Nama game
  • Sales: Penjualan game (dalam Millyaran)
  • Series: Nama series game
  • Release: Tanggal rilis game
  • Genre: Genre game
  • Developer: Developer game
  • Publisher: Publisher game

jika diperhatikan kolom Series memiliki nilai yang berbeda dengan kolom yang lainnya, hal ini dikarenakan kolom Series memiliki nilai NaN yang berarti tidak ada series game yang dimiliki oleh game tersebut.

  1. cek missing value

Untuk mengecek missing value, kita bisa menggunakan fungsi isna() dan sum() untuk mengetahui jumlah missing value pada kolom Series

game_sales.isna().sum()

output

Name          0
Sales         0
Series       36
Release       0
Genre         0
Developer     0
Publisher     0

Dari data diatas, terdapat 36 missing value pada kolom Series, untuk mengatasi missing value tersebut kita bisa mengganti nilai NaN dengan data yang diambil dari kolom Name.

  1. mengganti missing value

Untuk mengganti missing value, kita bisa menggunakan fungsi fillna() untuk mengganti nilai NaN pada kolom Series dengan data yang diambil dari kolom Name.

game_sales['Series'] = game_sales['Series'].fillna(game_sales['Name'])
game_sales.head(10)

output

Name Sales Series Release Genre Developer Publisher
0 PlayerUnknown's Battlegrounds 42.0 PlayerUnknown's Battlegrounds 2017-12-01 Battle royale PUBG Studios Krafton
1 Minecraft 33.0 Minecraft 2011-11-01 Sandbox, survival Mojang Studios Mojang Studios
2 Diablo III 20.0 Diablo 2012-05-01 Action role-playing Blizzard Entertainment Blizzard Entertainment
3 Garry's Mod 20.0 Garry's Mod 2006-11-01 Sandbox Facepunch Studios Valve
4 Terraria 17.2 Terraria 2011-05-01 Action-adventure Re-Logic Re-Logic
5 World of Warcraft 14.0 Warcraft 2004-11-01 MMORPG Blizzard Entertainment Blizzard Entertainment
6 Half-Life 2 12.0 Half-Life 2004-11-01 First-person shooter Valve Valve (digital)
7 The Witcher 3: Wild Hunt 12.0 The Witcher 2015-05-01 Action role-playing CD Projekt Red CD Projekt
8 StarCraft 11.0 StarCraft 1998-03-01 Real-time strategy Blizzard Entertainment Blizzard Entertainment
9 The Sims 11.0 The Sims 2000-02-01 Life simulation Maxis Electronic Arts

Dari data diatas, terihat bahwa kolom Series sudah tidak memiliki nilai NaN lagi. Kita dapat lihat bahwa kolom Series sudah diisi dengan data yang diambil dari kolom Name. contohnya pada kolom ke 1 dengan nama game "PlayerUnknown's Battlegrounds" dan kolom ke 3 dengan nama series "PlayerUnknown's Battlegrounds". Yang awalnya memiliki nilai NaN sekarang sudah diisi dengan nama game tersebut.

Cek kembali missing value

game_sales.isna().sum()

output

Name         0
Sales        0
Series       0
Release      0
Genre        0
Developer    0
Publisher    0

Dari data diatas, terlihat bahwa kolom Series sudah tidak memiliki nilai NaN lagi.

Visualisasi Data

Menjawab pertanyaan bussiness dengan visualisisasi data

  • Specific Question

    1. Game manakah yang paling laku terjual
      game_sales_max_sales = game_sales[game_sales['Sales'] == game_sales['Sales'].max()]
      game_sales_max_sales['Name']

    output

    PlayerUnknown's Battlegrounds
    
    1. Publisher manakah yang paling banyak merilis game

    alt text

    Dari data diatas, terlihat bahwa publisher yang paling banyak merilis game adalah "Electronic Arts".

    1. Developer manakah yang paling banyak membuat game

    alt text

    Dari data diatas, terlihat bahwa developer yang paling banyak membuat game adalah "Blizzard Entertainment".

    1. Game yang paling terlama dan terbaru rilis di dalam data ini
      game_realease_new = pd.to_datetime(game_sales['Release'])
      game_sales_new = game_sales['Release'].max()
      game_sales_new = game_sales[game_sales['Release'] == game_sales_new][['Name', 'Release', 'Sales']]
      print('Game with the most recent release date (in dataset):')
      print(game_sales_new)
      print('\n')
      game_realease_old = pd.to_datetime(game_sales['Release'])
      game_sales_old = game_sales['Release'].min()
      game_sales_old = game_sales[game_sales['Release'] == game_sales_old][['Name', 'Release',    'Sales']]
      print('Game with the most oldest release date (in dataset):')
      print(game_sales_old)

    Output

    Game with the most recent release date (in dataset):
       Name    Release  Sales
    20  Valheim 2021-02-01    6.0
    
    
    Game with the most oldest release date (in dataset):
        Name    Release  Sales
    133  Hydlide 1984-12-01    1.0
    

    Game dengan rilis terbaru adalah "Valheim" dengan rilis pada tahun 2021-02-01 dan game dengan rilis terlama adalah "Hydlide" dengan rilis pada tahun 1984-12-01.

  • Measurable Question

    1. Berapa banyak penjualan game terbanyak
      game_sales_max_sales = game_sales[game_sales['Sales'] == game_sales['Sales'].max()]
      game_sales_max_sales[['Name', 'Sales']]
Name Sales
0 PlayerUnknown's Battlegrounds 42.0

Game dengan penjualan terbanyak adalah "PlayerUnknown's Battlegrounds" dengan penjualan sebesar 42.0 M

  1. Berapa banyak game yang dirilis oleh publisher terbanyak

Electronic Arts: 19

Name Developer Series Genre Release Sales Publisher
9 The Sims Maxis The Sims Life simulation 2000-02-01 11.0 Electronic Arts
15 The Sims 3 Maxis The Sims Life simulation 2009-06-01 7.0 Electronic Arts
19 The Sims 2 Maxis The Sims Life simulation 2004-09-01 6.0 Electronic Arts
25 SimCity 3000 Maxis SimCity City-building 1999-01-01 5.0 Electronic Arts
30 Populous Bullfrog Productions Populous God game 1989-06-01 4.0 Electronic Arts
41 Crysis Crytek Crysis First-person shooter 2007-11-01 3.0 Electronic Arts
44 Theme Park Bullfrog Productions Theme Park Construction and management simulation 2005-06-01 3.0 Electronic Arts
76 SimCity Electronic Arts SimCity City-building 2013-03-01 2.0 Electronic Arts
79 Spore Maxis Spore God game 2008-09-01 2.0 Electronic Arts
60 Battlefield 1942 EA DICE Battlefield First-person shooter 2002-09-01 2.0 Electronic Arts
99 American McGee's Alice Rogue Entertainment Alice Action-adventure, platformer 2000-10-01 1.0 Electronic Arts
101 Battlefield Vietnam EA DICE Battlefield First-person shooter 2004-03-01 1.0 Electronic Arts
105 Command & Conquer 3: Tiberium Wars EA Los Angeles Command & Conquer Real-time strategy 2007-03-01 1.0 Electronic Arts
106 Command & Conquer: Red Alert 2 Westwood Pacific Command & Conquer Real-time strategy 2000-10-01 1.0 Electronic Arts
107 Command & Conquer: Tiberian Sun Westwood Studios Command & Conquer Real-time strategy 1999-08-01 1.0 Electronic Arts
111 Crysis Warhead Crytek Budapest Crysis First-person shooter 2008-09-01 1.0 Electronic Arts
127 Harry Potter and the Philosopher's Stone KnowWonder Harry Potter Action-adventure 2001-11-01 1.0 Electronic Arts
171 Warhammer Online: Age of Reckoning Mythic Entertainment Warhammer MMORPG 2008-09-01 1.0 Electronic Arts
173 Wing Commander 3: Heart of the Tiger Origin Systems Wing Commander Space combat simulation 1994-12-01 1.0 Electronic Arts
  1. Berapa banyak game yang dibuat oleh developer terbanyak

Blizzard Entertainment: 10

Name Developer Series Genre Release Sales Publisher
2 Diablo III Blizzard Entertainment Diablo Action role-playing 2012-05-01 20.0 Blizzard Entertainment
5 World of Warcraft Blizzard Entertainment Warcraft MMORPG 2004-11-01 14.0 Blizzard Entertainment
8 StarCraft Blizzard Entertainment StarCraft Real-time strategy 1998-03-01 11.0 Blizzard Entertainment
18 StarCraft II: Wings of Liberty Blizzard Entertainment StarCraft Real-time strategy 2010-07-01 6.0 Blizzard Entertainment
45 Warcraft III: Reign of Chaos Blizzard Entertainment Warcraft Real-time strategy 2002-07-01 3.0 Blizzard Entertainment (North America)
85 Warcraft II: Tides of Darkness Blizzard Entertainment Warcraft Real-time strategy 1995-12-01 2.0 Blizzard Entertainment
157 StarCraft II: Heart of the Swarm Blizzard Entertainment StarCraft Real-time strategy 2013-03-01 1.0 Blizzard Entertainment
158 StarCraft II: Legacy of the Void Blizzard Entertainment StarCraft Real-time strategy 2015-11-01 1.0 Blizzard Entertainment
175 StarCraft II: Heart of the Swarm Blizzard Entertainment StarCraft Real-time strategy 2013-03-01 1.0 Blizzard Entertainment
176 StarCraft II: Legacy of the Void Blizzard Entertainment StarCraft Real-time strategy 2015-11-01 1.0 Blizzard Entertainment
  1. Berapa banyak game yang dirilis setiap tahunnya alt text

Data data diatas, terlihat bahwa grafik menunjukkan bahwa game yang dirilis setiap tahunnya tidak stabil, terkesan naik turun. 5. Series game manakah yang paling banyak penjualannya Series PlayerUnknown's Battlegrounds 42.0 Minecraft 33.0 Diablo 26.0 The Sims 24.0 Half-Life 21.0

Series game dengan penjualan terbanyak adalah "PlayerUnknown's Battlegrounds" dengan penjualan sebesar 42

  1. Genre game manakah yang paling banyak dibuat/rilis

alt text

Dari data diatas, terlihat bahwa genre game yang paling banyak dibuat/rilis adalah "Real-time strategy' 7. Genre game manakah yang paling banyak penjualannya

  1. enre game manakah yang paling banyak penjualannya
Genre
Action role-playing     58.1
Real-time strategy      57.0
Battle royale           52.0
First-person shooter    46.0
Sandbox, survival       33.0

Genre game dengan penjualan terbanyak adalah "Action role-playing" dengan penjualan sebesar 58.1 m

Kesimpulan

Hasil dari analisis data ini adalah:

  1. Game yang paling laku terjual adalah "PlayerUnknown's Battlegrounds" dengan penjualan sebesar 42.0 M
  2. Publisher yang paling banyak merilis game adalah "Electronic Arts" dengan jumlah game yang dirilis sebanyak 19
  3. Developer yang paling banyak membuat game adalah "Blizzard Entertainment" dengan jumlah game yang dibuat sebanyak 10
  4. Game dengan rilis terbaru adalah "Valheim" dengan rilis pada tahun 2021-02-01 dan game dengan rilis terlama adalah "Hydlide" dengan rilis pada tahun 1984-12-01
  5. Game dengan penjualan terbanyak adalah "PlayerUnknown's Battlegrounds" dengan penjualan sebesar 42.0 M
  6. Series game dengan penjualan terbanyak adalah "PlayerUnknown's Battlegrounds" dengan penjualan sebesar 42
  7. Genre game yang paling banyak dibuat/rilis adalah "Real-time strategy"
  8. Genre game dengan penjualan terbanyak adalah "Action role-playing" dengan penjualan sebesar 58.1 m

Saran

Dari hasil analisis data diatas, dapat disimpulkan bahwa game dengan genre "Action role-playing" adalah genre game yang paling banyak dibuat/rilis dan juga memiliki penjualan terbanyak. Maka dari itu, disarankan untuk membuat game dengan genre "Action role-playing" karena genre ini memiliki peluang yang besar untuk laku terjual. Selain itu, disarankan juga untuk bekerja sama dengan developer "Blizzard Entertainment" karena developer ini adalah developer yang paling banyak membuat game.