# Desafio Nintendo
## Aspectos a incluir:
1. Abra o arquivo "best-selling game consoles.xlsx" em um dataframe.
2. Substitua a palavra "NES" por "Nintendinho" no nome dos consoles e deixe todos os nomes em maiúsculos.
3. Filtre o nome dos consoles com data de release depois de 2010.
4. Dê um describe e info da base, substitua os missing values pela string "missing".
5. Filtre os consoles que foram descontinuados a menos de 2 anos da data de release.

In [137]:
import numpy as np
import pandas as pd

In [138]:
# 1º aspecto: abrir o arquivo e incluir em um dataframe
df = pd.read_excel('best-selling game consoles.xlsx', sheet_name='consoles')

In [139]:
# 2º aspecto: substituição de NES para Nintendinho
# df.loc[df['Console Name'].str.contains('NES')] # Busca somente quais os consoles que sofrerão a alteração
# Para evitar casos de aparecer SNINTENDINHO no resultado final, decidi fazer o tratamento dos dados do Super NES e o SNES para Super Nintendo
df['Console Name'] = df['Console Name'].str.replace('SNES', 'Super Nintendo').str.replace('Super NES', 'Super Nintendo').str.replace('NES', 'Nintendinho')
df['Console Name'] = df['Console Name'].str.upper()
df['Console Name']


0                         PLAYSTATION 2
1                           NINTENDO DS
2                       NINTENDO SWITCH
3                              GAME BOY
4                        GAME BOY COLOR
5                         PLAYSTATION 4
6                           PLAYSTATION
7                                   WII
8                         PLAYSTATION 3
9                              XBOX 360
10                     GAME BOY ADVANCE
11                 PLAYSTATION PORTABLE
12                         NINTENDO 3DS
13                  NINTENDINHO/FAMICOM
14                             XBOX ONE
15         SUPER NINTENDO/SUPER FAMICOM
16                         GAME & WATCH
17                          NINTENDO 64
18              SEGA GENESIS/MEGA DRIVE
19                        PLAYSTATION 5
20                           ATARI 2600
21                                 XBOX
22                             GAMECUBE
23                      XBOX SERIES X/S
24                                WII U


In [140]:
# 3º aspecto: filtrar consoles lançados pós 2010
df.loc[df['Released Year'] > 2010, ['Console Name', 'Released Year']]

Unnamed: 0,Console Name,Released Year
2,NINTENDO SWITCH,2017
5,PLAYSTATION 4,2013
12,NINTENDO 3DS,2011
14,XBOX ONE,2013
19,PLAYSTATION 5,2020
23,XBOX SERIES X/S,2020
24,WII U,2012
25,PLAYSTATION VITA,2011
33,SUPER NINTENDO CLASSIC EDITION,2017
35,NINTENDINHO CLASSIC EDITION,2016


In [141]:
# 4º aspecto, parte a: dar um describe no dataframe. 
df.describe()

Unnamed: 0,Released Year,Discontinuation Year,Units sold (million)
count,51.0,51.0,51.0
mean,1996.058824,1844.803922,35.549412
std,12.378064,543.657319,42.608844
min,1976.0,0.0,1.0
25%,1987.5,1992.0,3.2
50%,1994.0,1998.0,13.56
75%,2004.5,2011.5,60.205
max,2020.0,2020.0,155.0


In [142]:
# 4º aspecto, parte b: dar um info no dataframe. 
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 51 entries, 0 to 50
Data columns (total 7 columns):
 #   Column                Non-Null Count  Dtype  
---  ------                --------------  -----  
 0   Console Name          51 non-null     object 
 1   Type                  51 non-null     object 
 2   Company               51 non-null     object 
 3   Released Year         51 non-null     int64  
 4   Discontinuation Year  51 non-null     int64  
 5   Units sold (million)  51 non-null     float64
 6   Remarks               16 non-null     object 
dtypes: float64(1), int64(2), object(4)
memory usage: 2.9+ KB


In [143]:
# 4º aspecto, parte c: substituir os missing values pela string 'missing'
df = df.fillna('missing')
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 51 entries, 0 to 50
Data columns (total 7 columns):
 #   Column                Non-Null Count  Dtype  
---  ------                --------------  -----  
 0   Console Name          51 non-null     object 
 1   Type                  51 non-null     object 
 2   Company               51 non-null     object 
 3   Released Year         51 non-null     int64  
 4   Discontinuation Year  51 non-null     int64  
 5   Units sold (million)  51 non-null     float64
 6   Remarks               51 non-null     object 
dtypes: float64(1), int64(2), object(4)
memory usage: 2.9+ KB


In [144]:
# 5º aspecto: filtrar consoles descontinuados em menos de 2 anos
df.loc[(df['Discontinuation Year'] != 0) & ((df['Discontinuation Year'] - df['Released Year'])<2), ['Console Name', 'Released Year', 'Discontinuation Year']]

Unnamed: 0,Console Name,Released Year,Discontinuation Year
33,SUPER NINTENDO CLASSIC EDITION,2017,2018
44,MAGNAVOX ODYSSEY,1978,1975


Identificado que o console Magnavox Odyssey apresenta um erro nos dados inputados, pois é impossível ele lançar depois de ser descontinuado.
Código abaixo feito para o ajuste dos dados conforme página do [Wikipedia](https://en.wikipedia.org/wiki/Magnavox_Odyssey):
* De: _Release Year_ = 1978
* Para: _Release Year_ = 1972

In [145]:
df.loc[df['Console Name']=='MAGNAVOX ODYSSEY', 'Released Year'] = 1972

# 5º aspecto corrigido: filtrar consoles descontinuados em menos de 2 anos
df.loc[(df['Discontinuation Year'] != 0) & ((df['Discontinuation Year'] - df['Released Year'])<2), ['Console Name', 'Released Year', 'Discontinuation Year']]


Unnamed: 0,Console Name,Released Year,Discontinuation Year
33,SUPER NINTENDO CLASSIC EDITION,2017,2018
