# Conhecendo melhor nossa base de consumidores: qual estado possui os clientes com melhores pontuações de crédito?

## Objetivo

Queremos conhecer melhor nossos clientes por estado. Para isso, iniciamos uma análise na pontuação de crédito. 
Para realizar a verificação inicial, precisamos de alguns valores.
Os valores são a média, a mediana, a moda e o desvio padrão da pontuação de crédito.

## Tópicos

Neste desafio você aprenderá:

- Média;
- Mediana;
- Moda;
- Desvio padrão.

## Requisitos

Você precisará de python 3.6 (ou superior).

O recomendado é você utilizar um [ambiente virtual](https://pythonacademy.com.br/blog/python-e-virtualenv-como-programar-em-ambientes-virtuais). Para isto, execute os comandos como no exemplo abaixo:

    pip3 install virtualenv
    virtualenv venv -p python3
    source venv/bin/activate 

Ao terminar o desafio, você pode sair do ambiente criado com o comando `deactivate`

## Detalhes

A resposta deve conter os valores da média, mediana, moda e desvio padrão da pontuação de crédito para cada estado do dataset.
O arquivo para submissão deve estar em formato json, conforme o arquivo exemplo "submission.json".

Descrição dos dados:

- *'id'*: Identificador do cliente
- *'sobrenome'*: Sobrenome do cliente
- *'pontuacao_credito'*: Pontuação de crédito do cliente (quanto maior, melhor o cliente geralmente)
- *'estado_residencia'*: Estado de residência do cliente
- *'genero'*: Gênero do cliente
- *'nivel_estabilidade'*: Nível de estabilidade do cliente
- *'saldo_conta'*: Saldo disponível na conta do cliente
- *'numero_produtos'*: Número de produtos que o cliente consome
- *'possui_cartao_de_credito'*: Possui um cartão de crédito cadastrado
- *'membro_ativo'*: Membro acessa e consome frequentemente

#### 1. Importando Bibliotecas

In [49]:
import pandas as pd

#### 2. Criando as funções com as respectivas operações

In [63]:
def mean(dataframe):
    """Calculate the mean from a dataframe"""
    return dataframe.mean()


def median(dataframe):
    """Calculate the median from a dataframe"""
    return int(dataframe.median())


def mode(dataframe):
    """Calculate the mode from a dataframe"""
    return dataframe.mode()[0]


def std(dataframe):
    """Calculate the std from a dataframe"""
    return dataframe.std()

#### 3. Carregando os dados

In [64]:
# Loading the .csv file in a dataframe named 'challenge'
challenge = pd.read_csv("desafio1.csv")

#### 4. Manipulando os dados

In [65]:
# Generating a groupby calculating the operations from the specific states with 'pontuacao_credito'
data = challenge.groupby('estado_residencia').agg([mode, median, mean, std])['pontuacao_credito']

# Rename the columns from the 'data' dataframe
data.columns = ['moda', 'mediana', 'media', 'desvio_padrao']

# Showing the 'data' dataframe
data

Unnamed: 0_level_0,moda,mediana,media,desvio_padrao
estado_residencia,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
PR,850,650,648.961294,98.607186
RS,850,650,651.105143,95.136598
SC,850,653,649.537653,97.233493


#### 5. Gerando a saída

In [66]:
# Saving the data in a .json file:
data.to_json('submission.json', orient='index')