## NAC 01 - Campanha Telefônica

Nosso estudo se baseia em uma campanha telefônica de um banco com os dados dos clientes que foram contemplados com as ligações.

Primeiro, importamos as bibliotecas que serão utilizadas para a leitura dos dados.

In [1]:
import pandas as pd
import numpy as np

Depois, importamos os arquivos que possuem os dados do estudo.

In [2]:
data = pd.read_csv('../data/bank-full.csv', sep = ";")

Listamos os dados para sabermos com quais informações estávamos lidando.

In [3]:
data.head()

Unnamed: 0,age,job,marital,education,default,balance,housing,loan,contact,day,month,duration,campaign,pdays,previous,poutcome,y
0,58,management,married,tertiary,no,2143,yes,no,unknown,5,may,261,1,-1,0,unknown,no
1,44,technician,single,secondary,no,29,yes,no,unknown,5,may,151,1,-1,0,unknown,no
2,33,entrepreneur,married,secondary,no,2,yes,yes,unknown,5,may,76,1,-1,0,unknown,no
3,47,blue-collar,married,unknown,no,1506,yes,no,unknown,5,may,92,1,-1,0,unknown,no
4,33,unknown,single,unknown,no,1,no,no,unknown,5,may,198,1,-1,0,unknown,no


### Início do estudo
Após listarmos os dados, resolvemos focar no impacto das campanhas de forma positiva e negativa, tentando entender qual
o tipo de público mais e menos propenso a ser atingido pela mesma.

#### Casos de sucesso

Começamos pelos clientes em que a campanha obteve sucesso.

Para podermos filtrá-los, criamos uma máscara e a armazenamos em uma variável, o que nos retornou 1511 clientes.

In [4]:
maskSuccess = (data.poutcome == "success")
dataSuccess = data[maskSuccess]

dataSuccess

Unnamed: 0,age,job,marital,education,default,balance,housing,loan,contact,day,month,duration,campaign,pdays,previous,poutcome,y
24080,56,technician,married,secondary,no,589,yes,no,unknown,23,oct,518,1,147,2,success,yes
24165,30,admin.,married,secondary,no,873,yes,no,telephone,12,nov,119,1,167,3,success,no
24239,48,admin.,divorced,secondary,no,295,yes,no,cellular,17,nov,123,1,164,2,success,no
24264,49,management,married,tertiary,no,64,no,no,cellular,17,nov,208,1,159,1,success,no
24435,42,technician,married,tertiary,no,14282,yes,no,cellular,17,nov,77,1,103,4,success,no
24506,42,unemployed,married,unknown,no,970,yes,no,telephone,17,nov,725,1,119,10,success,no
24545,46,services,divorced,secondary,no,0,no,no,cellular,17,nov,407,1,150,3,success,no
24574,36,management,divorced,tertiary,no,3837,yes,no,cellular,17,nov,184,1,193,1,success,no
24622,53,retired,married,tertiary,no,2269,no,no,cellular,17,nov,1091,2,150,1,success,yes
24786,41,blue-collar,married,primary,no,1461,yes,no,cellular,18,nov,290,1,165,2,success,no


Para entender melhor porquê a campanha deu certo com essas pessoas, buscamos saber o que elas possuem em comum.
Entre as pessoas que a campanha obteve sucesso, qual emprego aparece mais?

Para responder esta pergunta, rodamos o comando abaixo, e como é possível observar, a área de atuação que mais se destaca
é "management" (gerente).

In [5]:
dataSuccess.job.value_counts()

management       387
technician       245
admin.           204
retired          174
blue-collar      148
student           87
services          85
unemployed        64
self-employed     55
housemaid         29
entrepreneur      22
unknown           11
Name: job, dtype: int64

Indo um pouco mais fundo, buscamos saber se o nível de educação também seria relevante no sucesso da campanha.
Para isso, criamos uma máscara para filtrarmos pessoas que trabalham em "management", e utilizamos a máscara de
sucesso na campanha para buscar clientes que se encaixam nesses dois tópicos.

Em seguida, procuramos saber, qual nível de educação seria o mais recorrente entre esses clientes?
Como resultado, obtivemos que a grande maioria (87%) possui nível terceiro de educação, o que seria o mais alto entre os três listados.


In [23]:
maskJobManagement = (data.job == "management")
 
result = data[maskJobManagement & maskSuccess]
 
result.education.value_counts()

tertiary     337
unknown       23
secondary     20
primary        7
Name: education, dtype: int64

Apesar disso, a campanha também obteve sucesso em pessoas com nível segundo de educação, o que
descarta ela estar totalmente ligada ao sucesso da campanha, sendo mais possível que esteja
ligada ao trabalho que o cliente exerce.

#### Casos de fracasso

Em contrapartida, buscamos saber qual trabalho estaria em destaque entre clientes em que a campanha fracassou.
Seguindo a forma como fizemos para filtrar clientes em caso de sucesso, criamos uma máscara para clientes em que a campanha não o obteve, o que nos retornou 4901 clientes.

In [8]:
maskFailure = (data.poutcome == "failure")
dataFailure = data[maskFailure]

dataFailure

Unnamed: 0,age,job,marital,education,default,balance,housing,loan,contact,day,month,duration,campaign,pdays,previous,poutcome,y
24060,33,admin.,married,tertiary,no,882,no,no,telephone,21,oct,39,1,151,3,failure,no
24064,33,services,married,secondary,no,3444,yes,no,telephone,21,oct,144,1,91,4,failure,yes
24077,36,management,married,tertiary,no,0,yes,no,telephone,23,oct,140,1,143,3,failure,yes
24127,51,admin.,single,secondary,no,3132,no,no,telephone,5,nov,449,1,176,1,failure,no
24151,33,unemployed,divorced,secondary,no,1005,yes,no,telephone,10,nov,175,1,174,2,failure,no
24160,34,admin.,married,tertiary,no,899,yes,no,unknown,12,nov,114,1,170,3,failure,yes
24170,30,management,single,tertiary,no,1243,yes,no,telephone,13,nov,86,1,174,1,failure,no
24184,44,entrepreneur,married,tertiary,no,1631,yes,no,cellular,17,nov,81,1,195,2,failure,no
24186,51,management,divorced,tertiary,no,119,no,no,cellular,17,nov,200,1,165,2,failure,no
24187,51,technician,married,secondary,no,58,yes,no,cellular,17,nov,79,1,129,2,failure,no


Após isso, com o comando abaixo foi possível saber que a maior taxa de falha estava entre trabalhadores de "blue-collar" (colarinho azul).

In [9]:
dataFailure.job.value_counts()

blue-collar      1068
management       1044
technician        797
admin.            643
services          444
retired           230
self-employed     165
entrepreneur      164
student           117
unemployed        112
housemaid          97
unknown            20
Name: job, dtype: int64

Curiosamente, a segunda categoria de trabalho com a maior taxa de fracasso é management, o que nos leva a acreditar que a ocupação do cliente não possui relação direta com o sucesso/falha da campanha.

Mudando de estratégia, pensamos que talvez o resultado da campanha estivesse ligado ao fato do cliente possuir ou não uma casa.
Para sabermos isso, verificamos qual seria esse resultado nos casos de sucesso e falha da campanha.

In [25]:
dataSuccess.housing.value_counts()

no     1040
yes     471
Name: housing, dtype: int64

In [24]:
dataFailure.housing.value_counts()

yes    3470
no     1431
Name: housing, dtype: int64

Os resultados indicam que a campanha possui maior índice de sucesso entre clientes que não possuem uma casa própria.

Desta forma, podemos afirmar que o perfil de clientes em que a campanha deveria focar são "managements" que não possuem casa própria, supondo que, por possuírem uma boa renda devido à profissão que exercem e podem estar abertos a comprar uma moradia.
Por isso, possuem uma renda que daria a eles a possibilidade de realizar depósitos periódicos sem que o dinheiro fizesse falta.

Em contraponto, o público menos indicado para foco seriam blue-collars que já possuem casa própria, supondo que devido à sua ocupação, não possuem dinheiro "de sobra" para realizarem depósitos periódicos e por já possuírem uma casa, que é um dos bens mais caros que a maioria das pessoas possuem, assim também não se faz necessário abrir uma espécie de poupança na agência com urgência.