In [None]:
# Uma empresa quer entender o motivo da alta taxa de cancelamento do serviço e que sejam propostas soluções


# Recebe a base de dados e remove a coluna CustomerID, que não servirá para a análise
import pandas as pd
import requests
from io import StringIO

url = "https://drive.google.com/uc?id=1oKE63LTT_7uEa_RHxCztsoQNFpZQUwEV"

response = requests.get(url)
data = response.content

# Cria um DataFrame a partir do conteúdo baixado
tabela = pd.read_csv(StringIO(data.decode('utf-8')))

# Verifica se a coluna existe antes de tentar removê-la
if "CustomerID" in tabela.columns:
    tabela = tabela.drop("CustomerID", axis=1)

display(tabela)

In [None]:
# Trata a tabela, removendo as informações vazias

tabela = tabela.dropna()


In [None]:
# Verifica a taxa de cancelamento
display(tabela["cancelou"].value_counts(normalize=True).map("{:.1%}".format))

In [None]:
import plotly.express as px
for coluna in tabela.columns:
   grafico = px.histogram(tabela, x=coluna, color="cancelou")
   grafico.show()

In [None]:
# Conclusões:
# Quem faz acima de 4 ligações ao callcenter cancela, então é preciso resolver o problema no máximo até a quarta ligação
# Quem tem mais de 20 dias de atraso no pagamento cancela, então é necessário entrar em contato antes disso
# Quem tem o contrato mensal cancela, então é preciso oferecer promoções para os outros tipos
tabela = tabela[tabela["duracao_contrato"]!="Monthly"]
tabela = tabela[tabela["ligacoes_callcenter"]<=4]
tabela = tabela[tabela["dias_atraso"]<=20]
display(tabela["cancelou"].value_counts(normalize=True).map("{:.1%}".format))
# Aplicando essas alterações é possível reduzir a taxa de cancelamento de 56,7% para 18,4%