# Análise de Churn

## 🗂️ Descrição do Projeto

Este projeto é uma **Análise Descritiva e Diagnóstica** de *churn* de clientes de uma empresa de Telecomunicações, desenvolvida totalmente em **Python**.

A análise explora o **perfil dos clientes**, seus **gastos mensais**, o **tempo de permanência** e como o *churn* se distribui considerando **gênero** e **status de parceria**.

O objetivo é identificar **padrões e fatores que podem influenciar o cancelamento**, gerando **insights visuais claros** para apoiar estratégias de retenção de clientes.

## Importando os pacotes necessários

In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

In [3]:
df = pd.read_csv('WA_Fn-UseC_-Telco-Customer-Churn.csv')

## Dicionário de Variáveis

| Variável           | Descrição                                               |
|--------------------|---------------------------------------------------------|
| `customerID`       | Identificador único do cliente                          |
| `gender`           | Gênero                                                   |
| `SeniorCitizen`    | Se o cliente é idoso (0 = não, 1 = sim)                 |
| `Partner`          | Se o cliente tem parceiro(a)                            |
| `Dependents`       | Se o cliente tem dependentes                            |
| `tenure`           | Tempo (em meses) que o cliente está na empresa          |
| `PhoneService`     | Se o cliente tem serviço de telefone                    |
| `MultipleLines`    | Se tem várias linhas telefônicas                        |
| `InternetService`  | Tipo de serviço de internet                             |
| `OnlineSecurity`   | Se possui segurança online                              |
| `OnlineBackup`     | Se possui backup online                                 |
| `DeviceProtection` | Se possui proteção para dispositivo                     |
| `TechSupport`      | Se possui suporte técnico                               |
| `StreamingTV`      | Se possui serviço de TV por streaming                   |
| `StreamingMovies`  | Se possui serviço de filmes por streaming               |
| `Contract`         | Tipo de contrato (mensal, 1 ano, 2 anos)                |
| `PaperlessBilling` | Se recebe fatura eletrônica                             |
| `PaymentMethod`    | Método de pagamento                                     |
| `MonthlyCharges`   | Valor mensal cobrado                                    |
| `TotalCharges`     | Valor total cobrado                                     |
| `Churn`            | Se o cliente cancelou (Yes/No)                          |

## Exploração Univariada

In [12]:
df.head()

Unnamed: 0,customerID,gender,SeniorCitizen,Partner,Dependents,tenure,PhoneService,MultipleLines,InternetService,OnlineSecurity,...,DeviceProtection,TechSupport,StreamingTV,StreamingMovies,Contract,PaperlessBilling,PaymentMethod,MonthlyCharges,TotalCharges,Churn
0,7590-VHVEG,Female,0,Yes,No,1,No,No phone service,DSL,No,...,No,No,No,No,Month-to-month,Yes,Electronic check,29.85,29.85,No
1,5575-GNVDE,Male,0,No,No,34,Yes,No,DSL,Yes,...,Yes,No,No,No,One year,No,Mailed check,56.95,1889.5,No
2,3668-QPYBK,Male,0,No,No,2,Yes,No,DSL,Yes,...,No,No,No,No,Month-to-month,Yes,Mailed check,53.85,108.15,Yes
3,7795-CFOCW,Male,0,No,No,45,No,No phone service,DSL,Yes,...,Yes,Yes,No,No,One year,No,Bank transfer (automatic),42.3,1840.75,No
4,9237-HQITU,Female,0,No,No,2,Yes,No,Fiber optic,No,...,No,No,No,No,Month-to-month,Yes,Electronic check,70.7,151.65,Yes


In [11]:
# Visão geral dos tipos de dados e valores nulos
exploracao = pd.DataFrame({
    "Tipo": df.dtypes,
    "Nulos": df.isnull().sum(),
    "% Nulos": df.isnull().mean() * 100,
    "Valores Únicos" : df.nunique(),
    "Exemplo de Valores" : df.apply(lambda x: x.unique()[:3])
})
exploracao

Unnamed: 0,Tipo,Nulos,% Nulos,Valores Únicos,Exemplo de Valores
customerID,object,0,0.0,7043,"[7590-VHVEG, 5575-GNVDE, 3668-QPYBK]"
gender,object,0,0.0,2,"[Female, Male]"
SeniorCitizen,int64,0,0.0,2,"[0, 1]"
Partner,object,0,0.0,2,"[Yes, No]"
Dependents,object,0,0.0,2,"[No, Yes]"
tenure,int64,0,0.0,73,"[1, 34, 2]"
PhoneService,object,0,0.0,2,"[No, Yes]"
MultipleLines,object,0,0.0,3,"[No phone service, No, Yes]"
InternetService,object,0,0.0,3,"[DSL, Fiber optic, No]"
OnlineSecurity,object,0,0.0,3,"[No, Yes, No internet service]"


No resultado da tabela, podemos ver que não há problemas e não serão necessárias ações para a limpeza de dados
O dataset já se encontra pronto para análise

Agora vamos analisar as variáveis Univariadas

- gender, SeniorCitizen, Partner, Dependents
- tenure, MonthlyCharges, TotalCharges 

#### gender

In [13]:
# Análise da coluna 'gender'

coluna = "gender"
df[coluna]


0       Female
1         Male
2         Male
3         Male
4       Female
         ...  
7038      Male
7039    Female
7040    Female
7041      Male
7042      Male
Name: gender, Length: 7043, dtype: object