# Análise Exploratória de Dados - Churn de Telecomunicações

Este notebook contém uma análise exploratória completa dos dados de churn de uma empresa de telecomunicações.

## Objetivos
- Analisar o perfil dos clientes
- Identificar padrões de cancelamento
- Gerar insights para redução de churn

## Estrutura da Análise
1. Carregamento e Preparação dos Dados
2. Análise Descritiva
3. Análise de Churn
4. Visualizações e Insights
5. Recomendações

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# Configurações de visualização
plt.style.use('default')
pd.set_option('display.max_columns', None)

## 1. Carregamento e Preparação dos Dados
Vamos carregar os dados do arquivo CSV e fazer uma análise inicial da estrutura dos dados.

In [None]:
# Carregar os dados
df = pd.read_csv('CHURN_TELECON_MOD08_TAREFA.csv', delimiter=';')

# Visualizar as primeiras linhas
print("Primeiras linhas do dataset:")
df.head()

In [None]:
# Informações sobre o DataFrame
print("Informações do DataFrame:")
df.info()

## 2. Análise Descritiva
Vamos analisar as principais estatísticas descritivas e distribuições das variáveis.

In [None]:
# Estatísticas descritivas das variáveis numéricas
print("Estatísticas descritivas:")
df.describe()

In [None]:
# Análise de valores nulos
print("Valores nulos por coluna:")
df.isnull().sum()

## 3. Análise de Churn
Vamos analisar detalhadamente os padrões de churn em relação a diferentes variáveis.

In [None]:
# Distribuição geral de Churn
print("Distribuição de Churn:")
print(df['Churn'].value_counts(normalize=True).round(3) * 100)

# Visualização
plt.figure(figsize=(8, 5))
sns.countplot(data=df, x='Churn')
plt.title('Distribuição de Churn')
plt.show()

In [None]:
# Análise de Churn por Tipo de Contrato
contrato_churn = pd.crosstab(df['Tipo_Contrato'], df['Churn'], normalize='index') * 100

plt.figure(figsize=(10, 6))
contrato_churn[['Yes', 'No']].plot(kind='bar', stacked=True, color=['#e74c3c', '#2ecc71'])
plt.title('Percentual de Churn por Tipo de Contrato')
plt.ylabel('Percentual (%)')
plt.xlabel('Tipo de Contrato')
plt.legend(['Churn: Sim', 'Churn: Não'])
plt.tight_layout()
plt.show()

print("
Percentual de Churn por Tipo de Contrato:")
print(contrato_churn.round(2))

In [None]:
# Análise de Churn por Serviço de Internet
df['Servico_Internet'] = df['Servico_Internet'].str.strip().str.lower()
internet_churn = pd.crosstab(df['Servico_Internet'], df['Churn'], normalize='index') * 100

plt.figure(figsize=(10, 6))
internet_churn[['Yes', 'No']].plot(kind='bar', stacked=True, color=['#e67e22', '#3498db'])
plt.title('Percentual de Churn por Serviço de Internet')
plt.ylabel('Percentual (%)')
plt.xlabel('Serviço de Internet')
plt.legend(['Churn: Sim', 'Churn: Não'])
plt.tight_layout()
plt.show()

print("
Percentual de Churn por Serviço de Internet:")
print(internet_churn.round(2))

In [None]:
# Análise de Tempo como Cliente vs Churn
plt.figure(figsize=(10, 6))
sns.boxplot(data=df, x='Churn', y='Tempo_como_Cliente', palette=['#e74c3c', '#2ecc71'])
plt.title('Tempo como Cliente por Status de Churn')
plt.xlabel('Churn')
plt.ylabel('Tempo como Cliente (meses)')
plt.show()

print("
Estatísticas de Tempo como Cliente por status de Churn:")
print(df.groupby('Churn')['Tempo_como_Cliente'].describe().round(2))

## 4. Insights Principais

1. **Tipo de Contrato**:
   - Contratos mensais têm taxa de churn de 42.4%
   - Contratos anuais têm taxa de churn de 11.2%
   - Contratos de dois anos têm taxa de churn de apenas 1.5%

2. **Serviço de Internet**:
   - Clientes com Fiber Optic têm maior taxa de churn (42%)
   - DSL apresenta taxa moderada de churn (17.4%)
   - Clientes sem internet têm baixa taxa de churn (6.1%)

3. **Tempo como Cliente**:
   - Clientes que cancelam têm média de 18 meses
   - Clientes que permanecem têm média de 37 meses
   - Período crítico: primeiros 10 meses

## 5. Recomendações

1. **Foco em Retenção**:
   - Concentrar esforços nos primeiros 29 meses do cliente
   - Oferecer incentivos para migração para contratos mais longos
   - Investigar problemas com serviço Fiber Optic

2. **Ações Sugeridas**:
   - Criar programa de fidelidade para clientes mensais
   - Oferecer descontos para contratos anuais ou bianuais
   - Melhorar qualidade/suporte do serviço Fiber Optic
   - Desenvolver programa especial de acompanhamento para novos clientes

3. **Pontos de Atenção**:
   - Alta taxa de churn em contratos mensais
   - Problemas potenciais com serviço Fiber Optic
   - Período crítico: primeiros 10 meses