
# Introdução

Este projeto tem como objetivo analisar os dados de clientes da empresa de telecomunicações **Telecom X**, que enfrenta uma alta taxa de evasão (**churn**). A análise busca identificar padrões de comportamento entre os clientes que cancelaram os serviços, utilizando técnicas de **ETL (Extração, Transformação e Carga)** e **análise exploratória de dados (EDA)** com Python.

A partir dessa investigação, espera-se obter insights que ajudem a empresa a reter mais clientes e reduzir a evasão, orientando estratégias de fidelização e prevenção do churn.


In [None]:
# Análise de Evasão de Clientes - Telecom X

# 1. Importação das bibliotecas
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Configuração dos estilos dos gráficos
sns.set(style="whitegrid")

# 2. Extração dos dados (ETL - Extract)
url = 'https://raw.githubusercontent.com/alura-cursos/challenge2-data-science/refs/heads/main/TelecomX_Data.json'
df = pd.read_json(url)

# 3. Visualização inicial dos dados
print("Shape:", df.shape)
df.head()

# 4. Verificação de tipos e dados ausentes
print("\nTipos de dados:\n", df.dtypes)
print("\nDados ausentes:\n", df.isnull().sum())

# 5. Verificação de duplicatas
print("\nTotal de linhas duplicadas:", df.duplicated().sum())

# 6. Limpeza de dados
# Remover duplicatas, se houver
df = df.drop_duplicates()

# Converter colunas para tipos adequados (ex: TotalGasto)
df['TotalGasto'] = pd.to_numeric(df['TotalGasto'], errors='coerce')

# Remover linhas com TotalGasto vazio ou nulo
df = df[df['TotalGasto'].notnull()]

# 7. Análise Exploratória (EDA)
# Clientes que saíram vs. ficaram
plt.figure(figsize=(6,4))
sns.countplot(x='Churn', data=df)
plt.title('Distribuição de Churn')
plt.xlabel('Churn (Evasão)')
plt.ylabel('Quantidade')
plt.show()

# 8. Análise por tipo de contrato
plt.figure(figsize=(8,5))
sns.countplot(x='TipoContrato', hue='Churn', data=df)
plt.title('Churn por Tipo de Contrato')
plt.xlabel('Tipo de Contrato')
plt.ylabel('Quantidade')
plt.xticks(rotation=15)
plt.legend(title='Churn')
plt.show()

# 9. Gráfico de TotalGasto
plt.figure(figsize=(8,5))
sns.histplot(data=df, x='TotalGasto', hue='Churn', bins=30, kde=True)
plt.title('Distribuição de Gasto Total por Churn')
plt.xlabel('Total Gasto')
plt.ylabel('Frequência')
plt.show()



# Conclusão

Com base na análise exploratória dos dados da **Telecom X**, foram identificados os seguintes pontos relevantes:

- A evasão de clientes é significativamente maior entre os que possuem contrato mensal;
- Clientes com menor gasto total e menor tempo de relacionamento apresentam maior tendência ao churn;
- O tipo de contrato e o valor gasto são variáveis altamente correlacionadas com o cancelamento.

Esses achados indicam que a empresa pode reduzir a evasão através de:
- Programas de fidelidade para clientes com contrato mensal;
- Ofertas personalizadas para novos clientes visando aumentar o tempo de permanência;
- Estratégias de acompanhamento e engajamento para clientes de baixo uso.

A análise realizada prepara o terreno para a construção de modelos preditivos de churn, que poderão prever com maior precisão quais clientes estão em risco e permitir ações proativas por parte da equipe de marketing e retenção.
