# Exploração da Tabela Acompanhamento PCD (1)
Este código Python foi feito para explorar a tabela *Acompanhamento PCD* para facilitar o entendimento de seus dados


In [None]:
!pip install openpyxl

# Importação das bobliotecas
No código a seguir, vemos as bibliotecas utilizadas para a exploração de dados. O `pandas` é utilizado para leitura e manipulação dos dados, enquanto `matplotlib` e `seaborn` são bibliotecas para visualização. Abaixo está o bloco de código com a importação dessas bibliotecas.


In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# Carregamento do Arquivo
A primeira etapa consiste em carregar o arquivo Excel que contém os dados. O `pd.read_excel` é usado para ler os dados do arquivo 'Acompanhamento PCD (1).xlsx', que deve estar no mesmo diretório do script.


In [None]:
# Carregar o arquivo
dataset = pd.read_excel('Acompanhamento PCD (1).xlsx')

# Visualização dos dados
Após o carregamento do dataset, é importante realizar uma visualização inicial. O método `head()` mostra as primeiras linhas do DataFrame, permitindo uma primeira impressão sobre a estrutura e o conteúdo dos dados.


In [None]:
dataset.head()

# Estrutura do dataset
A função `shape` retorna as dimensões do DataFrame, indicando o número de linhas e colunas. Isso ajuda a entender a quantidade de dados disponíveis para análise.


In [None]:
dataset.shape

# Informações do dataset
O método `info()` fornece uma visão geral das colunas do DataFrame, tipos de dados e a presença de valores nulos. Essa informação é important para identificar colunas que podem precisar de tratamento.


In [None]:
dataset.info()

# Análise de valores nulos
A análise da quantidade de valores nulos em cada coluna é essencial. Isso pode ajudar a decidir se algumas colunas devem ser descartadas ou se os dados devem ser tratados de alguma forma.


In [None]:
dataset.isnull().sum()

# Vizualização de valores nulos
A plotagem de um mapa de calor utilizando `seaborn` é útil para visualizar a presença de valores nulos no DataFrame. As áreas em que há dados ausentes serão destacadas, permitindo uma rápida identificação.

In [None]:
import seaborn as sns
import matplotlib.pyplot as plt

plt.figure(figsize=(10, 6))
sns.heatmap(dataset.isnull(), cbar=False, cmap="viridis")
plt.show()

# Estatísticas descritivas
O método `describe()` gera estatísticas descritivas para as colunas numéricas do DataFrame, como contagem, média, desvio padrão, valores mínimo e máximo, e os quartis. Essa análise ajuda a entender a distribuição dos dados.


In [None]:
dataset.describe()

# Plotagem de boxplots

A plotagem de boxplots permite visualizar a distribuição e identificar possíveis outliers nas variáveis numéricas do dataset. O gráfico ajuda a entender a dispersão dos dados e a detectar anomalias.


In [None]:
sns.boxplot(data=dataset)
plt.xticks(rotation=90)
plt.show()