# 📊 Exploratory Data Analysis (EDA) - Template


Este notebook contém um **template reutilizável** para realizar **Análise Exploratória de Dados (EDA)** utilizando as principais bibliotecas Python.

### 🔹 Bibliotecas usadas:
- `pandas` → Manipulação de dados
- `numpy` → Cálculos numéricos
- `dtale` → Interface interativa para exploração de dados
- `sweetviz` → Relatórios automáticos de EDA
- `pandas_profiling` → Geração de relatórios completos de análise de dados

### 🔹 Fontes de Dados:
Os exemplos aqui usam datasets públicos disponíveis em:
- [Housing Prices Dataset (Kaggle)](https://www.kaggle.com/datasets/yasserh/housing-prices-dataset)
- [Data Analysis with Advanced Python Libraries](https://github.com/thom22/Data_Analysis_Collections/tree/main/data_analysis_with_advanced_python_libraries)

💡 **Dica:** Substitua o dataset pelos seus próprios dados para usar este template em seus projetos.


In [None]:
# import the necessary libraries
import pandas as pd
import numpy as np
from IPython.display import display, HTML
display(HTML("<style>.container { width:90% !important; }</style>"))

# read the data
#https://www.kaggle.com/datasets/yasserh/housing-prices-dataset
#https://github.com/thom22/Data_Analysis_Collections/tree/main/data_analysis_with_advanced_python_libraries
data = pd.read_csv('Housing.csv')
data.columns = data.columns.str.upper()   #convert the columns to uppercase 
data

### 🔍 Dtale - Interface Interativa para EDA

[Dtale](https://github.com/man-group/dtale) é uma ferramenta open-source que fornece uma interface interativa para explorar datasets.  
Com Dtale, podemos **visualizar, filtrar e gerar insights rapidamente**, sem necessidade de programar gráficos manualmente.

🔹 **Instalação** (caso não esteja instalado):  
```bash
pip install dtale
```

🔹 **Como usar**:

1. Execute `dtale.show(data)` para visualizar os dados na interface do editor Jupyter.  
2. Use `dtale.show(data).open_browser()` para abrir a análise no navegador.

📌 **Dica:** Você pode exportar os códigos das visualizações geradas no Dtale para reutilizá-los no seu código!


In [None]:
#install the dtale package
#pip install dtale# from inside jupyter notebook or

# import the library
import dtale

#view the data analysis result inside your editor 
dtale.show(data)

# open the analysis in browser
dtale.show(data).open_browser()

### 📊 Sweetviz - Relatórios Automáticos de EDA

[Sweetviz](https://github.com/fbdesignpro/sweetviz) é uma biblioteca que gera **relatórios interativos de análise exploratória**, permitindo comparar datasets de forma intuitiva.

🔹 **Instalação** (caso não esteja instalado):  
```bash
pip install sweetviz
```

🔹 **Como usar**:

1. Gere um relatório EDA com:
```python
import sweetviz as sv
report = sv.analyze(data)
report.show_html('sweetviz_report.html')  # Gera um relatório interativo em HTML
```

📌 **Dica:** O Sweetviz permite **comparar dois datasets** (ex.: conjunto de treino vs. teste) para identificar diferenças estatísticas!


In [None]:
#installing the package
#pip install sweetviz # from terminal or 

# analysis report with sweetviz
import sweetviz as sv

# make analysis and assign the target feature
sweet_report = sv.analyze(data , target_feat='PRICE') 

# view the analysis result in browser 
sweet_report.show_html()

# save the analysis result into html
sweet_report.show_html('analysis_with_sweetviz.html', scale=0.92)

### Data-profiling

Pandas-profiling also provides an extensive insight into your data effortlessly. It covers all the fundamental analysis you require with minimal coding effort. Just like Sweetviz, it also helps in documenting your EDA in HTML format, making data exploration and analysis a breeze.

In [None]:
# install the package 
#(use ydata-profiling instead of pandas-profiling to avoid errors.)
#pip install ydata-profiling

# import the library
from pandas_profiling import ProfileReport

# view the analysis result inside jupyter MINIMAL
#prof = ProfileReport(data,  minimal=True, title="DATA ANALYSIS REPORT")
#prof

# view the analysis result inside jupyter COMPLETE
prof = ProfileReport(data,  minimal=False, title="DATA ANALYSIS REPORT")
prof

# save the analysis to html
prof.to_file(output_file='PANDAS_PROFILING_ANALYSIS.html')

### PyGWalker
If you’re someone who uses Tableau or has some basic familiarity with it, this PyGWalker package is for you. You’ll find similar drag-and-drop features that streamline your data analysis process right in your Jupyter Notebook.

In [None]:
# install the packages 
#!pip install pygwalker  # inside jupyter or
#conda install -c conda-forge pygwalker # from conda terminal

# import the library
import pygwalker as pyg

# run the code
pyg.walk(data)

### autoviz
Wrapping up our exploration of package libraries in this article, we have Autoviz packages, which deliver a range of detailed visualizations. Once you’ve executed the code below, the outcomes of the analysis will be presented across various newly opened browser tabs.

In [None]:
# install the autovix library
#pip install autoviz

# import the library
from autoviz import AutoViz_Class

av = AutoViz_Class()
avt = av.AutoViz("",dfte = data,header = 0,verbose = 1,lowess = False,
      chart_format = "server",max_rows_analyzed = 10000,max_cols_analyzed = 10,
      save_plot_dir=None)