In [2]:
#Biblioteca
import pandas as pd
from sklearn.datasets import load_iris
import numpy as np
import matplotlib.pyplot as plt
from matplotlib.lines import lineStyles
from matplotlib.pyplot import bar
import plotly.express as px

In [3]:
iris = load_iris() #Carregando o conjunto de dados Iris
df_iris = pd.DataFrame(iris['data'], columns=iris['feature_names']) #Transformando o conjunto em DataFrame Pandas
df_iris['target'] = iris['target']
# Criar nova coluna com os nomes das espécies
df_iris['species'] = df_iris['target'].map({0: 'Setosa', 1: 'Versicolor', 2: 'Virginica'})

In [4]:
df_iris.head(2)

Unnamed: 0,sepal length (cm),sepal width (cm),petal length (cm),petal width (cm),target,species
0,5.1,3.5,1.4,0.2,0,Setosa
1,4.9,3.0,1.4,0.2,0,Setosa


4. **Análise Visual**

In [5]:
# Transformar o dataframe para visualizar todas as características em um único histograma
df_melted = df_iris.melt(id_vars=["species"], var_name="Característica", value_name="Valor")

In [6]:
# Criar histograma de todas as características separadas por espécie
fig = px.histogram(df_melted, 
                    x="Valor", 
                    facet_col="Característica", 
                    color="species", 
                    title="Distribuição de todas as características por espécie",
                    labels={"Valor": "Medida", "species": "Espécie"})

# Melhorias de layout
fig.update_layout(
    title_x=0.5,  # Centraliza o título
    height=600,
    template="plotly_white",
    margin=dict(l=50, r=50, t=80, b=50),
    font=dict(size=12),
    legend_title_text="Espécie",
    legend=dict(
        orientation="h",
        yanchor="bottom",
        y=1.02,
        xanchor="right",
        x=1
    )
)

# Exibir o gráfico
fig.show()

In [7]:
fig = px.scatter(df_iris,
                 x="sepal length (cm)",
                 y="sepal width (cm)",
                 color='species',
                 title="Distribuição das características por espécie"
)

# Melhorias de layout
fig.update_layout(
    title_x=0.5,  # Centraliza o título
    height=600,
    template="plotly_white",
    font=dict(size=12),
    legend_title_text="Espécie"
)

fig.show()


In [8]:
# Criar o scatter matrix (pairplot)
from turtle import width


fig = px.scatter_matrix(
    df_iris, 
    dimensions=iris.feature_names,  # Define as variáveis para comparação
    color="species",  # Colorir por espécie
    symbol="species",  # Diferentes marcadores por espécie
    title="Pairplot do Dataset Iris usando Plotly"
)

fig.update_layout(
    title_x=0.5,  # Centraliza o título
    height=800,
    template="plotly_white",
    font=dict(size=12),
    legend_title_text="Espécie"
)

fig.show()

In [10]:
df_iris_numeric = df_iris.select_dtypes(include='number')
correlacao = df_iris_numeric.corr()

correlacao.head()

Unnamed: 0,sepal length (cm),sepal width (cm),petal length (cm),petal width (cm),target
sepal length (cm),1.0,-0.11757,0.871754,0.817941,0.782561
sepal width (cm),-0.11757,1.0,-0.42844,-0.366126,-0.426658
petal length (cm),0.871754,-0.42844,1.0,0.962865,0.949035
petal width (cm),0.817941,-0.366126,0.962865,1.0,0.956547
target,0.782561,-0.426658,0.949035,0.956547,1.0


In [18]:
# Criar o heatmap usando plotly
fig = px.imshow(
    correlacao,
    text_auto=True,             # Mostra os valores das correlações
    aspect='auto',              # Autoajuste de proporção
    color_continuous_scale='RdBu',  # Escala de cores divergente para facilitar leitura
    title="Correlação entre características do Iris (todas as espécies)"
)

# Melhorar o layout
fig.update_layout(
    title_x=0.5,                 # Centraliza o título
    height=700,
    font=dict(size=12),
    margin=dict(l=40, r=40, t=60, b=40)
)

# Exibir o gráfico
fig.show()

In [16]:
# Correlação específica com target
correlacao_target = correlacao[['target']].sort_values(by='target', ascending=False)
correlacao_target

Unnamed: 0,target
target,1.0
petal width (cm),0.956547
petal length (cm),0.949035
sepal length (cm),0.782561
sepal width (cm),-0.426658
