# Instala as bibliotecas

In [None]:
! pip install seaborn
! pip install matplotlib

# Importa as bibliotecas

In [None]:
import pandas as pd
import seaborn as sns 
import matplotlib.pyplot as plt

# Lê o CSV
# Imprime os top 5

In [None]:
df = pd.read_csv("Iris.csv") 
df.head()

# Exibe o formato da tabela

In [None]:
df.shape

# Exibe as informações da tabela

In [None]:
df.info()

# Descreve (análise descritiva) os dados

In [None]:
df.describe()

# Verifica se há colunas nulas

In [None]:
df.isnull().sum()

# Mostra as Espécie de Flores nos Dados (excluindo a coluna de espécies)

In [None]:
data = df.drop_duplicates(subset ="Species",) 
data.drop('Species', axis= 1, inplace= True)
data

# Conta o número de Flores por Espécie

In [None]:
df.value_counts("Species")

# Plota as Espécies por Quantidade

In [None]:
sns.countplot(x='Species', data=df, ) 
plt.show()

# Plota as Espécies por Tamanho e Largura da Sépala

In [None]:
sns.scatterplot(x='SepalLengthCm', y='SepalWidthCm', 
				hue='Species', data=df, ) 

# Placing Legend outside the Figure 
plt.legend(bbox_to_anchor=(1, 1), loc=2) 
plt.show()


# Plota as Espécies por Tamanho e Largura da Pétala

In [None]:
sns.scatterplot(x='PetalLengthCm', y='PetalWidthCm', 
				hue='Species', data=df, ) 
# Placing Legend outside the Figure 
plt.legend(bbox_to_anchor=(1, 1), loc=2) 

plt.show()


# Mostra a análise estatística dos dados (sépala e pétala)

In [None]:
sns.pairplot(df.drop(['Id'], axis = 1), 
			hue='Species', height=2)


# Distribuição normal da Sépala e da Pétala (histogramas)

In [None]:
fig, axes = plt.subplots(2, 2, figsize=(10,10)) 

axes[0,0].set_title("Sepal Length") 
axes[0,0].hist(df['SepalLengthCm'], bins=7) 

axes[0,1].set_title("Sepal Width") 
axes[0,1].hist(df['SepalWidthCm'], bins=5); 

axes[1,0].set_title("Petal Length") 
axes[1,0].hist(df['PetalLengthCm'], bins=6); 

axes[1,1].set_title("Petal Width") 
axes[1,1].hist(df['PetalWidthCm'], bins=6);


# distribuição normal da Sépala e da Pétala (histogramas) 

In [None]:
plot = sns.FacetGrid(df, hue="Species") 
plot.map(sns.distplot, "SepalLengthCm").add_legend() 

plot = sns.FacetGrid(df, hue="Species") 
plot.map(sns.distplot, "SepalWidthCm").add_legend() 

plot = sns.FacetGrid(df, hue="Species") 
plot.map(sns.distplot, "PetalLengthCm").add_legend() 

plot = sns.FacetGrid(df, hue="Species") 
plot.map(sns.distplot, "PetalWidthCm").add_legend() 

plt.show()

# Mostra a correlação de pares de colunas

In [None]:
data.corr(method='pearson')

# mostra o mapa de calor

In [None]:
sns.heatmap(data.corr(method='pearson').drop( 
['Id'], axis=1).drop(['Id'], axis=0), 
			annot = True); 

plt.show()


# Plotar os box-plot para identificarmos os outliers

In [None]:

def graph(y): 
	sns.boxplot(x="Species", y=y, data=df) 

plt.figure(figsize=(10,10)) 
	
# Adding the subplot at the specified grid position 
plt.subplot(221) 
graph('SepalLengthCm') 

plt.subplot(222) 
graph('SepalWidthCm') 

plt.subplot(223) 
graph('PetalLengthCm') 

plt.subplot(224) 
graph('PetalWidthCm') 

plt.show()
