# Preditor de Espécies da Flor Íris

<img src="images/iris_dataset_banner.png" width="100%">

## Visão geral e objetivos

Iris é um género de plantas com flor, muito apreciado pelas suas diversas espécies, que ostentam flores de cores muito vivas. São, vulgarmente, designadas como lírios, embora tal termo se aplique com mais propriedade a outro tipo de flor. É uma flor muito frequente em jardins. O conjunto de dados da flor Iris é um conjunto de dados multivariados introduzido pelo estatístico e biólogo britânico Ronald Fisher em seu artigo de 1936 que quantifica a variação morfológica das flores da íris de três espécies relacionadas. O conjunto de dados, disponível no [UCI Machine Learning Repository](https://archive.ics.uci.edu/ml/datasets/Iris?spm=a2c4e.11153940.blogcont603256.5.333b1d6f05ZggC), consiste em 150 amostras de cada uma das três espécies de Iris ( Iris setosa, Iris virginica e Iris versicolor ). Quatro variáveis foram medidas em cada amostra: o comprimento e a largura das sépalas e pétalas, em centímetros (Fonte: Wikipedia: [Conjunto de dados flor Iris](https://pt.wikipedia.org/wiki/Conjunto_de_dados_flor_Iris)). Considerando este conjunto de dados, deseja-se construir uma aplicação web que auxilie botânicos e floriculturistas a classificar de forma mais precisa é mais rápida uma Iris data as medidas da sépala é da pétala.

# Passo 1 - Setup do projeto

In [2]:
import joblib
import os
import urllib

import matplotlib
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import sklearn

from sklearn.neighbors import KNeighborsClassifier

print('Matplot version: {}'.format(matplotlib.__version__))
print('Numpy version: {}'.format(np.__version__))
print('Pandas version: {}'.format(pd.__version__))
print('Scikit-learn version: {}'.format(sklearn.__version__))

IRIS_ROOT = 'https://archive.ics.uci.edu/ml/machine-learning-databases/iris/'
IRIS_URL = IRIS_ROOT + 'iris.data' 

DATA_PATH = os.path.join('..', 'data', 'raw')
DATA_FILE = 'iris.csv'
IRIS_DATA = os.path.join(DATA_PATH, DATA_FILE)

DEPLOY_PATH = os.path.join('..', 'app', 'model')
DEPLOY_FILE = 'finalized_model.sav'

Matplot version: 3.3.1
Numpy version: 1.19.1
Pandas version: 1.1.1
Scikit-learn version: 0.23.2


# Passo 2 - Recuperação dos Dados

In [4]:
def download_data(data_url, data_path, data_file):
    os.makedirs(data_path, exist_ok=True)
    local_path = os.path.join(data_path, data_file)
    urllib.request.urlretrieve(data_url, local_path)


In [6]:
download_data(IRIS_URL, DATA_PATH, DATA_FILE)

In [7]:
def load_data(data_path, data_file):
    local_path = os.path.join(data_path, data_file)
    return pd.read_csv(local_path, header=None, names=['sepal_length', 'sepal_width',
                                                       'petal_length', 'petal_width',
                                                       'class'])

In [8]:
iris_data = load_data(DATA_PATH, DATA_FILE)

# PASSO 3 - Análise Exploratória de Dados