## Trabalho de Estatística
#### Este trabalho utiliza o Python com as bibliotecas matplotlib e pandas.

Para começar, iniciamos com a instalação das bibliotecas necessárias.

In [None]:
! pip install matplotlib pandas

### Importação e definição de dependências
Aqui, estamos a importar as bibliotecas necessárias, para os gráficos (matplotlib) e para a leitura dos dados (pandas), estamos a definir variáveis para serem utilizadas depois, e estamos a ler os dados disponibilizados.

In [None]:
import matplotlib.pyplot as plt # biblioteca para os gráficos
import pandas as pd # biblioteca para a leitura dos dados
from numpy.polynomial.polynomial import polyfit

# linha de separação
sep = '=' * 60

# cores para os gráficos
cores = {'setosa': 'r', 'versicolor': 'b', 'virginica': 'y'}
marcadores = {'setosa': 'o', 'versicolor': 's', 'virginica': '^'}

# carrega os dados disponibilizados
try:
    data = pd.read_csv('BD_iris-21.csv')
except Exception as e:
    print(f'Erro ao carregar os dados: {e}')
else:
    print('Dados carregados com sucesso!')

### Gráfico 1
Neste primeiro gráfico, podemos observar a ligação entre o comprimento da pétala, por espécie de flor.

In [None]:
print(f'{sep}\nGráfico 1: Comprimento da pétala por espécie de flor\n{sep}') 
plt.bar(data['species'], data['petal_length'])
plt.ylabel('Comprimento da pétala')
plt.show()

### Gráfico 2
No gráfico seguinte, podemos observar a correlação entre o comprimento da sépala, por comprimento da pétala.

In [None]:
print(f'{sep}\nGráfico 2: Comprimento da sépala por comprimento da pétala\n{sep}')

for especie in data['species'].unique():
    dados_especie = data[data['species'] == especie]
    plt.scatter(dados_especie['sepal_length'], dados_especie['petal_length'], 
                c=cores[especie], marker=marcadores[especie], label=especie)
b, m = polyfit(data['sepal_length'], data['petal_length'], 1)
plt.plot(data['sepal_length'], b + m * data['sepal_length'], '-')
plt.xlabel('Comprimento da sépala')
plt.ylabel('Comprimento da pétala')
plt.legend()
plt.show()

### Gráfico 3
No terceiro gráfico, podemos ver a correlação entre o comprimento da pétala e a largura da pétala.

In [None]:
print(f'{sep}\nGráfico 3: Comprimento da pétala por largura da pétala\n{sep}')
for especie in data['species'].unique():
    dados_especie = data[data['species'] == especie]
    plt.scatter(dados_especie['petal_length'], dados_especie['petal_width'], 
                c=cores[especie], marker=marcadores[especie], label=especie)

b, m = polyfit(data['petal_length'], data['petal_width'], 1)
plt.plot(data['petal_length'], b + m * data['petal_length'], '-')
plt.xlabel('Comprimento da pétala')
plt.ylabel('Largura da pétala')
plt.legend()
plt.show()

### Gráfico 4
Para haver um exemplo de um gráfico sem correlação, podemos observar a largura da sépala, pelo comprimento da pétala.

In [None]:
print(f'{sep}\nGráfico 4: Largura da sépala por comprimento da pétala\n{sep}')
for especie in data['species'].unique():
    dados_especie = data[data['species'] == especie]
    plt.scatter(dados_especie['sepal_width'], dados_especie['petal_length'], 
                c=cores[especie], marker=marcadores[especie], label=especie)
plt.xlabel('Largura da sépala')
plt.ylabel('Comprimento da pétala')
plt.legend()
plt.show()