# 10 - Visualizando Dados

Visualização de dados em Python é o processo de criar gráficos e outras representações visuais para explorar, analisar e comunicar informações de dados de forma clara e intuitiva. Algumas das bibliotecas mais populares para visualização de dados em Python incluem:

- **Matplotlib:** A biblioteca mais básica e flexível para criar gráficos como linhas, barras, dispersões, histogramas, entre outros. https://matplotlib.org/
- **Seaborn:** Baseada no Matplotlib, mas com uma interface mais amigável e gráficos mais bonitos por padrão. É ótima para visualizações estatísticas, como box plots, heatmaps e gráficos de distribuição. https://seaborn.pydata.org/
- **Plotly:** Uma biblioteca interativa que permite criar gráficos dinâmicos, como gráficos de dispersão, de linha, e gráficos 3D. https://plotly.com/


## Exemplo 1

In [None]:
import matplotlib.pyplot as plt

In [None]:
# Criando alguns dados
dados = {
    'Meses': ['Jan', 'Fev', 'Mar', 'Abr', 'Mai', 'Jun', 'Jul', 'Ago', 'Set', 'Out', 'Nov', 'Dez'],
    'Vendas': [250, 300, 350, 400, 500, 450, 550, 600, 650, 700, 800, 900]
}

In [None]:
# Criando o gráfico de barras
plt.figure(figsize=(8, 5))
plt.bar(dados['Meses'], dados['Vendas'], color='skyblue')

# Adicionando título e rótulos aos eixos
plt.title('Vendas Mensais ao Longo do Ano', fontsize=16)
plt.xlabel('Meses', fontsize=12)
plt.ylabel('Vendas (em unidades)', fontsize=12)

# Exibindo o gráfico
plt.show()

In [None]:
# Criando o gráfico de linha
plt.figure(figsize=(8, 5))
plt.plot(dados['Meses'], dados['Vendas'], color='red')

# Adicionando título e rótulos aos eixos
plt.title('Vendas Mensais ao Longo do Ano', fontsize=16)
plt.xlabel('Meses', fontsize=12)
plt.ylabel('Vendas (em unidades)', fontsize=12)
plt.grid()

# Exibindo o gráfico
plt.show()

In [None]:
# Criando o gráfico de barras
plt.figure(figsize=(8, 5))
plt.bar(dados['Meses'], dados['Vendas'], color='skyblue')
plt.plot(dados['Meses'], dados['Vendas'], color='red')

# Adicionando título e rótulos aos eixos
plt.title('Vendas Mensais ao Longo do Ano', fontsize=16)
plt.xlabel('Meses', fontsize=12)
plt.ylabel('Vendas (em unidades)', fontsize=12)
plt.grid()

# Exibindo o gráfico
plt.show()

## Exemplo 2

In [None]:
import pandas as pd

In [None]:
dados = [
    ["João", 8.5, 9.0],
    ["Maria", 7.0, 8.5],
    ["Pedro", 6.5, 7.5],
    ["Ana", 9.0, 9.5],
    ["Lucas", 5.5, 6.0],
    ["Julia", 8.0, 7.0],
    ["Ronaldo", 8.0, 7.0],
    ["Mariana", 6.0, 10.0],
    ["Jonas", 7.0, 4.0],
    ["Fernanda", 7.5, 7.0],
    ["Beatriz", 4.5, 8.0],
]

In [None]:
df = pd.DataFrame(dados, columns=["Nome", "Estatística", "Programação"])

In [None]:
df

In [None]:
plt.figure(figsize=(8, 5))
plt.scatter(x=df['Estatística'], y=df['Programação'])
plt.xlabel('Nota em Estatística', fontsize=12)
plt.ylabel('Nota em Programação', fontsize=12)

In [None]:
import seaborn as sns

In [None]:
plt.figure(figsize=(8, 5))
sns.barplot(data=df, x='Nome', y='Estatística', alpha=0.5, color='red')
sns.barplot(data=df, x='Nome', y='Programação', alpha=0.5, color='blue')
plt.xlabel('Aluno', fontsize=12)
plt.ylabel('Nota em Programação', fontsize=12)
plt.xticks(rotation=45)

In [None]:
df_long = pd.melt(df, id_vars=["Nome"], value_vars=["Estatística", "Programação"], var_name="Disciplina", value_name="Nota")

# Criando o gráfico de barras
plt.figure(figsize=(8, 5))
sns.barplot(data=df_long, x='Nome', y='Nota', hue='Disciplina', alpha=0.7, palette=['red','blue'])

# Ajustando rótulos e título
plt.xlabel('Aluno', fontsize=12)
plt.ylabel('Nota', fontsize=12)
plt.title('Notas em Estatística e Programação', fontsize=14)
plt.xticks(rotation=45)
plt.legend()

plt.show()

In [None]:
media_programacao = df['Programação'].mean()
media_estatistica = df['Estatística'].mean()

# Criando o gráfico de barras
plt.figure(figsize=(8, 5))
sns.barplot(data=df_long, x='Nome', y='Nota', hue='Disciplina', alpha=0.7, palette=['red','blue'])


plt.axhline(y=media_programacao, color='blue', linestyle='--', label=f'Média Programação ({media_programacao:.2f})')
plt.axhline(y=media_estatistica, color='red', linestyle='--', label=f'Média Estatística ({media_estatistica:.2f})')


plt.xlabel('Aluno', fontsize=12)
plt.ylabel('Nota', fontsize=12)
plt.title('Notas em Estatística e Programação', fontsize=14)
plt.xticks(rotation=45)
plt.legend(loc='lower right')

plt.show()

## Exemplo 3

In [None]:
import seaborn as sns

In [None]:
# Carregando o dataset Iris
iris = sns.load_dataset('iris')

In [None]:
type(iris)

In [None]:
iris.head()

In [None]:
iris.info()

In [None]:
# Criando o gráfico de dispersão para as variáveis 'sepal_length' e 'sepal_width'
plt.figure(figsize=(10, 6))
sns.scatterplot(data=iris, x='sepal_length', y='sepal_width', hue='species', palette='Set1')

# Adicionando título e rótulos aos eixos
plt.title('Gráfico de Dispersão - Comprimento vs Largura das Sépalas', fontsize=16)
plt.xlabel('Comprimento da Sépala (cm)', fontsize=12)
plt.ylabel('Largura da Sépala (cm)', fontsize=12)

# Exibindo o gráfico
plt.show()

In [None]:
# Criando uma figura com 2 linhas e 2 colunas para os subgráficos
fig, axes = plt.subplots(2, 2, figsize=(8, 6), sharex=True)


sns.boxplot(x='species', y='sepal_length', data=iris, ax=axes[0, 0], hue='species', palette='Set1')
axes[0, 0].set_ylabel('Comprimento da Sépala')
#axes[0, 0].set_xlabel('')

sns.boxplot(x='species', y='sepal_width', data=iris, ax=axes[0, 1], hue='species',  palette='Set1')
axes[0, 1].set_ylabel('Largura da Sépala')
#axes[0, 1].set_xlabel('')

sns.boxplot(x='species', y='petal_length', data=iris, ax=axes[1, 0], hue='species',  palette='Set1')
axes[1, 0].set_ylabel('Comprimento da Pétala')
axes[1, 1].set_xlabel('Espécies')

sns.boxplot(x='species', y='petal_width', data=iris, ax=axes[1, 1], hue='species',  palette='Set1')
axes[1, 1].set_ylabel('Largura da Pétala')
axes[1, 1].set_xlabel('Espécies')


rotulos = ['(a)', '(b)', '(c)', '(d)']
for i, ax in enumerate(axes.flat):
    ax.text(0.025, 0.92, rotulos[i], transform=ax.transAxes, fontsize=10)

plt.tight_layout()

plt.show()

In [None]:
sns.pairplot(iris, hue='species')

In [None]:
import plotly.express as px

In [None]:
# Criando o gráfico 3D com Plotly
fig = px.scatter_3d(
    iris, 
    x='sepal_length', 
    y='sepal_width', 
    z='petal_length', 
    color='species',  # A cor vai representar as espécies
    title='Visualização 3D do Dataset Iris',
    labels={'sepal_length': 'Comprimento da Sépala', 
            'sepal_width': 'Largura da Sépala', 
            'petal_length': 'Comprimento da Pétala'},
    width=1000,  
    height=800    
)

# Exibindo o gráfico
fig.show()