<a href="https://colab.research.google.com/github/danisoaresl/Data-Analytics/blob/main/Data_Visualization_Dani.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

Exercício Prático - Data Visualization

Desafio Prático 1: Visualizando Dados Diferentes

Descrição: Neste desafio, suas alunas irão visualizar dados de diferentes formas utilizando
Matplotlib, Seaborn e Plotly. Elas deverão criar gráficos que mostrem a distribuição dos
dados, correlações entre variáveis e tendências.

Tarefas:

1. Carregar os dados de um arquivo CSV fornecido (saude.csv).

In [None]:
import pandas as pd

from google.colab import drive
drive.mount('/content/drive')

with open('/content/drive/My Drive/saude.csv', 'r') as file:
  #ler o conteúdo do arquivo
  #para ler todas as linhas:
  lines = file.readlines()

#ler arquivo CSV
df = pd.read_csv('/content/drive/My Drive/saude.csv')

#criar cópia DataFrame
df_saude = df.copy()

#visualizar os primeiros 5 registros da cópia
print(df_saude.head())

2. Criar um histograma da variável 'age' usando Matplotlib.

In [None]:
import pandas as pd
import matplotlib.pyplot as plt

#criar o histograma da variável 'age'
plt.hist(df_saude['age'], bins=10, color='pink')  # bins define o número de barras no histograma

#adicionar títulos aos eixos
plt.xlabel('Idade')
plt.ylabel('Frequência')
plt.title('Distribuição das Idades')

#mostrar gráfico
plt.show()

3. Criar um gráfico de dispersão mostrando a relação entre 'height' e 'weight' usando
Seaborn.

In [None]:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

#criando o gráfico de dispersão
sns.scatterplot(data=df_saude, x='height', y='weight', color='pink')

#adicionando título e rótulos aos eixos
plt.title('Relação entre Altura e Peso')
plt.xlabel('Altura (cm)')
plt.ylabel('Peso (kg)')

plt.show()

4. Criar um gráfico interativo de barras mostrando a contagem de indivíduos por
'gender' usando Plotly.

In [None]:
import pandas as pd
import plotly.express as px

#calculando contagem de cada gênero
gender_counts = df_saude['gender'].value_counts().reset_index()
gender_counts.columns = ['gender', 'contagem']

#gráfico de barras interativo
fig = px.bar(gender_counts, x='gender', y='contagem', color='gender', color_discrete_sequence=['pink'],
            labels={'gender': 'Gênero', 'contagem': 'Contagem'},
            title='Contagem de Indivíduos por Gênero')

#mostrar gráfico
fig.show()


In [None]:
# Calculando a contagem de cada gênero
gender_counts = df_saude['gender'].value_counts().reset_index()
gender_counts.columns = ['gender', 'contagem']

# Imprimindo as colunas para conferir os valores
print(gender_counts)

O eixo x deve ter os valores "M" e "F".

O eixo y deve mostrar a contagem de 5 para cada gênero.

Desafio Prático 2: Séries Temporais

Descrição: Neste desafio, suas alunas irão analisar uma série temporal de dados de
vendas.
Elas deverão criar gráficos que mostrem as vendas ao longo do tempo, identificar
tendências e sazonalidades.

Tarefas:

1.Carregar os dados de um arquivo CSV fornecido (vendas.csv).

In [None]:
import pandas as pd

from google.colab import drive
drive.mount('/content/drive')

with open('/content/drive/My Drive/vendas.csv', 'r') as file:
  #ler o conteúdo do arquivo
  #para ler todas as linhas:
  lines = file.readlines()

#ler arquivo CSV
df = pd.read_csv('/content/drive/My Drive/vendas.csv')

#criar cópia DataFrame
df_vendas = df.copy()

#visualizar os primeiros 5 registros da cópia
print(df_vendas.head())

2.Criar um gráfico de linhas das vendas ao longo do tempo usando Matplotlib.

In [None]:
import matplotlib.pyplot as plt

#carregar dados
df = pd.read_csv('/content/drive/My Drive/vendas.csv')

#cópia DataFrame
df_vendas = df.copy()

#garantir que coluna datas esteja no formato datetime
df_vendas['date'] = pd.to_datetime(df_vendas['date'])

#criar o gráfico de linha cor rosa
plt.figure(figsize=(10, 6))
plt.plot(df_vendas['date'], df_vendas['sales'], color='pink', marker='o')

#adicionar título e rótulos aos eixos
plt.title('Vendas ao longo do tempo', fontsize=14)
plt.xlabel('Data', fontsize=12)
plt.ylabel('Vendas', fontsize=12)

#adicionar grade ao gráfico
plt.grid(True)

#mostrar gráfico
plt.xticks(rotation=45)  # Rotacionar as datas para melhor visualização
plt.tight_layout()  # Ajustar o layout
plt.show()

3.Criar um gráfico de decomposição sazonal usando Seaborn.

In [None]:
import seaborn as sns
from statsmodels.tsa.seasonal import seasonal_decompose

#definir a coluna 'date' como índice
df_vendas.set_index('date', inplace=True)

#decomposição sazonal (usando a decomposição aditiva)
decomposition = seasonal_decompose(df_vendas['sales'], model='additive', period=7)  # period=7 pode ser ajustado conforme a sazonalidade

#extrair componentes
trend = decomposition.trend
seasonal = decomposition.seasonal
residual = decomposition.resid

#configurar gráfico
plt.figure(figsize=(12, 8))

#plotar tendência
plt.subplot(3, 1, 1)
sns.lineplot(x=df_vendas.index, y=trend, color='blue')
plt.title('Tendência')

#plotar sazonalidade
plt.subplot(3, 1, 2)
sns.lineplot(x=df_vendas.index, y=seasonal, color='green')
plt.title('Sazonalidade')

#plotar resíduos
plt.subplot(3, 1, 3)
sns.lineplot(x=df_vendas.index, y=residual, color='red')
plt.title('Resíduos')

#layout
plt.tight_layout()
plt.show()


4.Criar um gráfico interativo que permita a exploração dos dados de vendas ao longo
do tempo usando Plotly.

In [None]:
import pandas as pd
import plotly.express as px

#garantir que a coluna de datas esteja no formato datetime
df_vendas['date'] = pd.to_datetime(df_vendas['date'])

#criar o gráfico interativo com Plotly
fig = px.line(df_vendas, x='date', y='sales', title='Vendas ao longo do tempo')

#alterar linha para rosa
fig.update_traces(line=dict(color='pink'))

#mostrar gráfico
fig.show()
