
## Workshop Python 

Nesta primeira intervenção, vamos trabalhar com os seguintes pacotes:

* Pandas.
* Seaborn.
* Matplotlib

In [None]:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

O dataset que utilizaremos é denominado "tips" e contém os dados que um garçom registrou sobre cada gorjeta que recebeu durante um período de alguns meses trabalhando em um restaurante. Podemos encontrar o link para o dataset em um repositório público no GitHub.

Link: 'https://raw.githubusercontent.com/mwaskom/seaborn-data/master/tips.csv'

1. Vamos importar o arquivo

In [None]:
df = pd.read_csv('https://raw.githubusercontent.com/mwaskom/seaborn-data/master/tips.csv')

2. Visualizar o dataframe

In [None]:
df.head()

3. Gerar algumas estatísticas describe().

In [None]:
df.describe()

4. Avalitar as dimensões da base

In [None]:
df.shape

# Scatter plot
-------------
5. Criar um scatterplot entre x = 'total_bill', y = 'tip'


In [None]:
sns.scatterplot(x = 'total_bill', y = 'tip', data = df)
plt.show()

6. Modificar o tamanho do plot por largura = 20, altura= 10.

In [None]:
plt.figure(figsize = (20, 10))
sns.scatterplot(x = 'total_bill', y = 'tip', data = df)
plt.show()

7. Altere a cor padrão do gráfico para verde

In [None]:
plt.figure(figsize=(10,8))
sns.scatterplot(x='total_bill',y='tip',data=df,color='green')
plt.show()

8. Atribua uma cor com base na variável "sexo". Dica: Você tem que usar o atributo -hue

In [None]:
plt.figure(figsize=(10,5))
sns.scatterplot(x='total_bill',y='tip',data=df,hue='sex')
plt.show()

9. Atribua uma forma diferente a cada ponto com base nos valores da variável denominada "fumante". Dica: Você tem que usar o atributo -style

In [None]:
plt.figure(figsize=(10,5))
sns.scatterplot(x='total_bill', y='tip', data=df, hue='sex', style='smoker')
plt.show()

10. Adicione os seguintes rótulos ao nosso gráfico:

* Título: "Quantidade de Ingressos x Gorjetas"
* Eixo x: "Valor do Bilhete"
* eixo y: "Dicas"


In [None]:
p={'Female':'blue','Male':'green'}

plt.figure(figsize=(20,5))
sns.scatterplot(x='total_bill', y = 'tip',data = df, hue = 'sex', style = 'smoker', 
                s = 200, alpha = 0.5, palette = p, legend="full")
plt.xlabel('Valor da conta ')
plt.ylabel('Gorgeta')
plt.title('Valor da Conta vs Gorjetas',fontsize=20)

# Distplot

1. Gere um histograma para a variável total_bill

In [None]:
plt.figure(figsize=(20,5))

sns.displot(df.total_bill, kde=True, kind='hist', bins=15)
plt.xlabel('Total bill')
plt.ylabel('Frecuencia')
plt.title('Distribución de total_bill')

plt.show()

2. Compare no mesmo gráfico as distribuições de total_bill e tip


In [None]:
sns.set(style="darkgrid")

fig = plt.figure(figsize=(20,5))

fig = sns.kdeplot(df['total_bill'], fill=True, color="r")
fig = sns.kdeplot(df['tip'], fill=True, color="b")
plt.show()

# Barplot

1. Gere um gráfico de barras onde a variável dia está no eixo x

In [None]:
plt.figure(figsize=(20,5))
sns.countplot(x = 'day', data = df, color = "black")
plt.show()

2. Modifique o gráfico acima fazendo o eixo y agora day.

In [None]:
plt.figure(figsize=(20,5))
sns.countplot(y ='day',data = df, color = "black")
plt.show()

# Boxplot

1. Gere um boxplot onde x = dia e y = total_bill, atribua as seguintes cores:

*   #008B8B
*   #00FFFF

In [None]:
plt.figure(figsize=(20,5))
sns.boxplot(x = 'day',y = "total_bill", data = df, palette = ['#008B8B','#00FFFF'])
plt.show()

3. Adicionamos a variável "sexo". Dica: Você tem que usar -hue

In [None]:
plt.figure(figsize=(20,5))
sns.boxplot(x = 'day', y = "total_bill", data = df, hue = 'sex', palette = ['#008B8B','#00FFFF'])
plt.show()

# ViolinPlot

Crie um gráfico de violino onde x = dia e y = total_bill, atribua as mesmas cores usadas no boxplot.

In [None]:
plt.figure(figsize=(20,5))
sns.violinplot(x='day', y = "total_bill", data = df, hue = 'sex', palette = ['#008B8B','#00FFFF'])
plt.show()

En esta sección del workshop acudiremos a la librería **Plotly** para la creación de gráficos interactivos. 

1.Importar el paquete plotly.express

In [None]:
import plotly.express as px

-----------------------------
# Scatterplot com Plotly

1. Gere um gráfico de dispersão em que o eixo x é "total_bill" e o eixo y é "ponta"

In [None]:
fig = px.scatter(df, x = "total_bill", y = "tip")
fig.show()

2. Atribua as cores com base na variável "day"

In [None]:
fig = px.scatter(df, x="total_bill", y="tip",color='day')
fig.show()

3. Modifique o tamanho dos pontos com base na variável "size"

In [None]:
fig = px.scatter(df, x="total_bill", y="tip",color='day',size='size')
fig.show()

:4. Generar un scatter plot en 3d donde la variable **"x"** es "total_bill", la variable **"y"** es "tip" y la variable **"z"** es "size"

In [None]:
fig = px.scatter_3d(df, x="total_bill", y="tip",z='size')
fig.show()

5. Modifique o gráfico anterior e atribua uma cor com base na variável "day"

In [None]:
fig = px.scatter_3d(df, x="size", y="tip",z='total_bill',color='day')
fig.show()

# Violin Plot

Generar un box plot donde el eje x es "smoker" y el eje y es "total_bill"

In [None]:
fig = px.violin(df, x="smoker", y="total_bill", box = True)
fig.show()

# Pie Plot

1. Crear un pie plot en base a names="smoker",values='total_bill'

In [None]:
fig = px.pie(df, names="smoker",values='total_bill')
fig.show()

2. Crear un pie plot en base a names="day",values='tip'

In [None]:
fig = px.pie(df, names="day",values='tip',hole=0.4)
fig.show()

# Box

Generar un box plot donde el eje x = day y el eje y = total_bill

In [None]:
fig = px.box(df, x="day", y="total_bill")
fig.show()