# Importação dos pacotes necessários - Pandas e MatPlotLib

In [None]:
import pandas as pd

In [None]:
import matplotlib.pyplot as plt

Com o Pandas, criar um dataframe para a base **MTCars** https://stat.ethz.ch/R-manual/R-devel/library/datasets/html/mtcars.html

In [None]:
df = pd.read_csv("Dataset/mtcars.csv")

## Entendendo a base de dados 

Observar a estrutura do dataset

In [None]:
df.info()

Observar os primeiros registros do dataset

In [None]:
df.head()

## Plotagem de gráficos

Gráfico de dispersão

In [None]:
plt.figure(figsize=(15,8))
plt.scatter(df['wt'],df['mpg']);

Adicionando **Título**, **Suptítulo** e **rótulos dos eixos**

In [None]:
plt.figure(figsize=(15,8))
plt.scatter(df['wt'],df['mpg']);

plt.title("Motor Trend car Road Test")
plt.suptitle("Dados de 1974  Motor Trend US Magazine")
plt.xlabel("Peso do Carro")
plt.ylabel( "Mimlhas por Galão")

Inserindo cores a partir de uma variável

In [None]:
plt.figure(figsize=(15,8))

cores = {3:'tab:cyan',4:'tab:purple',5:'tab:green'}

for cambio in df['gear'].unique():
    tmp = df[df['gear'] == cambio]
    plt.scatter(tmp['wt'], tmp['mpg'], color=cores[cambio] )


plt.title("Motor Trend car Road Test")
plt.suptitle("Dados de 1974  Motor Trend US Magazine")
plt.xlabel("Peso do Carro")
plt.ylabel( "Milhas por Galão")



Inserindo marcadores a partir de uma variável

In [None]:
plt.figure(figsize=(15,8))

cores = {3:'tab:cyan',4:'tab:purple',5:'tab:green'}
marcadores = {3:'^',4:'s',5:'D'}


for cambio in df['gear'].unique():
    tmp = df[df['gear'] == cambio]
    plt.scatter(tmp['wt'], tmp['mpg'], color=cores[cambio],
                marker=marcadores[cambio], s=100)


plt.title("Motor Trend car Road Test")
plt.suptitle("Dados de 1974  Motor Trend US Magazine")
plt.xlabel("Peso do Carro")
plt.ylabel( "Milhas por Galão")


Histograma de uma variável

In [None]:
plt.figure(figsize=(15,8))
plt.hist(df['mpg'], edgecolor="black");

plt.title("Histograma de MPG", fontsize=20)
plt.xlabel("Milhas por Galão", fontsize=15)
plt.ylabel("Frequência", fontsize=15)

Histograma com os dados normalizados

In [None]:
plt.figure(figsize=(15,8))
plt.hist(df['mpg'], edgecolor="black", density=True)

Histograma impresso na horizontal

In [None]:
plt.figure(figsize=(15,8))
plt.hist(df['mpg'], edgecolor="black", orientation="horizontal")

Duas linhas verticais, a partir de valores calculados

In [None]:
plt.figure(figsize=(15,8))

cores = ["orange","purple"]
legenda = ["Média","Mediana"]

plt.hist(df['mpg'], edgecolor="black");
media, mediana = df['mpg'].mean(), df['mpg'].median()
plt.axvline(media, color=cores[0], lw=3, ls="--")
plt.axvline(mediana, color=cores[1], lw=3, ls="--")


Adicionando legenda no gráfico

In [None]:
plt.figure(figsize=(15,8))

cores = ["orange","purple"]
legenda = ["Média","Mediana"]

plt.hist(df['mpg'], edgecolor="black");
media, mediana = df['mpg'].mean(), df['mpg'].median()
plt.axvline(media, color=cores[0], lw=3, ls="--")
plt.axvline(mediana, color=cores[1], lw=3, ls="--")

plt.legend(legenda, loc="upper right")


Adicionando anotações ao gráfico, junto às linhas

In [None]:
plt.figure(figsize=(15,8))

cores = ["orange","purple"]
legenda = ["Média","Mediana"]

plt.hist(df['mpg'], edgecolor="black");
media, mediana = df['mpg'].mean(), df['mpg'].median()
plt.axvline(media, color=cores[0], lw=3, ls="--")
plt.axvline(mediana, color=cores[1], lw=3, ls="--")

plt.legend(legenda, loc="upper right")

plt.annotate(legenda[0], xy=(media + 0.5, 6),
             color=cores[0], fontsize=20)
plt.annotate(legenda[1], xy=(mediana - 3,6),
             color=cores[1], fontsize=20)

Gráfico de linha

In [None]:
plt.figure(figsize=(15,8))

plt.plot(df['wt'], df['mpg'], color="green", ls = "dotted")
plt.title("MTCars", fontsize=25)
plt.xlabel("WT", fontsize=15)
plt.ylabel("MPG", fontsize=15)
plt.legend(["WT"], loc="upper right")

Gráfico de linha com limite nos eixos **X** e **Y**

In [None]:
plt.figure(figsize=(15,8))

plt.plot(df['wt'], df['mpg'], color="green", ls = "dotted")

plt.xlim(2,5)
plt.ylim(20,25)

plt.title("MTCars", fontsize=20)
plt.xlabel("WT", fontsize=15)
plt.ylabel("MPG", fontsize=15)
plt.legend(["WT"], loc="upper right")

Cores das linhas e marcadores, a partir de valores da variável

In [None]:
plt.figure(figsize=(8,4.5))

menor_3 = df["wt"] < 3
maior_4 = df["wt"] > 4

plt.plot(df['wt'], df['mpg'], color="green", ls = "dotted"
         , marker = "o")
plt.plot(df[menor_3]['wt'],df[menor_3]['mpg'],color="blue"
         , ls = "dotted", marker = "o")
plt.plot(df[maior_4]['wt'],df[maior_4]['mpg'],color="blue"
         , ls = "dotted", marker = "o")
plt.title("MTCars", fontsize=25)
plt.xlabel("WT", fontsize=20)
plt.ylabel("MPG", fontsize=20)
plt.legend(["WT"], loc="upper right", fontsize=15);




Linhas horizontais com valores calculados

In [None]:
plt.figure(figsize=(15,8))

plt.plot(df['wt'], df['mpg'], color="green", ls = "dotted", marker = "o")
plt.title("MTCars", fontsize=25)
plt.xlabel("WT", fontsize=20)
plt.ylabel("MPG", fontsize=20)
plt.legend(["WT"], loc="upper right", fontsize=15)

plt.axhline(max(df['mpg']), color="orange", lw=3, ls="--")
plt.axhline(min(df['mpg']), color="orange", lw=3, ls='--')


Adicionando anotações no gráfico

In [None]:
plt.figure(figsize=(15,8))

plt.plot(df['wt'], df['mpg'], color="green", ls = "dotted", marker = "o")
plt.title("MTCars", fontsize=25)
plt.xlabel("WT", fontsize=20)
plt.ylabel("MPG", fontsize=20)
plt.legend(["WT"], loc="upper right", fontsize=15)

plt.axhline(max(df['mpg']), color="orange", lw=3, ls="--")
plt.axhline(min(df['mpg']), color="purple", lw=3, ls='--')

x_max = df['wt'][df['mpg'].idxmax()]
y_max = max(df['mpg'])
plt.annotate("Max", xy=(x_max,y_max), color="orange", fontsize=15)

x_min = df['wt'][df['mpg'].idxmin()]
y_min = min(df['mpg'])
plt.annotate("Min", xy=(x_min,y_min), color="purple", fontsize=15)




Deslocando o texto das anotações e inserindo uma seta

In [None]:
plt.figure(figsize=(15,8))

plt.plot(df['wt'], df['mpg'], color="green", ls = "dotted", marker = "o")
plt.title("MTCars", fontsize=25)
plt.xlabel("WT", fontsize=20)
plt.ylabel("MPG", fontsize=20)
plt.legend(["WT"], loc="upper right", fontsize=15)

plt.axhline(max(df['mpg']), color="orange", lw=3, ls="--")
plt.axhline(min(df['mpg']), color="purple", lw=3, ls='--')

x_max = df['wt'][df['mpg'].idxmax()]
y_max = max(df['mpg'])

xt_max = df['wt'][df['mpg'].idxmax()] + 0.5
yt_max = max(df['mpg']) - 5

plt.annotate("Max", xy=(x_max,y_max), color="orange",
             fontsize=15,xytext=(xt_max,yt_max), arrowprops=dict(facecolor="orange") )



x_min = df['wt'][df['mpg'].idxmin()]
y_min = min(df['mpg'])

xt_min = df['wt'][df['mpg'].idxmin()] - 0.5
yt_min = min(df['mpg']) + 5

plt.annotate("Min", xy=(x_min,y_min), color="purple", fontsize=15,
            xytext=(xt_min,yt_min), arrowprops=dict(facecolor="purple"))


Diagrama de Caixa simples

In [None]:
plt.figure(figsize=(15,8))

box = df.boxplot(column="mpg", 
                 grid=False, return_type=None)

Diagrama de caixa com uma variável segmentando as caixas

In [None]:
plt.figure(figsize=(15,8))

box = df.boxplot(column="mpg", by="cyl",grid=False, return_type=None)
plt.suptitle("")
plt.title("Boxplot - MPG")

