# **Instalar as bibliotecas**


In [None]:
!pip install pandas

In [None]:
!pip install matplotlib

In [None]:
!pip install plotly

# **Importar as bibliotecas**


In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import plotly.express as px

# **Importar dados**


**O arquivo csv está no drive junto da aula, para rodar essa célula é necessário upar o csv aqui no colab**


In [None]:
df = pd.read_csv(
    "https://raw.githubusercontent.com/dudu-soliveira/pijr-trainee-2024-2/refs/heads/main/aula_4/CopaDoMundo.csv"
)

# **Entender os dados**


In [None]:
df.columns

In [None]:
df.head()

In [None]:
df.describe()

# **Matplotlib**


## **Propriedades**


In [None]:
import numpy as np

x = np.linspace(0, 10, 100)  # Valores de x de 0 a 10
y = np.sin(x)  # Valores de y como seno de x


# Define o tamanho da figura do gráfico.
plt.figure(figsize=(10, 6))


# Plota os dados. Aqui, estamos usando:
plt.plot(
    x,
    y,  # Dados a serem plotados
    label="Seno",  # label: Nome para a legenda.
    color="blue",  # color: Cor da linha.
    linestyle="-",  # linestyle: Estilo da linha (sólido, pontilhado, etc.).
    linewidth=2,
)  # linewidth: Espessura da linha.


# Adiciona um título ao gráfico.
plt.title("Gráfico de Seno", fontsize=16, fontweight="bold")


# Adicionam rótulos aos eixos x e y, respectivamente.
plt.xlabel("Valor de x", fontsize=14)
plt.ylabel("Valor de sin(x)", fontsize=14)


# Adiciona uma grade ao gráfico. É possível ajustar o estilo e a transparência.
plt.grid(True, linestyle="--", alpha=0.7)


# Adiciona uma legenda ao gráfico, que explica o que cada linha representa.
plt.legend(loc="upper right", fontsize=12)


# Definem os limites dos eixos x e y.
plt.xlim(0, 10)
plt.ylim(-1.5, 1.5)


# Ajustam o tamanho das marcas nos eixos.
plt.xticks(fontsize=12)
plt.yticks(fontsize=12)


# Permite adicionar anotações ao gráfico, como comentários ou marcas em pontos específicos.
plt.annotate(
    "Ponto máximo",
    xy=(np.pi / 2, 1),
    xytext=(np.pi / 2 + 1, 1.2),
    arrowprops=dict(facecolor="black", arrowstyle="->"),
    fontsize=12,
)


# Exibe o gráfico final.
plt.show()

## **Exemplos**


In [None]:
plt.figure(figsize=(10, 6))
plt.bar(df["YEAR"], df["GOALS SCORED"], color="green", alpha=0.7)

plt.title("Total de Gols Marcados por Copa do Mundo")
plt.xlabel("Ano da Copa do Mundo")
plt.ylabel("Gols Marcados")
plt.xticks(rotation=45)
plt.grid(axis="y")

plt.show()

In [None]:
df["AVG GOALS"] = df["GOALS SCORED"] / df["MATCHES PLAYED"]

plt.figure(figsize=(15, 6))
plt.plot(df["YEAR"], df["AVG GOALS"], marker="o", color="purple")

plt.title("Média de Gols por Jogo ao Longo dos Anos")
plt.xlabel("Ano da Copa do Mundo")
plt.ylabel("Média de Gols por Jogo")
plt.grid()

plt.show()

# **Plotly Express**


## **Propriedades**


In [None]:
x = np.linspace(0, 10, 100)  # Valores de x de 0 a 10
y = np.sin(x)  # Valores de y como seno de x

# Criando um DataFrame para Plotly
data = pd.DataFrame({"x": x, "y": y})

fig = px.line(
    data,  # Dados a serem plotados
    x="x",  # Coluna para o eixo x
    y="y",  # Coluna para o eixo y
    title="Gráfico de Seno",  # Título do gráfico
    labels={"x": "Valor de x", "y": "Valor de sin(x)"},  # Rótulos dos eixos
    line_shape="linear",
)  # Forma da linha (linear, spline, etc.)

# Adicionando a legenda e personalizando a linha
fig.update_traces(
    name="Seno",  # Nome da linha na legenda
    line=dict(
        color="blue",  # Cor da linha
        width=2,
    ),
)  # Largura da linha

# Adicionando título e rótulos
fig.update_layout(
    title=dict(
        text="Gráfico de Seno",  # Título do gráfico
        font=dict(
            size=16,  # Tamanho da fonte
            family="Arial",  # Família da fonte
            color="black",
        ),
    ),  # Cor da fonte
    xaxis_title="Valor de x",  # Rótulo do eixo x
    yaxis_title="Valor de sin(x)",  # Rótulo do eixo y
    xaxis=dict(tickfont=dict(size=12)),  # Tamanho da fonte das marcas do eixo x
    yaxis=dict(tickfont=dict(size=12)),  # Tamanho da fonte das marcas do eixo y
    showlegend=True,
)  # Exibe a legenda

# Adicionando uma anotação
fig.add_annotation(
    x=np.pi / 2,
    y=1,  # Coordenadas da anotação
    text="Ponto máximo",  # Texto da anotação
    showarrow=True,  # Exibe uma seta
    arrowhead=2,  # Estilo da seta
    ax=0,
    ay=-40,
)  # Offset da anotação

# Exibindo o gráfico
fig.show()

## **Exemplos**


In [None]:
fig_gols = px.bar(
    df,
    x="YEAR",
    y="GOALS SCORED",
    title="Total de Gols Marcados por Copa do Mundo",
    color_discrete_sequence=["green"],
)

fig_gols.update_layout(
    xaxis_title="Ano da Copa do Mundo",
    yaxis_title="Gols Marcados",
    xaxis_tickangle=-45,
    yaxis=dict(showgrid=True),
)

fig_gols.show()

In [None]:
df["AVG GOALS PER GAME"] = df["GOALS SCORED"] / df["MATCHES PLAYED"]

fig = px.line(
    df,
    x="YEAR",
    y="AVG GOALS PER GAME",
    title="Evolução da Média de Gols por Jogo nas Copas do Mundo",
    markers=True,
    color_discrete_sequence=["purple"],
)

fig.update_layout(
    xaxis_title="Ano da Copa do Mundo",
    yaxis_title="Média de Gols por Jogo",
    xaxis_tickangle=-45,
    plot_bgcolor="rgba(0,0,0,0)",
    hovermode="x unified",
)

fig.show()

# **Desafio**


In [None]:
campeoes_count = df["CHAMPION"].value_counts().head(5)