# üèéÔ∏è An√°lise de Pit Stops - Temporada 2024

üìç *Notebook 05: An√°lise de Pit Stops*

Neste notebook, vamos explorar os **pit stops** realizados durante a temporada 2024, analisando os tempos m√©dios por piloto e equipe, al√©m de identificar os pit stops mais r√°pidos.

Ser√£o realidzadas as seguintes etapas:
1. Importar os dados necess√°rios.
2. Filtrar os pit stops da temporada 2024.
3. Juntar com os dados dos pilotos e equipes.
4. Analisar os tempos m√©dios de pit stop por piloto e por equipe.
5. Identificar os pit stops mais r√°pidos.
6. Visualizar os dados com gr√°ficos.

Essa an√°lise ajuda a entender a efici√™ncia das equipes nos boxes, algo crucial em corridas onde cada mil√©simo conta.

Vamos come√ßar!


In [31]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np

# 1. Estilo dos gr√°ficos

In [32]:
sns.set(style='darkgrid')
plt.rcParams['figure.figsize'] = (12, 6)


# 2. Importando os dados que ser√£o utilizados

In [33]:
pit_stops_2024 = pd.read_csv('../data_filtrada/pit_stops_2024.csv')
drivers = pd.read_csv('../data/drivers.csv')
constructors = pd.read_csv('../data/constructors.csv')
races_2024 = pd.read_csv('../data_filtrada/races_2024.csv')
results_2024 = pd.read_csv('../data_filtrada/results_2024.csv')

# 3. Pr√©-processamento dos dados

In [None]:
def tempo_para_segundos(tempo_str):
    try:
        # Verificando se o valor j√° √© num√©rico (caso 22.437)
        if isinstance(tempo_str, (int, float)):
            return float(tempo_str)
        
        # Verificando se o valor est√° no formato de string "minutos:segundos"
        if isinstance(tempo_str, str) and ':' in tempo_str:
            minutos, segundos = tempo_str.split(':')
            return int(minutos) * 60 + float(segundos)
        
        # Caso o valor n√£o se encaixe em nenhum dos formatos, retorna NaN
        return np.nan
    except Exception as e:
        print(f'Erro ao processar o valor: {tempo_str} -> {e}')
        return np.nan

# Aplicando a convers√£o para segundos
pit_stops_2024['duration'] = pit_stops_2024['duration'].apply(tempo_para_segundos)

# Remover linhas com valores NaN (caso algum valor n√£o tenha sido convertido corretamente)
pit_stops_2024 = pit_stops_2024.dropna(subset=['duration'])


# 4. Jun√ß√£o de dados (pilotos, equipes e corridas)

In [34]:
resultados_reduzidos = results_2024[['driverId', 'raceId', 'constructorId']]
pit_stops_com_constructor = pit_stops_2024.merge(resultados_reduzidos, on=['driverId', 'raceId'], how='left')
pit_completo = pit_stops_com_constructor.merge(drivers, on='driverId', how='left').merge(races_2024, on='raceId', how='left').merge(constructors, on='constructorId', how='left')

# 5. Paradas mais r√°pidas da temporada

# 6. Dura√ß√£o m√©dia por equipe

# 7. Conclus√£o 
Neste notebook analisei os dados de **paradas nos boxes** da temporada de 2024. Identificamos: 

- As 10 paradas mais r√°pidas da temporada. 
- As equipes com menor tempo m√©dio de parada, evidenciando aquelas que t√™m melhor desempenho operacional.

A an√°lise de pit stops revela o papel essencial da equipe al√©m do piloto, mostrando como segundos podem fazer a diferen√ßa em uma corrida.

üëâ **Pr√≥ximo passo:** `06_analise_abandonos_2024.ipynb`