# TESTE DATAFRAMES FOOD DELIVERY

Link do dataset: https://www.kaggle.com/datasets/gauravmalik26/food-delivery-dataset/data?select=train.csv

Visualização de dados sobre:
1. Média de idade dos entregadores por cidade
2. Número de entregas diárias feitas por densidade igual a 'low' e 'jam'
3. Avaliações médias das entregas por semana
4. Média de avaliações das entregas feitas por condições climáticas

## 0. INSPEÇÃO INICIAL (LIMPEZA E TRATAMENTO)

In [4]:
# IMPORTANDO BIBLIOTECA PANDAS PARA ANÁLISE DE DADOS
import pandas as pd
import plotly.express as px

In [5]:
# Abrindo arquivo csv com base de dados 'limpa':
df = pd.read_csv('clean_food_delivery_dataset.csv')

In [6]:
# Removendo coluna errônea
df = df.drop('Unnamed: 0', axis=1)

In [7]:
# Convertendo a coluna 'Data_Pedido' para datetime
df['Data_Pedido'] = pd.to_datetime(df['Data_Pedido'])

# Criando a coluna 'Semana_Ano'
df['Semana_Ano'] = df['Data_Pedido'].dt.strftime('%U')

## 1. Média de idade dos entregadores por cidade

In [19]:
# Agrupando cidades
df_cidades = df.groupby('Cidade')

# Calculando média de idade dos entregadores por cidade
df_1 = df_cidades['Idade_Entregador'].mean().reset_index(name='Media de Idade dos Entregadores')

# Plotagem em gráfico de barras verticais
px.bar(df_1, y='Cidade', x='Media de Idade dos Entregadores', orientation='h')

## 2. Número de entregas diárias feitas por densidade igual a 'low' e 'jam'

In [34]:
# Selecionando registros com densidade de trafego igual a 'low' e 'jam'
condicao = (df['Densidade_Trafego'] == 'Low') | (df['Densidade_Trafego'] == 'Jam')
df_densidades = df.loc[condicao, :]

# Agrupando entregas por data e densidade / Calculando contagem de entregas
df_2 = df_densidades.groupby(['Data_Pedido'])['ID'].count().reset_index(name='Quantidade de Entregas Low/Jam')

# Plotando em gráfico de linhas
px.line(df_2, x='Data_Pedido', y='Quantidade de Entregas Low/Jam')


The behavior of DatetimeProperties.to_pydatetime is deprecated, in a future version this will return a Series containing python datetime objects instead of an ndarray. To retain the old behavior, call `np.array` on the result



## 3. Avaliações médias das entregas por semana

In [42]:
# Agrupamento das semanas
df_semanas = df.groupby('Semana_Ano')

# Cálculo das avaliações médias por semana
df_3 = df_semanas['Avaliacoes_Entregador'].mean().reset_index(name='Avaliacoes Medias de Entregas')

# Plotagem de gráfico de barras
px.bar(df_3, x='Semana_Ano', y='Avaliacoes Medias de Entregas')

## 4. Média de avaliações das entregas feitas por condições climáticas

In [61]:
# Agrupando condições climáticas
df_cc = df.groupby('Condicoes_Climaticas')

# Calculando média de avaliações das entregas por condição climática
df_4 = df_cc['Avaliacoes_Entregador'].mean().reset_index(name='Media de Avaliacoes de Entregas')

# Excluindo registros NaN
df_4 = df_4.loc[df_4['Condicoes_Climaticas'] != 'conditions NaN']

# Plotagem de gráfico de rosca (donut chart)
fig = px.pie(df_4, names='Condicoes_Climaticas', values='Media de Avaliacoes de Entregas', hole=0.4, title='Média de Avaliações por Condição Climática')
fig.update_traces(textinfo='value', text=df_4['Media de Avaliacoes de Entregas'])
# Exibir o gráfico
fig.show()