# üïí M√©dia de passageiros por hora ‚Äî Maio (toda a frota)

Esta consulta cria a *view* `DateTimeMediumPassenger` que calcula a **m√©dia de passageiros por hora do dia**
para o **m√™s de maio** (`Mes_Inicio_Viagem = 5` e `Mes_Fim_Viagem = 5`), considerando **todos os t√°xis da frota**.


In [0]:
%sql
-- Contexto (cat√°logo e schema) onde a view ser√° criada
USE CATALOG ifood_case;
USE SCHEMA  nytaxi;

-- Cria (ou substitui) a VIEW que consolida a m√©dia de passageiros por hora do dia em maio
CREATE OR REPLACE VIEW DateTimeMediumPassenger AS

-- =========================================
-- CTE: prepara dados do m√™s de maio
-- - Deriva a data no formato dd-MM-yyyy (Data_Viagem)
-- - Extrai a hora do dia (Hora_Dia) a partir de 'Hora_Inicio_Viagem'
-- - Converte 'passenger_count' para DOUBLE (para AVG)
-- - Mant√©m colunas √∫teis para auditoria/extens√µes (vendorId, total_amount, timestamps)
-- - Filtra apenas corridas cujo in√≠cio e fim est√£o em maio (Mes_Inicio_Viagem = Mes_Fim_Viagem = 5)
--   >> Observa√ß√£o: o nome da CTE coincide com o nome da view; √© v√°lido, mas se preferir clareza, renomeie a CTE.
-- =========================================
WITH DateTimeMediumPassenger AS (
  SELECT
      DATE_FORMAT(tpep_pickup_datetime, 'dd-MM-yyyy')         AS Data_Viagem     -- data do pickup (dia/m√™s/ano)
    , TRY_CAST(SUBSTRING(Hora_Inicio_Viagem, 1, 2) AS INT)    AS Hora_Dia        -- hora (0‚Äì23) extra√≠da do campo textual
    , TRY_CAST(passenger_count AS DOUBLE)                     AS passenger_count -- casting para permitir AVG
    , vendorId                                                                   -- mantido para eventuais recortes por fornecedor
    , total_amount                                                               -- mantido para futuras an√°lises de receita
    , tpep_dropoff_datetime                                                      -- timestamp de t√©rmino
    , tpep_pickup_datetime                                                       -- timestamp de in√≠cio
  FROM GoldYellow
  WHERE
    Mes_Fim_Viagem        = 5                                                   -- fim em maio
    AND Mes_Inicio_Viagem = 5                                                   -- in√≠cio em maio
)

-- =========================================
-- Agrega√ß√£o final: m√©dia por Data_Viagem + Hora_Dia
-- - Responde diretamente √† pergunta solicitada
-- - Filtra horas v√°lidas (0‚Äì23)
-- - Calcula AVG(passenger_count) com 2 casas decimais
-- =========================================
SELECT
    Data_Viagem
  , Hora_Dia
  , ROUND(AVG(passenger_count), 2) AS Media_Passageiros
FROM DateTimeMediumPassenger
WHERE Hora_Dia BETWEEN 0 AND 23
GROUP BY
    Data_Viagem
  , Hora_Dia
ORDER BY
    Data_Viagem ASC
  , Hora_Dia   ASC;


In [0]:
%sql
-- Contexto (cat√°logo e schema) onde a view ser√° criada
USE CATALOG ifood_case;
USE SCHEMA  nytaxi;

SELECT * FROM DateTimeMediumPassenger