Utilizaremos uma amostra dos dados de 2006 do dataset: Data Expo 2009: Airline on time data.
Utilize esse link para baixar o arquivo csv.
Uma descrição dos dados presentes no dataset pode ser encontrada nesse link.
Em duplas, utilizar o workflow de feature branch e escrever códigos em bash script
para resolver os seguintes problemas.
Para cada feature, uma issue precisa ser aberta. A issue deve ser assinalada a um dos componentes da dupla. O pull request com a implementação da feature deve fechar a issue relacionada. Por favor verificar essa referência sobre como relacionar uma issue a um pull request.
-
Descobrir a quantiade de atrasos de uma dada companhia passada como parâmetro. Consultar essa referência sobre como criar e receber parâmetros em um script bash.
-
Descobrir o vôo com maior atraso na chegada (
ArrDelay
) registrado. -
Descobrir o vôo com maior atraso na saída (
DepDelay
) registrado. -
Descobrir o vôo mais longo.
-
Contar quantos vôos precisaram ser redirecionados (
Diverted
). -
Utilizando a dica nessa resposta, calcular o tempo de atraso total para a companhia
Delta Air Lines
. Não esquecer de filtrar linhas com dados faltando e também com valores negativos (casos em que os vôos são adiantados) -
Mostrar o tempo total de atrasos para a decolagem de vôos no aeroporto
JFK
, de Nova Iorque. -
Mostrar o tempo total de atrasos para pousos no
Aeroporto Internacional de Los Angeles
.
Utilizar a referência no link, para construir scripts que implementem as seguintes funcionalidades:
-
Listar qual companhia teve o maior tempo total de atrasos (atrasos somente na decolagem).
-
Listar qual aeroporto teve o maior tempo total de atrasos (atrasos somente na decolagem).