F1 Lake

Vamos coletar, armazenar, processar dados de Fórmula 1 para construção de análises e modelos preditivos.

Todo projeto será realizado ao vivo na Twitch (Téo Me Why) de maneira aberta para toda a comunidade com início no dia 02/03 às 9AM.

A gravação ficará disponível no YouTube para apoiadores do canal.

Coleta

Utilizaremos a biblioteca FastF1 como fonte de dados, a partir de scripts em Python para realizar a coleta das informações históricas.

Esta etapa será executada em um servidor próprio de maneira agendada.

Envio dos dados

Ainda que a coleta seja feita em um servidor próprio, enviaremos esses dados para um Bucket S3 na AWS. Assim, a Nekt poderá acessar os dados brutos para realizar a ingestão em nosso Lakehouse.

Em termos de camada de dados, ela nos servirá de camada raw, ou camada de dados brutos.

Camada Bronze

Na camada bronze, nossos dados estarão consolidados em formato Delta com histórico de modificações, facilitando suas consultas. Além disso, teremos uma representação fiel de como este dado poderia ser encontrado em sua origem.

Camada Silver

A partir dos dados na camada anterior, já dentro de nosso Lakehouse, podemos realizar novas modelagens de dados e também criação de Feature Stores com o histórico de cada entidade de nosso interesse.

Camada Gold

Aqui, deixamos apenas tabelas em formatos de relatórios e dados sumarizados para que sejam facilmente analisados e conectados em ferramentas de BI/dashboards.

Treinamento do Modelo

Utilizando dados das Feature Store e eventos de interesse, podemos gerar uma Analytical Base Table (ABT) para treinar nossos algoritmos de Machine Learning.

Os modelos serão treinados e comparados localmente, fazendo uso do MLFlow hospedado em nosso servidor próprio.

Aplicação para usuário

Com nosso modelo treinado, podemos criar uma aplicação onde entusiastas de Fórmula 1 poderão acompanhar as predições do modelo.

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
img		img
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

F1 Lake

Etapas do projeto

Coleta

Envio dos dados

Camada Bronze

Camada Silver

Camada Gold

Treinamento do Modelo

Aplicação para usuário

About

Uh oh!

Releases

Sponsor this project

Uh oh!

Packages

Uh oh!

Contributors

Uh oh!

Uh oh!

License

TeoMeWhy/f1-lake

Folders and files

Latest commit

History

Repository files navigation

F1 Lake

Etapas do projeto

Coleta

Envio dos dados

Camada Bronze

Camada Silver

Camada Gold

Treinamento do Modelo

Aplicação para usuário

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Sponsor this project

Uh oh!

Packages 0

Uh oh!

Contributors

Uh oh!

Packages