Skip to content

Projeto de engenharia de dados para obtenção de dados, desenvolvimento de um deltalake com o python e análises com o Apache Spark

License

Notifications You must be signed in to change notification settings

cantaruttim/Deltalake

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

12 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Deltalake

O objetivo deste projeto é construir uma aplicação em engenharia de dados que utilize duas fontes de dados (o yahoo finance e o github)

Tasks

  • Utilizar dados reais (yahoo finance & github)
  • Criar um deltalake com python 🎉
  • Copiar esses dados para o deltalake
  • Realizar análises com o Apache Spark
  • Realizar um modelo de machine learning para prever preços das ações 🎉
  • Automatizar o processo de obtenção de dados 🎉
  • Possibilitar análises em tempo real (Kafka) 🎉

Pipeline

Inicialmente tenhos o nosso fluxo de operações da seguinte maneira:

image

About

Projeto de engenharia de dados para obtenção de dados, desenvolvimento de um deltalake com o python e análises com o Apache Spark

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published