Skip to content
@mbaliu-treino

mbaliu-treino

Repositórios de Estudos

1. Projetos Guiados

2. Santander Code 2023: Data Engineering

Curso profissionalizante na área de engenharia de dados oferecido pela Ada Tech, com apoio do banco Santander. Carga horária de 324 horas no total ao longo de 5 meses, com aulas síncronas e entrega de um projeto de conclusão para cada um dos 6 módulos (54 horas).

Conheça o meu repositório de resumo do curso: Santander Code 2023 - Data Engineering

Os temas abordados foram:

  • Lógica de programação (Python)
  • Programação orientada a objetos (OOP)
  • Técnicas de programação para dados
  • Extração automatizada de dados
  • Analytics Engineering

    • PROJETO FINAL - Data Pipeline de especialização de dados com Python, DBT e Data Quality
      • Imagem
      • Solução de dados para especializar dados do AirBnB em camadas de um Data Warehouse. Para a construção da camada RAW (BRONZE), os dados em arquivo CSV foram adquiridos na web e ingeridos em uma instância PostgreSQL na AWS RDS (ou um container Docker) através de uma aplicação Python. Na camada de Data Quality, os dados da RAW foram validados com o Great Expectations. Identificado e documentado as falhas de qualidades, os dados foram tratados com Pandas e persistidos na camada TRUSTED. Neste camada, novamente outra validação de qualidade foi realizada. Para disponibilizar informações de negócios, os dados foram harmonizados e especializados utilizando o DBT.
  • Big Data

    • PROJETO FINAL - Desenvolvimento e Avaliação da Performance de uma Arquitura Distribuída usando Databricks, Apache Hive, Python
      • Arquitetura de solução de Big Data de dados do Cadastro Ambiental Rural (CAR). O projeto é um estudo sobre o desempenho de uma proposta de particionamento do Banco de Dados. Ele compreende o desenho da arquitetura, implementação, modelagem dos dados e avaliação da efetividade do particionamento segundo alguns testes de consultas.

Link da página oficial do curso:

Curso Badge

3. Desenvolve 2022: Ciência de Dados

Curso profissionalizante na área de ciência de dados oferecido pelo Grupo Boticário junto da escola de programação Alura. Carga horária de 625 horas no total ao longo de 10 meses.

Conheça o meu repositório de resumo do curso: Desenvolve 2022 - Ciência de Dados

Os temas abordados foram:

  • Engenharia de software e Computação
  • Análise de Dados
  • Estatística
  • Algorítmos de Machine Learning: supervisionados e não-supervisionados
  • Deploy de modelos
  • Validação de modelos de ML
  • Deep Learning
  • NLP
  • Visão Computacional
  • Urban Data Science
  • Metodologia Ágil

Pinned Loading

  1. SDS SDS Public

    Spatial Data Science (SDS) learning repository

    Jupyter Notebook

  2. Desenvolve Desenvolve Public

    Notas de aulas do Programa Desenvolve na trilha de Dados

    Jupyter Notebook

  3. Bootcamp-Challenge Bootcamp-Challenge Public

    Bootcamps, Challenges, and Competitions

    Jupyter Notebook

Repositories

Showing 10 of 18 repositories
  • ada-big-data-hadoop-hive-partition Public

    Big data solution with Apache Hive to analyze environmental data

    mbaliu-treino/ada-big-data-hadoop-hive-partition’s past year of commit activity
    Jupyter Notebook 0 0 0 0 Updated Jul 11, 2024
  • .github Public
    mbaliu-treino/.github’s past year of commit activity
    0 0 0 0 Updated Jul 11, 2024
  • 101_etl_pipeline_xlsx Public

    Guided project to build an ETL pipeline with data in file XLSX

    mbaliu-treino/101_etl_pipeline_xlsx’s past year of commit activity
    Jupyter Notebook 0 0 0 0 Updated Jul 5, 2024
  • bootcamp-data-engineering-aws-2023 Public

    Bootcamp about data engineering in Cloud with AWS

    mbaliu-treino/bootcamp-data-engineering-aws-2023’s past year of commit activity
    Jupyter Notebook 0 0 0 0 Updated Jul 4, 2024
  • 101-csharp-fundamentals Public

    First studies about C# programing language

    mbaliu-treino/101-csharp-fundamentals’s past year of commit activity
    C# 0 0 0 0 Updated Mar 18, 2024
  • ada-santander-projeto-big-data Public

    Projeto final de curso do módulo 6 - Big Data

    mbaliu-treino/ada-santander-projeto-big-data’s past year of commit activity
    Jupyter Notebook 0 0 0 0 Updated Nov 22, 2023
  • learn-data-quality-great-expectations Public

    Annotations during tutorials about the Data Quality framework Great-Expectations

    mbaliu-treino/learn-data-quality-great-expectations’s past year of commit activity
    Jupyter Notebook 0 0 0 0 Updated Oct 25, 2023
  • mbaliu-treino/ada-santander-projeto-analytics-engineering’s past year of commit activity
    Jupyter Notebook 0 0 0 0 Updated Oct 20, 2023
  • ADA-ED-4-proj Public

    Projeto final de curso do módulo 4 - Extração de Dados

    mbaliu-treino/ADA-ED-4-proj’s past year of commit activity
    Jupyter Notebook 0 0 0 0 Updated Oct 4, 2023
  • ADA_Engenharia_de_Dados Public

    Repositório de estudos realizados durante o curso da ADA Tech na trilha de Engenharia de Dados

    mbaliu-treino/ADA_Engenharia_de_Dados’s past year of commit activity
    Jupyter Notebook 0 0 0 0 Updated Aug 22, 2023

People

This organization has no public members. You must be a member to see who’s a part of this organization.

Top languages

Loading…

Most used topics

Loading…