Skip to content

Repositório com scripts e notebooks utilizando Python 3 e bancos de dados relacionais e não-relacionais (Oracle, MongoDB, Redis, Neo4J) como estudo para a Pós-Graduação em Data Science & Big Data pela Pontifícia Universidade Católica de Minas Gerais (PUC-MG)

vhnegrisoli/materiais-pos-graduacao

Repository files navigation

Especialização em Data Science & Big Data (PUC-MG)

Logo PUC

Materiais e scripts desenvolvidos durante as aulas da especialização

Repositório com scripts e notebooks utilizando Python 3 e bancos de dados relacionais e não-relacionais (Oracle, MongoDB, Redis, Neo4J) como estudo para a Pós-Graduação em Data Science & Big Data pela Pontifícia Universidade Católica de Minas Gerais (PUC-MG)

Tecnologias abordadas

  • Python 3
  • NumPy
  • Pandas
  • Microsoft Power BI
  • SQL: Oracle Database (Apex)
  • NoSQL: MongoDB
  • NoSQL: Redis
  • NoSQL: Neo4j
  • Tableau Desktop
  • Java 11
  • Apache Spark
  • Hadoop
  • Docker e Docker-Compose

Matérias do curso

Início: 03/2020 Conclusão aproximada: 08/2021

Conteúdos já desenvolvidos

Durante os conteúdos da Pós, foram desenvolvidos Notebooks integrando bancos de dados NoSQL à linguagem Python, foram também criado Notebooks contendo o uso da ferramenta Pandas e NumPy para tratamento e análise avanada de dados. E também foram desenvolvidas dashboards com o Microsoft Power BI para visualização de dados, Analytics e Data Discovery.

01 - Bancos de Dados Relacionais e Não-Relacionais

Integração do MongoDB ao Python usando a biblioteca PyMongo:

Notebook - Python e MongoDB

Integração do Redis ao Python com a biblioteca redis, criando conexão e inserindo documentos:

Python - Redis

02 - Linguagens de Programação para Ciência de Dados

Utilização do DataFrame do Pandas para transformar dados:

Pandas - DataFrame

Utilização da biblioteca NumPy e teste de benchmarking com funções de cálculos:

NumPy

03 - Visualização de Dados

Dashboard analisando casos de feminicídio no Brasil no ano de 2015.

Feminicídio Dashboard

Dashboard analisando casos de reclamação do Procon entre os anos de 2014 a 2017

Procon Dashboard

Dashboard analisando casos de dengue no Brasil entre os anos de 1991 a 2014

Dengue Dashboard

04 - Data Discovery & Analytics

Dashboard analisando os casos de acidentes da Prefeitura de Belo Horizonte por regional, bairros, períodos e dia da semana

Dados Acidentes PBH - Regional, Barrio, Período Dia Semana

Dashboard analisando os casos de acidentes da Prefeitura de Belo Horizonte por perfil do condutor, habilitação, embriaguez, sexo e feixa de idade

Dados Acidentes PBH - Regional, Barrio, Período Dia Semana

09 - Modelos Estatísticos

Plotagem de um modelo de regressão linear múltipla utilizando Scikit-Learn, Matplotlib e Seaborn.

Regressão Linear Múltipla

Modelo de regressão logística para analisar sobreviventes por sexo utilizando Scikit-Learn, Matplotlib e Seaborn.

Regressão Logística

Modelo de algoritmo de Média Móvel Simples (MMS) para realização de forecast de séries temporais

Forecast MMS

10 - Machine Learning

Modelo de treino e teste para algoritmo de Árvores de Decisão do dataset Iris da Scikit-Learn

Árvores de Decisão

Modelo de algoritmo de Árvore de Decisão do dataset Iris da Scikit-Learn com a biblioteca DTreeViz para visualização

DTreeViz

About

Repositório com scripts e notebooks utilizando Python 3 e bancos de dados relacionais e não-relacionais (Oracle, MongoDB, Redis, Neo4J) como estudo para a Pós-Graduação em Data Science & Big Data pela Pontifícia Universidade Católica de Minas Gerais (PUC-MG)

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages