Repositório para juntar informações sobre materiais de estudo em análise de dados e áreas afins, empresas que trabalham com dados e dicionário de conceitos
Latest commit b3dc9b5 Jan 19, 2018

README.md

Guia do Cientista de Dados das Galáxias

neil

--

DISCLAIMER: Este repositório foi feito pela e para a comunidade. Existem opiniões divergentes sobre o que básico e o que é avançado entre outros temas. Caso discorde de alguma coisa que está escrita aqui, fique a vontade para fazer um pull request melhorando as descrições feitas aqui.

O intuito é agregar o conhecimento que se espalha em diversos grupos e iniciativas. Muitas vezes esse conhecimento fica espalhado em drives, pockets e outros meios... Dessa forma, esse repositório visa ajudar os iniciantes e servir como referência para os experientes.

Se possuir material interessante, por favor compartilhe com a comunidade. Estamos aqui para crescermos juntos.

Dessa iniciativa também nasceu o Pizza de Dados, um podcast brasileiro focado em ciência de dados. Se tiver um tempinho, prestigie esse trabalho 100% brasileiro.

No mais, é isso. Bem vindo(a), pequeno(a) padawan :)

Sumário

Algumas dicas sobre o que estudar para ser um cientista de dados hoje:


Recomendações

Iniciante

  • Python (lib Pandas) ou R
  • SQL
  • Jupyter Notebook
  • Estatística Descritiva

Intermediário

  • Machine Learning
  • Cálculo
  • Álgebra Linear
  • Deep Learning
  • Linguagem de Processamento Natural

Grandes projetos (big data)

  • NoSQL
  • Scala
  • Spark
  • Estatística Bayesiana
  • Hive
  • Hadoop
  • Julia
  • Computação distribuída com AWS e Google Cloud

Em Python

  • Numpy
  • Pandas
  • Scipy
  • Matplotlib (Visualização)
  • Seaborn (Visualização)
  • Bokeh (Visualização)
  • Sklearn

Vídeos

Estudos

Webcasts & Webinars


Datasets


Grupos


Metodologias ágeis


Dados em Imagens

infographic