Permalink
Fetching contributors…
Cannot retrieve contributors at this time
212 lines (172 sloc) 10.9 KB

Guia do Cientista de Dados das Galáxias

neil

--

DISCLAIMER: Este repositório foi feito pela e para a comunidade. Existem opiniões divergentes sobre o que é básico e o que é avançado entre outros temas. Caso discorde de alguma coisa que está escrita aqui, fique a vontade para fazer um pull request melhorando as descrições feitas aqui.

O intuito é agregar o conhecimento que se espalha em diversos grupos e iniciativas. Muitas vezes esse conhecimento fica espalhado em drives, pockets e outros meios... Dessa forma, esse repositório visa ajudar os iniciantes e servir como referência para os experientes.

Se possuir material interessante, por favor compartilhe com a comunidade. Estamos aqui para crescermos juntos.

Dessa iniciativa também nasceu o Pizza de Dados, um podcast brasileiro focado em ciência de dados. Se tiver um tempinho, prestigie esse trabalho 100% brasileiro.

No mais, é isso. Bem vinda(o), pequena(o) padawan :)

Sumário

Algumas dicas sobre o que estudar para ser um cientista de dados hoje:


Recomendações

Iniciante

  • Python (lib Pandas) ou R
  • SQL
  • Jupyter Notebook
  • Estatística Descritiva

Intermediário

  • Machine Learning
  • Cálculo
  • Álgebra Linear
  • Deep Learning
  • Processamento de Linguagem Natural

Grandes projetos (big data)

  • NoSQL
  • Scala
  • Spark
  • Estatística Bayesiana
  • Hive
  • Hadoop
  • Julia
  • Computação distribuída com AWS e Google Cloud

Em Python

Em R

Em Julia


Vídeos

Estudos

Webcasts & Webinars

Tutoriais de Python


Datasets


Grupos


Metodologias ágeis


Dados em Imagens

infographic