Permalink
Branch: master
Find file Copy path
Fetching contributors…
Cannot retrieve contributors at this time
121 lines (77 sloc) 8.46 KB

Trilha de Estudos de Data Science

Para quem este guia é voltado?

Para pessoas que já tem alguma experiência em programação, com habilidades analíticas aguçadas e que desejam entrar na área de Ciência de Dados.

Quais os objetivos deste guia?

Desenvolver competências que tornarão a pessoa rapidamente capaz de trabalhar de forma independente (como freelancer por exemplo) ou em times dentro empresas de qualquer porte.

Quais as etapas e o tempo de duração?

Espera-se que uma pessoa que não domine nenhum dos assuntos mencionados abaixo consiga, dedicando-se 15 horas semanais, completar a trilha de estudos após um período de 4 e 12 meses. O número entre parênteses ao lado de cada item indica o número de semanas necessário, em média, para atingir um nível básico de proficiência no assunto, suficiente para poder realizar atividades profissionais (ainda sob supervisão).

  • Desenvolvimento de Software (4 semanas no total)

    • Linguagem Python (2)
    • Versionamento (1)
    • Gestão de ambiente e dependências (0,5)
    • Jupyter Notebooks (0,5)
  • Gestão e planejamento de projetos (4 semanas no total)

    • Valores Ágeis (1)
    • Visão geral das principais metodologias ágeis para desenvolvimento de software (1)
    • Visão de negócios (2)
  • Manipulação de dados (4 semanas no total)

    • Pandas (1)
    • O processo de análise exploratória (1)
    • SQL (2)
  • Visualização de dados (1 semana no total)

    • Métodos descritivos (0,5)
    • Métodos gráficos (0,5)
  • Machine Learning (8 semanas no total)

    • Paradigmas de aprendizado de máquina (0,5)
    • Algoritmos de Classificação (1,5)
    • Algoritmos de Regressão (1,5)
    • Algoritmos de Clusterização (1,5)
    • Redução dimensional (1,5)
    • Viés vs Variância (0,5)
    • Validação de modelos (1)
  • Apresentação de resultados (2 semanas no total)

    • User Experience (1)
    • Storytelling (1)
  • Otimização de código (2 semanas no total)

    • Lidando com Datasets maiores do que a RAM (1)
    • Tempo de execução em manipulação de dados (1)

Como o estudo será feito?

A Trilha de Estudos é fornecida somente como uma sugestão de habilidades e conhecimentos necessários ordenada de forma conveniente para tornar o estudante apto a oferecer trabalhos remunerados o mais rápido possível, não sendo porém uma lista completa e nem definitiva. Espera-se que a pessoa interessada em adquirir estes conhecimentos tenha uma atitude proativa de buscar conhecimento de forma autônoma para preencher quaisquer lacunas que por ventura surjam em seu percurso de aprendizado.

Junto com esta Trilha, um conjunto de referências é compartilhado com a intenção de poupar tempo do estudante na busca por material de qualidade sobre os temas mencionados. Os materiais de referência não precisam ser lidos de forma integral. Sugere-se que o estudante consulte cada um deles na medida necessária para saciar sua curiosidade sobre o tema. Espera-se que, com o tempo, certos assuntos tornem-se repetitivos por estarem presentes em mais de uma referência.

É recomendado também que o estudante busque um método de aprendizado ativo para aumentar a retenção e compreensão dos conhecimentos adquiridos. As sugestões feitas aqui são (1) desenvolvimento de projetos pessoais ou para terceiros onde as habilidades recém adquiridas possam ser aplicadas e (2) compartilhamento de conhecimentos com a comunidade através da produção de textos, vídeos, guias e outros materiais.

Materiais de Referência

Desenvolvimento de Software

Linguagem Python

Gestão de ambiente e dependências

Jupyter Notebooks

Atitude Profissional e método de trabalho

Gestão de Projetos Ágil

Posicionamento no mercado

Mineração de Dados e Aprendizado de Máquina

Otimização de código