Skip to content

Latest commit

 

History

History
65 lines (38 loc) · 4.68 KB

aula5.md

File metadata and controls

65 lines (38 loc) · 4.68 KB

Aula 5: Machine Learning, Sci-kit Learning e Desafios envolvidos.

Participe e vá mais fundo

07/05/2021

Seja bem-vindo e bem-vinda à última aula da Imersão Dados 3ª Edição!

Nesta aula, finalmente vamos criar o nosso primeiro modelo de Machine Learning para classificar um novo composto com o intuito de prever se o MoA foi ativado ou não. Para isso, vamos usar a famosa biblioteca scikit-learn para testar a regressão logística e entender o funcionamento de uma árvore de decisão (AD). Além disso, discutiremos problemas importantes como o overfit.

Para ver os desafios e todo o conteúdo que foi dado em aula siga os seguintes passos:

Acesse o notebook da Aula 05. Na parte superior esquerda, clique em >File, logo depois em >Save a copy in Drive. Se você não estiver logado em uma conta gmail, um pop-up solicitará que você crie ou faça login em uma conta google. Feito o login, uma cópia da aula é criada em seu drive (pasta Colab Notebook, criada automaticamente). Abra o notebook e boa diversão.

Neste link, temos o Github do projeto onde está localizado a base de dados e os notebooks das aulas.

As respostas para os desafios da aula 04 você encontra neste notebook e da aula 05 neste notebook, a maioria das soluções utilizaram conceitos ensinados em aula, entretanto é importante salientar que existem diversas maneiras de resolver os exercícios.

Se tiver dificuldades ao utilizar o Colab, acesse este artigo da Alura para entendê-lo.

Faça os desafios deixados no final de cada aula e não deixe de compartilhar seus resultados nas redes sociais marcando os instrutores e adicionando a #ImersaoDados

E não esqueça, agora no repositório do nosso projeto criamos a vitrine vai lá conferir os projetos incríveis que vocês estão desenvolvendo. E para ter seu projeto nesta vitrine, a única coisa que precisa é no repositório do seu projeto adicionar os tópicos alura e imersão dados. Para fazer isso é só clicar na engrenagem de configurações na parte superior direita do seu repositório ao lado de About.

Eu e toda equipe estamos presentes no nosso espaço de discussão dentro do Discord, não deixe de tirar suas dúvidas e participar da comunidade.

Projeto final

Agora sim chegou o momento de se dedicar ao projeto final são 10 bolsas de estudo de 100% do Bootcamp Data Science Aplicada, todas as informações sobre o projeto e a premiação você vai encontrar neste repositório.

E se tiver qualquer dúvida na hora de criar o seu projeto no github, você pode assistir este vídeo.

Links extras bacanas

Para dar um mergulho ainda mais profundo, dê uma olhada nos links abaixo:

Assista esse vídeo para entender mais sobre o Overfit Quer entender como funciona o Machine Learning? Que tal conhecer como é trabalhar com Machine Learning na Europa? Otimização de hiperparâmetros

Compartilhe seus resultados!

É muito legal ver seus resultados e isso também é muito importante para sua carreira! Para isso, você pode escrever artigos no Linkedin e no Medium com link para seu Colab, texto comentando o que fez de diferente e marcando nós, instrutores e também a Alura (@aluraonline). Dá até para fazer um vídeo e encher a gente de orgulho! :)

Esse projeto foi inspirado em um desafio do Laboratory Innovation Science at Harvard disponibilizando os dados em uma competição no Kaggle.

Compartilhe seus resultados!

A gente fica muito feliz ao ver os seus resultados, onde vocês foram além.

Para isso, você pode escrever artigos no Linkedin e no Medium com link para seu Colab, texto comentando o que fez de diferente e marcando nós, instrutores.

Dá até para fazer um video e encher a gente de orgulho!

Quem são os mergulhadores?

Os seus instrutores nesta imersão.

  • Thiago G. Santos
  • Vanessa Leiko
  • Guilherme Silveira