Este é o repositório com o material do minicurso Aprendizado de Máquina com o Pacote tidymodels
, ministrado durante a XVII Escola de Modelos de Regressão, entre 29 e 30 de Novembro de 2021. Nele é possível encontrar os slides, códigos e respostas dos exercícios propostos.
O minicurso foi criado por Marcus Nunes.
Os pré-requisitos abaixo não são obrigatórios para participar do minicurso, mas o aluno irá aproveitá-lo muito mais se já tiver conhecimento prévio a respeito dos seguintes assuntos:
-
Familiariade com a Linguagem R
-
Análise de Componentes Principais
-
tidyverse
(pacotes comoggplot2
edplyr
são suficientes) -
Modelos de regressão
-
Material do curso disponível em https://github.com/mnunes/emr-2021
Há alguns programas que devem ser instalados em seu computador para que ele fique preparado para acompanhar as aulas. A lista destes programas está abaixo. Eles devem ser instalados na ordem em que estão colocados abaixo.
-
Instale o interpretador da linguagem de programação R. A versão 4.1.1 é a mais recente neste momento. Recomendo fortemente que, caso o
R
já esteja instalado em seu computador, ele seja atualizado para a versão mais atual. -
Instale a versão desktop gratuita do RStudio.
-
Há uma série de pacotes a serem instalados no
R
para que a disciplina seja acompanhada. Assim, após abrir o RStudio pela primeira vez, rode o comando abaixo para que todos os pacotes necessários sejam instalados em seu computador. O script irá verificar quais pacotes necessários para a disciplina já estão em seu computador e apenas aqueles pacotes que estiverem faltando serão baixados e instalados. Além disso, o script irá atualizar os pacotes que estiverem em versões antigas. É um comando demorado a ser executado, cuja duração dependerá da velocidade da sua conexão à internet.
source("https://raw.githubusercontent.com/mnunes/emr-2021/master/scripts/pacotes.R")
O material da minicurso foi produzido a partir de várias referências espalhadas por bibliotecas e pela internet. Poucas delas estão em português.
- Hastie, T. e Tibshirani, R. (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer. link
- Izbicki, R. e dos Santos, T. M. (2020) Aprendizado de máquina: uma abordagem estatística. São Carlos. link
- James, G., Witten, D., Hastie, T., e Tibshirani, R. (2014). An Introduction to Statistical Learning with Applications in R. Springer.
- Kuhn, M. e Johnson, K. (2013). Applied Predictive Modeling. Springer. site do livro, sem seu conteúdo completo
- Kuhn, M. e Johnson, K. (2019). Feature Engineering and Selection: A Practical Approach for Predictive Models. Taylor & Francis. link
- Lantz, B. (2013). Machine Learning with R. Packt Publishing.
- Tan, P.-K., Steinbach, M., e Kumar, V. (2012). Introdução ao Data Mining: Mineração de Dados. Ciência Moderna.
- Zhao, Y. (2012). R and Data Mining: Examples and Case Studies. Academic Press.
- Domingos, P. (2015). The Master Algorithm: How the Quest for the Ultimate Learning Machine Will Remake Our World. Basic Books.
- O'Neil, C. (2017) Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy. Crown.
- O'Neil, C. e Schutt, R. (2013) Doing Data Science: Straight Talk from the Frontline. O'Reilly.
- Parker, M. (2020). Humble Pi: A Comedy of Maths Errors. Penguin.