# Introdução ao R

Este material é inspirado nas seguintes referências:

[Quick intro to R](https://www.statmethods.net/input/datatypes.html)

[An Introduction to R](https://cran.r-project.org/doc/manuals/r-release/R-intro.pdf)

## O básico de R

R é um ambiente para cálculos estatísticos e gráficos. Está disponível como software livre e você pode baixá-lo (aqui)[https://www.r-project.org/]


## R studio
R Studio é uma IDE para R e está disponível (aqui)[https://www.rstudio.com]


### Pacotes, instalação e importação 

Após a instalação do R, estará disponível em seu computador um conjunto amplo de ferramentas. Para acessar um conjunto de ferramentas disponíveis em um pacote R, basta utilizar o comando **library**, passando como argumento o nome do pacote.

library(readxl)

Caso o pacote não esteja disponível localmente, basta utilizar o comando **install.packages**


In [67]:
install.packages("readxl")

library(readxl)

"unable to access index for repository https://mran.microsoft.com/snapshot/2017-09-01/src/contrib:
"unable to access index for repository http://www.stats.ox.ac.uk/pub/RWin/src/contrib:
"não foi possível abrir o arquivo comprimido 'C:\Users\danie\AppData\Local\Temp\Rtmp8smJSh/libloc_205_61a9f705.rds', motivo provável 'No such file or directory'"

ERROR: Error in gzfile(file, mode): não é possível abrir a conexão


In [None]:
# History acessa o histórico de comandos
# history()

# Caso tenha dúvidas sobre um comando, basta acessá-lo somente pelo nome
c

# Para acessar a ajuda sobre um determinado comando, basta digitar ? antes do nome do comando ou usar o comando help
?c
help(c)

In [None]:
# Obtendo o diretório atual
getwd()

# Alterar o diretório
setwd('Novo diretório')

In [None]:
# Executando um script externo
source('script.R')

In [None]:
# Listando os objetos que estão na sessão
ls()
objects()

# Removendo objetos que estão na sessão
rm(x, y, z)

# Removendo todos os objetos da sessão
rm(list=ls())

### Variáveis e tipos

In [None]:
# Atribuindo valores a uma variável
x <- c(1, 2, 3, 4)

# Pode-se, também, usar a função assign

assign(y, c(5, 6, 7, 8))

# Atribuição também funciona em outra direção

c(9, 10, 11, 12) -> z

#### Tipos em R
Em R temos os tipos:
* **númerico**: que envolve todos os tipos de números
* **caracter**: que envolve os tipo relativos a texto
* **factor**: que envolve os tipo categóricos
* **matrix**: que é relacionado aos vetores bidimensionais
* **dataframe**: relacionado a conjunto de dados
* **lógico**: valores booleanos

In [None]:
class(3)
class(2.5)
class('a')
class('tipo')
v <- c(1, 2, 3, 4)
class(v)
f <- factor(0, 1, 1, 0)
class(f)
m <- matrix(v, byrow=TRUE, nrow=2)
class(m)
df <- data.frame(v, f)
class(df)
class(TRUE)
class(NA)

### Criação de vetores

In [None]:
# Utilizando a função c
c(1, 2, 3, 4, 5)

# Criando uma sequência
seq(length=10, from=1, by=1)

# Ou mesmo
seq(1,10)

# Quem sabe replicando o mesmo objeto diversas vezes
rep(1, times=5)

# Repetindo cada elemento 5 vezes
rep(c(1,2,3), each=5)


#### Propriedades de um vetor

In [None]:
x <- c(1,2,3,4)
# Verificando o tipo de x
class(x)
# verificando o tamanho de x
length(x)
# verificando as dimensões de x
dim(x)

#### Vetores lógicos

In [None]:
c(3, 4, 1, -2, -3, 5) > 0

### Nomeando os vetores

### Operações com vetores

Diferente de Python, indices de vetores em R começam com 1

In [None]:
vetor(c(2,3,4))
vetor[2:5]

### Matrizes

In [None]:
m<- matrix(c(1,2,3,4), byrow=TRUE, nrow=2)
m
colnames(m) <- c('c1', 'c2')
rownames(m) <- c('l1', 'l2')
m
## OU

m2 <- matrix( c(1,2,3,4), byrow=TRUE, nrow=2,
            dimnames = list(c('c1', 'c2'), c('c1', 'c2')))

# Adicionando nova coluna
matriz <- cbind(m,c(5, 6))
matriz
# Adicionando nova linha
matriz <- rbind(m, c(7, 8))
matriz
# Somando colunas
# colsum

# Somando linhas
# rowsum

# Selecionando pedaços
# Todos elementos da 1 linha
# matrix[1, ]

# Todos elementos da 2 coluna
# matrix[, 2]

### Factors

Estruturas utilizadas para variáveis categóricas


In [69]:
f <- factor(c('M', 'F', 'M', 'F', 'F'))
alturas <- c('Baixo', 'Médio', 'Baixo', 'Médio', 'Alto')
alturasf <- factor(alturas, order = TRUE, levels = c('Baixo', 'Médio', 'Alto'))
alturasf
alturasf[1] > alturasf[2]


### Dataframes
Conjunto de dados

In [None]:
nome <- c('Jose', 'Ana', 'Joao', 'Maria', 'Carmem')
idade <- c(41, 34, 25, 37, 23)
df <- data.frame(nome, idade, f)
names(df) <- c('Nome', 'Idade', 'Sexo')
df

In [None]:
df$Nome
class(df$Nome)

### Lists

Lista são coleções ordenadas com objetos múltiplos de tipos. 

In [None]:
l <- list('Jose', 41, 'M', 2500.00)
l

### Básico para trabalhar com R
Algumas funções úteis para trabalhar com R, que ainda não foram exploradas neste notebook

Para isso, vamos importar o dataset de estudo de teste de motor de carros, para ter uma pequena amostra do poder de R. 

Informações sobre o pacote datasets pode ser encontrado [aqui](https://stat.ethz.ch/R-manual/R-devel/library/datasets/html/00Index.html)


In [None]:
data(mtcars)
mtcars


In [None]:
summary(mtcars)

In [None]:
head(mtcars)

In [None]:
tail(mtcars)