<a href="http://www.unioeste.br"><img src="https://www5.unioeste.br/portalunioeste/templates/tlpcampus/images/logoUnioeste.png" align="right"></a>

<h1><center>Uma breve introdução à linguagem R</center></h1>

<center>Prof.Dr. Plinio Andrade</center>

<b> <font color='red'>ATENÇÃO!</font></b> sempre que este notebook for reaberto você deverá executar todas as células de código novamente. Cada célula **ativa** é executada pressionando o botão <b>Run</b> no menu da parte superior da tela, ou teclando <b>Ctrl+Enter</b>.

Download do R: https://www.r-project.org/

Interface RStudio (opcional): https://www.rstudio.com/products/rstudio/

Neste roteiro, você aprenderá a:

* realizar operações aritméticas no R;
* construir vetores, matrizes e dataframes;
* definir variáveis (objetos);
* identificar os diferentes tipos de dados.

**IMPORTANTE:** 

- Os decimais no R são separados por ponto e não por vírgula. A vírgula é utilizada como separador em outras estruturas. Por exemplo, o número $0,263$ deve ser informado no R como ```0.263```.

- Sempre que houver dúvida sobre alguma função do R (p.ex. função ```plot()```), utilize o código ```?plot``` para abrir uma página com a documentação desta função. Se a pesquisa for ampla, utilize ```??plot``` para buscar por todos os tópicos que possuem a palavra "plot".

## Parte 1: Operações aritméticas no R

Os operadores ```+```, ```-```, ```/```, ```*``` ```^``` realizam operações de adição, subtração, divisão, multiplicação e potenciação respectivamente (somente para números). Execute as células a seguir para visualizar os resultados:

In [None]:
3+5

In [None]:
3-5

In [None]:
2/3

In [None]:
4*2

In [None]:
2^3

As operações podem ser combinadas, respeitando a ordem usual:

* 1º Parêntesis;

* 2º Expoentes;

* 3º Multiplicações e Divisões; (da esquerda para a direita)

* 4º Somas e Subtrações. (da esquerda para a direita)

Suponha que se queria calcular o quociente entre a soma $3+5$ e a potência $2^4$. Note que:

In [None]:
3+5/2^4

é equivalente a:

In [None]:
3+(5/2^4)

Em ambos os casos, o objetivo não foi alcançado. **Na dúvida, utilize parêntesis para evitar erros!** Observe que o código a seguir entrega a operação desejada:

In [None]:
(3+5)/(2^4)

Caso a potenciação tenha como base o *número de Euler* ($e=2,71828\ldots$), podemos utilizar a função ```exp()```. Por exemplo, suponha que se queira calcular

$$e^{1/2}$$

Basta fazer:

In [None]:
exp(1/2)

Recorde que a **radiciação** pode ser vista como uma operação de potenciação. Por exemplo,

$$2=\sqrt{4}=4^{1/2},$$

de fato:

In [None]:
4^(1/2)

Podemos também usar uma função pronta (que funciona apenas para raízes quadradas):

In [None]:
sqrt(4)

Para calcular logaritimos, podemos recorrer à algumas funções do R como veremos a seguir:

In [None]:
log(2)    # logaritmo natural de 2

In [None]:
log10(2)  # logaritmo de 2 na base 10

In [None]:
log(2, 5) # logaritmo de 2 na base 5

## Parte 2: Vetores e operadores lógicos

Vetores são conjuntos de valores ordenados. No R, estes podem ser formados por números ou caracteres. O operador ```:``` cria uma sequência a partir de um número até o outro, enquanto a função ```c``` concatena valores, retornando um vetor. Exemplos:

In [None]:
2:7

In [None]:
c(2,3,4,5,6,7)

Diversas operações podem ser feitas com vetores e entre vetores. Observe alguns exemplos:

In [None]:
2:7 + 8:13

In [None]:
c(2,3,4,5,6,7) + c(8,9,10,11,12,13)

In [None]:
c(2,3,4,5,6,7) + 8:13

In [None]:
c(2, 3, 5, 7, 11, 13) - 2  # subtração

In [None]:
-2:2 * -2:2                # multiplicação

In [None]:
(1:10)^2                   # exponenciação

In [None]:
1:10 / 3                   # divisão

A igualdade entre dois valores ou dois vetores pode ser estudada por meio do operador ```==``` (note que são dois sinais de igual). No caso da diferença, utiliza-se o operador ```!=```.

In [None]:
2 == 3

In [None]:
c(3, 4 - 1, 1 + 1 + 1) == c(3, 3, 3)

In [None]:
c(1,2,3) != c(3,2,1)

No R, os caracteres devem ser informados entre aspas, por exemplo, o caractere ```categoria 1``` deve ser infomado como ```"categoria 1"```. Note que o R reconhece letras maiúsculas e minúsculas:

In [None]:
c("A", "B", "C") == c("A", "b", "d")

Operações do tipo *maior*, *menor*, *maior ou igual* ou *menor ou igual* são feitas utilizando os operadores ```>```, ```<```, ```>=``` ou ```<=``` respectivamente. Observe os exemplo a seguir:

In [None]:
2>4

In [None]:
2>=2

In [None]:
exp(1:5) < 100

In [None]:
c(1,2,3) >= c(1,5,6)

## Parte 3: Definindo variáveis

Existem diversas situações onde o resultado de uma operação ou função será utilizada várias vezes. Nestes casos, é interessante armazenar tais resultados em variáveis (ou objetos). Para isso, utiliza-se o operador ```<-``` ou o sinal de igual ```=```. Ou seja, um código do tipo ```a <- 10```, significa que uma variável rotulada como ```a``` ficará armazenada na memória com o valor ```10```, e sempre que ```a``` for digitado e executado, o valor ```10``` será exibido. Quando fizer sentido, podemos fazer operações entre variáveis e aplicá-las em funções. Observe os exemplos a seguir:

In [None]:
a <- 10

In [None]:
b <- 3 * 7

In [None]:
x <- 1:5

In [None]:
y <- c(0.2, exp(1), pi, 0.05, 10)

In [None]:
a

In [None]:
b

In [None]:
x

In [None]:
y

In [None]:
a + 2 * b

In [None]:
x + (2 * y) - 3

Note que o R já identifica ```a``` e ```b``` como números e ```x``` e ```y``` como vetores. Além disso, o R suporta quatro valores especiais de números: ```Inf```, ```-Inf```, ```NaN``` e ```NA```. Os dois primeiros representam *infinito positivo* e *infinito negativo*, ```NaN``` é um acrônimo em inglês para "not a number", ou seja, *não é um número*, aparecendo quando um cálculo não faz sentido ou é uma indeterminação matemática. Por fim, o valor ```NA``` significa "not available", ou seja, *não disponível*, e representa um valor faltante.

In [None]:
c(Inf + 1, Inf - 1, Inf - Inf, NA + 1)

In [None]:
c(0 / 0, Inf / Inf, 1 / Inf)

Valores lógicos podem ser armazenado em variáveis e operações lógicas podem ser conduzidas (mas não vamos entrar nestes detalhes). Observe:

In [None]:
z <- 1:10 >= 5

In [None]:
z

Pode ser necessário acessar valores específicos de um vetor. Por exemplo, suponha que se queira acessar o terceiro elemento do vetor ```y``` previamente armazenado. Isso pode ser feito da seguinte maneira:

In [None]:
y[3]

In [None]:
y[-3] # todos os elementos de y menos o terceiro

Podemos utilizar um vetor de índices para acessar as componentes correspondentes de um vetor. Por exemplo, podemos acessar o primeiro, terceiro e quinto valor do vetor ```y``` da seguinte maneira:

In [None]:
y[c(1,3,5)]

In [None]:
y[c(-2,-4)] # forma alternativa

O número de elementos de um vetor pode ser obtido por meio da função ```length()```. Por exemplo:

In [None]:
length(a)

In [None]:
length(y)

Cada variável do R possui uma classe. Podemos descobrir a classe de uma variável por meio da função ```class()```. Por exemplo:

In [None]:
class(a)

In [None]:
class(x)

In [None]:
class(y)

In [None]:
class(z)

In [None]:
palavras <- c("Aprender", "R", "é", "divertido!")

In [None]:
class(palavras)

Para saber quais variáveis estão armazenadas na memória, basta digitar o comando ```ls()```. Para remover uma variável utilize a função ```rm()```. Por exemplo:

In [None]:
ls()

In [None]:
rm(palavras)    # remove a variável "palavras" (verifique!)

In [None]:
rm(list = ls()) # remove todas as variáveis! Cuidado!

## Parte 4: Matrizes e dataframes

Uma matriz pode ser pensada como um vetor em duas dimensões. Vamos criar a seguinte matriz no R:

$$
A=\begin{pmatrix}
1 & 5 & 9\\
2 & 6 & 10\\
3 & 7 & 11\\
4 & 8 & 12
\end{pmatrix}
$$

Podemos concatenar as linhas (ou colunas) da matriz $A$ em um único vetor que será passado para a função ```matrix()``` do R. Veja a seguir:

In [None]:
A <- matrix(1:12, nrow = 4) # no lugar de nrow = 4 podemos informar ncol = 3 (verifique!)

In [None]:
A

In [None]:
class(A) # classe do objeto A

Em algumas situações, pode ser importante nomear as linhas e/ou colunas de uma matrix. Veja como fazer isso a seguir:

In [None]:
linhas  <- c("L1", "L2", "L3", "L4")
colunas <- c("C1", "C2", "C3")
A <- matrix(1:12, nrow = 4, dimnames = list(linhas, colunas))

In [None]:
A

Vejamos alguns comandos para obter informações sobre uma matriz:

In [None]:
dim(A)    # retorna a dimensão da matriz

In [None]:
nrow(A)   # retorna o número de linhas da matriz

In [None]:
ncol(A)   # retorna o número de colunas da matriz

In [None]:
length(A) # retorna o número de elementos da matriz

Podemos fazer operações com matrizes como soma, multiplicação, multiplicação por escalar, matriz transposta, matriz inversa (quando possível), etc. Não entraremos em detalhes sobre isso agora.

Assim como foi feito com os vetores, podemos acessar elementos ou partes de uma matriz. No entanto, devemos informar dois índices. Por exemplo, o elemento $6$ está na segunda linha e segunda coluna da matriz $A$. Assim, para acessá-lo, devemos proceder da seguinte maneira:

In [None]:
A[2,2]

Para acessar uma linha de uma matriz, basta informar apenas o índice correspondente à linha e deixar o índice correspondente à coluna em branco. Por exemplo, vamos acessar a terceira linha da matriz $A$:

In [None]:
A[3,]

O mesmo raciocínio vale para acessar colunas. Vamos acessar a segunda coluna da matriz $A$:

In [None]:
A[,2]

Existem várias maneiras de acessar "submatrizes" de uma matrix. Por exemplo, vamos acessar apenas os valores das duas últimas linhas e duas últimas colunas de $A$:

In [None]:
A[3:4,2:3]

Vetores e matrizes devem conter elementos do mesmo tipo (números, caracteres, elementos lógicos). Um **dataframe** permite o armazenamento de diferentes tipos de dados, cada um em uma coluna. Vamos criar um dataframe a seguir cujas colunas terão os rótulos x, y, z, w e n, cada um com um tipo diferente de dado e com 10 elementos cada:

In [None]:
df1 <- data.frame(
   x = letters[1:10],
   y = rnorm(10),
   z = runif(10) > 0.5,
   w = rpois(10,3),
   n = 1:10
)

In [None]:
df1

Observe alguns comandos a seguir que podem ser utilizados para obter informações de um dataframe:

In [None]:
class(df1)

In [None]:
rownames(df1)

In [None]:
colnames(df1)

In [None]:
dim(df1)

In [None]:
nrow(df1)

In [None]:
ncol(df1)

A seleção dos elementos de um dataframe pode ser feita de forma análoga ao das matrizes. Observe:

In [None]:
df1[2,2]

Podemos selecionar uma determinada coluna pelo seu nome, utilizando o símbolo ```$``` após o nome do dataframe seguido do rótulo da coluna. Por exemplo, vamos selecionar todos os elementos da coluna ```z```:

In [None]:
df1$z

O objeto ```df1$z``` é um vetor, logo, podemos selecionar um elemento ou partes dele como vimos anteriormente:

In [None]:
df1$z[2:4]

### Até a próxima!