# Introducción a R

## Operando con números

El procedimiento más básico que podemos realizar con R es utilizarlo como una calculadora en donde los operadores `+`, `-`, `*` o `/` pueden ser utilizados para operar sobre números, como también podemos utilizar paréntesis redodondos `()` tal como lo hacemos en álgebra. Al ejecutar la operación, se retornará el resultado.

In [3]:
2 + 2

In [2]:
2 * 3

In [6]:
2 * 3 - 2

In [7]:
2 * ( 3 - 2 )

## Variables y tipos de datos

Una variable está formada un espacio que podemos utilizar en la memoria del computador para almacenar un valor y este espacio de memoria le podemos asignar un nombre simbólico o al que nos referiremos como nombre de la variable.

In [97]:
# Este es un comentario y en la línea de abajo tenemos el nombre de la variable junto con su valor.
number = 1
number

A una variable le podemos asignar distintos tipos de datos, los más básicos en R son:
* `character`: Una cadena de caracteres. Podemos darnos cuenta que una variable es de este tipo, porque siempre estará entre comillas (`'foo'`).
* `numeric`: Un número que puede ser entero o decimal.
* `logical`: Un valor dicotómico (`TRUE`, `FALSE`)

In [9]:
the_character = "foo"

Cuando le asignamos un valor a una variable R no retornará nada hasta que nosotros llamemos a la misma.

In [10]:
# Estoy llamando a la variable.
the_character

In [11]:
# Una variable del tipo character no es exclusivo para letras.
also_character = '11'
also_character

In [15]:
# Esta variable es de la clase numeric.
the_numeric = 11
the_numeric

In [14]:
also_numeric = 11.1
also_numeric

In [16]:
# Atención a que la variable logical sólo recibe los valores TRUE o FALSE, exactamente en mayúsculas
# y sin comillas
the_logical = TRUE
the_logical

In [17]:
also_logical = FALSE
also_logical

## Estructuras de datos

Cuando necesitamos tratar a un conjunto de datos aislados como uno sólo, podemos utilizar estructuras de datos. Las estructuras de datos básicas en R son:
* `vector`: Un conjunto unidimensional de datos de la misma clase.
* `matrix`: Un conjunto bidimensional de datos de la misma clase.
* `data frame`: Conjunto bidimensional de datos, donde cada columna puede contener datos de distintas clases y además una de las ventajas es que por defecto podemos añadir un nombre a cada columna.

Para inicializar un vector podemos hacerlo con la función `c()`, la cual concatena todos los elementos contenidos en los parametros que le pasemos.

In [18]:
# Este es un vector de números.
vector = c(120,121,125,130,119,88,135,85,118,132,125,81,120,150,115,140,120)
vector

In [19]:
# Si a la función le pasamos elementos de distinta clase, todos se convertirán a character
c(1,2,"a")

Para acceder a un elemento o un grupo de elementos específico dentro de un vector, podemos utilizar el índice o índices de los elementos dentro de paréntesis cuadrados `[]`. Los índices parten desde el 1, distinto a otros lenguajes de programación, como por ejemplo en `Python`, donde se parte desde el 0.

In [20]:
vector[1]

In [22]:
vector[0]

In [23]:
# Para acceder a más de un elemento podemos utilizar un vector de índices.
vector[c(1,8)]

Cuando necesitemos estructurar nuestros datos de manera bidimensional, podemos utilizar la función `matrix()`, de manera similar a la función `c()`. La función `matrix()` nos devolverá un objeto de la clase `matrix`.

La función `matrix()` recibe un vector y además podemos especificar el parámetro `ncol` o `nrow` para especificar el número de columnas o filas que debe tener la matriz.

In [29]:
matrix(c(1,2,3,4,5,6),nrow=2)

0,1,2
1,3,5
2,4,6


In [32]:
vector_2 = c(80 ,83, 87, 85, 74, 99, 78, 83, 90, 77, 76, 78, 86, 98, 78, 69, 65)
the_matrix = matrix(c(vector,vector_2),ncol=2)
the_matrix

0,1
120,80
121,83
125,87
130,85
119,74
88,99
135,78
85,83
118,90
132,77


In [87]:
TRUE

In [88]:
TRUE&TRUE

In [89]:
TRUE&FALSE

In [90]:
TRUE|FALSE

In [91]:
!TRUE

In [73]:
vector_high = vector>max_lim
vector_high

In [77]:
vector_low = vector<min_lim
vector_low

In [84]:
vector_normal = !vector_low&!vector_high
vector_normal

In [79]:
vector_high_values = vector[vector_high]
vector_high_values

In [78]:
vector_low_values = vector[vector_low]
vector_low_values

In [85]:
vector_normal_values = vector[vector_normal]
vector_normal_values

In [86]:
vector_abnormal_values = vector[!vector_normal]
vector_abnormal_values

In [106]:
n = length(vector)
n

In [109]:
vector_2 = rnorm(n,80,20)
vector_2

In [114]:
matrix(c(1,2,3,4),ncol=2)

0,1
1,3
2,4


In [118]:
the_matrix = matrix(c(vector,vector_2),ncol=2)
the_matrix

0,1
120,70.22444
121,111.15901
125,59.01433
130,59.49473
119,44.97965
88,65.87777
135,57.2185
85,120.58892
118,110.7137
132,59.71598


In [120]:
the_matrix[,1]

In [121]:
mbp = the_matrix[,2]+(1/3)*(the_matrix[,1]-the_matrix[,2])
mbp

In [136]:
new_matrix = cbind(the_matrix,mbp)
unname(new_matrix)

0,1,2
120,70.22444,86.8163
121,111.15901,114.43934
125,59.01433,81.00955
130,59.49473,82.99649
119,44.97965,69.6531
88,65.87777,73.25185
135,57.2185,83.14567
85,120.58892,108.72595
118,110.7137,113.14247
132,59.71598,83.81065
