<img src="logo.png">

# El Lenguaje R

**R** es un lenguaje cuyo propósito es el análisis estadístico, el cómputo estadístico, gráficos y procesamiento de bases de datos. Para ello viene implementado con una gran variedad de técnicas estadísticas y de graficación. 

En este sentido, puedes utilizar **R** como 

* Calculadora.
* Aplicación de técnicas estadísticas clásicas.
* Graficación.
* Desarrollo de técnicas estadísticas modernas (como el Machine y el Deep Learning).



# R como calculadora

En esta sección aprenderemos los comandos básicos para hacer trabajar a **R** como una calculadora. 

## Los cálculos en R

**R** permite realizar la gran mayoría de operaciones matemáticas que te puedes imaginar.

Por ejemplo sumas, restas, divisiones, multiplicaciones, raíces cuadradas, exponenciales o logarítmicas. Incluso permite trabajar con números complejos.

## Los objetos de R

La mayoría de las *cosas* en **R** son objetos. Estos objetos tienen cada uno sus propias características (como tamaño, dimensinoes, longitud o tipo) y sus propios métodos (es decir, sus propias funciones).

Algunos ejemplos de objetos en **R** son:
* Vectores.
* Matrices.
* Listas.
* Dataframes

### Vectores en R

Uno de los objetos más simples, pero mas poderosos, de **R** son los **vectores**.

Los vectores son *listas ordenadas* de datos. Por ejemplo ``mi_vector = c("a","hola","tengo hambre","2")``.  Sus elementos tienen un orden (primero va la *palabra* "a", luego la *palabra* "hola", luego la frase "tengo hambre" y luego la grafía "2"); además todos los datos son del mismo tipo: texto (que a partir de ahora llamaremos strings).

Los vectores en **R** tienen la propiedad de poseer una longitud: cuántos datos lo forman.

In [None]:
mi_vector = c("a","hola","tengo hambre","2")

In [None]:
length(mi_vector)

Como los datos de un vector tienen un orden, sus elementos pueden ser *llamados* a través de *índices*. Aquí es importante saber que **R** siempre indexa desde 1 (a diferencia de Python que indexa desde 0). Para mandar a llamar al n-ésimo dato de un vector simplemente escribimos ``nombre_del_vector[n]``

**Ejemplo.**

In [None]:
## Llamar el segundo dato de mi_vector
mi_vector[2]

Mas adelante veremos que de hecho podemos mandar a llamar varios elementos de un vector.

#### Creación de vectores

Puedes utilizar la sintaxis ``c(dato_1,dato_2,...,dato_l)`` para crear vectores. Los datos deben ir dentro de los paréntesis separados por una coma, y recuerda que todos los datos deben ser del mismo tipo; es decir, o todos son textos, o todos son números.

Por ejemplo, supongamos que tengo cuatro personas y voy a guardar sus pesos en kilogramos. Si estos pesos son 71.4, 65.1, 63 y 94.5, entonces el comando ``mis_personas = c(71.4, 65.1, 63, 94.5)`` me creará un vector con esos pesos.

In [None]:
mis_personas = c(71.4, 65.1, 63, 94.5)
mis_personas

In [None]:
# La persona 3 pesa
mis_personas[3]

#### Las asignaciones de objetos

En **R**, para asignarle un nombre a los objetos que vayamos trabajando hay dos maneras de hacerlo: ``nombre <- objeto`` o ``nombre = objeto``. 

Por ejemplo, observa que cuando creamos el vector de pesos de las personas, le asignamos un nombre a ese vector. Esto también lo pudimos hacer con ``mis_personas <- c(71.4, 65.1, 63, 94.5)``

In [None]:
# Este código crea un vector pero al no asignarle ningún numbre, lo destruye inmediatemente después de crearlo
c(71.4, 65.1, 63, 94.5)

In [None]:
# Este código crea un vector y le asigna un nombre, de modo que cuando queramos mandar a llamar al vector lo podemos hacer a 
# través de su nombre

mis_personas <- c(71.4, 65.1, 63, 94.5)

In [None]:
mis_personas

Así, si tienes a cuatro personas en tu casa, esas personas ocuparán un espacio en tu casa. En **R**, si tienes un objeto y le asignas un nombre, ese objeto ocupará un espacio en tu computadora.

En RStudio, los objetos que tienen un nombre asignado se pueden ver en la zona de *Environment* (ambiente).

### Operaciones vectorizadas

El concepto de operaciones vectorizadas es muy importante en Programación. Una operación es vectorizada si se puede aplicar a cada elemento de un vector.

Por ejemplo, si ``mi_vector`` es un vector formado únicamente por números en un lenguaje de programación , entonces *la multiplicación está vectorizada en ese lenguaje* si, sin importar quién es el número x, tienes que ``x*mi_vector`` es un vector donde cada uno de sus elementos es x mutiplicado por el respectivo elemento del vector original.

In [None]:
# El peso de cada una de las personas está en kilogramos. Un kilogramo equivale a 2.2 libras. 
# Si queremos el peso de las personas en libras hacemos lo siguiente

mis_personas_libras = 2.02 * mis_personas
mis_personas_libras

En **R**, la gran mayoría de operaciones matemáticas importantes están vectorizadas, como son la multiplicación, las divisiones, las raíces cuadradas, los logaritmos o las exponenciales (a diferencia de Python, donde las operaciones vectorizadas están en la paquetería Numpy).

In [None]:
c(5,2,0)/2

In [None]:
c(5,2,0)^2

In [None]:
exp(c(5,2,0))

In [None]:
log(c(5,2,0))

In [None]:
sqrt(c(5,2,0))

**Ejemplo.**

In [None]:
#DIVISIÓN: Si queremos saber la mitad del peso de cada persona
mis_personas / 2

Se pueden combinar operaciones vectorizadas e índices

In [None]:
#¿Cuanto pesa en libras la segunda persona?
(2.2 * mis_personas)[2]

In [None]:
2.2 * (mis_personas[2])

Las sumas (y restas) tienen un comportamiento especial con los vectores. 

Si tomas dos vectores de la misma longitud, su suma es un vector de la misma longitud pero donde cada elemento es la suma de los elementos correspondientes en sus mismas posiciones.

In [None]:
# Por alguna razón la balanza estaba mal calibrada y se a cada persona se le dió un peso menor al verdadero.
# En la primer persona falló por 0.4; en la segunda por 0.2; en la tercera por 0.4 y en la cuarta por 0.3

mis_personas_corregido  <- mis_personas + c(0.4,0.2,0.4,0.3)
mis_personas_corregido

In [None]:
mis_personas

Incluso, podemos sumar vectores simplemente mandando a llamar a sus nombres

In [None]:
correcciones  <- c(0.4,0.2,0.4,0.3) #Guardamos el vector de errores con el nombre de correcciones
mis_personas + correcciones #Hacemos la corrección

Sin embargo, **R** es capaz de sumar vectores con diferente longitud sin ningún problema aplicando una especie de ciclado

In [None]:
c(1,2,3)+c(10,20)

In [None]:
c(10,20) + c(1,2,3)

Siempre ten cuidado con esta propiedad que tiene la suma de vectores en **R**. En otros lenguajes, como Python, esta suma no tendría sentido.

En **R** es útil porque **la suma y la resta son operaciones vectorizadas**

In [None]:
# La balanza falló y pesó 0.5kg de más a cada persona
mis_personas - 0.5

In [None]:
mis_personas

Otras operaciones vectorizadas importantes en **R** son las comparaciones. 

Por ejemplo, la sintaxis ``mi_vector > x`` devuelve un nuevo vector de la misma longitud que ``mi_vector`` pero formado por datos de tipo *booleano*: Verdadero cuando el dato cumpla que es más grande que el número x, y Falso en caso contrario.

In [None]:
# Encuentra las personas cuyo peso es mayor a 64 kg
mis_personas > 64

Los operadores de comparación que puedes usar en **R** son:
* ``==`` para ver igualdad
* ``!=`` para ver diferencia
* ``>=`` para ver si el lado izquierdo es mayor o igual que el derecho
* ``<=`` para ver si el lado izquierdo es menor o igual que el derecho
* ``>`` para ver si el lado izquierdo es mayor que el derecho
* ``<`` para ver si el lado izquierdo es menor que el derecho

Es muy importante que recuerdes que estas comparaciones son funciones vectorizadas.

In [None]:
# Uso del ==
c(1,2,5) == c(2,2,5)

In [None]:
c(1,2,3) == c(1,2,4,1,2,4)

### Volviendo al tema de las calculadoras

Como habrás visto, en **R** las operaciones aritméticas básicas se escriben con los comandos ``+, -, *,/`` y ``^``.

Es importante que sepas que **R** sigue la jerarquía de las operaciones usuales. Si no la recuerdas, puedes ver este video [https://www.youtube.com/watch?v=XV5PiV2-91U]

Si te es muy difícil aprenderlas, recuerda que hay una regla fundamental: siempre se hacen primero las cosas entre paréntesis, así que intenta usarlos.

In [None]:
(2+3)*5

In [None]:
2+(3*5)

In [None]:
sqrt(4)+12

In [None]:
sqrt(4+12)

In [None]:
10/(sqrt(9)*8)

Recuerda que la funciones exponencial es ``exp( )``. Así, por ejemplo, $e^2$ se calcula como ``exp(2)``.

La función logaritmo es más delicada: la sintaxis es ``log(número o vector,base)``. Si omites el valor de ``base``, entonces calculará el logaritmo natural o neperiano (es decir, la función inversa de ``exp()``)



In [None]:
log(100)

In [None]:
# logaritmo en base 10 de 100 es 2 porque 10^2=100

log(100,base=10)

Otra cosa **muy importante** a recordar es que nunca puedes dividir entre 0. En **R**, cuando hay presencia de división entre 0, nos devuelve como resultado ``Inf`` o ``-Inf``, dependiendo del signo del numerador, o ``NaN`` cuando el numerador es 0.

In [None]:
(1-3)*8/0

In [None]:
(1+3)*8/0

In [None]:
exp(0)/(1-1)

In [None]:
0/0

In [None]:
(exp(0)-1)/0

El ``NaN`` también aparece cuando haces raíces cuadradas de números negativos.

Por ejemplo, sabemos que en los números reales no existe $\sqrt{-4}$

In [None]:
sqrt(-4)

Sin embargo, como dijimos anteriormente, **R** es capaz de trabajar con números complejos con la sintaxis ``numero_a+numero_bi``

In [None]:
sqrt(-4+0i)

Mas aun, los ``NaN`` tienen *su propia aritmética*. Prácticamente operar un ``NaN`` con otra cosa nos devuelve un ``NaN``

In [None]:
NaN / 0

In [None]:
NaN + 2

In [None]:
0 * NaN 

In [None]:
Inf + NaN

In [None]:
NaN / Inf

Finalmente, te platico que otras funciones matemáticas (que también están vectorizadas) son el seno, coseno, tangente y sus inversas: `sin()`, `cos()`, ``tan()``, `asin()`, `acos()` y `atan()`

Si quieres saber qué hace o para qué sirve algo en **R**, utiliza el comando ``?funcion``

In [None]:
?sin()