<img src="logo.png">

# La Calculadora de R

**R** está provisto por default de librerías que permiten utilizarlo como calculadora científica. La [jerarquía de operaciones *occidental*](https://www.todamateria.com/jerarquia-de-operaciones/) prevalece y además la gran mayoría de las funciones matemáticas que ocupa tienen el nombre *usual* de las calculadoras científicas.

## Ejemplos de uso de R como calculadora

* Los comandos ```+```, ```-```, ```*```,```/``` y ```^``` tienen los significados usuales.
* Para calcular raíces cuadradas de números positivos se escribe ```sqrt(ARG)```, donde, en principio, `ARG` es un real positivo.
* El uso de funciones trigonométricas usuales (por default, calcula en radianes): ```sin(ARGUMENTO)```, ```cos(ARGUMENTO)```, ```tan(ARGUMENTO)```son el seno, coseno y tangente usuales del número ```ARGUMENTO```. Además por default tiene el valor de $\pi$ guardado bajo el nombre ```pi```. Sin embargo, es propenso a cometer errores.
  

In [None]:
help(pi)

In [None]:
sin(2*pi)

In [None]:
sinpi(2)

* Para calcular exponenciales y logaritmos usamos ```exp(ARGUMENTO)``` y ```log(ARGUMENTO1,base = ARGUMENTO2)```, donde ```ARGUMENTO2``` es la base del logaritmo. En particular, el número $e$ se obtiene con ```exp(1)```. Sin embargo, nuevamente nos enfrentamos a problemas (que pueden resolverse usando la librería ```Rmpfr```).

In [None]:
exp(1)

In [None]:
log(exp(1))

In [None]:
log(100, base = 10)

In [None]:
exp(710)

In [None]:
install.packages("Rmpfr")

In [None]:
library(Rmpfr)

In [None]:
exp(mpfr(710, precBits = 54))

* La [división entera](https://www.ditutor.com/numeros_naturales/division_entera.html) de los números ```ARG1``` y ```ARG2```, en ese orden, se obtiene escribiendo ```ARG1 %/% ARG2```. Es decir, es el resultado de hacer $\left\lfloor\frac{\mathrm{ARG1}}{\mathrm{ARG2}}\right\rfloor$ donde $\lfloor\cdot\rfloor$ es la función *parte entera* usual.
* El módulo (o residuo) de ```ARG1``` respecto de ```ARG2``` se obtiene escribiendo ```ARG1 %% ARG2```. Es decir, si $\mathrm{ARG1}=\mathrm{ARG2}\cdot b+r$, donde $|r|<\mathrm{ARG2}$, entonces $r$ es el resultado de ```ARG1 %% ARG2```.


In [None]:
26 / 3; 26 %/% 3; 26 %% 3 ### 23 = 3 * 8 + 2 y |2|<3

In [None]:
24.3 / 2; 24.3 %/% 2; 24.3 %% 2 ### 24.3 = 2 * 12 + 0.3

* Las funciones combinatorias [*factorial* (de ``ARG1``)](https://www.smartick.es/blog/matematicas/recursos-didacticos/factoriales/), denotado por $\mathrm{ARG1}!$, y [*coeficiente binomial*](https://es.wikipedia.org/wiki/Coeficiente_binomial) ("`ARG1` en `ARG2`", denotado por $\binom{\mathrm{ARG1}}{\mathrm{ARG1}}$) se obtienen escribiendo, respectivamente, ``factorial(ARG1)`` y ``choose(ARG1,ARG2)``.

In [None]:
factorial(6)

In [None]:
choose(5,2)

# Generalidades de R y RStudio

## Comentarios

En **R** podemos indicar que una línea es un comentario escribiendo el símbolo numeral: ```#```. Este puede ser usado tantas veces como se quiera y suele aplicarse en varios renglones si el comentario es muy largo.

In [None]:
# Este es un comentario corto.

1 + 2

### Este también es un comentario corto.

1 + 2 + 3

#######################   David Hilbert   #######################
# David Hilbert (Königsberg, Prusia Oriental; 23 de enero de 1862-Gotinga, Alemania; 14 de febrero de 1943) fue un
# matemático alemán, reconocido como uno de los más influyentes del siglo XIX y principios del XX. Estableció su reputación
# como gran matemático y científico inventando y/o desarrollando un gran abanico de ideas, como la teoría de invariantes,
# la axiomatización de la geometría y la noción de espacio de Hilbert, uno de los fundamentos del análisis funcional. 

1 + 2 + 3 + 4



## Uso de la Ayuda

Para pedir ayuda sobre objetos predefinidos en **R** podemos utilizar dos caminos: ```help(OBJ)``` o ```?OBJ``` donde ```OBJ``` es el objeto del que queremos saber.


In [None]:
help(seq)

In [None]:
?round

## Autocomplementado de texto

En **RStudio** existe también la ayuda del autocomplementado, que sirve para ahorrar tiempo y mostrar breves ayudas sobre los objetos predefinidos. Para activarla, se pulsa la tecla `TAB`


## Ejecución de líneas desde script

En un *script*, la ejecución de líneas específicas se hace sombreando las líneas que nos interesa ejecutar seguidas de la combinación de teclas ```Ctrl```+```r``` en **R** clásico y ```Ctrl```+```Intro``` en **RStudio**.

# Operadores de asignación y nombres de las variables

## Operadores de asignación

Los operadores de asignación sirven para guardar en el ambiente actual el valor de una variable mediante un nombre. En el caso de **R** y **RStudio**, los operadores de asignación son `<-`, `->` y `=` y la sintaxis es ``NOM <- OBJ``, ``OBJ -> NOM`` y `NOM = OBJ` donde `NOM` es el nombre que asignamos y `OBJ` es el valor que guardaremos bajo ese nombre.



In [None]:
x <- 2 * pi

In [None]:
x / 2

In [None]:
3 * pi -> y

In [None]:
sin(y)

In [None]:
z1 = 4 * pi

In [None]:
( z2 = round(sqrt(5),4) )

La combinación de teclas rápidas para obtener `<-` es `Alt`+`-`

## Nombre de una variable

En la Ciencia de datos (particularmente en la Administración de datos) es de suma importancia que los nombres asignados a nuestros valores sean descriptivos. El lenguaje **R** tiene restricciones para asignar nombres: los nombres no pueden ser palabras reservadas y no pueden iniciar con números o caracteres extraños.  

In [None]:
1numerodeeuler <- exp(1)

In [None]:
if  <- exp(1)

In [None]:
&numerodeeuler  <- exp(1)

In [None]:
( numerodeeuler  <- exp(1) )  

### Pero sí permite usar acentos aunque no es muy común

( medionúmerodeeuler <- numerodeeuler/2 )

### Estilos de nombres.

Existen una serie de estilos que se han tomado como estilos genéricos entre los programadores.
* Estilo de serpiente (snake_case): heredado de la programación en Python.
* Estilo de camello (SnakeCase): es heredado de la programación en móviles.
* Estilo con puntos (point.case): es propio de la programación en **R**.
* Cualquier mezcla de los anteriores.

In [None]:
numero_de_euler <- exp(1)
NumeroDeEuler <- exp(1)
numero.de.euler <- exp(1)
numero_de.Euler <- exp(1)

# Tipos de datos

En todo lenguaje de programación que maneje datos existen dos clasificaciones de datos en general: *atómicos* y *estructurados*.

Un *dato atómico* es aquel que se considera unidad mínima de información (como los números), en tanto que un *dato estructurado* es una colección de datos atómicos.



Entre los tipos de **datos atómicos** tenemos:

**Lógico** Son datos que sólo permite los valores lógicos de verdadero (TRUE) o falso (FALSE).

**Numérico** Son datos cuyos valores son números reales.

**Complejo** Son datos cuyos valores son números complejos.

**Caracter** Son datos cuyos valores son cualquier tipo de carácter o cadena. Técnicamente en realidad son datos estructurados, pero para fines prácticos se les considera atómicos.


Por otra parte, entre los tipos de **datos estructurados** tenemos:

**Arrays** son colecciones multidimensionales de datos.

**Vectores** son arrays unidimensionales. Cada uno de sus elementos es del mismo tipo.

**Matrices** son arrays de dos dimensiones. Todos sus datos son del mismo tipo.

**Dataframes** son arrays de dos dimensiones. Los datos en cada columna son del mismo tipo, pero por cada fila pueden variar. Son conocidos como tablas de bases de datos.

**Listas** son colecciones unidimensionales donde cada uno de sus elementos es otro dato de cualquier tipo (atómico o estructurado). En conjunto, sus datos pueden ser de diferente tipo. 


# Funciones

En todo lenguaje de programación la construcción de funciones resulta fundamental; particularmente en la programación orientada a objetos. Ya hemos tenido oportunidad de trabajar con algunas como `seq()` y `round()`.

## Funciones importantes para el manejo de datos.

Todo dato en **R** tiene asociadas dos propiedades importantes: la clase y su longitud. Estas se obtienen con las funciones `class(OBJ)` y `length(OBJ)`. 

In [None]:
class(1); class(2+3i); class("hola")

In [None]:
class(c(1,2,3))

In [1]:
BD <- data.frame("Num_lista" = c(1,2,3,4), "Nombre" = c("Hugo", "Paco", "Luis","Conchita"), "Apellido" = c("García", "Rulfo", "Hilbert","Alonso"))

In [None]:
BD

In [7]:
class(BD)

In [3]:
length(1)

In [4]:
length(1+2i)

In [5]:
length("hola")

In [6]:
length(c("hola","mundo"))

In [None]:
length(BD)

In [None]:
length(BD$Nombre)

### Funciones especiales

Algunas funciones especiales sirven para operar con ciertos tipos de datos. Ejemplos de estas son

* *unique*: su sintaxis es `unique(OBJ)` donde `OBJ` es un vector. Nos devolverá otro vector cuyos elementos son los mismos que `OBJ` pero quitando las repeticiones y respetando el orden de aparición.

&nbsp;
* *paste* y *paste0* sirven para concatenar. Las sintaxis son ``paste(ARG1,ARG2,...,ARGn, sep = "SEPARADOR")`` y `paste0(ARG1,ARG2,...,ARGn)` donde `SEPARADOR` es el símbolo que se usa para concatenar los argumentos. `paste0` corresponde a usar `sep=""` en `paste` (no usar separadores). Los argumentos pueden ser de diferente tipo, pero todos deben tener una equivalencia en la clase caracter.

&nbsp;
* *View* sirve para mejorar la visualización de tablas. La sintaxis es `View(OBJ)`, donde `OBJ` generalmente es un array bidimensional. 

&nbsp;
* *dim* devuelve las dimensiones de arrays que no sean listas. Su sintaxis es `dim(OBJ)`. Devuelve un vector numérico cuya longitud es el número de dimensiones del array. En arrays bidimensionales su primer entrada es el número de filas y su segunda entrada es el número de columnas. En el caso de arrays tridimensionales, la tercera entrada indica la *posición vertical*.

&nbsp;
* La familia de funciones *apply*. Constituyen probablemente las funciones mas importantes para trabajar con arrays, pues permiten realizar mútiples acciones, usualmente repetitivas, sin ayuda de ciclos y de manera mucho más rápida (ver los tres últimos videos del **Diplomado Programador Jr en R** de SciData).

## Construcción de funciones

En el lenguaje **R** es importante el saber construir funciones que realicen tareas específicas que tal vez no se encuentren implementadas en el mismo lenguaje (o simplemente porque es difícil de interpretar la ayuda).

La sintaxis general para construir una función es:

```
NOMBRE_DE_LA_FUNCION <- function(PAR1,PAR2,...,PARn){
    CUERPO
    RESULTADO
    }
```

In [None]:
### Función para resolver cualquier ecuación de segundo grado 
### Los parámetros a,b,c corresponden a la ecuación ax^2 + bx + c=0
solver_equation <- function(a,b,c){
    x1 <- (-b - sqrt(b^2-4*a*c+0i))/(2*a)
    x2 <- (-b + sqrt(b^2-4*a*c+0i))/(2*a)
    c(x1,x2)
    }

In [None]:
### Resolver la ecuación x^2 + 2x + 1 = 0
solver_equation(1,2,1)

In [None]:
### Resolver la ecuación x^2 + 2x + 1 = 0
solver_equation(1,2,1)

In [None]:
### Resolver la ecuación x^2 -2x + 5 =0
solver_equation(1,-2,5)

In [None]:
Im(solver_equation(1,-2,5)[1])

In [None]:
### Función para resolver cualquier ecuación de segundo grado pero la salida tiene mejor estética.
### Los parámetros a,b,c corresponden a la ecuación ax^2 + bx + c = 0
###     * En el caso de que haya raíz doble, devuelve la única raíz. 
###     * Si las raíces son reales, devuelve un vector numérico. En caso contrario devuelve un vector complejo.

solver_equation_adv <- function(a,b,c){

    if(a == 0){return("El primer argumento debe ser diferente de 0")}
    
    if(Im(solver_equation(a,b,c)[1]) == 0 & Im(solver_equation(a,b,c)[2]) == 0) 
        {as.numeric(unique(solver_equation(a,b,c)))}
    else{
        unique(solver_equation(a,b,c))}
    
}

In [None]:
solver_equation_adv(0,1,1)

In [None]:
solver_equation_adv(1,2,1)

In [None]:
solver_equation_adv(1,-2,5)

In [None]:
solver_equation(1i,-1+1i,-1i)

In [None]:
solver_equation_adv(1,0,1)

# Áreas de trabajo

El IDE de **RStudio** está dividido en cuatro secciones:

1. Zona del editor: donde se escribe el código (scripts y markdowns).
2. Zona de consola: donde se ubican la consola, la terminal del SO y errores de markdowns.
3. Zona de salidas: brinda información como paquetes instalados y gráficación.
4. Zona de entorno: variables actuales e historial.

## Scripts

Los scripts de **R Studio** tienen la ventaja de que en la barra izquierda aparecen ciertos símbolos. Es importante ir notando su aparición.

Dicho lo anterior, una buena costumbre para la elaboración de un script es comenzar en el siguiente orden

```
###### Instalar los paquetes necesarios y que no se hayan instalado previamente en alguna sesión. Es posible hacerlo en una ###### solo línea utilizando la sintaxis
# install.packages(c("NOMBRE_DEL_PAQUETE_A_INSTALAR","NOMBRE_DEL_PAQUETE_A_INSTALAR",...,"NOMBRE_DEL_PAQUETE_A_INSTALAR"))
###### pero no es recomendable

install.packages("NOMBRE_DEL_PAQUETE_A_INSTALAR")
install.packages("NOMBRE_DEL_PAQUETE_A_INSTALAR")
...
install.packages("NOMBRE_DEL_PAQUETE_A_INSTALAR")

###### Llamar las bibliotecas necesarias. Es posible hacerlo en una ###### solo línea utilizando la sintaxis
# library(c("BIBLIOTECA_A_UTILIZAR","BIBLIOTECA_A_UTILIZAR",...,"BIBLIOTECA_A_UTILIZAR"))
###### pero no es recomendable

library(BIBLIOTECA_A_UTILIZAR)
library(BIBLIOTECA_A_UTILIZAR)
...
library(BIBLIOTECA_A_UTILIZAR)

###### Dirigirnos a la ubicación en la PC donde trabajaremos o de donde extraeremos nuestras bases de datos.

setwd("DIRECCIÓN") ## Recordar que en Linux y Mac las diagonales deben ser de la forma /, mientras que en 
                   ## Windows se usa \\ o /
```



## Rutas y directorios de trabajo

Como vimos anteriormente, para dirigirnos a un lugar específico dentro de nuestra computadora utilizamos la instrucción `setwd("DIRECCIÓN")` donde la escritura de `DIRECCIÓN` obedece al SO que estemos usando. Independientemente de esto, podemos ayudarnos de la tecla `TAB` para autocomplementar las direcciones.

Por otra parte, para saber en qué lugar estamos parados utilizamos la función (sin argumentos) `getwd()`.



# Proyectos en R Studio

Los expertos de **R** prefieren mantener todos los ficheros (bases de datos, imágenes, scripts) en *proyectos*. Básicamente los proyectos son la manera mas ordenada de organizar nuestros espacios de trabajo. A continuación veremos algunos ejemplos que son mejor explicarlos en la práctica que en estas notas.