# Apuntes sobre R

## Introducción a R

El lenguaje y entorno de progrmación **R** está especialmente orientado al
análisis estadístico, representación gráfica y generación de informes. R fue
creado por Ross Ihaka y Robert Gentleman de la Universidad de Auckland, Nueva
Zelanda, y está desarrollado y mantenido por el grupo _R Development Core
Team_. Es un lenguaje interpretado, modular, completo y permite integración con
librerías escritas en C, C++, .Net, Python o Fortran.


### Hola, Mundo

In [16]:
# Print Hello World.
print("Hello World")

# Add two numbers.
print(23.9 + 11.6)

[1] "Hello World"
[1] 35.5


### Asignación

In [21]:
s <- "Hola, mundo"
print(s)

# Pero también se puede asignar de izquierda a derecha, esto mola

"Mery has a little lamb" -> song
print(song)

# Y también podemos usar el signo igual
s = 'simple and easy'
print(s)

[1] "Hola, mundo"
[1] "Mery has a little lamb"
[1] "simple and easy"


### Variables

La declaración del tipo de las variables no es obligatoria, se deduce
del contenido asignado a la variable, igual que en Python. Los tipos
de datos básicos de R son:

| Tipo      | Ejemplos     |
|-----------|--------------|
| Boolean   | TRUE / FALSE |
| Numeric   | 12.3, 5, 999 |
| Integer   | 2L, 23L      |
| Complex   | 3x2i         |
| Character | 'a', "bcD"   |
| Raw       | Binario      |

Los tipos compuestos son:

- Vectores
- Lists
- Matrices
- Arrays
- Factors
- Data Frames


### Vectores

Para crear un vector se usa la función `c()` que combina todos los elementos
que le pasemos en un vector.


In [7]:
v <- c(23, 45, 34, "Hola")
print(v)

[1] "23"   "45"   "34"   "Hola"


### Matrices

Una matríz (_Matrix_) es una estructura de datos bidimensional, rectangular. Se puede crear usando un vector de entrada con la función `matrix()`.

In [11]:
# Create a matrix.
M <- matrix( c('a','b','c','d','e','f'), nrow = 2, ncol = 3, byrow = TRUE)
print(M)

     [,1] [,2] [,3]
[1,] "a"  "b"  "c" 
[2,] "d"  "e"  "f" 


### Arrays

Las matrices estan restringidas a dos dimensiones, mientras que las arrays no tienen esa limitación. La función `array()` acepta un parámetro `dim` para especificar el número de dimensiones. En el siguiente ejemplo lo usamos para crear una metríz cúbica de 3 por 3 por 2:

In [13]:
# Create an array.
a <- array(c('rojo', 'verde', 'amarillo'),dim = c(3,3,2))
print(a)

, , 1

     [,1]       [,2]       [,3]      
[1,] "rojo"     "rojo"     "rojo"    
[2,] "verde"    "verde"    "verde"   
[3,] "amarillo" "amarillo" "amarillo"

, , 2

     [,1]       [,2]       [,3]      
[1,] "rojo"     "rojo"     "rojo"    
[2,] "verde"    "verde"    "verde"   
[3,] "amarillo" "amarillo" "amarillo"



### Data Frames

Data frames are tabular data objects. Unlike a matrix in data frame each column can contain different modes of data. The first column can be numeric while the second column can be character and third column can be logical. It is a list of vectors of equal length.

Se pueden crear con la función `data.frame()`.

In [19]:
# Create the data frame.
BMI <- 	data.frame(
   gender = c("Male", "Male","Female"), 
   height = c(152, 171.5, 165), 
   weight = c(81,93, 78),
   Age = c(42,38,26)
)
print(BMI)

  gender height weight Age
1   Male  152.0     81  42
2   Male  171.5     93  38
3 Female  165.0     78  26


In [24]:
# Podemos listar las variables que están ahora mismo en memoria con la función  `ls()`.
print(ls())

[1] "a"    "BMI"  "M"    "s"    "song" "v"   
