In [2]:
version

               _                           
platform       x86_64-w64-mingw32          
arch           x86_64                      
os             mingw32                     
system         x86_64, mingw32             
status                                     
major          3                           
minor          5.3                         
year           2019                        
month          03                          
day            11                          
svn rev        76217                       
language       R                           
version.string R version 3.5.3 (2019-03-11)
nickname       Great Truth                 

# Fundamentos de programación en R
1. Lenguaje de programación orientado a objetos
2. Objetos en R
3. Indexando y algunos comandos básicos
4. Operaciones

## 1. Lenguaje de programación orientado a objetos
### Lenguaje de Programación Orientado a Objetos (OOP) o Programación Funcional (FP)
OOP y FP son diferentes paradigmas para alcanzar un objetivo a través de la programación.

> OOP: Un paradigma de programación basado en el concepto de "objetos", que son estructuras que contienen datos en forma de campos, a menudo conocidos como atributos; y código, en forma de procedimientos, a menudo conocidos como métodos.
[wikipedia](https://en.wikipedia.org/wiki/Object-oriented_programming)

> FP: Un paradigma de programación, un estilo de construcción de estructuras y elementos del código, que trata al programa como evaluación de funciones matemáticas, evitando así, el cambio de estados y datos mutables.
[wikipedia](https://en.wikipedia.org/wiki/Functional_programming)

En cualquier programa hay dos componentes principales: *datos* y *comportamientos*. OOP reúne a los datos y sus comportamientos asociados en una única ubicación (llamada "objeto"). En cambio, FP mantiene los datos y sus comportamientos por separado.

Interesante artículo comparando OOP y FP [here](https://www.tutorialspoint.com/functional_programming/functional_programming_introduction.htm)

### Ejemplos
* OOP: lenguajes más populare como Python, R, Matlab, Julia, Fortran, Ruby, ...

* FP: Mathematica, Ruby,...

## 2. Objectos en R: Tipos de datos

Cuando programas en cualquier lenguaje necesitas usar diferentes variables para almacenar diferentes datos. Además, las variables se reservan en una ubicación de memoria, esto implica que, una vez que se crea una variable, se reserva un área en la memoria. Estos objetos son:

<table>
<thead>
<tr>
<th>Objeto</th>
<th>Descripción</th>
<th>Función que verifica</th>    
</tr>
</thead>
<tbody>
<tr>
<td>integer</td>
<td>valores enteros</td>
<td><code>is.integer()</code></td>    
</tr>
<tr>
<td>numeric</td>
<td>valores flotantes</td>
<td><code>is.numeric()</code></td>    
</tr>
<tr>
<td>character</td>
<td>cadenas de texto</td>
<td><code>is.character()</code></td>
</tr>
<tr>
<td>logical</td>
<td>valores booleanos</td>
<td><code>is.logical()</code></td>
</tbody>
</table>

Los objetos se pueden identificar con el comando *class()* o *mode()*

**Nota**: *las variables no tienen que declararse antes de ser usadas. Cuando asignas tiene una declaración automática*

### 2.1. Logical
Una declaración lógica verdadera/falsa

In [None]:
#Logical
a <- TRUE
b <- FALSE

print(a)
print(b)

R puede indetificar el tipo de variable

In [None]:
print(class(a))
print(class(b))

In [None]:
mode(a)
class(a)

### 2.2. Integer y numeric
Los números pueden ser enteros (sin decimales) o flotantes (decimales de doble precisión).

In [None]:
#numeric
c <- 4L #se usa el sufijo L
d <- 4
e <- 4.5
print(c)
print(d)
print(e)

In [None]:
class(c)
class(d)

In [None]:
is.logical(c)
is.integer(c)
is.numeric(c)

In [None]:
is.logical(d)
is.integer(d)
is.numeric(d)

In [None]:
c==d

In [None]:
class(c)
class(d)
class(c)==class(d)

### 2.3. Character
Un Character es una cadena de texto

In [None]:
#Character
a <- 'R-proyect'
b <- "R-proyect"
c <- "4"
d <- 4

print(a)
print(b)
print(c)
print(d)
print("hola mundo")
print("a")

In [None]:
f <- "a"
g <- a

print(f)
print(g)

In [None]:
print(class(a))
print(class(b))
print(class(c))
print(class(d))
print(class(f))
print(class(g))

In [None]:
a==b 
class(a)==class(b)

In [None]:
"4"== 4
c==d
class(c)==class(d)

In [None]:
a <- "manzana"
b <- "platano"
c <- "uva"
#meta: "manzana,platano,uva"
d <- paste(a,b,c, sep=",")
print(d)

In [None]:
e <- "hola"
f <- "mundo"
#meta: "hola mundo"

paste(e,f)
paste(e,f,sep=" ")

## 3. Objectos en R: Estructuras de datos

También existen objetos que son estructuras de datos, en la cual una variable puede almacenar más de un dato.

<table>
<thead>
<tr>
<th>Dimensiones</th>
<th>Homogeneas</th>
<th>Heterogeneas</th>
</tr>
</thead>
<tbody>
<tr>
<td>1</td>
<td>Vector</td>
<td>Lista</td>
</tr>
<tr>
<td>2</td>
<td>Matriz</td>
<td>Data frame</td>
</tbody>
</table>

### 3.1 Vectores

Un vector es la estructura de datos más sencilla en R. Un vector es una colección de uno o más datos del mismo tipo.

**Tipo**: Un vector tiene el mismo tipo que los datos que contiene. Si tenemos un vector que contiene datos de tipo numérico, el vector será también de tipo numérico. Los vectores son atómicos, pues sólo pueden contener datos de un sólo tipo, no es posible mezclar datos de tipos diferentes dentro de ellos.

**Largo**: Es el número de elementos que contiene un vector. El largo es la única dimensión que tiene esta estructura de datos.

In [None]:
#Vectores
a <- c(FALSE, FALSE,TRUE)
b <- c(1,2,3,4)
c <- c("hola","como","estas")
a
b
c

In [None]:
class(a)
class(b)
class(c)

In [None]:
length(a)
length(b)
length(c)

En caso de escribir valores de diferentes tipos se homogeniza con la clase más flexible. El orden de flexibilidad es: character, numeric y logical.

In [None]:
d <- c(1,2,TRUE,FALSE,TRUE,5) #TRUE: 1 , FALSE: 0
e <- c(1,2,TRUE,"hola")
print(d)
print(e)

In [None]:
class(d)
class(e)

También se puede unir vectores con <code>c()</code>

In [None]:
f <- c(d,e)
print(f)

In [None]:
g <- 1:10
h <- 10:1

print(g)
print(h)

In [None]:
g[2]
h[2]

In [None]:
i <- seq(4,6,0.5)

print(i)

In [None]:
#segundo elemento
print(i[2])

#todo el vector excepto el segundo elemento
print(i[-2])

#del segundo al cuarto elemeto
print(i[2:4])

#el elemento 1 y 4
print(i[c(1,4)])

In [None]:
i[2] <- 517
print(i)

In [None]:
j <- 1:5
h <- 1:5

### 3.2 Matrices

Las matrices son una estructura de datos bidimensionales, poseen largo y alto. Al igual que un vector, únicamente pueden contener datos de un sólo tipo, es decir son atómicos.

In [None]:
#Matrices
a <- 1:10 
print(a)

In [None]:
b <- matrix(a)
print(b)

In [None]:
nrow(b)
ncol(b)
dim(b)

In [None]:
c <- matrix(a,nrow=2)
print(c)

In [None]:
d <- matrix(a,ncol=2)
print(d)

In [None]:
e <- matrix(a,ncol=2, byrow=TRUE)
print(e)

In [None]:
class(b)
class(c)
class(d)
class(e)

In [None]:
f <- c(1,1,1)
g <- c(0,0,0)

h <- rbind(f,g)
print(h)
class(h)

In [None]:
i <- cbind(f,g)

print(i)
class(i)

In [None]:
print(e)

In [None]:
#elemento de segunda fila y segunda columna
print(e[2,2])

In [None]:
#segunda fila
print(e[2,])

In [None]:
#segunda columna
print(e[,2])

In [None]:
#toda la matriz excepto la segunda fila
print(e[-2,])

### 3.3 Listas
Las listas, al igual que los vectores, son estructuras de datos unidimensionales, sólo tienen largo, pero a diferencia de los vectores cada uno de sus elementos puede ser de diferente tipo o incluso de diferente clase, por lo que son estructuras heterogéneas.

In [None]:
#Listas
a <- c(2,TRUE,"hola")
print(a)

In [None]:
b <- list(2,TRUE,"hola")
print(b)

In [None]:
c <- list(2,TRUE,"hola",c(5,7,9))
print(c)

In [None]:
vectorNumerico <- c(1,2,3)
vectorChar <- c("hola","chau")
matriz <- matrix(1:9,nrow=3, byrow=TRUE)
dummy <- TRUE

a <- list(vectorNumerico, vectorChar, matriz, dummy)
print(a)

In [None]:
b <- list("vector1"=vectorNumerico, "vector2"=vectorChar, "matriz"=matriz, "dummy"=dummy)
print(b)

In [None]:
a[2]

In [None]:
b$vector2
b[2]
print(b$matriz)

In [None]:
names(a)
names(b)

In [None]:
names(a) <- c("vector1","vector2","matriz","dummy")
print(a)

In [None]:
a$nuevo <- "Hola mundo"
print(a)

In [None]:
a[6] <- list(c(5,6))
print(a)

In [None]:
names(a)

### 3.3 Data frames
El origen del data frame proviene de una intensa investigación empírica en el mundo del software estadístico. En particular, es una estructura de datos en R donde hay observaciones o registros (filas) y variables o campos (columnas).

Se utiliza un data frame para almacenar tablas de datos, los vectores que están contenidos en forma de una lista en un marco de datos son de igual longitud.

In [None]:
#Data Frames
vector1 <- c("Armando", "Elsa", "Ignacio", "Olga")
vector2 <- c(20, 24, 22, 30)
vector3 <- c("Hombre", "Mujer", "Hombre", "Mujer")


dataEstructurada <- data.frame("nombres"= vector1, "edad" = vector2, "sexo"= vector3)
dataEstructurada #printeo Jupyter
print(dataEstructurada) #printeo R

In [None]:
names(dataEstructurada)

In [None]:
print(dataEstructurada$sexo)

In [None]:
print(dataEstructurada[3])

In [None]:
print(dataEstructurada[2,])

In [None]:
print(dataEstructurada[-2,])

In [None]:
print(dataEstructurada[2:3,])

In [None]:
str(dataEstructurada)

In [None]:
dim(dataEstructurada)
nrow(dataEstructurada)
ncol(dataEstructurada)

In [None]:
summary(dataEstructurada)

#### Nota sobre Data Frame: Factores

In [None]:
sexo <- c(1, 1, 1, 1, 2, 2, 2)
peso <- c(60, 65, 70, 66, 80, 60, 76)
df <- data.frame(sexo, peso)
df$sexo <- factor(df$sexo)

print(df)

In [None]:
df$sexo <- factor( df$sexo,
levels = c(1, 2),
labels = c("masculino", "femenino")
)

print(df)

#### Ejemplo: Manipulación de Data Frames

In [None]:
id <- c( 1:5 )
date <- c( "10/07/08", "10/08/08", "10/09/08", "10/10/08", "10/11/08" )
country <- c( "US", "US", "UK", "UK", "UK" )
gender <- c( "M", "F", "F", NA, "F" )
age <- c( NA, 45, 25, 39, 99 )
q1 <- c( 5, 3, 3, 3, 2 )
q2 <- c( 5, 5, 5, NA, 2 )
q3 <- c( 5, 5, 2, NA, 1 )
df <- data.frame( id, date, country, gender, age, q1, q2, q3,
stringsAsFactors = FALSE )
df

In [None]:
# creamos variables con la función transform()
df <- transform( df,
    sumx = q1 + q2,
    meanx = ( q1 + q2 ) / 2 )
df

In [None]:
df <- df[ ,-c(9 , 10)]
df

In [None]:
#creamos como objeto

df$sumx = df$q1 + df$q2
df

In [None]:
#creamos una nueva columna promx que sea el promedio de las q

Creamos una variable agecata tal que si la persona es menor de 44 es joven, si esta entre 45 y 75 es maduro y si es mayor de 75 es anciano

In [None]:
df$agecat[ df$age > 75 ] <- "anciano" # crea la variable
df$agecat[ df$age <= 75 & df$age > 44 ] <- "maduro"
df$agecat[ df$age <= 44 ] <- "joven"
df

In [None]:
names(df)

In [None]:
names( df )[ 1 ] <- "ID"
names( df )[ 3 ] <- "pais"
names( df )[ 4 ] <- "G"
names( df )[ 6:8 ] <- c( "it1", "it2", "it3" )
df

In [None]:
### Que es un NA?
y <- c( 1, 2, 3, NA )
is.na( y ) # ¿cuáles son NA?

In [None]:
is.na( df[ , 4:10 ] )

In [None]:
#cambiar el valor de NA de edad por un valor especifico
df

In [None]:
df$age[ is.na( df$age ) ] <- 99
df

In [None]:
#Cambiar el valor especifico a NA
df$age[ df$age == 99 ] <- NA
df

In [None]:
#evitar los valores NA
x <- c( 1, 2, NA, 3 )
z <- sum( x )

print(z)

In [None]:
sum(x,na.rm=TRUE)

In [None]:
#para un data frame
df <- na.omit( df )
df

In [None]:
#ordenar el data frame
df

In [None]:
#Ascendente por age
df_ordenado <- df[ order( df$age ), ]
df_ordenado

In [None]:
#Ascendente por gender y descendente segun age
df_ordenado2 <- df[ order( df$gender , -df$age ), ]
df_ordenado2