# Estructuras de Datos en R

 ## Vectores(vectors):  lista de elementos del mismo tipo de dato
 
 La función c() combina valores en una lista o vector

In [None]:
fruits <- c("banana", "apple", "orange")
numbers <- 1:10

length(fruits) 

## Listas (lists): 

In [None]:
thislist <- list("apple", "banana", "cherry")
thislist[1] <- "blackcurrant"

"apple" %in% thislist 

append(thislist, "orange") 

# quitamos elementos

newlist <- thislist[-1]

# nos quedamos con un trozo del array desde el elemnto con indice 1, y cogemos un total de 2
(thislist)[1:2] 1

# podemos hacer loop por la lista

for (x in thislist) {
  print(x)
} 

# se pueden unir listas

list1 <- list("a", "b", "c")
list2 <- list(1,2,3)
list3 <- c(list1,list2)

## Matrices: un dataset de dos dimensiones

In [None]:
thismatrix <- matrix(c(1,2,3,4,5,6), nrow = 3, ncol = 2) # se pueden crear con strings.
thismatrix

# acceso a algun elemento

thismatrix[1, 2]

# accceso a una fila completa

thismatrix[2,]


## Arrays: matrices multidimensionales

In [None]:
thisarray <- c(1:24)

# Access all the items from the first row from matrix one

multiarray <- array(thisarray, dim = c(4, 3, 2))
multiarray[c(1),,1]

# Access all the items from the first column from matrix one

multiarray <- array(thisarray, dim = c(4, 3, 2))
multiarray[,c(1),1] 



## Dataframe

In [None]:
# Create a data frame
Data_Frame <- data.frame (
  Training = c("Strength", "Stamina", "Other"),
  Pulse = c(100, 150, 120),
  Duration = c(60, 30, 45)
)

# Print the data frame
Data_Frame 

summary(Data_Frame) 


# acceso a las columnas del dataframe, 3 modos

Data_Frame[1]

Data_Frame[["Training"]]

Data_Frame$Training 


In [None]:
# podemos añadir filas   rbind ( row bind ), esto también permite unir dataframes

New_row_DF <- rbind(Data_Frame, c("Strength", 110, 110))

New_row_DF

In [None]:
# podemos añadir columnas cbind ( column bind )

New_col_DF <- cbind(Data_Frame, Steps = c(1000, 6000, 2000))

New_col_DF

# el tamaño del dataframe

dim(New_col_DF)

In [None]:
# se pueden borrar filas y columnas del dataframe

Data_Frame_New <- Data_Frame[-c(1), -c(1)]

Data_Frame_New 


## Factors

# Funciones

In [None]:
# ponemos un ejemplo

circumference <- function(r){
    2*pi*r
}
print(circumference(2))

# Gráficos

## Lineas y Scatter plots

In [None]:
# la funcion plot dibuja puntos
# dibujamos un punto en x=1 e y=3
plot(1, 3) 

# dibujamos dos puntos

plot(c(1, 8), c(3, 10)) 


# lineas, modo 1

plot(1:10, type="l") 


line1 <- c(1,2,3,4,5,10)
line2 <- c(2,5,7,8,9,10)

plot(line1, type = "l", col = "blue")
lines(line2, type="l", col = "red")   # no funciona si hay dos lines --FIXME--


# los scatters son representaciones de puntos para comparar

# day one, the age and speed of 12 cars:
x1 <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y1 <- c(99,86,87,88,111,103,87,94,78,77,85,86)

# day two, the age and speed of 15 cars:
x2 <- c(2,2,8,1,15,8,12,9,7,3,11,4,7,14,12)
y2 <- c(100,105,84,105,90,99,90,95,94,100,79,112,91,80,85)

plot(x1, y1, main="Observation of Cars", xlab="Car age", ylab="Car speed", col="red", cex=2)

# se usa la funcion points

points(x2, y2, col="blue", cex=2) 


## Pie Charts

In [None]:
# Create a vector of pies
x <- c(10,20,30,40)

# Display the pie chart
pie(x) 

## de barras

In [None]:
# x-axis values
x <- c("A", "B", "C", "D")

# y-axis values
y <- c(2, 4, 6, 8)

barplot(y, names.arg = x) 

# Estadísticas



In [None]:
# por defecto tenemos el dataframe mtcars

mtcars

In [None]:
# para ver la información sobre el dataset

?mtcars 

In [None]:
# si queremos encontrar el máximo y el mínimo de los datos de una columna ( busqueda de outliners )

Data_cars <- mtcars

max(Data_Cars$hp)
min(Data_Cars$hp)

# si queremos que nos diga el índice de la fila para localizar

which.max(Data_Cars$hp)
which.min(Data_Cars$hp) 


rownames(Data_Cars)[which.max(Data_Cars$hp)]
rownames(Data_Cars)[which.min(Data_Cars$hp)] 



### media, mediana y moda (mean,median,mode)

In [None]:
mean(Data_Cars$wt) 
median(Data_Cars$wt) 
mode(Data_Cars$wt) 

### cuartiles


In [None]:
# recordemos
# cuartil Q1: aquel valor tal que es mayor que el 25% del total de valaores

Data_Cars <- mtcars

#  el tercer cuartil
quantile(Data_Cars$wt, c(0.25))

# todos los cuartiles
quantile(Data_Cars$wt)

# Referencias

- https://www.r-project.org/  ( página oficial )
- https://cran.rediris.es/  ( descarga del R editor desde mirror en España en Rediris )
- https://www.dataquest.io/blog/install-package-r/  ( cómo instalar paquetes )
- https://www.w3schools.com/r/default.asp