# Introducción a datos, funciones y operadores en R

## Contenido clase

- Tipos de datos en R (vectores, matrices, arreglos, factores, data frames)
- Operadores en R
- Funciones en R
- Ejercicio práctico
- Validación de ejercicio de clases pendiente en por realizar en lenguaje Python

### Tipos de datos en R

R cuenta con un conjunto de tipos y estructuras de datos estándar, la igual que en otros lenguajes de programación como por ejemplo python.  

Mientras que en Python contamos con `float, int, string, boolean`, en R podemos encontrarnos con los tipos `vectores, listas, matrices, arreglos, factores, dataframes`, los cuales tienen subtipos.

**Vectores**: Son los objetos más simples que se pueden encontrar en el lenguaje de programación R. Este tiene como subtipos a:  

- lógicos (true / false)
- númericos (decimales)
- integer (no decimales, ID, enteros)
- complejos (números imaginarios)
- caracter (texto)
- raw (bytes)

*R convierte de númerico a integer sin necesidad de hacer lo que conocemos en Python como cast*  

**Listas**: Es un tipo que consta de un vector con múltiples elementos

`c(elemento1, elemento2, elemento3, elemento4)`

*Una lista puede almacenar cualquier tipo de objetos*  

**Matrices**: Conjunto de datos de 2 dimensiones filas / columnas. Los objetos deben ser todos del mismo tipo. Para construir una matriz se debe serguir el comando: 

`M <- matrix(c('x','y','z','a','b','c'), nrow=2, ncol=3, byrow=TRUE)`

*Un error muy común es confundir una matriz con un dataframe, además hay una relación entre gráficas de dispersión y matrices*  

**Arreglo**: Conjunto de datos de varias dimensiones

`A <- array(c('virus', 'bacteria', 'virus'), dim=c(3,3,1))`

*Su comportamiento es similar al de una matriz*  

**Factores**: Tipos de objetos que utilizan para categorizar datos e información, clasifican la información y permiten filtrar por columnas. Estos tipos de datos son utilizados para el modelado y análisis de datos.

- *No confunir con listas sencillas*
- *Columna de tipo factor no permite realizar operaciones*

**Dataframes**: Este tipo de dato, define una estructura en forma de tabla similar a una matriz pero permitiendo operar y almacenar diferentes tipos de datos. El número de columnas debe ser igual al número de filas, se usan encabezados para identificar cada columna y se usan nombres únicos para los renglones. (Son como hojas de cálculo en excel)

*Los dataframes deben tener la misma cantidad de datos*


#### Para tener en cuenta

Aunque una matriz y un arreglo en R inicialmente pueden parecer lo mismo, sus diferencias recaen en que una matriz puede tener 2 dimensiones filas/columnas. Mientras que un arreglo proporciona la libertad de crear objetos en múltiples dimensiones, además un arreglo se puede multiplicar muchas veces.

**Veamos los ejemplos de tipos en el IDE R studio**

`#Variables en R
x <- 56
y <- "Hola mundo"
z <- x>10
a <- 45.7`

`#Datos de tipo vector
materias <- c('Biología', 'Matemáticas', 'Química')
numeros <- c(1,2,3,4,5,6,7,8,9,10)
numeros_automaticos <- (1:100)
vector_variables <- c(x,y,z)`

`#Datos de tipo Lista
nombre_materias <- c("Biología", "Matemáticas", "Química")
notas_materias <- matrix(c(4.3,4.2,4.1, 3.9, 2.3, 4.5, 4.1, 3.8, 2.0), nrow=3, ncol=3)
lista_final <- list(nombre_materias, notas_materias)`

`#Datos de tipo matrix
m <- matrix( c('x', 'y', 'z', 'a', 'b', 'c'), nrow=2, ncol=3, byrow=TRUE)
m2 <- matrix( c('x', 'y', 'z', 'a', 'b', 'c'), nrow=2, ncol=3, byrow=FALSE)
mn <- matrix( c(10,20,03,15,12,20,08,19,18,19), nrow=5, ncol=2)`

`
disney <- c(11,13,11,8,12)
warner <- c(20,20,16,17,22)
peliculas <- matrix(c(warner,disney), nrow=5, ncol=2)
colnames(peliculas) <- c('warner', 'disney')
rownames(peliculas) <- c('2017','2018', '2019', '2020', '2021')`

`#Datos de tipo arreglo
a <- array(c('perros', 'gatos'), dim = c(3,4,2))`

#### ¿Qué son los factores en R? 

Estructura de datos encargada de manipular variables que tienen un conjunto fijo y conocido de valores posibles (variables categóricas). son de gran utilidad cuando se desea mostrar vectores de caracteres que no cuentan con algún orden.

## Operadores en R

En R es posible encontrar todo tipo de operadores aritméticos, relacionales, lógicos de asignación, al igual que en otros lenguajes de programación, ya que R está diseñado principalmente para realizar operaciones complejas y de análisis estadistico.

Algunos operadores cambian, a diferencia de Python, por ejemplo en el caso del módulo el cual se representa por `%%`, división entera `%/%`, potenciación `^2`

Para mayor detalle ir: https://www.rstudio.com/resources/cheatsheets/

## Funciones en R


En R es posible llevar a cabo la construcción de funciones al igual que en un lenguaje de programación como por ejemplo Python. La estructura es similar:

`nombre_funcion <- function(var1, var2) {
    operacion1 <- operacion
    operacion2 <- operacion
    resultado = oepracion1 + operacion2
    return(resultado)
}`

Sin embargo, en muchas ocasiones no es necesario implementar una función desde cero, ya que R cuenta con funciones que realizan operaciones que parecen complejas pero se utilizan comúnmente como lo son la media (mean), raíz cuadrada (sqrt), logaritmo (log(num,base)), valor absoluto (abs), exponencial (exp)

## Ejercicio Práctico

1. Realice una función que haga operaciones básicas con tres números.
2. Realice una función que opere número negativos y utilice abs para volverlos positivos
3. Cree un data frame con información del semestre de un estudiante, nombre de los cursos, notas por curso y corte, recuerde utilizar vectores para esto
4. Capture las notas del primer corte, y sumelas para obtener el promedio. Aplique esto mismo para todos los otros dos cortes.