<img src="logo.png">

# Tipos de datos

En este capítulo estudiaremos los tipos de datos básicos de **R**: strings (textos), 

## Strings

El primer tipo de dato que estudiaremos el de tipo string. Se trata de valores de texto, palabras y letras. 

**Características**

- No pueden aplicárseles funciones matemáticas.
- Se utilizan para manejar textos.
- Se definen entre comillas. Pueden ser comillas simples o dobles.
- Todo lo que escribas entre comillas será interpretado en **R** como string.

## Numéricos

Son datos que, como su nombre lo establece, indican números. Los números enteros no se guardan como enteros en **R** a menos que se especifique. 

``1`` es un dato de tipo numérico, al igual que ``1.0``.

En caso de querer gestionar valores interos, se definen a través de la letra ``L`` o *convirtiendo* el valor a numérico.

In [None]:
Num = 1L
Num = as.integer(1)

**Características**

- Puedes hacer operaciones matemáticas con este tipo de datos.
- Convertir a entero trunca los decimales.

## Lógicos (booleanos)

**R** puede gestionar valores de tipo Verdadero o Falso. Este tipo de datos se conocen como datos booleanos: ``TRUE`` y ``FALSE``.

**Características**

- Los operadores de comparación siempre devuelven valores booleanos
- Se pueden transformar en numéricos utilizando las funciones ``as.numeric()`` o ``as.integer()``



## Funciones importantes relacionadas con el tipo de datos

**R** cuenta con una familia de funciones para convertir, siempre que se pueda, de un tipo de dato a otro. Estas funciones son:

- ``as.numeric()``
- ``as.integer()``
- ``as.character()``
- ``as.logical()``

Si quieres saber si un dato es de tipo x, siendo x= numeric, integer, character o logical, utilizas ``is.x()``


### Funciones para saber tipo de datos

En **R** existen tres funciones fundamentales para conocer el tipo de dato de una variable. A saber: ``class()``, ``typeof()`` y ``mode()``. La tercera es bastante técnica y no la comentaremos aquí.

El concepto de clase está relacionado con el paradigma de *programación orientada a objetos*, y tiene que ver con el tipo de funciones o métodos que se pueden aplicar a un objeto; en tanto el concepto de tipo está más relacionado con la manera en que un objeto se guarda en la memoria.

Sin entrar en tantos detalles, en **R** la función ``class()`` es la más importante para conocer el *tipo* de un objeto, ya que nos da la información, al menos intuitivamente, sobre qué podemos hacer con el objeto.





In [None]:
numero = 1
class(numero)

In [None]:
typeof(1)

In [None]:
palabra = "perico"
class(palabra)

In [None]:
typeof(palabra)

In [None]:
entero = 1L

In [None]:
class(entero)

In [None]:
typeof(entero)

In [None]:
class(TRUE)

In [None]:
typeof(TRUE)

Es importante notar que estas funciones también pueden aplicarse a vectores.

In [None]:
mi_vector = c(1,2,3)
class(mi_vector)

In [None]:
typeof(mi_vector)

### Funciones para testear clase de datos

Como dijimos, **R** tiene toda una familia para preguntar si un dato es de una clase en específico: ``is.x()`` donde x puede ser numeric, character, logical (y otros).

In [None]:
is.numeric(1)

In [None]:
is.logical(FALSE)

In [None]:
is.character("1")

In [None]:
is.numeric(mi_vector)

In [None]:
is.character(mi_vector)

### Conversiones entre clases de datos

A su vez, **R** cuenta con una familia de funciones para convertir de una clase de dato a otra: ``as.x()`` donde x puede ser character, numeric o logical (y otras).

In [None]:
mi_vector  <-  c(1,2,3)
mi_vector_caracteres  <- as.character(mi_vector)

In [None]:
class(mi_vector_caracteres)

Por supuesto, no todas la palabras se pueden convertir a números.

In [None]:
as.numeric("2022")

In [None]:
as.numeric("perico")

In [None]:
as.logical("FALSE")

De nuevo, las funciones de conversión se pueden aplicar a vectores.

In [None]:
(mi_vector_char  <- as.character(mi_vector))

In [None]:
(mis_pesos  <- c(71.2,78.5,"No es un peso",73.2))

In [None]:
(mis_pesos_num  <- as.numeric(mis_pesos))

In [None]:
mi_vector_logico  <- c(TRUE,TRUE,FALSE,TRUE,FALSE)
as.numeric(mi_vector_logico)

## Introducción a los factores

Ya hemos estudiado datos de clase numérica, caracter y lógicos. Vamos a introducir otra clase llamada **factores**.

Una variable de este tipo permite representar clasificaciones. Por ejemplo, los países se pueden clasificar por continentes; las personas por su sexo; etc.

En general, los factores representan *variables ordinales*. Los diferentes niveles en que un factor se puede clasificar se conocen como *levels*.

In [None]:
clasificaciones  <- c("América","Europa","Asia","Africa","Oceania","Antartida","América","Asia")

Nota que hay repeticiones.

In [None]:
factor(clasificaciones)

In [None]:
clasificaciones_factor  <- factor(clasificaciones)

In [None]:
class(clasificaciones_factor)

In [None]:
typeof(clasificaciones_factor)

In [None]:
as.numeric(clasificaciones_factor)

Para conocer los diferentes niveles de una variable factor utilizamos ``levels()``.

In [None]:
levels(clasificaciones_factor)

Para conocer cuántos niveles diferentes tiene una variable factor utilizamos ``nlevels()``

In [None]:
nlevels(clasificaciones_factor)

Como dijimos, las variables de tipo factor se pueden utilizar para realizar clasificaciones ordinales. En este sentido, debes saber que, por default, el orden que se toma es el orden alfabético.

In [None]:
altitudes  <- c("media","alta","baja","alta","media")
factor(altitudes)

No obstante, este orden puede ser cambiado utilizando los parámetros ``order`` y ``levels``

In [None]:
factor(altitudes, order = TRUE, levels = c("baja","media","alta"))

In [None]:
altitudes_factor  <- factor(altitudes, order = TRUE, levels = c("baja","media","alta"))
as.numeric(altitudes_factor)