# R básico
- **Conferencista:** Felipe Calvo Cepeda
	-	**Emails:**
		- fcalvoc@unal.edu.co
		- fe.calvo@uniandes.edu.co
	-	**GitHub:** [felipe-calvo](https://github.com/felipe-calvo)
- **Monitoras:**
  - Diana Carolina Sanchez Perez
    - **Email:** dicsanchezpe@unal.edu.co
  - Guiselle Tatiana Zambrano Penagos
    - **Email:** gtzambranop@unal.edu.co
- **Fecha de inicio:** 1 de octubre de 2020
- **Fecha de finalización:** 17 de octubre de 2020
- **Material utilizado en esta clase:**
  - [p1-setup](https://felipe-calvo.github.io/r-101/p1-setup.html)
  - [p2-basic-R](https://felipe-calvo.github.io/r-101/p2-basics-R.html)


# Configuración del ambiente de trabajo en R

## ¿Qué es R?

- R es un lenguaje de programación de acceso libre, inicialmente diseñado y utilizado para realizar análisis estadístico.
- R es el programa que instalamos para interpretar el código que escribimos.
- RStudio es un IDE (Integrated Development Environment) que funciona como una “máscara” sobre R, con más herramientas y facilidades.

## ¿Por qué nos gusta?

- Es una forma BBB de convertirse en un geek.
- No solamente permite realizar análisis estadístico; tambien es posible capturar información de páginas web, crear aplicaciones web, procesar texto, entre otras cosas.
- La comunidad que lo usa es muy amplia (= muchísima ayuda e información en internet).
- Es muy versátil para la creación de gráficos.
- Tiene disponibles muchos paquetes para diferentes tipos de análisis.
- ¡ES GRATIS!.



## Particularmente útil para

- Manejar, combinar, limpiar y reorganizar datos.
- Análisis estadístico, álgebra matricial, modelado, estadística avanzada.
- Entorno gráfico poderoso para explorar datos o para publicar.
- Análisis pipeline

## ¿Por qué no usar R?

- R no puede hacer todo.
- La documentación a veces es muy técnica o muy compacta.
- No todo el código ha sido exhaustivamente testeado, es decir, no siempre hay garantías que las cosas funcionen.
- La curva de aprendizaje es más difícil que programas como SPSS o Minitab (frente a Stata o SAS es más bien similar).



## ¿Cómo correr comandos/código?

- Si se está trabajando en el panel console solamente es necesario presionar “Enter”.
- Si se está trabajando en un script es posible ejecutar los comandos presionando “Ctrl+Enter”.
- Adicionalmente, el símbolo “#” nos permite incluir comentarios en cualquier lugar del script.
- ¡Siempre usa scripts (si nunca antes has creado un ‘programa para un computador’ en este curso lo vas a hacer)!

## Instalación de R

[Link de descarga](https://cran.r-project.org/)

## Interfaces de usuario

- Por defecto
- [RStudio](http://www.rstudio.org/): funciona en Windows, MacOS, Linux. Recomendada
- [Eclipse](http://www.eclipse.org/eclipse): funciona en Windows, MacOS, Linux.
- Entre otras


## Front-ends gráficos

- [Rcmdr](https://socialsciences.mcmaster.ca/jfox/Misc/Rcmdr/)
- [RKWard](https://rkward.kde.org/)

## Grupos de funciones (Paquetes)

- Cuando varias funciones son desarrolladas con un objetivos similar se suelen agrupar en paquetes, los cuales son colaborativamente distribuidos y de forma gratuita.
- Para utilizar de las funciones de un paquete es necesario instalar este paquete primero usando `install.packages()` y luego cargarlo en nuestro ambiente de trabajo usando `library()`.
- Se instalan una vez y se llaman muchas veces.
- [Lista de paquetes del CRAN](https://cran.r-project.org/web/packages/available_packages_by_date.html)
- [Lista de paquetes de Bioconductor](https://www.bioconductor.org/packages/release/bioc/)
- [rdrr.io](https://rdrr.io/)

## Buenas prácticas

- Usar projects para ajustar el ambiente de trabajo para un proyecto.
- Por reproducibilidad, facilidad y para tener los proyectos mejor organizados es mucho mejor usar projects.
- La idea es que cada proyecto tenga su propio espacio y esté aislado, de tal manera que los recursos y códigos de uno no interfieran con otros proyectos.
- A todo lo que le pongamos un nombre (variables, funciones, bases de datos) [hay que ponerle un buen nombre](https://felipe-calvo.github.io/r-101/resources/naming.pdf).
- Si aparecen errores, se puede copiar y pegar el error en Google.
- A R podemos preguntarle cosas.


In [1]:
?ayuda
?cualquier_cosa
?mean
??mean

## Informes automáticos

R cuenta con un paquete llamado knitr con el cual podemos generar dinámicamente reportes, análisis y documentos.

- [Elegant, flexible, and fast dynamic report generation with R](https://yihui.org/knitr/)
- [RMarkdwon](https://rmarkdown.rstudio.com/)


# Creación de nuestro primer proyecto

1. Abrir RStudio.
1. Clic en **File > New Project**
  - **New Directory > New Project** si queremos crear una nueva carpeta en nuestro equipo.
  - **Existing Directory** si queremos alojar nuestro proyecto en una carpeta ya creada.
1. Una vez creado el proyecto, podemos verificar que la ventana del programa se renombra y apunta a la carpeta donde está alojado.
1. Clic en **File > New File > R Script**. En la ventana que se carga ya podemos empezar a ejecutar nuestro código.

![Estructura proyecto](images/R_00.png)


En la carpeta **referencias** se deben especificar los datos:
- Nombre
- Descripción de los mismos
- Valores que puede tomar

# Carga de datos y programación básica en R

## Importar datos a R

[Conjunto de datos](https://felipe-calvo.github.io/r-101/resources/data.zip)

Una vez descargados los archivos de datos, vamos a ubicarlos al interior de una carpeta llamada **data** que a su vez crearemos dentro del directorio de nuestro proyecto.

### Paquetes para importar datos

- [tidyverse](https://www.tidyverse.org/): Conjunto de funciones para limpiar,
  procesar, organizar y mostrar datos
- [readxl](https://readxl.tidyverse.org/): leer archivos de excel
- [haven](https://haven.tidyverse.org/): Leer archivos spss
- [googlesheets](https://github.com/jennybc/googlesheets)Leer archivos de google
- [RMySQL](https://github.com/r-dbi/RMySQL): Leer archivos sql

In [2]:
# Instalamos los paquetes -> LOCALMENTE
#install.packages("tidyverse")
#install.packages("readxl")
#install.packages("haven")
#install.packages("googlesheets")
#install.packages("RMySQL")

# Cargamos los paquetes
library("tidyverse")
library("readxl")
library("haven")
library("googlesheets")
library("RMySQL")

── [1mAttaching packages[22m ─────────────────────────────────────── tidyverse 1.3.0 ──

[32m✔[39m [34mggplot2[39m 3.3.2     [32m✔[39m [34mpurrr  [39m 0.3.4
[32m✔[39m [34mtibble [39m 3.0.3     [32m✔[39m [34mdplyr  [39m 1.0.2
[32m✔[39m [34mtidyr  [39m 1.1.2     [32m✔[39m [34mstringr[39m 1.4.0
[32m✔[39m [34mreadr  [39m 1.3.1     [32m✔[39m [34mforcats[39m 0.5.0

── [1mConflicts[22m ────────────────────────────────────────── tidyverse_conflicts() ──
[31m✖[39m [34mdplyr[39m::[32mfilter()[39m masks [34mstats[39m::filter()
[31m✖[39m [34mdplyr[39m::[32mlag()[39m    masks [34mstats[39m::lag()

Loading required package: DBI



La función [str()](https://www.rdocumentation.org/packages/utils/versions/3.6.2/topics/str) muestra de forma compacta la estructura de un objeto R arbitrario

### Archivos de texto plano (.txt)

In [3]:
read_delim(
  file = "data/Boston_Housing.txt",
  delim = "|", 
  locale=locale(decimal_mark = ",")
  ) -> boston_housing_txt
str(boston_housing_txt)

Parsed with column specification:
cols(
  CRIM = [32mcol_double()[39m,
  ZN = [32mcol_double()[39m,
  INDUS = [32mcol_double()[39m,
  CHAS = [32mcol_double()[39m,
  NOX = [32mcol_double()[39m,
  RM = [32mcol_double()[39m,
  AGE = [32mcol_double()[39m,
  DIS = [32mcol_double()[39m,
  RAD = [32mcol_double()[39m,
  TAX = [32mcol_double()[39m,
  PTRATIO = [32mcol_double()[39m,
  B = [32mcol_double()[39m,
  LSTAT = [32mcol_double()[39m,
  MEDV = [32mcol_double()[39m
)



tibble [506 × 14] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
 $ CRIM   : num [1:506] 0.00632 0.02731 0.02729 0.03237 0.06905 ...
 $ ZN     : num [1:506] 18 0 0 0 0 0 12.5 12.5 12.5 12.5 ...
 $ INDUS  : num [1:506] 2.31 7.07 7.07 2.18 2.18 2.18 7.87 7.87 7.87 7.87 ...
 $ CHAS   : num [1:506] 0 0 0 0 0 0 0 0 0 0 ...
 $ NOX    : num [1:506] 0.538 0.469 0.469 0.458 0.458 0.458 0.524 0.524 0.524 0.524 ...
 $ RM     : num [1:506] 6.58 6.42 7.18 7 7.15 ...
 $ AGE    : num [1:506] 65.2 78.9 61.1 45.8 54.2 58.7 66.6 96.1 100 85.9 ...
 $ DIS    : num [1:506] 4.09 4.97 4.97 6.06 6.06 ...
 $ RAD    : num [1:506] 1 2 2 3 3 3 5 5 5 5 ...
 $ TAX    : num [1:506] 296 242 242 222 222 222 311 311 311 311 ...
 $ PTRATIO: num [1:506] 15.3 17.8 17.8 18.7 18.7 18.7 15.2 15.2 15.2 15.2 ...
 $ B      : num [1:506] 397 397 393 395 397 ...
 $ LSTAT  : num [1:506] 4.98 9.14 4.03 2.94 5.33 ...
 $ MEDV   : num [1:506] 24 21.6 34.7 33.4 36.2 28.7 22.9 27.1 16.5 18.9 ...
 - attr(*, "spec")=
  .. cols(
  ..   CRIM = [3

[Codificación de caracteres](https://www.w3.org/International/articles/definitions-characters/index.es). Unicode es un set de caracteres universal, es
decir, un estándar en el que se definen todos los caracteres necesarios para la
escritura de la mayoría de los idiomas hablados en la actualidad que se usan en la
computadora.

In [4]:
read.table(
  file =  "data/Boston_Housing.txt",
  sep =  "|",
  header = TRUE,
  dec = ",",
  fileEncoding = "UTF-8"
  ) -> boston_housing_txt

str(boston_housing_txt)

'data.frame':	506 obs. of  14 variables:
 $ CRIM   : num  0.00632 0.02731 0.02729 0.03237 0.06905 ...
 $ ZN     : num  18 0 0 0 0 0 12.5 12.5 12.5 12.5 ...
 $ INDUS  : num  2.31 7.07 7.07 2.18 2.18 2.18 7.87 7.87 7.87 7.87 ...
 $ CHAS   : int  0 0 0 0 0 0 0 0 0 0 ...
 $ NOX    : num  0.538 0.469 0.469 0.458 0.458 0.458 0.524 0.524 0.524 0.524 ...
 $ RM     : num  6.58 6.42 7.18 7 7.15 ...
 $ AGE    : num  65.2 78.9 61.1 45.8 54.2 58.7 66.6 96.1 100 85.9 ...
 $ DIS    : num  4.09 4.97 4.97 6.06 6.06 ...
 $ RAD    : int  1 2 2 3 3 3 5 5 5 5 ...
 $ TAX    : int  296 242 242 222 222 222 311 311 311 311 ...
 $ PTRATIO: num  15.3 17.8 17.8 18.7 18.7 18.7 15.2 15.2 15.2 15.2 ...
 $ B      : num  397 397 393 395 397 ...
 $ LSTAT  : num  4.98 9.14 4.03 2.94 5.33 ...
 $ MEDV   : num  24 21.6 34.7 33.4 36.2 28.7 22.9 27.1 16.5 18.9 ...


### Archivo de valores separados por comas (.csv)

In [5]:
read_csv2(
  file = "data/Boston_Housing.csv"
) -> boston_housing_csv

str(boston_housing_csv)

Using ',' as decimal and '.' as grouping mark. Use read_delim() for more control.

Parsed with column specification:
cols(
  CRIM = [32mcol_double()[39m,
  ZN = [32mcol_double()[39m,
  INDUS = [32mcol_double()[39m,
  CHAS = [32mcol_double()[39m,
  NOX = [32mcol_double()[39m,
  RM = [32mcol_double()[39m,
  AGE = [32mcol_double()[39m,
  DIS = [32mcol_double()[39m,
  RAD = [32mcol_double()[39m,
  TAX = [32mcol_double()[39m,
  PTRATIO = [32mcol_double()[39m,
  B = [32mcol_double()[39m,
  LSTAT = [32mcol_double()[39m,
  MEDV = [32mcol_double()[39m
)



tibble [506 × 14] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
 $ CRIM   : num [1:506] 0.00632 0.02731 0.02729 0.03237 0.06905 ...
 $ ZN     : num [1:506] 18 0 0 0 0 0 12.5 12.5 12.5 12.5 ...
 $ INDUS  : num [1:506] 2.31 7.07 7.07 2.18 2.18 2.18 7.87 7.87 7.87 7.87 ...
 $ CHAS   : num [1:506] 0 0 0 0 0 0 0 0 0 0 ...
 $ NOX    : num [1:506] 0.538 0.469 0.469 0.458 0.458 0.458 0.524 0.524 0.524 0.524 ...
 $ RM     : num [1:506] 6.58 6.42 7.18 7 7.15 ...
 $ AGE    : num [1:506] 65.2 78.9 61.1 45.8 54.2 58.7 66.6 96.1 100 85.9 ...
 $ DIS    : num [1:506] 4.09 4.97 4.97 6.06 6.06 ...
 $ RAD    : num [1:506] 1 2 2 3 3 3 5 5 5 5 ...
 $ TAX    : num [1:506] 296 242 242 222 222 222 311 311 311 311 ...
 $ PTRATIO: num [1:506] 15.3 17.8 17.8 18.7 18.7 18.7 15.2 15.2 15.2 15.2 ...
 $ B      : num [1:506] 397 397 393 395 397 ...
 $ LSTAT  : num [1:506] 4.98 9.14 4.03 2.94 5.33 ...
 $ MEDV   : num [1:506] 24 21.6 34.7 33.4 36.2 28.7 22.9 27.1 16.5 18.9 ...
 - attr(*, "spec")=
  .. cols(
  ..   CRIM = [3

### Archivos de Excel (.xls .xlsx)

In [6]:
read_excel(
  path = "data/Boston_Housing.xls"
) -> boston_housing_xls

str(boston_housing_xls)

tibble [506 × 14] (S3: tbl_df/tbl/data.frame)
 $ CRIM   : num [1:506] 0.00632 0.02731 0.02729 0.03237 0.06905 ...
 $ ZN     : num [1:506] 18 0 0 0 0 0 12.5 12.5 12.5 12.5 ...
 $ INDUS  : num [1:506] 2.31 7.07 7.07 2.18 2.18 2.18 7.87 7.87 7.87 7.87 ...
 $ CHAS   : num [1:506] 0 0 0 0 0 0 0 0 0 0 ...
 $ NOX    : num [1:506] 0.538 0.469 0.469 0.458 0.458 0.458 0.524 0.524 0.524 0.524 ...
 $ RM     : num [1:506] 6.58 6.42 7.18 7 7.15 ...
 $ AGE    : num [1:506] 65.2 78.9 61.1 45.8 54.2 58.7 66.6 96.1 100 85.9 ...
 $ DIS    : num [1:506] 4.09 4.97 4.97 6.06 6.06 ...
 $ RAD    : num [1:506] 1 2 2 3 3 3 5 5 5 5 ...
 $ TAX    : num [1:506] 296 242 242 222 222 222 311 311 311 311 ...
 $ PTRATIO: num [1:506] 15.3 17.8 17.8 18.7 18.7 18.7 15.2 15.2 15.2 15.2 ...
 $ B      : num [1:506] 397 397 393 395 397 ...
 $ LSTAT  : num [1:506] 4.98 9.14 4.03 2.94 5.33 ...
 $ MEDV   : num [1:506] 24 21.6 34.7 33.4 36.2 28.7 22.9 27.1 16.5 18.9 ...


In [7]:
read_xlsx(
  path = "data/Boston_Housing.xlsx", 
  sheet="Data"
) -> boston_housing_xlsx
str(boston_housing_xlsx)

tibble [506 × 14] (S3: tbl_df/tbl/data.frame)
 $ CRIM   : num [1:506] 0.00632 0.02731 0.02729 0.03237 0.06905 ...
 $ ZN     : num [1:506] 18 0 0 0 0 0 12.5 12.5 12.5 12.5 ...
 $ INDUS  : num [1:506] 2.31 7.07 7.07 2.18 2.18 2.18 7.87 7.87 7.87 7.87 ...
 $ CHAS   : num [1:506] 0 0 0 0 0 0 0 0 0 0 ...
 $ NOX    : num [1:506] 0.538 0.469 0.469 0.458 0.458 0.458 0.524 0.524 0.524 0.524 ...
 $ RM     : num [1:506] 6.58 6.42 7.18 7 7.15 ...
 $ AGE    : num [1:506] 65.2 78.9 61.1 45.8 54.2 58.7 66.6 96.1 100 85.9 ...
 $ DIS    : num [1:506] 4.09 4.97 4.97 6.06 6.06 ...
 $ RAD    : num [1:506] 1 2 2 3 3 3 5 5 5 5 ...
 $ TAX    : num [1:506] 296 242 242 222 222 222 311 311 311 311 ...
 $ PTRATIO: num [1:506] 15.3 17.8 17.8 18.7 18.7 18.7 15.2 15.2 15.2 15.2 ...
 $ B      : num [1:506] 397 397 393 395 397 ...
 $ LSTAT  : num [1:506] 4.98 9.14 4.03 2.94 5.33 ...
 $ MEDV   : num [1:506] 24 21.6 34.7 33.4 36.2 28.7 22.9 27.1 16.5 18.9 ...


### Archivos de STATA (.dta)

In [8]:
read_dta(
  file = "data/Boston_Housing.dta"
) -> boston_housing_dta

str(boston_housing_dta)

tibble [506 × 14] (S3: tbl_df/tbl/data.frame)
 $ CRIM   : num [1:506] 0.00632 0.02731 0.02729 0.03237 0.06905 ...
  ..- attr(*, "label")= chr "CRIM"
  ..- attr(*, "format.stata")= chr "%10.0g"
 $ ZN     : num [1:506] 18 0 0 0 0 0 12.5 12.5 12.5 12.5 ...
  ..- attr(*, "label")= chr "ZN"
  ..- attr(*, "format.stata")= chr "%10.0g"
 $ INDUS  : num [1:506] 2.31 7.07 7.07 2.18 2.18 2.18 7.87 7.87 7.87 7.87 ...
  ..- attr(*, "label")= chr "INDUS"
  ..- attr(*, "format.stata")= chr "%10.0g"
 $ CHAS   : num [1:506] 0 0 0 0 0 0 0 0 0 0 ...
  ..- attr(*, "label")= chr "CHAS"
  ..- attr(*, "format.stata")= chr "%10.0g"
 $ NOX    : num [1:506] 0.538 0.469 0.469 0.458 0.458 0.458 0.524 0.524 0.524 0.524 ...
  ..- attr(*, "label")= chr "NOX"
  ..- attr(*, "format.stata")= chr "%10.0g"
 $ RM     : num [1:506] 6.58 6.42 7.18 7 7.15 ...
  ..- attr(*, "label")= chr "RM"
  ..- attr(*, "format.stata")= chr "%10.0g"
 $ AGE    : num [1:506] 65.2 78.9 61.1 45.8 54.2 58.7 66.6 96.1 100 85.9 ...
  ..- attr(*, 

### Archivos de bases de datos de SPSS

In [9]:
read_sav(
  file = "data/PRICING.sav"
) -> pricing_sav

str(pricing_sav)

tibble [109 × 12] (S3: tbl_df/tbl/data.frame)
 $ VAR00001: dbl+lbl [1:109] 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ...
   ..@ label      : chr "TARGET"
   ..@ format.spss: chr "F8.2"
   ..@ labels     : Named num [1:2] 1 2
   .. ..- attr(*, "names")= chr [1:2] "PADRES" "ESTUDIANTES"
 $ VAR00002: dbl+lbl [1:109] 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ...
   ..@ label      : chr "P1. CIUDAD"
   ..@ format.spss: chr "F8.2"
   ..@ labels     : Named num [1:2] 1 2
   .. ..- attr(*, "names")= chr [1:2] "BOGOTÁ" "FUERA BOGOTÁ"
 $ VAR00010: num [1:109] 5 10 9 9 9 10 9 8 8 8 ...
  ..- attr(*, "label")= chr "ALTA CALIDAD U1"
  ..- attr(*, "format.spss")= chr "F8.2"
 $ VAR00011: dbl+lbl [1:109]  8,  6,  4,  6,  9,  9,  3,  8,  9,  8,  7,  8, 10, 10...
   ..@ label      : chr "ALTA CALIDAD U2"
   ..@ format.spss: chr "F8.2"
   ..@ labels     : Named num [1:15] 1 2 3 4 5 6 7 8 9 10 ...
   .. ..- attr(*, "names")= chr [1:15] "1 MILLÓN" "2 MILLONES" "3 MILLONES" "4 MILLON

### Bases de datos en Google Sheets

In [10]:
"https://docs.google.com/spreadsheets/d/1z7uEedjNKXN4ub5lNZLO-dJhtWs4-Lv3PRcOTf-HWdk/edit?usp=sharing" -> link
gs_url(link, lookup = FALSE, verbose = FALSE) -> online_gs_object
gs_read(online_gs_object, verbose = FALSE) -> boston_housing_gs

str(boston_housing_gs)

“`as_data_frame()` is deprecated as of tibble 2.0.0.
Please use `as_tibble()` instead.
The signature and semantics have changed, see `?as_tibble`.
Parsed with column specification:
cols(
  CRIM = [32mcol_double()[39m,
  ZN = [32mcol_double()[39m,
  INDUS = [32mcol_double()[39m,
  CHAS = [32mcol_double()[39m,
  NOX = [32mcol_double()[39m,
  RM = [32mcol_double()[39m,
  AGE = [32mcol_double()[39m,
  DIS = [32mcol_double()[39m,
  RAD = [32mcol_double()[39m,
  TAX = [32mcol_double()[39m,
  PTRATIO = [32mcol_double()[39m,
  B = [32mcol_double()[39m,
  LSTAT = [32mcol_double()[39m,
  MEDV = [32mcol_double()[39m
)



tibble [506 × 14] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
 $ CRIM   : num [1:506] 0.00632 0.02731 0.02729 0.03237 0.06905 ...
 $ ZN     : num [1:506] 18 0 0 0 0 0 12.5 12.5 12.5 12.5 ...
 $ INDUS  : num [1:506] 2.31 7.07 7.07 2.18 2.18 2.18 7.87 7.87 7.87 7.87 ...
 $ CHAS   : num [1:506] 0 0 0 0 0 0 0 0 0 0 ...
 $ NOX    : num [1:506] 0.538 0.469 0.469 0.458 0.458 0.458 0.524 0.524 0.524 0.524 ...
 $ RM     : num [1:506] 6.58 6.42 7.18 7 7.15 ...
 $ AGE    : num [1:506] 65.2 78.9 61.1 45.8 54.2 58.7 66.6 96.1 100 85.9 ...
 $ DIS    : num [1:506] 4.09 4.97 4.97 6.06 6.06 ...
 $ RAD    : num [1:506] 1 2 2 3 3 3 5 5 5 5 ...
 $ TAX    : num [1:506] 296 242 242 222 222 222 311 311 311 311 ...
 $ PTRATIO: num [1:506] 15.3 17.8 17.8 18.7 18.7 18.7 15.2 15.2 15.2 15.2 ...
 $ B      : num [1:506] 397 397 393 395 397 ...
 $ LSTAT  : num [1:506] 4.98 9.14 4.03 2.94 5.33 ...
 $ MEDV   : num [1:506] 24 21.6 34.7 33.4 36.2 28.7 22.9 27.1 16.5 18.9 ...
 - attr(*, "spec")=
  .. cols(
  ..   CRIM = [3

## Usando la interfaz de RStudio

![carga de datos gráfica](images/R_01.png)

## Algoritmos

Un algoritmo es un conjunto finito de instrucciones que, si se siguen rigurosamente, llevan a cabo una tarea específica.

Todos los algoritmos se componen de “partes” básicas que se utilizan para crear “partes” más complejas.

# Tipos y operaciones

## Tipos de variables

### Booleanos (lógicos) 

- VERDADERO
- FALSO

In [11]:
objeto_nombrado_por_mi <- TRUE # Siempre con mayúsculas
objeto_nombrado_por_mi

In [12]:
class(objeto_nombrado_por_mi)

In [13]:
is.logical(objeto_nombrado_por_mi)

### Numéricos

- Enteros
- Reales

In [14]:
# Real
pi

In [15]:
class(pi)

In [16]:
objeto_nombrado_por_mi <- 0
objeto_nombrado_por_mi

In [17]:
class(objeto_nombrado_por_mi)

In [18]:
is.numeric(objeto_nombrado_por_mi)

### Alfanuméricos: caracteres o cadenas de texto

In [19]:
objeto_nombrado_por_mi <- "hola mundo"
objeto_nombrado_por_mi

In [20]:
class(objeto_nombrado_por_mi)

In [21]:
is.character(objeto_nombrado_por_mi)

### Fechas

In [22]:
objeto_nombrado_por_mi <- "2020-04-06" # Recomendado: ISO 8601 para fechas
objeto_nombrado_por_mi

In [23]:
class(objeto_nombrado_por_mi)

In [24]:
otro_objeto_distinto <- as.Date(objeto_nombrado_por_mi)
class(otro_objeto_distinto)

### NA

In [25]:
objeto_nombrado_por_mi <- NA # Siempre en mayúsculas NA
objeto_nombrado_por_mi

In [26]:
class(objeto_nombrado_por_mi)

## Método is

In [27]:
cualquier_cosa <- TRUE
is.logical(cualquier_cosa)

In [28]:
is.numeric(cualquier_cosa)

In [29]:
is.character(cualquier_cosa)

## Método as

### Conversiones

|Desde | Hacia |
| :---:| :---: |
| logical | numeric |
| logical |	character |
| numeric |	character |
| numeric |	Date |
| character | Date |

In [30]:
TRUE -> true_logico
true_logico

In [31]:
class(true_logico)

In [32]:
as.character(true_logico) -> true_char
true_char

In [33]:
class(true_char)

In [34]:
1 -> uno_numeric
uno_numeric

In [35]:
class(uno_numeric)

In [36]:
as.character(uno_numeric) -> uno_char
uno_char

In [37]:
class(uno_char)

## Operadores

### Operadores matemáticos

| Operador | Operación |
| :---: | :---: |
| + | Suma |
| - | Resta |
| * | Multiplicación |
| / | División |
| %% | Módulo |
| ** | Potenciación |
| ^ | Potenciación |
| [log()](https://www.rdocumentation.org/packages/base/versions/3.6.2/topics/log) | Logaritmo |
| sqrt() | Raiz cuadrada |


**Recordar**
![propiedades potenciación](https://i.pinimg.com/originals/26/c7/23/26c723075b7d08e73d157f99884fe54e.png)

In [38]:
2+2

In [39]:
5-2

In [40]:
3*4

In [41]:
5/4

In [42]:
9 %% 2

In [43]:
3 ** 3

In [44]:
3 ^ 3

In [45]:
log(10) # logarítmo natural

In [46]:
sqrt(16) # Raíz cuadrada

$a^{\frac{n}{m}} = \sqrt[m]{a^n}$

In [47]:
16 ** (1/2)

### Operadores para comparación

| Operador | Comparación |
| :---: | :---: |
| > | Mayor que |
| < | Menor que |
| == | Igual que |
| != | Diferente a |
| >= | Mayor o igual que |
| <= | Menor o igual que |

In [48]:
5 > 2

In [49]:
5 < 2

In [50]:
10 == 10

In [51]:
10 == 9

In [52]:
10 != 9

In [53]:
10 >= 10

In [54]:
10 <= 8

### Operadores lógicas

| Operador | Operación | Descripción|
| :---: | :---: | :---: |
| && | Conjunción | Ambas sentencias deben ser verdaderas |
| \|\| | Disyunción | Al menos una de las sentencias son verdaderas |
| ! | Negación | Cambia el valor de verdad de la sentencia |

In [55]:
(4 > 2) && (5 < 3)

In [56]:
(4 > 2) && (5 > 3)

In [57]:
(4 > 2) || (5 < 3)

In [58]:
(4 < 2) && (5 < 3)

In [59]:
!((4 < 2) && (5 < 3))

### Orden de las operaciones

PEMDAS
1. Paréntesis
1. Exponentes
1. Multiplicaciones / Divisiones
1. Adición / Sustracción

## Variables

In [60]:
pi = 3.1415
radio = 3
area = pi * radio**2
area

In [61]:
round(area, 2)