In [36]:
# venv uacademia >>> 20250414

<p align="right" width="100%">
    <img width="100%" src="https://blogs.masterhacks.net/wp-content/uploads/2024/04/masterhacks_vulnerabilidades_lenguaje_programacion_R-1536x782.jpg">
</p>

# Qué es R

R es un lenguaje de programación y un entorno de software libre y de código abierto diseñado específicamente para el análisis estadístico y la visualización de datos. Es ampliamente utilizado en diversas disciplinas, incluyendo la ciencia de datos, la bioinformática, la economía, la epidemiología y muchas otras áreas donde se requiere análisis cuantitativo.

## Relevancia de R en la ciencia de datos y análisis estadístico

Este lenguaje es extremadamente relevante en el campo de la ciencia de datos y el análisis estadístico debido a su flexibilidad, su amplia gama de paquetes y su poderosa capacidad de visualización. Permite a los usuarios realizar desde análisis estadísticos básicos hasta complejos modelos predictivos. Además, al ser un software de código abierto, ofrece acceso a una amplia comunidad de usuarios y desarrolladores que contribuyen con nuevos paquetes y funcionalidades de forma constante.

## Origen de R y su evolución

R se originó como un proyecto de investigación en los laboratorios de Bell en los Estados Unidos en los 90. Fue desarrollado inicialmente por Ross Ihaka y Robert Gentleman, dos profesores de la Universidad de Auckland, en Nueva Zelanda. Desde entonces, ha experimentado un crecimiento significativo en términos de funcionalidades, rendimiento y popularidad. La evolución de R ha sido impulsada en gran medida por la contribución de la comunidad de usuarios y desarrolladores, quienes han creado una amplia variedad de paquetes para satisfacer diversas necesidades de análisis de datos.

## Fundamentos de R

### Estructuras de datos en R

R ofrece diversas estructuras de datos que permiten almacenar y manipular información de manera eficiente. Algunas de las estructuras de datos más comunes en R incluyen:

- Vector: Un vector es una secuencia ordenada de elementos del mismo tipo. Puede ser un vector numérico, de caracteres, lógico, entre otros.

```r
vector_numerico <- c(1, 2, 3, 4, 5)
vector_caracteres <- c("a", "b", "c", "d", "e")
```

- Matriz: Una matriz es una estructura bidimensional que contiene elementos del mismo tipo organizados en filas y columnas.

```r
matriz <- matrix(1:9, nrow = 3, ncol = 3)
```

- Lista: Una lista es una colección ordenada de objetos que pueden ser de diferentes tipos, como vectores, matrices, data frames, entre otros.

```r
lista <- list(numeros = c(1, 2, 3), letras = c("a", "b", "c"))
```

- Data frame: Un data frame es una estructura tabular similar a una matriz, donde cada columna puede ser de un tipo diferente y se pueden aplicar operaciones de data frame específicas.

```r
data <- data.frame(ID = 1:3, Nombre = c("Juan", "María", "Pedro"), Edad = c(25, 30, 28))
```

### Operaciones básicas

En R, se pueden realizar diversas operaciones básicas para manipular datos, como:

- Asignación de valores:

Se utiliza el operador **<-** o **=** para asignar valores a variables.

Por ejemplo: x <- 10 asigna el valor 10 a la variable x.

- Operaciones aritméticas:

R permite realizar operaciones aritméticas básicas como suma, resta, multiplicación y división utilizando los operadores +, -, * y /, respectivamente.

- Indexación:

Para acceder a elementos específicos de una estructura de datos, se utiliza la indexación. 

Por ejemplo, vector[3] accede al tercer elemento de un vector.

```r
mi_vector <- c(10, 20, 30, 40, 50)
elemento <- mi_vector[3]
```

- Funciones de resumen:

R proporciona funciones para calcular estadísticas resumidas, como la media (mean()), la mediana (median()), la desviación estándar (sd()), entre otras.

```r
mean_resultado <- mean(mi_vector)
median_resultado <- median(mi_vector)
sd_resultado <- sd(mi_vector)
```

- Operaciones lógicas:

Se pueden realizar operaciones lógicas como AND (&), OR (|) y NOT (!) para comparar valores.

```r
resultado_logico <- (x > 5) & (x < 20)
```

### Funciones en R

Las funciones en R son bloques de código que realizan una tarea específica y pueden aceptar argumentos como entrada. R incluye una amplia variedad de funciones predefinidas para realizar tareas comunes, como cálculos estadísticos, manipulación de datos y visualización.

Los usuarios pueden definir sus propias funciones utilizando la palabra clave function. Por ejemplo,

```r
mi_funcion <- function(x) { return(x^2) }
```

Define una función llamada mi_funcion que devuelve el cuadrado de su argumento x.

Para llamar a una función, simplemente se escribe el nombre de la función seguido de paréntesis que pueden contener argumentos si es necesario. Por ejemplo, resultado <- mi_funcion(3) llama a la función mi_funcion con el argumento 3 y almacena el resultado en la variable resultado.

## Características clave de R


### Análisis estadístico

El análisis estadístico es una de las capacidades principales de R. Con una amplia variedad de funciones y paquetes estadísticos, R permite a los usuarios realizar una amplia gama de análisis estadísticos, desde simples cálculos descriptivos hasta complejos modelos predictivos.

### Gráficos personalizables

Una de las características más destacadas de R es su capacidad para crear gráficos altamente personalizables y de alta calidad. R ofrece una amplia variedad de paquetes para la visualización de datos, incluyendo ggplot2, lattice, y base graphics, que permiten crear una amplia gama de gráficos estáticos y dinámicos. Estos gráficos pueden ser personalizados en términos de colores, estilos, etiquetas y otros aspectos para satisfacer las necesidades específicas de visualización de cada usuario.

```r
library(ggplot2) 
datos <- data.frame(x = 1:10, y = 1:10) ggplot(datos, aes(x = x, y = y)) + geom_point(color = "blue") + labs(title = "Gráfico de dispersión", x = "Eje X", y = "Eje Y")
```

### Comunidad y paquetes

Una de las mayores fortalezas de R es su activa y diversa comunidad de usuarios y desarrolladores. Esta comunidad contribuye constantemente al desarrollo de nuevos paquetes y funcionalidades, lo que enriquece el ecosistema de R y amplía sus capacidades. Además, la comunidad proporciona soporte a través de foros en línea, listas de correo, grupos de usuarios y eventos como conferencias y talleres. Gracias a esta comunidad, R cuenta con una gran cantidad de paquetes disponibles para una amplia variedad de propósitos, lo que permite a los usuarios aprovechar fácilmente las últimas técnicas y métodos en sus análisis de datos.

```r
install.packages("dplyr") # Instalar el paquete dplyr
library(dplyr) # Cargar el paquete dplyr
datos_filtrados <- filter(datos, x > 5)
```

Hay otros paquetes disponibles muy interesantes como:

- stats: Este es el paquete base de R que proporciona funciones para realizar cálculos estadísticos básicos y modelos estadísticos clásicos como regresión lineal, análisis de varianza, pruebas de hipótesis, entre otros.

- caret: Este paquete proporciona una interfaz unificada para el entrenamiento de modelos de aprendizaje automático y la evaluación de su rendimiento.

## Primeros pasos con R


### Plataformas compatibles

R es compatible con una amplia variedad de plataformas, lo que hace que sea accesible para usuarios de diferentes sistemas operativos. Algunas de las plataformas compatibles con R incluyen. Las plataformas compatibles con el lenguaje R incluyen **GNU/Linux**, **Mac OSX**, **MS Windows**, y **Unix**. Además, R Software está disponible para Linux, Windows y Mac.

## ¿Qué es RStudio?

RStudio es un entorno de desarrollo integrado (IDE) diseñado específicamente para trabajar con el lenguaje de programación R. Proporciona un conjunto de herramientas que facilitan la escritura, depuración, ejecución y visualización de código en R, lo que lo convierte en una opción popular entre los usuarios de R.

### Características de RStudio

En la imagen se puede observar las cuatro áreas principales de las que consta R Studio, además de la barra de opciones ubicada en la parte superior.

<p align="right" width="100%">
    <img width="100%" src="https://cdn.openwebinars.net/media/uploads/2024/04/01/r6.webp">
</p>

1. Se encuentra el **editor** de sintaxis, donde se escribe el código que se desea ejecutar. Sin embargo, el código no se ejecuta automáticamente al escribirlo; se necesita presionar algún botón o usar la combinación de teclas **ctrl + enter** para ejecutar los comandos.

<p align="right" width="100%">
    <img width="100%" src="https://cdn.openwebinars.net/media/uploads/2024/04/01/r6.webp">
</p>

2. Corresponde al **entorno de trabajo** del programa. Aquí se muestran los conjuntos de datos y los resultados, variables y gráficos generados al ejecutar diferentes análisis.

<p align="right" width="100%">
    <img width="100%" src="https://cdn.openwebinars.net/media/uploads/2024/04/01/r6.webp">
</p>

3. Se encuentran varias pestañas:

    - La pestaña de **archivos**, permite ver el historial de archivos trabajados con el programa.
    - La pestaña de **gráficos**, permite visualizar los gráficos generados.
    - La pestaña de **paquetes**, permite ver los paquetes descargados y almacenados en el disco duro, así como gestionar su instalación o actualización.
    - La pestaña de **ayuda** brinda acceso al CRAN (Comprehensive R Archive Network), la página oficial del software que ofrece una variedad de recursos, como manuales para el usuario, cursos en línea, información general y descarga de paquetes. Esta pestaña es especialmente útil, ya que mediante el motor de búsqueda podemos acceder rápidamente a los manuales de uso de los diferentes paquetes instalados en el ordenador, sin necesidad de estar conectados a Internet.
    - La ventana **visor** muestra los resultados al construir reportes utilizando funcionalidades similares a rmarkdown.

<p align="right" width="100%">
    <img width="100%" src="https://cdn.openwebinars.net/media/uploads/2024/04/01/r6.webp">
</p>

4. Corresponde a la **consola**, que funciona de manera similar al software R en su versión básica. Aquí es donde se ejecutan las operaciones realizadas desde el editor de sintaxis.

### Ventajas de usar Rstudio

RStudio ofrece una serie de ventajas que lo convierten en una herramienta imprescindible para analistas de datos, científicos y desarrolladores. Su interfaz intuitiva y centrada en el usuario facilita la programación en R, permitiendo una rápida exploración y manipulación de datos. La integración de funciones como la visualización de gráficos en tiempo real y la capacidad de generar informes dinámicos con Markdown agilizan el proceso de análisis y presentación de resultados. Además, RStudio ofrece un entorno de desarrollo robusto con características como la depuración de código, control de versiones y gestión de paquetes, lo que aumenta la eficiencia y productividad del usuario. Su naturaleza de código abierto y la activa comunidad de usuarios garantizan un continuo desarrollo y soporte, asegurando que RStudio siga siendo una herramienta líder en el campo del análisis de datos y la ciencia de datos.

## Lo que deberías recordar del lenguaje R

- R es un lenguaje de programación y un entorno de software libre y de código abierto diseñado para análisis estadístico y visualización de datos.

- Es ampliamente utilizado en diversas disciplinas debido a su flexibilidad, amplia gama de paquetes y poderosa capacidad de visualización.

- Se originó como un proyecto de investigación en los laboratorios de Bell en los años 90 y ha experimentado un crecimiento significativo gracias a la contribución de la comunidad de usuarios y desarrolladores.

- La comunidad de usuarios y colaboradores de R es activa y diversa, contribuyendo al desarrollo de nuevos paquetes y funcionalidades, así como proporcionando soporte a otros usuarios.

- R ofrece capacidades avanzadas para el análisis estadístico, la creación de gráficos personalizables y una amplia variedad de paquetes disponibles gracias a su activa comunidad.

### ¿Dudas o consultas?