## Importando Datos

La primera etapa en cualquier análisis de datos es importar los datos a R. R puede leer una amplia variedad de formatos de archivo, incluyendo CSV, Excel, bases de datos y más.

In [None]:
"""Importando datos desde un archivo CSV"""
# Cargar el paquete necesario
library(readr)

# Importar los datos
datos <- read_csv("mis_datos.csv")

"""Importando datos desde un archivo Excel"""

# Cargar el paquete necesario
library(readxl)

# Importar los datos
datos <- read_excel("mis_datos.xlsx", sheet = "Hoja1")

## Explorando los Datos

Una vez que los datos están en R, es importante explorarlos para entender su estructura y contenido.

In [None]:
# Ver las primeras filas
head(datos)

# Ver las últimas filas
tail(datos)

# Obtener un resumen estadístico
summary(datos)

# Ver la estructura del data frame
str(datos)

# Manipular los datos

## Seleccionando columnas:

In [None]:
# Seleccionar la columna "edad"
edad <- datos$edad

# Seleccionar múltiples columnas
datos_seleccionados <- datos[, c("nombre", "edad")]

## Filtrando datos:

In [None]:
# Filtrar los datos para obtener solo las personas mayores de 30 años
personas_mayores <- datos[datos$edad > 30, ]

## Ordenando datos:

In [None]:
# Ordenar los datos por edad de forma ascendente
datos_ordenados <- datos[order(datos$edad), ]

## Agregando y transformando variables:

In [None]:
# Crear una nueva variable
datos$nueva_variable <- datos$edad * 2

# Agrupar y calcular el promedio por grupo
library(dplyr)
datos %>%
  group_by(ciudad) %>%
  summarise(edad_promedio = mean(edad))

# Mas Ejemplos

In [None]:
"""Limpiando datos"""

# Eliminar filas con valores faltantes
datos_limpios <- na.omit(datos)

# Reemplazar valores faltantes con la media
library(tidyr)
datos_completos <- replace_na(datos, list(edad = mean(datos$edad, na.rm = TRUE)))

"""Creando nuevas variables a partir de fechas"""

# Convertir una columna de fechas a un formato de fecha
datos$fecha <- as.Date(datos$fecha, format = "%Y-%m-%d")

# Extraer el año
datos$anio <- year(datos$fecha)