# Manipulación de strings



Como podemos suponer, al trabajar con conjuntos de datos, nos algunos de ellos serán de tipo texto. En **R**, los _strings: son una parte fundamental para el manejo de datos y textos. Aquí tienes algunos conceptos básicos relacionados con el uso de strings en R:

Aunque ya lo sabemos, vale la pena recordar que un string es una secuencia de caracteres, como palabras o frases, encerrada entre comillas simples (`' '`) o dobles (`" "`).

1. **Concatenación**: Podemos combinar strings usando el operador `paste()` o `paste0()` para unir varios strings en uno solo. La característica de `paste0` es que antes de concatenar los vectores los pasa a tipo `character`.

```R
string1 = "Hola"
string2 = "mundo"
resultado <- paste(string1, string2)
# resultado contendrá "Hola mundo"
```

2. **Longitud de un String**: Podemos obtener la longitud de un string usando la función `nchar()`.

```R
mi_string <- "Hola, mundo!"
longitud <- nchar(mi_string)
# longitud contendrá 12
```

3. **Substrings**: Podemos extraer partes de un string utilizando la notación basada en índices que ya hemos visto en los vectores mediante la función `substr()`.

```R
mi_string = "Hey, joe!"
substring <- substr(mi_string, start = 1, stop = 3)
# substring contendrá "Hola"
```

4. **`tolower()` y `toupper()`**: Convierten un string a minúsculas o mayúsculas, respectivamente.

```R
mi_string = "Hola, Mundo!"
minusculas = tolower(mi_string) # minusculas contendrá "hola, mundo!"
```

5. **`gsub()`**: Realiza sustituciones de patrones en un string.

```R
mi_string = "Hola, mundo!"
nuevo_string = gsub("mundo", "Planeta", mi_string) # nuevo_string contendrá "Hola, Planeta!"
```

6. **`strsplit()`**: Divide un string en partes según el delimitador que definamos como segundo parámetro.

```R
mi_string = "manzana pera  naranja"
lista_de_frutas = strsplit(mi_string, " ")
# lista_de_frutas contendrá la lista "manzana", "pera", "naranja"
```

7. **`sprintf()`**: Da formato a un string utilizando una plantilla. Ver documentación para tener más información de los símbolos que permiten intercalar datos de diferentes tipos en el siguiente [enlace](https://www.rdocumentation.org/packages/base/versions/3.6.2/topics/sprintf).

```R
nombre = "Juan"
edad = 37
mensaje = sprintf("Mi nombre es %s y tengo %d años.", nombre, edad)
# la variable mensaje contendrá "Mi nombre es Juan y tengo 30 años."
```

8. **`grepl()`**: Busca un patrón en un string y devuelve un valor lógico indicando si este se encuentra en él o no.

```R
mi_string = "Hola, mundo!"
resultado = grepl("mundo", mi_string)
# resultado contendrá TRUE
```

9. **`str_trim()`**: Elimina espacios en blanco adicionales al principio y al final de un string.

```R
mi_string = "   Hola, mundo!   "
string_limpio = str_trim(mi_string)
# string_limpio contendrá "Hola, mundo!"
```
### Ejercicios


1. Dado el siguiente vector con fechas `fechas = c("01/01/2023", "15/03/2023", "22/06/2023", "04/09/2023", "10/10/2023", "25/12/2023", "07/04/2024", "19/08/2024", "30/11/2024", "12/05/2025")
` queremos obtener un vector que solamente contenga los años. Finalmente, puedes usar la función `unique` para eliminar los años duplicados.
2. Dado el siguiente vector con nombres: `nombres = c("Juan Pérez", "MARÍA GONZÁLEZ", "pedro López", "Ana Martínez", "jUliA Nuñez", "CARLOS Sánchez", "lUisA RODRÍGUEZ", "Miguel Ángel García", "sOfía ruiz", "Diego Fernández")` queremos estandarizarlo
para que todos estén en formato "NombreApellido" con la primera letra de cada palabra en mayúscula.

Nota: La función `paste` tiene un parámetro para indicar el separador que queremos usar: `sep`.









