# Datos estructurados

Como ya hemos comentado anteriormente en **R** podemos realizar agrupaciones de datos. En concreto, tenemos los
vectores, un vector es una secuencia ordenada de datos que comparten el mismo tipo.

En este capítulo aprenderemos a construirlos y a usarlos. Este conocimiento nos permitirá usar estructuras más
avanzadas:

## Creación

La sintaxis para crear un vector con una colección de números emplea la función `c` (concantenar), por ejemplo: 5,4,2,5,3,7,2,8 es la siguiente:

```R
> x=c(5,4,2,5,3,7,2,8)
> x
[1] 5,4,2,5,3,7,2,8
```
Podemos crear vectores de cualquier tipo de datos básico, por ejemplo, podemos crear un vector de _strings_ de la siguiente manera:

```R
> strs = c("Palma", "Inca", "Manacor", "Alcudia", "Sineu")
> strs
[1] "Palma"   "Inca"    "Manacor" "Alcudia" "Sineu"
```
Debemos fijarnos en que la diferencia entre declarar una variable y un _string_ es el uso del las dobles comillas `"`.

Si intentamos crear un vector con datos de diferentes tipos, **R** automáticamente los convertirá a un tipo que pueda ser común a todos ellos. El orden de conversión entre los tipos es el siguiente: _character_ >  _complex_ > _numeric_ > _integer_ > _logical_. Así, cuando algún elemento de un vector es de tipo _strings_, **R** considera el resto de sus elementos son _strings_.

La función `c` que hemos usado para crear vectores en realidad concatena sus argumentos en un vector. Si la aplicamos a vectores, crea un nuevo vector concatenando sus elementos. Podemos mezclar vectores y datos en su argumento:

```R
> v = c(1, 2, 3, 4)
> v2 = c(5, 6, 7)
> v3 = c(v, v2, 8, 9)
> v3
[1] 1 2 3 4 5 6 7 8 9
```

### Cargar datos de un fichero

El uso habitual de los vectores implica el manejo de colecciones de datos las cuales no nos interesará introducir a mano sino que las tendremos guardados en algún archivo en nuestro ordenador o estará disponible en internet.  La función _scan_ se puede usar para copiar en un vector el contenido de un fichero de texto situado en el directorio de trabajo, o del que conozcamos su dirección en Internet. La manera de hacerlo es aplicando _scan_ al nombre del fichero o a su _url_, escritos entre comillas.

**TODO: EXEMPLE!!**


### Creación de vectores con patrones

#### La función _rep_

Para definir un vector constante podemos usar la función `rep(a, b)`, que genera un vector que contiene el valor `a` repetido `b` veces:

```R
> rep(33, 5)
[1] 33 33 33 33 33
> rep("Palma", 5)
[1] "Palma" "Palma" "Palma" "Palma" "Palma"
```

Esta función también nos permite repetir vectores. En concreto tiene dos modos de repetición, para especificar el tipo de repetición tenemos que usar el parámetro adecuado en el argumento de rep: si usamos el parámetro `times`, repetiremos el vector en bloque,
y si, en cambio, usamos el parámetro _each_ repetiremos cada valor del vector de manera independiente.

Veamos un ejemplo de uso para entender mejor su funcionamiento

```R
> rep ( c (1 ,2 ,3 ,4) ,times=5)
[1] 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
> rep ( c (1 ,2 ,3 ,4) ,each=5)
[1] 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 4 4 4 4 4
```


#### La función _seq_

Las progresiones aritméticas se pueden especificar de manera compacta usando la función seq. Una primera manera de hacerlo es mediante la instrucción `seq(a, b, by=p)`, que especifica la progresión aritmética de paso p que empieza en a: `a, a + p, a + 2p, . . . ,` hasta llegar a `b`.

La instrucción `seq` con paso ±1 se puede abreviar con el símbolo `:`. La instrucción a:b define la secuencia de números consecutivos entre dos números `a` y `b`, es decir, la secuencia `a, a + 1, a + 2, . . .` hasta llegar a `b`.

```R
> my_vector = 5:10
> my_vector
[1]  5  6  7  8  9 10
> d_vector = 20:10
> d_vector
 [1] 20 19 18 17 16 15 14 13 12 11 10
```

La función `seq` sirve para definir progresiones aritméticas de otros dos tipos:
 - `seq(a, b, length.out=n)` define la progresión aritmética de longitud `n` que va de `a` a `b`, por lo tanto, `p = (b − a)/(n − 1)`.
 - `seq(a, by=p, length.out=n)` define la progresión aritmética `a, a + p, a + 2p, . . . , a + (n − 1)p` de longitud `n` y paso `p` que empieza en `a`.


## Operaciones
Usar vectores con **R** tiene una propiedad muy útil: podemos aplicar una función a todos los miembros de un vector en un solo paso. **R** dispone de muchas funciones para aplicar a vectores, relacionadas principalmente con la estadística. Veamos algunas que nos pueden ser útiles por el momento, y ya iremos viendo otras a medida que avance el curso:

- **length** calcula la longitud del vector.
- **max y min** calculan sus valores máximo y mínimo, respectivamente.
- **sum** calcula la suma de sus entradas.
- **prod** calcula el producto de sus entradas.
- **mean** calcula la media aritmética de sus entradas.
- **diff** calcula el vector formado por las diferencias sucesivas entre entradas del vector original.
- **cumsum** calcula el vector formado por las sumas acumuladas de las entradas del vector original: cada entrada de `cumsum(x)` es la suma de las entradas de `x` hasta su posición.
- **sort** ordena el vector en el orden natural de los objetos que lo forman: el orden numérico creciente, el orden alfabético, etc. Si lo queremos ordenar en orden decreciente, podemos incluir en su argumento el parámetro `dec=TRUE` que invierte el orden de los elementos del vector.
### sapply