# Strutture dati

Le strutture dati principali sono:

- vettori
- matrici
- liste
- array
- data frame

## Vettori

Collezione ordinata di celle dello stesso tipo; ogni vettore ha un tipo, una lunghezza ed un insieme di attributi o metadati; i tipi di vettore sono:

- integer
- logical
- double
- complex
- character
- raw

In [8]:
integer <- 1L
double <- 1.2
character <- 'ciao'
boolean <- TRUE

mode(integer)
mode(double)
mode(complex)
mode(boolean)

Alle singole variabili sembra venire assegnato uno scalare, mentre in realtá sono vettori di lunghezza 1

In [11]:
length(character)

### function `c`

La funzione `c` permette di combinare un insieme di valori creando un vettore

In [18]:
vettore1 <- c(1,2,3)
vettore1

vettore2 <- c(1:5, elemento_a=10, elemento_b=11)
vettore2

#### Coercizione implicita

Tutti gli elementi dell'array devono essere dello stesso tipo; di conseguenza all'interno della funzione `c` avviene una coercizione implicita in cui i valori di tipo diverso vengono adattati al tipo piú adatto

In [19]:
vettore3 <- c(1,2,'3')   # tutti gli elementi vengono convertiti in character
vettore4 <- c(TRUE, 1)   # tutti gli elementi vengono convertiti in numerici

### Proprietá dei vettori

In [29]:
typeof(vettore3)                    # tipo del vettore
length(vettore3)                    # lunghezza del vettore

attr(vettore3, 'attributo_a') <- a
attributes(vettore3)                # attributi del vettore
attr(vettore3, 'attributo_a')       # accesso al valore dell'attributo

Esistono 3 attributi speciali:

In [44]:
names(vettore2)                     # attribuisce un'etichetta agli elementi del vettore
attr(vettore2, 'names')

class(vettore3)                     # permette ad R di implementare una logica orientata agli oggetti
str(vettore3)                       # visualizza la struttura della variabile

 chr [1:3] "1" "2" "3"
 - attr(*, "attributo_a")= num 1


### Valori NA

`NA` é una costante che rappresenta un valore mancante; questo valore influenza i risultati delle operazioni logica e matematiche

In [40]:
vettoreIncompleto <- c(1,2,NA)
is.na(vettoreIncompleto)

## Matrici

E' una collezione bidimensionale di celle dello stesso tipo, un'array di 2 dimensioni; nella realtá si tratta di un vettore con attributo `dim` e con lunghezza `righe * colonne`

In [50]:
matrice1 <- matrix(c(1,2,3,4,5,6,7,8,9), nrow=3, ncol=3)
matrice1

0,1,2
1,4,7
2,5,8
3,6,9


In [63]:
str(matrice1)
dim(matrice1)       # restituisce la dimensione tabellare; é l'attributo che permette ad un vettore di essere rappresentato come matrice
length(matrice1)    # lunghezza del vettore sottostante (righe * colonne)
as.vector(matrice1) # restituisce il vettore sottostante
t(matrice1)         # trasposizione della matrice
colnames(matrice1) <- c('a', 'b', 'c')   # assegna delle etichette alle colonne della matrice
rownames(matrice1) <- c('d', 'e', 'f')   # assegna delle etichette alle righe della matrice
rownames(matrice1)  # visualizza le etichette associate alle righe
colnames(matrice1)  # visualizza le etichette associate alle colonne

 num [1:3, 1:3] 1 2 3 4 5 6 7 8 9
 - attr(*, "dimnames")=List of 2
  ..$ : chr [1:3] "d" "e" "f"
  ..$ : chr [1:3] "a" "b" "c"


Unnamed: 0,d,e,f
a,1,2,3
b,4,5,6
c,7,8,9


## Fattori

Un fattore é un vettore che rappresenta una variabile nominale, cioé contiene un insieme di variabili che puó assumere un insieme di valori fisso e definito

In [75]:
cat <- c('a', 'b', 'a', 'a', 'b')
nominale <- factor(cat)                      # se non esplicitamente dichiarato, i livelli sono ordinati alfabeticamente
nominale
ordinale <- factor(cat, levels=c('a', 'b'))  # definisce implicitamente l'ordine dei fattori

attributes(nominale)
typeof(nominale)
as.integer(nominale)                         # integer perché gli interi mappano l'indice con il corrispondente livellob
levels(nominale)                             # estrae i possibili valori di categori

## Liste

E' una collezione ordinata ed eterogenea di oggetti anche complessi; una lista puó contenere anche liste, quindi permette la costruzione di strutture ad albero

In [81]:
lista <- list(
    matrice=matrix(c(1,2,3), nrow=1, ncol=3),
    'ciao',
    vettore=c('a', 'b')
)
str(lista)

List of 3
 $ matrice: num [1, 1:3] 1 2 3
 $        : chr "ciao"
 $ vettore: chr [1:2] "a" "b"


## Data frame

E' una lista di vettore, fattori o matrici di uguale lunghezza; puó essere visto come una matrice dove i vettori costituiscono le colonne; a differenza delle matrici, dove tutti gli elementi devono essere dello stesso tipo, ciascun vettore puó essere di tipo diverso

In [86]:
a <- c(1,2,3)
b <- c('a', 'b', 'c')
c <- c(TRUE, FALSE, NA)

df <- data.frame(a,b,c)
str(df)

'data.frame':	3 obs. of  3 variables:
 $ a: num  1 2 3
 $ b: chr  "a" "b" "c"
 $ c: logi  TRUE FALSE NA
