## Creazione di vettori

In [19]:
c(0,1,2,3,4,5)                    # crea un vettore con gli elementi 1,2,3,4,5,6 e 7
c(0:7)                            # crea un vettore con gli elementi da 0 a 7
0:7                               # crea un vettore con gli elementi da 0 a 7
seq(from=0,to=10,by=2)            # crea un vettore con gli elementi da 0 a 7 con step di 2
seq(from=0,to=10,length.out=5)    # crea un vettore da 0 a 10 con 5 elementi
c(TRUE,FALSE,TRUE,TRUE)           # crea un vettore di bool
c("one", "two", "three")          # crea un vettore di stringhe
c("one", c("two", "three"))       # crea un vettore con "one" concatenato con il vettore "two","three"
rep(1:3, times=5)                 # ripete il vettore 1,2,3 per 5 volte
rep(c("one","two"), length.out=5) # ripete il vettore "one","two" fino ad essere di lunghezza 5

## Prints

In [66]:
print("there we have a print of a vector:")                 # stampa la rappresentazione stringa dell'oggetto passato come argomento.
print(c(1:10))                                              # stampa la rappresentazione stringa del vettore c(1:10).
cat("there we have a print of a vector:", c(1:10),end="\n") # concatena stringhe delle rappresentazione degli argomenti.

[1] "there we have a print of a vector:"
 [1]  1  2  3  4  5  6  7  8  9 10
there we have a print of a vector: 1 2 3 4 5 6 7 8 9 10 


## Assegnamenti

In [48]:
x <- 1
y <<- 2
3 -> z
4 ->> k
t = 5
cat("x=",x,", y=",y,", z=",z,", k=",k,", t=",t, sep="")

x=1, y=2, z=3, k=4, t=5

## Dati non disponibili
I dati mancanti vengono segnati con il valore ```NA```  .  
Gli ```NA``` vengono tratti in modo un po differente da come ci si aspetterebbe  .  
Per esempio, ```NA == NA``` ha come risultato ```NA```.
Per verificare se un elemento è ```NA``` utilizziamo ```is.na(x)``` che ritorna ```TRUE``` solo se ```x``` ha valore ```NA```.

In [65]:
x <- c(1,2,3,NA,3,4) 
cat("NA == NA  is evaluated in", NA == NA ,"\n")
cat("is.na(NA) is evaluated in", is.na(NA),"\n")
cat("is.na(x)  is evaluated in", is.na(x) ,"\n")

NA == NA  is evaluated in NA 
is.na(NA) is evaluated in TRUE 
is.na(x)  is evaluated in FALSE FALSE FALSE TRUE FALSE FALSE 


## Indicizzazione 1D
l'indicizzazione in R può avvenire attraverso le seguenti:
- singolo indice.
- vettori di indici.
- maschere (vettori di booleani), se la maschera è incompleta il valore di default è ```TRUE```.
- espressioni booleane.
L'indicizzazione parte da 1.

In [2]:
x <- c(1:10)

cat("x[1]           =", x[1]         , end="\n")
cat("x[c(1,3,5,2)]  =", x[c(1,3,5,2)], end="\n")
cat("x[1:5]         =", x[1:5]       , end="\n")

mask <- rep(c(TRUE,FALSE),lengh.to=10)

cat("x[mask]        =", x[mask]      , end="\n")
cat("x[x %% 2 == 0] =", x[x %% 2==0] , end="\n")

x[1]           = 1 
x[c(1,3,5,2)]  = 1 3 5 2 
x[1:5]         = 1 2 3 4 5 
x[mask]        = 1 3 5 7 9 
x[x %% 2 == 0] = 2 4 6 8 10 


Notate che la valutazione dell'espressione ```x %% 2 == 0``` non fa altro che ritornare la maschera sugli elementi:  
```FALSE, TRUE, FALSE, TRUE, FALSE, TRUE, FALSE, TRUE, FALSE, TRUE```  .  
Lo stesso vale anche per le funzioni, queste vengono broadcastate (eseguite elemento per elemento) su tutto il vettore.  
Per esempio: ```c(1,2,3)+2``` ritorna ```3,4,5```  .    
O ancora: ```is.na(c(1,NA,3))``` ritorna ```FALSE,TRUE,FALSE```  .  
Di conseguenza: ```x[!is.na(x)]``` può essere utilizzata per filtrare gli elementi ```NA``` da un vettore.

## Utilities
Di seguito riporto alcune primitive di R che possono tornarvi utili:
- ```max(x)``` massimo di x.
- ```min(x)``` minimo di x.
- ```sum(x)``` somma degli elementi di x.
- ```sort(x)``` copia ordinata di x.
- ```unique(x)``` copia di x senza ripetizioni.
- ```sample(x, n, replace = TRUE)``` estrae n elementi a caso.
- ```table(x)``` frequenze assolute di x.
- ```prop.table(table(x))``` frequenze relative di x.
- ```paste(x, y, sep = c)``` concatena ogni stringa di x con il separatore c e la rispettiva stringa di y.

## DataFrame

In [69]:
col0 <- 1:5
col1 <- rep(c("A","B","C"), length.out=5)
col2 <- rep(1:3           , length.out=5)
data <- data.frame(col0, col1, col2, row.names=1:5)
names(data) <- c("col1","col2","col3")
data

Unnamed: 0_level_0,col1,col2,col3
Unnamed: 0_level_1,<int>,<fct>,<int>
1,1,A,1
2,2,B,2
3,3,C,3
4,4,A,1
5,5,B,2


I data frame possono essere creati utilizzando la funzione ```data.frame(col0, col1, col2, ...)```  .  
Le colonne vengono impostate utilizzando gli argomenti  .  
Il nome delle righe può essere impostato utilizzando il campo ```row.names```  .  
I nomi delle colonne possono essere impostati utilizzando la funzione ```names()```.

## Indicizzazione 2D (per DataFrame)
La notazione ```data$columnName``` ritorna la colonna di dati nominata ```columnName```  .  
L'indicizzazione può avvenire nei modi seguenti utilizzando 2 indici ```data[•,•]```:  
- Indici singoli ```data[2,2]```.
- Sequence di indici ```data[1:3,1:2]```.
- Sequence di labels ```data[1:3,c("col2", "col3")]```.
- Un indice lasciato vuoto implicitamente indica tutti i valori ```data[ ,c("col2", "col3")]```.
- Attraverso maschere, come l'indicizzazione 1D ```data[ ,c(TRUE,FALSE,TRUE)]```.
- Attraverso espressioni booleane sulle righe ```data[data$col1 %% 2 == 0,]```.
- Attraverso espressioni booleane sulle colonne ```data[ ,names(data) != "col2"]```.

In [76]:
d0 = data[2,2]
d1 = data[1:3,1:2]
d2 = data[1:3,c("col2", "col3")]
d3 = data[ ,c("col2", "col3")]
d4 = data[ ,c(TRUE,FALSE,TRUE)]
d5 = data[data$col1 %% 2 == 0,]
d6 = data[ ,names(data) != "col2"]

## Documentazione
La documentazione può essere consultata online all'indirizzo: https://www.rdocumentation.org/  
Potete accedere alla documentazione anche tramite il comando ```help()```  .  
Per esempio: ```help(cat)``` ritorna la documentazione relativa alla funzione ```cat```-