# Data Frames

En esta práctica veremos como:
* Crear Data Frames.
* Extraer y Filrar información de un DataFrame.
* Ordenar un Data Frame con respecto a una columna.
* Extracción de características de un Data Frame.

Los Data frames son arrgelos en forma matricial donde cada columna puede ser de distinto tipo.

In [1]:
# Creamos las columnas que compondrán el Data Frame:
meses <- c('Enero','Febrero','Marzo')
ventas <- c(100,120,80)
objetivos <- c(TRUE,TRUE,FALSE)

In [2]:
df <- data.frame(meses, ventas, objetivos)
df

meses,ventas,objetivos
<chr>,<dbl>,<lgl>
Enero,100,True
Febrero,120,True
Marzo,80,False


## Extracción de información por índices

### Extracción de columnas

* Si usamos: `df$ColumnName` o `df[,ColumnName]` se extraerá la columna en forma vectorial.
* Si usamos: `df[ColumnName]` o `df[ColumnNumber]` se extraerá la columna en forma de matriz.

In [4]:
df$meses

In [5]:
df[,'meses']

In [6]:
df['meses']

meses
<chr>
Enero
Febrero
Marzo


In [7]:
df[1]

meses
<chr>
Enero
Febrero
Marzo


In [8]:
df[,1]

In [9]:
df$ventas

In [13]:
df[,'ventas']

In [14]:
5*df[,'ventas']

In [16]:
5*df['ventas']

ventas
<dbl>
500
600
400


In [11]:
df[,2]

In [17]:
# Extracción de las columnas 1 y 3:
df[,c(1,3)]

meses,objetivos
<chr>,<lgl>
Enero,True
Febrero,True
Marzo,False


In [18]:
# Extracción de las columnas 1 y 3:
df[,c('meses','objetivos')]

meses,objetivos
<chr>,<lgl>
Enero,True
Febrero,True
Marzo,False


### Extracción de renglones

In [19]:
df

meses,ventas,objetivos
<chr>,<dbl>,<lgl>
Enero,100,True
Febrero,120,True
Marzo,80,False


In [20]:
df[1,]

Unnamed: 0_level_0,meses,ventas,objetivos
Unnamed: 0_level_1,<chr>,<dbl>,<lgl>
1,Enero,100,True


In [21]:
df[c(1),]

Unnamed: 0_level_0,meses,ventas,objetivos
Unnamed: 0_level_1,<chr>,<dbl>,<lgl>
1,Enero,100,True


In [22]:
df[c(1,3),]

Unnamed: 0_level_0,meses,ventas,objetivos
Unnamed: 0_level_1,<chr>,<dbl>,<lgl>
1,Enero,100,True
3,Marzo,80,False


### Extracción de renglones y columnas específicas

In [23]:
df

meses,ventas,objetivos
<chr>,<dbl>,<lgl>
Enero,100,True
Febrero,120,True
Marzo,80,False


In [24]:
df[c(1,3),c(1,2)]

Unnamed: 0_level_0,meses,ventas
Unnamed: 0_level_1,<chr>,<dbl>
1,Enero,100
3,Marzo,80


In [25]:
df[c(1,3),c('meses','ventas')]

Unnamed: 0_level_0,meses,ventas
Unnamed: 0_level_1,<chr>,<dbl>
1,Enero,100
3,Marzo,80


In [26]:
df[c(1,3),2]

In [28]:
50*df[c(1,3),2]

## Extracción de información por filtros

In [29]:
df

meses,ventas,objetivos
<chr>,<dbl>,<lgl>
Enero,100,True
Febrero,120,True
Marzo,80,False


In [32]:
ventas

In [30]:
# Extraer todos los registros del DataFrame dónde "ventas >= 100"
filtro1 <- (ventas >= 100)
subset(df, subset = filtro1 )

Unnamed: 0_level_0,meses,ventas,objetivos
Unnamed: 0_level_1,<chr>,<dbl>,<lgl>
1,Enero,100,True
2,Febrero,120,True


In [33]:
# Extraer los meses del DataFrame dónde "ventas >= 100"
subset(df[,1], subset = filtro1 )

In [34]:
# Extraer los meses del DataFrame dónde "ventas >= 100"
subset(df[,'meses'], subset = filtro1 )

In [35]:
# Extraer los meses y objetivos del DataFrame dónde "ventas >= 100"
subset(df[,c('meses','objetivos')], subset = filtro1 )

Unnamed: 0_level_0,meses,objetivos
Unnamed: 0_level_1,<chr>,<lgl>
1,Enero,True
2,Febrero,True


In [36]:
# Extraer los meses y objetivos del DataFrame dónde "ventas >= 100"
subset(df[,c(1,3)], subset = filtro1 )

Unnamed: 0_level_0,meses,objetivos
Unnamed: 0_level_1,<chr>,<lgl>
1,Enero,True
2,Febrero,True


In [37]:
# Extraer los meses y objetivos del DataFrame dónde "ventas < 100"
subset(df, subset = (ventas < 100) )

Unnamed: 0_level_0,meses,ventas,objetivos
Unnamed: 0_level_1,<chr>,<dbl>,<lgl>
3,Marzo,80,False


## Ordenamiento por columnas

In [38]:
df

meses,ventas,objetivos
<chr>,<dbl>,<lgl>
Enero,100,True
Febrero,120,True
Marzo,80,False


In [39]:
# Muestra los índices en orden ascendente con respecto a la columna 2:
order(df[,2])

In [40]:
# Muestra los índices en orden ascendente con respecto a la columna 2:
order(df[,'ventas'])

In [41]:
# Muestra los índices en orden ascendente con respecto a la columna 2:
order(df$ventas)

In [42]:
# ordenamos de forma ascendente con respecto a una columna:
df[ order(df$ventas), ]

Unnamed: 0_level_0,meses,ventas,objetivos
Unnamed: 0_level_1,<chr>,<dbl>,<lgl>
3,Marzo,80,False
1,Enero,100,True
2,Febrero,120,True


In [43]:
# ordenamos de forma descendente con respecto a una columna:
df[ order(-df$ventas), ]

Unnamed: 0_level_0,meses,ventas,objetivos
Unnamed: 0_level_1,<chr>,<dbl>,<lgl>
2,Febrero,120,True
1,Enero,100,True
3,Marzo,80,False


In [44]:
# ordenamos de forma descendente con respecto a varias columnas columna:
df[ order(-df$ventas, df$meses), ]

Unnamed: 0_level_0,meses,ventas,objetivos
Unnamed: 0_level_1,<chr>,<dbl>,<lgl>
2,Febrero,120,True
1,Enero,100,True
3,Marzo,80,False


## Extrayendo características de un Data Frame

In [45]:
str(df)

'data.frame':	3 obs. of  3 variables:
 $ meses    : chr  "Enero" "Febrero" "Marzo"
 $ ventas   : num  100 120 80
 $ objetivos: logi  TRUE TRUE FALSE


In [46]:
summary(df)

    meses               ventas    objetivos      
 Length:3           Min.   : 80   Mode :logical  
 Class :character   1st Qu.: 90   FALSE:1        
 Mode  :character   Median :100   TRUE :2        
                    Mean   :100                  
                    3rd Qu.:110                  
                    Max.   :120                  