# Filtros

Ao se examinar um conjunto de dados, é frequente a situação em que o auditor tem interesse em selecionar para exame apenas um subconjunto do mesmo, ou seja, selecionar os registros que atendam a determinados critérios por ele definidos.

Assim o auditor pode desejar selecionar para análise, apenas os registros onde o valor das faturas, por exemplo, sejam superiores a determinado valor, ou faturas emitidas em um determinado período ou ainda registros relativos a funcionários de um determinado departamente de uma empresa.

Para a aplicação de filtros aos dados, o R dispõe da função **`subset()`**. Além desta função, também pode-se usar o sistema de indexação do R.

Para ilustrar o uso de filtros usarei o conjunto de dados `rh.RData` que contém informação relativa aos recursos humandos de uma empresa. Os dados estão armazenados no formato `.RData` que é o formato de dados do R.

A importação dos dados pode ser feita da seguinte forma:

In [1]:
setwd('C:\\Users\\Marcos\\Documents\\GitHub\\Usando-R-em-Auditoria\\dados')
load('rh.RData')
ls()

In [3]:
str(rh)
head(rh)

'data.frame':	5000 obs. of  10 variables:
 $ Sexo            : chr  "Masculino" "Masculino" "Feminino" "Feminino" ...
 $ Estado.Civil    : chr  "Casado" "Viúvo" "Casado" "Casado" ...
 $ Anos.de.estudo  : int  14 19 18 16 15 18 18 12 14 12 ...
 $ Formação        : chr  "SEC" "SEC" "SEC" "SEC" ...
 $ Tempo.de.empresa: int  19 31 28 20 15 23 27 20 11 16 ...
 $ Unidade         : chr  "Curitiba" "São Paulo" "Rio de Janeiro" "Rio de Janeiro" ...
 $ Departamento    : chr  "Produção" "Vendas" "Financeiro" "Vendas" ...
 $ Cargo           : chr  "Assistente" "Assistente" "Assistente" "Assistente" ...
 $ Salário         : num  16.7 29.1 21.8 22.6 16.7 ...
 $ Bônus           : num  28.02 41.24 16.88 13.5 8.44 ...


Sexo,Estado.Civil,Anos.de.estudo,Formação,Tempo.de.empresa,Unidade,Departamento,Cargo,Salário,Bônus
Masculino,Casado,14,SEC,19,Curitiba,Produção,Assistente,16.67,28.02
Masculino,Viúvo,19,SEC,31,São Paulo,Vendas,Assistente,29.13,41.24
Feminino,Casado,18,SEC,28,Rio de Janeiro,Financeiro,Assistente,21.8,16.88
Feminino,Casado,16,SEC,20,Rio de Janeiro,Vendas,Assistente,22.61,13.5
Masculino,Solteiro,15,SEC,15,Curitiba,Vendas,Auxiliar,16.67,8.44
Masculino,Casado,18,SEC,23,São Paulo,Pessoal,Assistente,8.34,86.88


Supondo que se deseje selecionar apenas os registros relativos a funcionários do sexo feminino, pode-se fazer da seguinte forma:

In [8]:
rh_feminino <- subset(rh, Sexo == 'Feminino')
head(rh_feminino)

Unnamed: 0,Sexo,Estado.Civil,Anos.de.estudo,Formação,Tempo.de.empresa,Unidade,Departamento,Cargo,Salário,Bônus
3,Feminino,Casado,18,SEC,28,Rio de Janeiro,Financeiro,Assistente,21.8,16.88
4,Feminino,Casado,16,SEC,20,Rio de Janeiro,Vendas,Assistente,22.61,13.5
10,Feminino,Casado,12,HUM,16,Rio de Janeiro,Produção,Assistente,5.78,16.68
11,Feminino,Solteiro,13,HUM,20,Florianópolis,Produção,Auxiliar,1.08,11.72
13,Feminino,Casado,13,EXA,23,Rio de Janeiro,Pessoal,Assistente,5.19,16.48
14,Feminino,Solteiro,8,EXA,0,Florianópolis,Produção,Auxiliar,1.02,2.3


Bem, e se quisermos filtrar os registros relativos a funcionários do sexo masculino, da unidade do Rio de Janeiro, dos departamentos financeiro e de vendas e que possuam salário superior a $70,00?

In [12]:
subset(rh, Sexo == 'Masculino' &
           Unidade == 'Rio de Janeiro' &
           Departamento %in% c('Financeiro', 'Vendas') &
           Salário > 70)

Unnamed: 0,Sexo,Estado.Civil,Anos.de.estudo,Formação,Tempo.de.empresa,Unidade,Departamento,Cargo,Salário,Bônus
368,Masculino,Viúvo,22,SEC,50,Rio de Janeiro,Vendas,Vice-Presidente,77.47,49.48
388,Masculino,Casado,23,SEC,42,Rio de Janeiro,Vendas,Gerente,88.93,148.6
398,Masculino,Casado,19,SEC,45,Rio de Janeiro,Vendas,Vice-Presidente,88.93,110.26
409,Masculino,Casado,28,SEC,37,Rio de Janeiro,Vendas,Vice-Presidente,141.42,341.18
608,Masculino,Casado,22,SEC,36,Rio de Janeiro,Vendas,Gerente,92.97,127.32
761,Masculino,Casado,19,SEC,41,Rio de Janeiro,Vendas,Gerente,75.2,84.36
799,Masculino,Casado,21,SEC,39,Rio de Janeiro,Vendas,Gerente,81.65,103.02
1317,Masculino,Casado,23,SEC,39,Rio de Janeiro,Vendas,Vice-Presidente,79.31,192.14
1436,Masculino,Casado,22,SEC,37,Rio de Janeiro,Vendas,Vice-Presidente,99.77,176.88
1568,Masculino,Casado,22,SEC,35,Rio de Janeiro,Vendas,Gerente,75.2,90.74
