In [3]:
import pandas as pd

### Base utilizada

In [4]:
df_data = pd.read_csv('./Base de dados/ConsumidorGov.csv',sep = ';')

# Filtragem

Durante a análise exploratória dos dados, frequentemente será necessário filtrar amostras, a partir de certas condições, para fins de análise mais específica. Existe algumas maneiras de fazermos isso como as mostradas a seguir:

### Filtragem condicional direta

Supondo que nosso objetivo seja trazer apenas as reclamações do site "ConsumidorGov" do estádo **GOIÁS**, como seria feito?

Para fazer essa selação condicional, é necessário buscar o descritivo que representa **SÃO PAULO** e como esta escrita dentro da massa de dados, neste caso utilizaremos a seleção da coluna `UF` juntamente com o método `unique()`, este é responsável por trazer uma array com os campos **distintos** para cada valor do campo selecionado.

In [5]:
## Mostra todos os estados com reclamações no site "Consumidor Gov".
## Mostra os únicos (unique) valores para a coluna 'UF'.
df_data['UF'].unique()

array(['AL', 'PE', 'BA', 'SP', 'MT', 'PR', 'PA', 'RN', 'RJ', 'MG', 'RS',
       'SE', 'CE', 'GO', 'DF', 'ES', 'MS', 'PB', 'MA', 'AP', 'SC', 'RO',
       'TO', 'PI', 'AC', 'AM', 'RR'], dtype=object)

Podemos observar que o nosso objetivo então é fazer a filtragem condicional/direta utilizando o valor 'SP' da coluna `UF`. Podemos fazer isto da seguinte forma:

In [6]:
## Comparação da coluna 'UF' com o valor 'SP'
df_data['UF'] == 'SP'

0         False
1         False
2         False
3         False
4          True
          ...  
105013    False
105014    False
105015    False
105016    False
105017    False
Name: UF, Length: 105018, dtype: bool

Repare que o retorno é feito __**linha a linha**__ através de uma Series('array') de **booleans** mostrando se a linha em questão respeita(**TRUE**) ou não respeita(**FALSE**) a condição proposta `UF = 'SP'`.

Como filtrar então o DataFrame `df_data` para obter apenas as linhas que contém o campo `UF` igual a 'SP'?

In [7]:
## Armazenando a series retornada em uma variável
selecao = df_data['UF'] == 'SP'
selecao

0         False
1         False
2         False
3         False
4          True
          ...  
105013    False
105014    False
105015    False
105016    False
105017    False
Name: UF, Length: 105018, dtype: bool

Utilizaremos a Series criada `selecao` para filtragem no DataFrame `df_data`

In [8]:
df_data[selecao] ## Aplicando a filtragem em todos os registros do DataFrame 'df_data' utilizando a series de booleano 'selecao'

Unnamed: 0,Gestor,Canal de Origem,Região,UF,Cidade,Sexo,Faixa Etária,Ano Abertura,Mês Abertura,Data Abertura,...,Assunto,Grupo Problema,Problema,Como Comprou Contratou,Procurou Empresa,Respondida,Situação,Avaliação Reclamação,Nota do Consumidor,Análise da Recusa
4,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,Guarujá,M,entre 51 a 60 anos,2024,10,01/10/2024,...,Água e Esgoto,Atendimento / SAC,Má qualidade no atendimento (descortesia / des...,Loja física,S,S,Finalizada avaliada,Resolvida,3.0,
22,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,Osasco,M,entre 41 a 50 anos,2024,10,02/10/2024,...,Cartão de Crédito / Cartão de Débito / Cartão ...,Contrato / Oferta,Oferta não cumprida / serviço não fornecido/ v...,Internet,S,S,Finalizada avaliada,Resolvida,4.0,
28,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,São Paulo,M,entre 31 a 40 anos,2024,10,02/10/2024,...,Aplicativo de mobilidade urbana,Cobrança / Contestação,"Cobrança de tarifas, taxas, valores não previs...",Internet,S,S,Finalizada avaliada,Não Resolvida,1.0,
34,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,Itanhaém,M,entre 51 a 60 anos,2024,10,03/10/2024,...,"Produtos Veterinários (ração, acessórios etc)",Cobrança / Contestação,Cobrança em duplicidade / Cobrança referente a...,Internet,S,S,Finalizada avaliada,Resolvida,1.0,
35,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,Santo André,M,entre 61 a 70 anos,2024,10,03/10/2024,...,Energia Elétrica,Cobrança / Contestação,C?obrança de participação financeira em obra? ...,Domicílio,S,S,Finalizada avaliada,Não Resolvida,1.0,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
104926,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,Carapicuíba,M,entre 31 a 40 anos,2024,12,29/12/2024,...,Serviços Veterinários,Atendimento / SAC,Má qualidade no atendimento (descortesia / des...,Não comprei / contratei,S,S,Finalizada avaliada,Não Resolvida,1.0,
104932,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,Diadema,M,entre 21 a 30 anos,2024,12,30/12/2024,...,Cartão de Crédito / Cartão de Débito / Cartão ...,Cobrança / Contestação,Negativação indevida referente à pagamento já ...,Internet,S,S,Finalizada avaliada,Resolvida,5.0,
104953,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,Ribeirão Preto,F,entre 21 a 30 anos,2024,12,30/12/2024,...,Pacote / excursão / agência de turismo,Cobrança / Contestação,Dificuldade / atraso na devolução de valores p...,Internet,S,S,Finalizada avaliada,Não Resolvida,1.0,
104958,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,São Paulo,M,entre 31 a 40 anos,2024,12,30/12/2024,...,Cartão de Crédito / Cartão de Débito / Cartão ...,Cobrança / Contestação,Negativação indevida referente à pagamento já ...,Não comprei / contratei,S,S,Finalizada avaliada,Resolvida,5.0,


Desta forma, o retorno do DataFrame é apenas com as linhas onde o campo `UF` é igual a **'SP'**

**OBSEVAÇÃO : **Também é possível utilizando o comando `.loc[selecao]` para obter o mesmo resultado.

### Filtragem com método Query

Também é possível utilizar o método `query`, este filtra linhas de um DataFrame baseando-se em uma **pergunta(Query)**.

In [9]:
df_data.query('UF == "SP"')

Unnamed: 0,Gestor,Canal de Origem,Região,UF,Cidade,Sexo,Faixa Etária,Ano Abertura,Mês Abertura,Data Abertura,...,Assunto,Grupo Problema,Problema,Como Comprou Contratou,Procurou Empresa,Respondida,Situação,Avaliação Reclamação,Nota do Consumidor,Análise da Recusa
4,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,Guarujá,M,entre 51 a 60 anos,2024,10,01/10/2024,...,Água e Esgoto,Atendimento / SAC,Má qualidade no atendimento (descortesia / des...,Loja física,S,S,Finalizada avaliada,Resolvida,3.0,
22,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,Osasco,M,entre 41 a 50 anos,2024,10,02/10/2024,...,Cartão de Crédito / Cartão de Débito / Cartão ...,Contrato / Oferta,Oferta não cumprida / serviço não fornecido/ v...,Internet,S,S,Finalizada avaliada,Resolvida,4.0,
28,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,São Paulo,M,entre 31 a 40 anos,2024,10,02/10/2024,...,Aplicativo de mobilidade urbana,Cobrança / Contestação,"Cobrança de tarifas, taxas, valores não previs...",Internet,S,S,Finalizada avaliada,Não Resolvida,1.0,
34,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,Itanhaém,M,entre 51 a 60 anos,2024,10,03/10/2024,...,"Produtos Veterinários (ração, acessórios etc)",Cobrança / Contestação,Cobrança em duplicidade / Cobrança referente a...,Internet,S,S,Finalizada avaliada,Resolvida,1.0,
35,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,Santo André,M,entre 61 a 70 anos,2024,10,03/10/2024,...,Energia Elétrica,Cobrança / Contestação,C?obrança de participação financeira em obra? ...,Domicílio,S,S,Finalizada avaliada,Não Resolvida,1.0,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
104926,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,Carapicuíba,M,entre 31 a 40 anos,2024,12,29/12/2024,...,Serviços Veterinários,Atendimento / SAC,Má qualidade no atendimento (descortesia / des...,Não comprei / contratei,S,S,Finalizada avaliada,Não Resolvida,1.0,
104932,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,Diadema,M,entre 21 a 30 anos,2024,12,30/12/2024,...,Cartão de Crédito / Cartão de Débito / Cartão ...,Cobrança / Contestação,Negativação indevida referente à pagamento já ...,Internet,S,S,Finalizada avaliada,Resolvida,5.0,
104953,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,Ribeirão Preto,F,entre 21 a 30 anos,2024,12,30/12/2024,...,Pacote / excursão / agência de turismo,Cobrança / Contestação,Dificuldade / atraso na devolução de valores p...,Internet,S,S,Finalizada avaliada,Não Resolvida,1.0,
104958,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,São Paulo,M,entre 31 a 40 anos,2024,12,30/12/2024,...,Cartão de Crédito / Cartão de Débito / Cartão ...,Cobrança / Contestação,Negativação indevida referente à pagamento já ...,Não comprei / contratei,S,S,Finalizada avaliada,Resolvida,5.0,


Uma boa prática é sempre salvar o DataFrame em uma nova variável. Isso simplifica a complexidade do código para futuras análises feitas.

In [10]:
consumidor_sp = df_data.query('UF == "SP"')
consumidor_sp

Unnamed: 0,Gestor,Canal de Origem,Região,UF,Cidade,Sexo,Faixa Etária,Ano Abertura,Mês Abertura,Data Abertura,...,Assunto,Grupo Problema,Problema,Como Comprou Contratou,Procurou Empresa,Respondida,Situação,Avaliação Reclamação,Nota do Consumidor,Análise da Recusa
4,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,Guarujá,M,entre 51 a 60 anos,2024,10,01/10/2024,...,Água e Esgoto,Atendimento / SAC,Má qualidade no atendimento (descortesia / des...,Loja física,S,S,Finalizada avaliada,Resolvida,3.0,
22,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,Osasco,M,entre 41 a 50 anos,2024,10,02/10/2024,...,Cartão de Crédito / Cartão de Débito / Cartão ...,Contrato / Oferta,Oferta não cumprida / serviço não fornecido/ v...,Internet,S,S,Finalizada avaliada,Resolvida,4.0,
28,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,São Paulo,M,entre 31 a 40 anos,2024,10,02/10/2024,...,Aplicativo de mobilidade urbana,Cobrança / Contestação,"Cobrança de tarifas, taxas, valores não previs...",Internet,S,S,Finalizada avaliada,Não Resolvida,1.0,
34,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,Itanhaém,M,entre 51 a 60 anos,2024,10,03/10/2024,...,"Produtos Veterinários (ração, acessórios etc)",Cobrança / Contestação,Cobrança em duplicidade / Cobrança referente a...,Internet,S,S,Finalizada avaliada,Resolvida,1.0,
35,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,Santo André,M,entre 61 a 70 anos,2024,10,03/10/2024,...,Energia Elétrica,Cobrança / Contestação,C?obrança de participação financeira em obra? ...,Domicílio,S,S,Finalizada avaliada,Não Resolvida,1.0,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
104926,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,Carapicuíba,M,entre 31 a 40 anos,2024,12,29/12/2024,...,Serviços Veterinários,Atendimento / SAC,Má qualidade no atendimento (descortesia / des...,Não comprei / contratei,S,S,Finalizada avaliada,Não Resolvida,1.0,
104932,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,Diadema,M,entre 21 a 30 anos,2024,12,30/12/2024,...,Cartão de Crédito / Cartão de Débito / Cartão ...,Cobrança / Contestação,Negativação indevida referente à pagamento já ...,Internet,S,S,Finalizada avaliada,Resolvida,5.0,
104953,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,Ribeirão Preto,F,entre 21 a 30 anos,2024,12,30/12/2024,...,Pacote / excursão / agência de turismo,Cobrança / Contestação,Dificuldade / atraso na devolução de valores p...,Internet,S,S,Finalizada avaliada,Não Resolvida,1.0,
104958,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,São Paulo,M,entre 31 a 40 anos,2024,12,30/12/2024,...,Cartão de Crédito / Cartão de Débito / Cartão ...,Cobrança / Contestação,Negativação indevida referente à pagamento já ...,Não comprei / contratei,S,S,Finalizada avaliada,Resolvida,5.0,


Note, que os índices das linhas mesmo após a filtragem continuam sendo os mesmos do DataFrame `df_data`. Em algumas situações, manter esta informação é importante.

Caso seja necessário *resetar os índices* do Data Frame novo filtrado, use o método `reset_index`.

In [11]:
consumidor_sp.reset_index().head()

Unnamed: 0,index,Gestor,Canal de Origem,Região,UF,Cidade,Sexo,Faixa Etária,Ano Abertura,Mês Abertura,...,Assunto,Grupo Problema,Problema,Como Comprou Contratou,Procurou Empresa,Respondida,Situação,Avaliação Reclamação,Nota do Consumidor,Análise da Recusa
0,4,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,Guarujá,M,entre 51 a 60 anos,2024,10,...,Água e Esgoto,Atendimento / SAC,Má qualidade no atendimento (descortesia / des...,Loja física,S,S,Finalizada avaliada,Resolvida,3.0,
1,22,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,Osasco,M,entre 41 a 50 anos,2024,10,...,Cartão de Crédito / Cartão de Débito / Cartão ...,Contrato / Oferta,Oferta não cumprida / serviço não fornecido/ v...,Internet,S,S,Finalizada avaliada,Resolvida,4.0,
2,28,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,São Paulo,M,entre 31 a 40 anos,2024,10,...,Aplicativo de mobilidade urbana,Cobrança / Contestação,"Cobrança de tarifas, taxas, valores não previs...",Internet,S,S,Finalizada avaliada,Não Resolvida,1.0,
3,34,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,Itanhaém,M,entre 51 a 60 anos,2024,10,...,"Produtos Veterinários (ração, acessórios etc)",Cobrança / Contestação,Cobrança em duplicidade / Cobrança referente a...,Internet,S,S,Finalizada avaliada,Resolvida,1.0,
4,35,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,Santo André,M,entre 61 a 70 anos,2024,10,...,Energia Elétrica,Cobrança / Contestação,C?obrança de participação financeira em obra? ...,Domicílio,S,S,Finalizada avaliada,Não Resolvida,1.0,


Note que o retorno mantém o antigo **INDEX** como coluna, caso você queira remover este do novo DataFrame utilize o parâmetro `drop=True` no método `reset_index()`

In [12]:
consumidor_sp.reset_index(drop = True).head()

Unnamed: 0,Gestor,Canal de Origem,Região,UF,Cidade,Sexo,Faixa Etária,Ano Abertura,Mês Abertura,Data Abertura,...,Assunto,Grupo Problema,Problema,Como Comprou Contratou,Procurou Empresa,Respondida,Situação,Avaliação Reclamação,Nota do Consumidor,Análise da Recusa
0,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,Guarujá,M,entre 51 a 60 anos,2024,10,01/10/2024,...,Água e Esgoto,Atendimento / SAC,Má qualidade no atendimento (descortesia / des...,Loja física,S,S,Finalizada avaliada,Resolvida,3.0,
1,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,Osasco,M,entre 41 a 50 anos,2024,10,02/10/2024,...,Cartão de Crédito / Cartão de Débito / Cartão ...,Contrato / Oferta,Oferta não cumprida / serviço não fornecido/ v...,Internet,S,S,Finalizada avaliada,Resolvida,4.0,
2,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,São Paulo,M,entre 31 a 40 anos,2024,10,02/10/2024,...,Aplicativo de mobilidade urbana,Cobrança / Contestação,"Cobrança de tarifas, taxas, valores não previs...",Internet,S,S,Finalizada avaliada,Não Resolvida,1.0,
3,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,Itanhaém,M,entre 51 a 60 anos,2024,10,03/10/2024,...,"Produtos Veterinários (ração, acessórios etc)",Cobrança / Contestação,Cobrança em duplicidade / Cobrança referente a...,Internet,S,S,Finalizada avaliada,Resolvida,1.0,
4,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,Santo André,M,entre 61 a 70 anos,2024,10,03/10/2024,...,Energia Elétrica,Cobrança / Contestação,C?obrança de participação financeira em obra? ...,Domicílio,S,S,Finalizada avaliada,Não Resolvida,1.0,


**OBSEVAÇÃO :** O DataFrame `consumidor_sp` não foi alterado, caso seja necessário alterar é preciso utilizar o parâmetro `inplace=True`.

### Filtragem com multiplas condicionais

Em Pandas, você pode filtrar um DataFrame com múltiplas condições usando operadores lógicos como:
* `&` **(AND)** → Ambas as condições devem ser verdadeiras;
* `|` **(OR)** → Ao menos uma condição deve ser verdadeira;
* `~` **(NOT)** → Inverte a condição;

**É importante que cada condição esteja em parênteses**

Por exemplo, se quisermos todas as reclamações do .csv do **Consumidor GOV** do estado de **GOIÁS (GO)** que contenha nota menor ou igual a 3, podemos obter esse retorno da seguinte forma:

In [19]:
df_data[(df_data['UF'] == 'GO') & (df_data['Nota do Consumidor'] <= 3.0)] ##Consumidor GOV do estado de GOIÁS (GO) que contenha nota menor ou igual a 3

Unnamed: 0,Gestor,Canal de Origem,Região,UF,Cidade,Sexo,Faixa Etária,Ano Abertura,Mês Abertura,Data Abertura,...,Assunto,Grupo Problema,Problema,Como Comprou Contratou,Procurou Empresa,Respondida,Situação,Avaliação Reclamação,Nota do Consumidor,Análise da Recusa
18,Superintendência de Proteção e Defesa do Consu...,Plataforma Web,CO,GO,Anápolis,M,entre 21 a 30 anos,2024,10,02/10/2024,...,Conta corrente / Salário / Poupança /Conta Apo...,Atendimento / SAC,SAC - Demanda não resolvida / não respondida /...,Telefone,S,S,Finalizada avaliada,Não Resolvida,1.0,
19,Superintendência de Proteção e Defesa do Consu...,Plataforma Web,CO,GO,Anápolis,M,entre 21 a 30 anos,2024,10,02/10/2024,...,Serviço de pagamento online/ via celular/ maqu...,Informação,Informações incompletas / inadequadas sobre o ...,Telefone,S,S,Finalizada avaliada,Não Resolvida,1.0,
20,Superintendência de Proteção e Defesa do Consu...,Plataforma Web,CO,GO,Anápolis,M,entre 21 a 30 anos,2024,10,02/10/2024,...,Conta corrente / Salário / Poupança /Conta Apo...,Cobrança / Contestação,Dificuldade / atraso na devolução de valores p...,Telefone,S,S,Finalizada avaliada,Não Resolvida,1.0,
21,Superintendência de Proteção e Defesa do Consu...,Plataforma Web,CO,GO,Anápolis,M,entre 21 a 30 anos,2024,10,02/10/2024,...,Atendimento Bancário,Atendimento / SAC,SAC - Demanda não resolvida / não respondida /...,Telefone,S,S,Finalizada avaliada,Não Resolvida,1.0,
60,Superintendência de Proteção e Defesa do Consu...,Plataforma Web,CO,GO,Goiânia,M,entre 41 a 50 anos,2024,10,05/10/2024,...,Gás,Cobrança / Contestação,"Cobrança de tarifas, taxas, valores não previs...",Telefone,S,S,Finalizada avaliada,Resolvida,1.0,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
104606,Superintendência de Proteção e Defesa do Consu...,Plataforma Web,CO,GO,Goiânia,M,entre 41 a 50 anos,2024,12,26/12/2024,...,"Serviços por Assinatura (livros, vinhos etc)",Cobrança / Contestação,"Cobrança de tarifas, taxas, valores não previs...",Internet,S,S,Finalizada avaliada,Não Resolvida,1.0,
104712,Superintendência de Proteção e Defesa do Consu...,Plataforma Web,CO,GO,Valparaíso de Goiás,M,entre 31 a 40 anos,2024,12,26/12/2024,...,Cadastro Positivo,Dados Pessoais e Privacidade,"Coleta, uso ou compartilhamento indevido ou nã...",Não comprei / contratei,N,S,Finalizada avaliada,Não Resolvida,1.0,
104727,Superintendência de Proteção e Defesa do Consu...,Plataforma Web,CO,GO,Santa Helena de Goiás,M,entre 31 a 40 anos,2024,12,27/12/2024,...,"Acessórios e periféricos (monitor, impressora,...",Cobrança / Contestação,Dificuldade / atraso na devolução de valores p...,Loja física,S,S,Finalizada avaliada,Não Resolvida,1.0,
104943,Superintendência de Proteção e Defesa do Consu...,Plataforma Web,CO,GO,Senador Canedo,M,entre 31 a 40 anos,2024,12,30/12/2024,...,Cartão de Crédito / Cartão de Débito / Cartão ...,Cobrança / Contestação,"Cálculo de juros, saldo devedor (contestação, ...",Internet,S,S,Finalizada avaliada,Não Resolvida,3.0,


**OBSEVAÇÃO :** Também é possível utilizar o método `query()` para fazer filtragem com multiplas condicionais. Porém, não é possível neste caso em específico devido a coluna **Nota do Consumidor** possuir caracteres invádios para o método (Cedilha, acentos ou espaços)

#### Detalhando a filtragem com múltiplas condicionais

A **PRIMEIRA** comparação `(df_data['UF'] == 'GO')` checa linha a linha do DataFrame, quais são aqueles cujo o estado é **GOIÁS** e nenhuma verificação de **Nota do Consumidor** é feita neste momento. Como resultado, temos uma Series de booleans com apenas esta filtragem.

A **SEGUNDA** comparação `(df_data['Nota do Consumidor'] <= 3.0)` checa linha a linha do DataFrame, quais são aquelas reclamações cujo a **Nota do Consumidor** é menor ou igual a **3.0** e nenhuma verificação de **UF** é feita neste momento. Como resultado, temos uma Series de booleans com apenas esta filtragem.

Por fim a **PRIMEIRA** e **SEGUNDA** comparação são unidas pelo operador lógico `&` **(AND)** retornando assim uma terceira Series de booleans fazendo a comparação completa.

Tal abordagem pode ser **INEFICIENTE**, uma vez que, para cada condição, estamos varrendo todas as linhas do DataFrame `df_data` (Ou seja, a varredura neste exemplo em específico é feita **3X**). O Pandas tentará otimizar o máximo possível por trás dos pano porém, se tivermos uma base muito grande, tal abordagem se tornará mais **INEFICIENTE** ainda.

Logo, poderíamos fazer a filtragem utilizando múltiplos condicionais por partes:

1. Podemos fazer primeiro o filtro `(df_data['UF'] == 'GO')` trazendo assim primeiro, todos as linhas com o estado igual a **GOIÁS**

In [21]:
filtro_consumidores_goias = df_data[(df_data['UF'] == 'GO')]
filtro_consumidores_goias

Unnamed: 0,Gestor,Canal de Origem,Região,UF,Cidade,Sexo,Faixa Etária,Ano Abertura,Mês Abertura,Data Abertura,...,Assunto,Grupo Problema,Problema,Como Comprou Contratou,Procurou Empresa,Respondida,Situação,Avaliação Reclamação,Nota do Consumidor,Análise da Recusa
18,Superintendência de Proteção e Defesa do Consu...,Plataforma Web,CO,GO,Anápolis,M,entre 21 a 30 anos,2024,10,02/10/2024,...,Conta corrente / Salário / Poupança /Conta Apo...,Atendimento / SAC,SAC - Demanda não resolvida / não respondida /...,Telefone,S,S,Finalizada avaliada,Não Resolvida,1.0,
19,Superintendência de Proteção e Defesa do Consu...,Plataforma Web,CO,GO,Anápolis,M,entre 21 a 30 anos,2024,10,02/10/2024,...,Serviço de pagamento online/ via celular/ maqu...,Informação,Informações incompletas / inadequadas sobre o ...,Telefone,S,S,Finalizada avaliada,Não Resolvida,1.0,
20,Superintendência de Proteção e Defesa do Consu...,Plataforma Web,CO,GO,Anápolis,M,entre 21 a 30 anos,2024,10,02/10/2024,...,Conta corrente / Salário / Poupança /Conta Apo...,Cobrança / Contestação,Dificuldade / atraso na devolução de valores p...,Telefone,S,S,Finalizada avaliada,Não Resolvida,1.0,
21,Superintendência de Proteção e Defesa do Consu...,Plataforma Web,CO,GO,Anápolis,M,entre 21 a 30 anos,2024,10,02/10/2024,...,Atendimento Bancário,Atendimento / SAC,SAC - Demanda não resolvida / não respondida /...,Telefone,S,S,Finalizada avaliada,Não Resolvida,1.0,
26,Superintendência de Proteção e Defesa do Consu...,Plataforma Web,CO,GO,Goiânia,M,entre 21 a 30 anos,2024,10,02/10/2024,...,"Programas de Fidelidade / Benefícios (pontos, ...",Dados Pessoais e Privacidade,Dificuldade de acesso a dados pessoais ou fina...,Internet,S,S,Finalizada avaliada,Resolvida,5.0,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
104922,Superintendência de Proteção e Defesa do Consu...,Plataforma Web,CO,GO,Rio Verde,M,entre 21 a 30 anos,2024,12,29/12/2024,...,Aéreo,Vício de Qualidade,"Falta de acesso a comunicação, alimentação, ac...",Internet,S,S,Finalizada avaliada,Resolvida,5.0,
104942,Superintendência de Proteção e Defesa do Consu...,Plataforma Web,CO,GO,Goiânia,F,entre 31 a 40 anos,2024,12,30/12/2024,...,Cartão de Crédito / Cartão de Débito / Cartão ...,Cobrança / Contestação,Renegociação / parcelamento de dívida,Loja física,N,S,Finalizada avaliada,Não Resolvida,5.0,
104943,Superintendência de Proteção e Defesa do Consu...,Plataforma Web,CO,GO,Senador Canedo,M,entre 31 a 40 anos,2024,12,30/12/2024,...,Cartão de Crédito / Cartão de Débito / Cartão ...,Cobrança / Contestação,"Cálculo de juros, saldo devedor (contestação, ...",Internet,S,S,Finalizada avaliada,Não Resolvida,3.0,
104949,Superintendência de Proteção e Defesa do Consu...,Plataforma Web,CO,GO,Goiânia,M,entre 41 a 50 anos,2024,12,30/12/2024,...,Crédito Pessoal e Demais Empréstimos (exceto f...,Cobrança / Contestação,"Cobrança de tarifas, taxas, valores não previs...",Não comprei / contratei,N,S,Finalizada avaliada,Resolvida,5.0,


Logo, o DataFrame `filtro_consumidores_goias` contém 4.207 linhas

2. Em seguida, aplicaremos o segundo filtro em cima do DataFrame `filtro_consumidores_goias`. Portanto, a busca dos registros com **Nota do Consumidor** menor ou igual a 3.0 (`(df_data['Nota do Consumidor'] <= 3.0)`) será feita apenas em cima dos 4.207 registros (Ao invés das 105.018 linhas anteriores).

In [23]:
filtro_consumidores_goias_nota_baixa = filtro_consumidores_goias[(df_data['Nota do Consumidor'] <= 3.0)]
filtro_consumidores_goias_nota_baixa

  filtro_consumidores_goias_nota_baixa = filtro_consumidores_goias[(df_data['Nota do Consumidor'] <= 3.0)]


Unnamed: 0,Gestor,Canal de Origem,Região,UF,Cidade,Sexo,Faixa Etária,Ano Abertura,Mês Abertura,Data Abertura,...,Assunto,Grupo Problema,Problema,Como Comprou Contratou,Procurou Empresa,Respondida,Situação,Avaliação Reclamação,Nota do Consumidor,Análise da Recusa
18,Superintendência de Proteção e Defesa do Consu...,Plataforma Web,CO,GO,Anápolis,M,entre 21 a 30 anos,2024,10,02/10/2024,...,Conta corrente / Salário / Poupança /Conta Apo...,Atendimento / SAC,SAC - Demanda não resolvida / não respondida /...,Telefone,S,S,Finalizada avaliada,Não Resolvida,1.0,
19,Superintendência de Proteção e Defesa do Consu...,Plataforma Web,CO,GO,Anápolis,M,entre 21 a 30 anos,2024,10,02/10/2024,...,Serviço de pagamento online/ via celular/ maqu...,Informação,Informações incompletas / inadequadas sobre o ...,Telefone,S,S,Finalizada avaliada,Não Resolvida,1.0,
20,Superintendência de Proteção e Defesa do Consu...,Plataforma Web,CO,GO,Anápolis,M,entre 21 a 30 anos,2024,10,02/10/2024,...,Conta corrente / Salário / Poupança /Conta Apo...,Cobrança / Contestação,Dificuldade / atraso na devolução de valores p...,Telefone,S,S,Finalizada avaliada,Não Resolvida,1.0,
21,Superintendência de Proteção e Defesa do Consu...,Plataforma Web,CO,GO,Anápolis,M,entre 21 a 30 anos,2024,10,02/10/2024,...,Atendimento Bancário,Atendimento / SAC,SAC - Demanda não resolvida / não respondida /...,Telefone,S,S,Finalizada avaliada,Não Resolvida,1.0,
60,Superintendência de Proteção e Defesa do Consu...,Plataforma Web,CO,GO,Goiânia,M,entre 41 a 50 anos,2024,10,05/10/2024,...,Gás,Cobrança / Contestação,"Cobrança de tarifas, taxas, valores não previs...",Telefone,S,S,Finalizada avaliada,Resolvida,1.0,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
104606,Superintendência de Proteção e Defesa do Consu...,Plataforma Web,CO,GO,Goiânia,M,entre 41 a 50 anos,2024,12,26/12/2024,...,"Serviços por Assinatura (livros, vinhos etc)",Cobrança / Contestação,"Cobrança de tarifas, taxas, valores não previs...",Internet,S,S,Finalizada avaliada,Não Resolvida,1.0,
104712,Superintendência de Proteção e Defesa do Consu...,Plataforma Web,CO,GO,Valparaíso de Goiás,M,entre 31 a 40 anos,2024,12,26/12/2024,...,Cadastro Positivo,Dados Pessoais e Privacidade,"Coleta, uso ou compartilhamento indevido ou nã...",Não comprei / contratei,N,S,Finalizada avaliada,Não Resolvida,1.0,
104727,Superintendência de Proteção e Defesa do Consu...,Plataforma Web,CO,GO,Santa Helena de Goiás,M,entre 31 a 40 anos,2024,12,27/12/2024,...,"Acessórios e periféricos (monitor, impressora,...",Cobrança / Contestação,Dificuldade / atraso na devolução de valores p...,Loja física,S,S,Finalizada avaliada,Não Resolvida,1.0,
104943,Superintendência de Proteção e Defesa do Consu...,Plataforma Web,CO,GO,Senador Canedo,M,entre 31 a 40 anos,2024,12,30/12/2024,...,Cartão de Crédito / Cartão de Débito / Cartão ...,Cobrança / Contestação,"Cálculo de juros, saldo devedor (contestação, ...",Internet,S,S,Finalizada avaliada,Não Resolvida,3.0,


Obtemos assim então, o mesmo resultado conseguido previamente. Este método economizou busca desnecessária sendo mais eficiente em casos onde a consulta envolve bases gigantes com milhões de linhas.

### Filtragem com listas

Se quisermos filtrar apenas as reclamações de compras feitas nas UF's **'GO'**, **'SP'**, **'RO'** e **MT**, ao invés de fazer a filtragem caso a caso podemos criar uma variável do tipo lista em python e repassar para filtragem:

In [16]:
lista_uf = ['GO','SP','RO','MT'] ## Criando lista contendo as UF's 'GO', 'SP', 'RO' e MT
lista_uf

['GO', 'SP', 'RO', 'MT']

Agora também podemos repassar esta lista na filtragem do DataFrame utilizando o método `isin()` :

In [17]:
df_data[df_data['UF'].isin(lista_uf)]['UF'].unique()

array(['SP', 'MT', 'GO', 'RO'], dtype=object)

Também podemos utilizar lista via método `query()`, da seguinte forma:

In [18]:
df_data.query('UF in @lista_uf')['UF'].unique()

array(['SP', 'MT', 'GO', 'RO'], dtype=object)

Para utilizarmos uma variável dentro do método `Query()` precisamos utilizar o caractere `@nome_variavel`