**Índice**<a id='toc0_'></a>    
- [Material de apoio](#toc1_1_)    
    - [Referências de apoio para uso do pandas ao longo do curso](#toc1_1_1_)    
  - [Sobre o Pandas](#toc1_2_)    
- [Caso 1](#toc2_)    
    - [Lendo arquivos](#toc2_1_1_)    
  - [Acessando informações básicas de um DataFrame](#toc2_2_)    
  - [Acessando dados em um DataFrame](#toc2_3_)    
    - [Acessando colunas](#toc2_3_1_)    
    - [Acessando linhas](#toc2_3_2_)    
    - [Acessando células](#toc2_3_3_)    
    - [Também é possível acessar ranges](#toc2_3_4_)    
    - [Indexação lógica](#toc2_3_5_)    
    - [Criando novas colunas](#toc2_3_6_)    
    - [Excluindo colunas](#toc2_3_7_)    
    - [Executando operações permanentes](#toc2_3_8_)    
  - [Retornando ao caso: encontrando casos onde há compra de cloroquina](#toc2_4_)    
    - [Tratando os dados](#toc2_4_1_)    
    - [Conclusão](#toc2_4_2_)    

<!-- vscode-jupyter-toc-config
	numbering=false
	anchor=true
	flat=false
	minLevel=1
	maxLevel=3
	/vscode-jupyter-toc-config -->
<!-- THIS CELL WILL BE REPLACED ON TOC UPDATE. DO NOT WRITE YOUR TEXT IN THIS CELL -->


## <a id='toc1_1_'></a>[Material de apoio](#toc0_)



### <a id='toc1_1_1_'></a>[Referências de apoio para uso do pandas ao longo do curso](#toc0_)


Esse link contém uma tabela que serve de referência para várias das funções do pandas: [https://pandas.pydata.org/Pandas_Cheat_Sheet.pdf](https://pandas.pydata.org/Pandas_Cheat_Sheet.pdf). As explicações são dadas de forma um pouco técnica, mas isso não é um problema se já conhecemos as operações.

[Essa série de vídeos contém explicações sobre o funcionamento do pandas: https://www.youtube.com/watch?v=7myBWiNwZBc](https://www.youtube.com/watch?v=7myBWiNwZBc&ab_channel=UniversidadedosDados)
    
#### Query

**Importante: [esse vídeo explica o funcionamento do método `query` que usamos para filtrar dados: https://www.youtube.com/watch?v=c1Xz9wXQSGM](https://www.youtube.com/watch?v=c1Xz9wXQSGM)**.

[O artigo a seguir também contém algumas explicações e dicas de como usar o `query`: <br> https://towardsdatascience.com/10-examples-that-will-make-you-use-pandas-query-function-more-often-a8fb3e9361cb](https://towardsdatascience.com/10-examples-that-will-make-you-use-pandas-query-function-more-often-a8fb3e9361cb)

[Capítulo sobre sumarização e tratamento de dados com o pandas: https://statsthinking21.github.io/statsthinking21-python/02-SummarizingData.html](https://statsthinking21.github.io/statsthinking21-python/02-SummarizingData.html)

## <a id='toc1_2_'></a>[Sobre o Pandas](#toc0_)

Para realizar grandes coisas, precisamos subir sobre os ombros de gigantes. A comunidade Python é incrível e já desenvolveu muitas ferramentas que foram disponibilizadas gratuitamente para os usuários da plataforma. Não há necessidade de reinventar a roda.

Uma dessas ferramentas é o pacote `Pandas`, que vamos usar para ler e trabalhar com dados estruturados.

In [1]:
import pandas

Essa linha importa o pacote `Pandas` e todas as funções e métodos que estão contidos nele. Usando a notação acima, toda vez que quisermos usar qualquer função do Pandas, como `read_csv`, precisamos escrever o nome inteiro do pacote, usando `pandas.read_csv`. Por conta da inconveniência da digitação extra, costumamos importar a maior parte dos pacotes usando certas abreviações ou "aliases" com a seguinte notação:

In [2]:
import pandas as pd

No caso do pacote `pandas` a abreviação canônica é `pd`. Assim, sempre utilizaremos essa forma de importar a biblioteca.

Vários outros pacotes possuem abreviações similares. É fácil encontrar na internet exemplos de importação canônica para cada um deles.

# <a id='toc2_'></a>[Caso 1](#toc0_)

Recentemente, os dados do [portal de compras do Governo Federal](http://compras.dados.gov.br/docs/home.html) foram destaque por conta do [elevado valor gasto com leite condensado nos anos de 2019 e 2020](https://www1.folha.uol.com.br/colunas/monicabergamo/2021/01/psol-pede-que-pgr-investigue-gasto-federal-de-r-18-bilhao-com-alimentos-e-bebidas.shtml). Outro assunto polêmico de 2020 envolveu o uso da Cloroquina contra o COVID-19 ([apontado como inefetivo pela comunidade científica](https://noticias.uol.com.br/colunas/jamil-chade/2020/10/16/oms-estudo-global-revela-que-remdesivir-e-cloroquina-nao-funcionam.htm)). Quanto será que o governo gastou com Cloroquina ao longo de 2020? Preparei um arquivo CSV com todas as compras sem licitação do Governo Federal em 2020 pra iniciar nossa experimentação com o Pandas.

##Algumas funcionalidades do pandas.

### <a id='toc2_1_1_'></a>[Lendo arquivos](#toc0_)

Já falamos a respeito da função `read_csv`. Ela é responsável por fazer exatamente o que seu nome sugere: ler arquivos ".csv". Mas pra que queremos ler arquivos ".csv"?

O `pandas` é uma biblioteca que introduz no Python um tipo de objeto especialmente desenhado para lidar com **tabelas**: o `DataFrame`. 
    
*Arquivos .csv* (comma separated values) são o formato aberto mais universal para a leitura de tabelas. 
    
  Ao longo do curso, vamos ver como é possível usar o `pandas` para ler arquvios tirados de uma API, como podemos usar a biblioteca pra ler arquivos do Excel, e até mesmo para extrair as tabelas contidas em uma página da internet.

Uma característica interessante do Pandas é que *ele consegue ler arquivos a partir da URL*. Se você tem um link que faz o download de um arquivo csv, pode usar esse link para carregar esse arquivo diretamente para o Pandas.

In [3]:
compras_2020 = pd.read_csv("https://bit.ly/3amlUZK")

O arquivo foi carregado como um novo tipo de objeto no Python: um `DataFrame` do `pandas`.

In [4]:
type(compras_2020)

pandas.core.frame.DataFrame

A biblioteca `pandas` é muito bem estabelecida e recebe muito apoio da comunidade de programadores de python, assim muito do que precisamos fazer já está pronto de alguma forma. Também podemos carregar outros formatos de dado como arquivos excel com a função `read_excel` e até carregar dados de sites seja baixando o arquivo, perceba como estamos passando um link para carregar o csv, ou do código HTML de uma página - há um arquivo específico sobre esse assunto.

## <a id='toc2_2_'></a>[Acessando informações básicas de um DataFrame](#toc0_)

Assim como *listas e dicionários* possuíam certos métodos que nos permitiam fazer coisas interessantes com essas estruturas de dados (por exemplo, usando `.insert()` e `.pop()` em listas), os `DataFrames` também possuem vários métodos desenhados para facilitar o trabalho do cientista de dados. 

Um bom primeiro passo é obter um panorama das informações que possuímos, algo que pode ser feito usando os métodos do `pandas` `.head()` e `.tail()`.

In [5]:
compras_2020.head()

Unnamed: 0,Orgão,UASG,Código da modalidade da compra,Descrição Lei,Número Inciso,Número processo,Quantidade item,Valor total da compra,Número da compra,Descrição objeto licitação,Descrição justificativa,Data de reconhecimento da compra sem licitação,Data da ratificação da compra sem licitação,Data da publicação da compra sem licitação,Itens > uri
0,52111: COMANDO DA AERONAUTICA,120641: GRUPAMENTO DE APOIO DE PORTO VELHO,6: Dispensa,,2,67206014598202031,,R$ 313.00,,Objeto: Contratação do serviço de prestação de...,"Justificativa: Despesa de pequeno vulto, confo...",06/03/2020,,,/compraSemLicitacao/id/item_slicitacao/1206410...
1,29208: COMPANHIA DE PESQUISA DE RECURSOS MINERAIS,495500: COMPANHIA DE PESQUISA DE RECURSOS MINE...,6: Dispensa,,2,48048.000613/2020,,"R$ 20,716.00",,Objeto: Aquisição de dispenser para álcool gel...,Justificativa: Aquisição de produtos e/ou serv...,29/05/2020,,,/compraSemLicitacao/id/item_slicitacao/4955000...
2,25000: MINISTERIO DA ECONOMIA,170198: DELEGACIA DA REC.FEDERAL EM GOIANIA/GO,6: Dispensa,,2,10120759636201977,,"R$ 14,245.00",,Objeto: Contratação de serviços de confecção d...,Justificativa: Pequeno valor. ...,27/12/2019,,,/compraSemLicitacao/id/item_slicitacao/1701980...
3,22202: EMPRESA BRASILEIRA DE PESQUISA AGROPECU...,135020: EMBRAPA/CTAA,6: Dispensa,,4,21152.000208/2020,,"R$ 137,104.00",,Objeto: Contratação de Prestação de Serviços d...,"Justificativa: Contratação temporária, em cará...",27/02/2020,27/02/2020,28/02/2020,/compraSemLicitacao/id/item_slicitacao/1350200...
4,37202: INSTITUTO NACIONAL DO SEGURO SOCIAL,511359: GERÊNCIA EXECUTIVA CAMPINAS/SP,6: Dispensa,,2,35014040275202063,,"R$ 8,760.00",,Objeto: Contratação de Companhia de Seguros pa...,Justificativa: Procedimento simplificado e de ...,14/04/2020,,,/compraSemLicitacao/id/item_slicitacao/5113590...


In [6]:
compras_2020.shape

(96005, 15)

A tabela compras_2020 tem mais de 90 mil linhas! Por isso, pode não ser uma boa ideia imprimir todas as linhas de uma única vez. O tamanho dessa tabela também justifica a preferência pelo Python: tabelas desse tamanho começam a se comportar de maneira bastante lenta em plataformas como o Excel (inclusive, quando as tabelas são realmente muito grandes, o Excel sequer consegue abrir!).

A função info oferece informações importantes: o tipo dos dados armazenados em cada coluna, quantos valores estão preenchidos com valores não nulos

In [1]:
compras_2020.info()

NameError: name 'df' is not defined

## <a id='toc2_3_'></a>[Acessando dados em um DataFrame](#toc0_)

Um `DataFrame` é uma estrutura de dados (também um tipo de variável) que representa uma tabela. Tabelas são compostas por linhas e colunas.

Cada interseção entre linhas e colunas é chamada de uma **célula**. 

Algumas vezes, queremos acessar a informação constante de uma linha. Outras vezes, estamos interessados em conseguir as informações de uma coluna inteira. Ainda outras vezes, queremos apenas o valor armazenado em uma célula.

### <a id='toc2_3_1_'></a>[Acessando colunas](#toc0_)

In [6]:
#imprime o nome de todas as colunas
compras_2020.columns

Index(['Orgão', 'UASG', 'Código da modalidade da compra', 'Descrição Lei',
       'Número Inciso', 'Número processo', 'Quantidade item',
       'Valor total da compra', 'Número da compra',
       'Descrição objeto licitação', 'Descrição justificativa',
       'Data de reconhecimento da compra sem licitação',
       'Data da ratificação da compra sem licitação',
       'Data da publicação da compra sem licitação', 'Itens > uri'],
      dtype='object')



Podemos acessar as colunas como se fosse uma lista. Veja que o resultado é muito parecido com de uma lista, mas indicando que é um **Índice (index)**

In [7]:
cols_compras = compras_2020.columns

cols_compras[1]

'UASG'

In [8]:
compras_2020["Orgão"] # notem como é similar a um dicionário

0                            52111: COMANDO DA AERONAUTICA
1        29208: COMPANHIA DE PESQUISA DE RECURSOS MINERAIS
2                            25000: MINISTERIO DA ECONOMIA
3        22202: EMPRESA BRASILEIRA DE PESQUISA AGROPECU...
4               37202: INSTITUTO NACIONAL DO SEGURO SOCIAL
                               ...                        
96000             26271: FUNDACAO UNIVERSIDADE DE BRASILIA
96001             26271: FUNDACAO UNIVERSIDADE DE BRASILIA
96002             26271: FUNDACAO UNIVERSIDADE DE BRASILIA
96003             26271: FUNDACAO UNIVERSIDADE DE BRASILIA
96004                            52131: COMANDO DA MARINHA
Name: Orgão, Length: 96005, dtype: object

In [10]:
compras_2020["Descrição objeto licitação"]

0        Objeto: Contratação do serviço de prestação de...
1        Objeto: Aquisição de dispenser para álcool gel...
2        Objeto: Contratação de serviços de confecção d...
3        Objeto: Contratação de Prestação de Serviços d...
4        Objeto: Contratação de Companhia de Seguros pa...
                               ...                        
96000    Objeto: Pagamento de Inscrição em Evento.     ...
96001    Objeto: Pagamento de Inscrição em Evento.     ...
96002    Objeto: Publicação do artigo científico intitu...
96003    Objeto: Despesa bancária com contratação cambi...
96004    Objeto: Serviço de telefonia                  ...
Name: Descrição objeto licitação, Length: 96005, dtype: object




### <a id='toc2_3_2_'></a>[Acessando linhas](#toc0_)

In [11]:
compras_2020.iloc[1]

Orgão                                             29208: COMPANHIA DE PESQUISA DE RECURSOS MINERAIS
UASG                                              495500: COMPANHIA DE PESQUISA DE RECURSOS MINE...
Código da modalidade da compra                                                          6: Dispensa
Descrição Lei                                                                                   NaN
Número Inciso                                                                                     2
Número processo                                                                   48048.000613/2020
Quantidade item                                                                                 NaN
Valor total da compra                                                                  R$ 20,716.00
Número da compra                                                                                NaN
Descrição objeto licitação                        Objeto: Aquisição de dispenser para álcool gel...




Tanto uma linhas quanto uma coluna são do tipo `Series`, e os valores individuais podem ser acessados como por um *dicionário* usando a chave do valor desejado.

In [12]:
linha2 = compras_2020.iloc[1]

print(type(linha2))

<class 'pandas.core.series.Series'>


In [13]:
linha2["Valor total da compra"]

'R$ 20,716.00'

`DataFrames`representam tabelas, e são compostos por diversas `Series`, que se assemelham a uma lista ordenada de valores contendo uma chave. Ao acessar uma linha ou coluna de uma variável DataFrame o `Pandas`gera uma variável do tipo `Series`. Mais a frente veremos que essas variáveis tem uma série de métodos, que utilizaremos para fazer operações em toda uma coluna (exemplo, somar ou cálcular a média).

### <a id='toc2_3_3_'></a>[Acessando células](#toc0_)

Podemos combinar a forma de acessar linhas e colunas com a sintaxe `.iloc[indice]['nome_da_coluna']`:

In [14]:
compras_2020['Orgão'].iloc[1]

'29208: COMPANHIA DE PESQUISA DE RECURSOS MINERAIS'

Podemos obter o mesmo resultado alterando a ordem. Nesse caso, primeiro acessamos a coluna e depois a linha, chegando na mesma célula.

In [15]:
compras_2020.iloc[1]['Orgão']

'29208: COMPANHIA DE PESQUISA DE RECURSOS MINERAIS'



### <a id='toc2_3_4_'></a>[Também é possível acessar ranges](#toc0_)

A sintaxe para isso é distinta para linhas e para colunas.

Para **linhas** usamos a indexação **junto ao iloc**, como para selecionar elementos de uma lista.

Já para acessar **colunas**, passamos uma **lista de valores dentro dos colchetes que seleciona a coluna**. Observe que são abertos e fechados 2 colchetes.

In [16]:
compras_2020.iloc[0:24]['Orgão']

0                         52111: COMANDO DA AERONAUTICA
1     29208: COMPANHIA DE PESQUISA DE RECURSOS MINERAIS
2                         25000: MINISTERIO DA ECONOMIA
3     22202: EMPRESA BRASILEIRA DE PESQUISA AGROPECU...
4            37202: INSTITUTO NACIONAL DO SEGURO SOCIAL
5     20701: INST.BRAS.DO MEIO AMB.E DOS REC.NAT.REN...
6                            52121: COMANDO DO EXERCITO
7                         25000: MINISTERIO DA ECONOMIA
8                            52121: COMANDO DO EXERCITO
9         26245: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO
10    26420: INST.FED.DE EDUC.,CIENC. E TEC.FARROUPILHA
11           38701: CONSELHO REGIONAL DE FARMÁCIA DE PE
12                             14000: JUSTICA ELEITORAL
13                             94520: ESTADO DA PARAIBA
14                           52121: COMANDO DO EXERCITO
15        26405: INST.FED.DE EDUC.,CIENC.E TEC.DO CEARÁ
16                            52131: COMANDO DA MARINHA
17    26420: INST.FED.DE EDUC.,CIENC. E TEC.FARR

In [17]:
compras_2020.iloc[0:24][['Orgão', 'Descrição justificativa']]

Unnamed: 0,Orgão,Descrição justificativa
0,52111: COMANDO DA AERONAUTICA,"Justificativa: Despesa de pequeno vulto, confo..."
1,29208: COMPANHIA DE PESQUISA DE RECURSOS MINERAIS,Justificativa: Aquisição de produtos e/ou serv...
2,25000: MINISTERIO DA ECONOMIA,Justificativa: Pequeno valor. ...
3,22202: EMPRESA BRASILEIRA DE PESQUISA AGROPECU...,"Justificativa: Contratação temporária, em cará..."
4,37202: INSTITUTO NACIONAL DO SEGURO SOCIAL,Justificativa: Procedimento simplificado e de ...
5,20701: INST.BRAS.DO MEIO AMB.E DOS REC.NAT.REN...,"Justificativa: Art. 24º, Inciso II da Lei nº 8..."
6,52121: COMANDO DO EXERCITO,Justificativa: Destina-se ao serviço de fornec...
7,25000: MINISTERIO DA ECONOMIA,Justificativa: Para atender as necessidades de...
8,52121: COMANDO DO EXERCITO,"Justificativa: Art. 25º, Inciso I da Lei nº 8...."
9,26245: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO,Justificativa: Aquisição urgente de mangotes p...



### <a id='toc2_3_5_'></a>[Indexação lógica](#toc0_)

Com mais frequência, não queremos uma parte arbitrária do `DataFrame`, mas sim o subconjunto do `DataFrame` que satisfaz alguma condição. Por exemplo, podemos querer a relação de todas as compras feitas sem licitação pela UFRJ.

Acima, podemos ver que a UFRJ é identificada na coluna Orgão pela string "26245: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO". Com essa informação, podemos pedir para que o `DataFrame` encontre apenas as linhas que possuem "26245: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO" no campo Orgão. Existem algumas maneiras de fazer isso. A mais simples delas envolve o método `.query()`.

Podemos perceber nos exemplos abaixo que usamos uma sintaxe semelhante à de condicionais para definir a condição que as linhas que irão permanecer devem cumprir, mas podemos nos referir ao nome da coluna livremente dentro da *string* que delimita o query.

In [18]:
compras_2020.query("Orgão == '26245: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO'")

Unnamed: 0,Orgão,UASG,Código da modalidade da compra,Descrição Lei,Número Inciso,Número processo,Quantidade item,Valor total da compra,Número da compra,Descrição objeto licitação,Descrição justificativa,Data de reconhecimento da compra sem licitação,Data da ratificação da compra sem licitação,Data da publicação da compra sem licitação,Itens > uri
9,26245: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO,153147: INSTITUTO DE GINECOLOGIA DA UFRJ,6: Dispensa,,2,23079000743202023,,"R$ 2,800.00",,Objeto: Aquisição de mangotes ...,Justificativa: Aquisição urgente de mangotes p...,12/02/2020,,,/compraSemLicitacao/id/item_slicitacao/1531470...
26,26245: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO,153131: MEC-FACULDADE DE EDUCACAO DA UF/RJ,6: Dispensa,,0,004290/2020-12,,"R$ 2,396.00",,Objeto: Aquisição de material de limpeza e pro...,Justificativa: Abaixo do valor exigido por lei...,28/04/2020,,,/compraSemLicitacao/id/item_slicitacao/1531310...
94,26245: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO,153127: DECANATO DO CENTRO DE LETRAS E ARTES D...,6: Dispensa,,2,003550/2020-24,,"R$ 2,570.00",,Objeto: Aquisição de material de elétrico para...,Justificativa: Valor abaixo do limite permitid...,09/03/2020,,,/compraSemLicitacao/id/item_slicitacao/1531270...
147,26245: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO,158222: ESCOLA DE COMUNICAÇÃO DA UFRJ,6: Dispensa,,2,23079005165202011,,"R$ 3,000.00",,Objeto: Retirada dos ventiladores com defeito;...,Justificativa: Valor dentro do limite de Dispe...,08/06/2020,,,/compraSemLicitacao/id/item_slicitacao/1582220...
280,26245: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO,158223: FACULDADE NACIONAL DE DIREITO DA UFRJ,6: Dispensa,,1,23079004841202030,,"R$ 5,061.00",,Objeto: Reforma Recuperação de espaços paredes...,Justificativa: Abaixo do valor para licitar ...,11/05/2020,,,/compraSemLicitacao/id/item_slicitacao/1582230...
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
95357,26245: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO,153150: INSTITUTO PUERIC. PED MAT. GESTEIRA DA...,7: Inexigibilidade,,1,23079054034201509,,"R$ 70,683.00",,Objeto: Serviço de manutenção do aparelho BDFA...,"Justificativa: Art. 25, I da Lei 8.666/93 (Ine...",02/03/2020,02/03/2020,03/03/2020,/compraSemLicitacao/id/item_slicitacao/1531500...
95360,26245: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO,153150: INSTITUTO PUERIC. PED MAT. GESTEIRA DA...,6: Dispensa,,4,23079004452202012,,"R$ 71,223.00",,Objeto: Pagamento de Serviço de tratamento nef...,"Justificativa: Art. 24, IV da Lei 8.666/93. ...",11/11/2020,11/11/2020,12/11/2020,/compraSemLicitacao/id/item_slicitacao/1531500...
95807,26245: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO,153150: INSTITUTO PUERIC. PED MAT. GESTEIRA DA...,6: Dispensa,,4,23079044146201977,,"R$ 86,600.00",,Objeto: De Serviço de Manutenção do Sistema de...,"Justificativa: Art. 24, IV da Lei 8.666/93 (aq...",09/04/2020,09/04/2020,13/04/2020,/compraSemLicitacao/id/item_slicitacao/1531500...
95836,26245: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO,153150: INSTITUTO PUERIC. PED MAT. GESTEIRA DA...,6: Dispensa,,2,23079004450202015,,R$ 650.00,,Objeto: Aquisição de serviço de exame de eletr...,Justificativa: Valor inferior ao exigido por l...,30/09/2020,,,/compraSemLicitacao/id/item_slicitacao/1531500...




Podemos replicar o mesmo caminho para encontrar todas as despesas da FND, usando agora a coluna "UASG".

In [19]:
compras_2020.query("UASG == '158223: FACULDADE NACIONAL DE DIREITO DA UFRJ'")

Unnamed: 0,Orgão,UASG,Código da modalidade da compra,Descrição Lei,Número Inciso,Número processo,Quantidade item,Valor total da compra,Número da compra,Descrição objeto licitação,Descrição justificativa,Data de reconhecimento da compra sem licitação,Data da ratificação da compra sem licitação,Data da publicação da compra sem licitação,Itens > uri
280,26245: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO,158223: FACULDADE NACIONAL DE DIREITO DA UFRJ,6: Dispensa,,1,23079004841202030,,"R$ 5,061.00",,Objeto: Reforma Recuperação de espaços paredes...,Justificativa: Abaixo do valor para licitar ...,11/05/2020,,,/compraSemLicitacao/id/item_slicitacao/1582230...
8300,26245: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO,158223: FACULDADE NACIONAL DE DIREITO DA UFRJ,6: Dispensa,,1,23079216019202010,,R$ 980.00,,Objeto: Contratação de serviço de descupinizaç...,Justificativa: Aaixo ...,24/09/2020,,,/compraSemLicitacao/id/item_slicitacao/1582230...
11632,26245: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO,158223: FACULDADE NACIONAL DE DIREITO DA UFRJ,6: Dispensa,,2,23079216237202054,,"R$ 11,370.00",,Objeto: Aquisição de patrimônio - Compra de 11...,Justificativa: Aquisição de produtos e/ou serv...,26/10/2020,,,/compraSemLicitacao/id/item_slicitacao/1582230...
13320,26245: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO,158223: FACULDADE NACIONAL DE DIREITO DA UFRJ,7: Inexigibilidade,,2,23079006848202096,,"R$ 18,000.00",,Objeto: Contratação de Empresa especializada e...,Justificativa: Inexigibilidade ...,05/11/2020,,,/compraSemLicitacao/id/item_slicitacao/1582230...
15770,26245: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO,158223: FACULDADE NACIONAL DE DIREITO DA UFRJ,6: Dispensa,,1,23079215840202019,,"R$ 63,049.00",,Objeto: Contratação emergencial de empresa de ...,Justificativa: Abaixo do valor para licitação ...,30/10/2020,,,/compraSemLicitacao/id/item_slicitacao/1582230...
16784,26245: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO,158223: FACULDADE NACIONAL DE DIREITO DA UFRJ,6: Dispensa,,2,23079210237202041,,"R$ 3,960.00",,Objeto: Contratação de empresa especializada p...,Justificativa: Abaixo do valor para licitação ...,30/10/2020,,,/compraSemLicitacao/id/item_slicitacao/1582230...
17197,26245: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO,158223: FACULDADE NACIONAL DE DIREITO DA UFRJ,6: Dispensa,,2,23079213978202083,,"R$ 10,160.00",,Objeto: Contratação de serviço de limpeza e ma...,Justificativa: Abaixo do valor para licitação ...,09/11/2020,,,/compraSemLicitacao/id/item_slicitacao/1582230...
19359,26245: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO,158223: FACULDADE NACIONAL DE DIREITO DA UFRJ,6: Dispensa,,2,23079219758202063,,"R$ 1,050.00",,Objeto: Objeto a aquisição de fonte de aliment...,Justificativa: Aquisição de produtos e/ou serv...,09/11/2020,,,/compraSemLicitacao/id/item_slicitacao/1582230...
20033,26245: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO,158223: FACULDADE NACIONAL DE DIREITO DA UFRJ,6: Dispensa,,2,23079218808202095,,"R$ 7,280.00",,Objeto: Aquisição de material permanente Note...,Justificativa: Aquisição de produtos e/ou serv...,09/11/2020,,,/compraSemLicitacao/id/item_slicitacao/1582230...
20928,26245: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO,158223: FACULDADE NACIONAL DE DIREITO DA UFRJ,6: Dispensa,,2,23079219687202007,,"R$ 7,332.00",,Objeto: Aquisição de materiais e insumos para ...,Justificativa: Aquisição de produtos e/ou serv...,17/11/2020,,,/compraSemLicitacao/id/item_slicitacao/1582230...


In [20]:
fnd = compras_2020.query("UASG == '158223: FACULDADE NACIONAL DE DIREITO DA UFRJ'")

In [21]:
fnd.shape

(13, 15)

Quando a coluna que queremos pesquisar possui espaços, precisamos usar \` dentro do `query` para sinalizar ao método que estamos falando de uma única coluna.

In [22]:
compras_2020.query("`Código da modalidade da compra` == '7: Inexigibilidade'")

Unnamed: 0,Orgão,UASG,Código da modalidade da compra,Descrição Lei,Número Inciso,Número processo,Quantidade item,Valor total da compra,Número da compra,Descrição objeto licitação,Descrição justificativa,Data de reconhecimento da compra sem licitação,Data da ratificação da compra sem licitação,Data da publicação da compra sem licitação,Itens > uri
6,52121: COMANDO DO EXERCITO,160482: 1A. BRIGADA DE INFANTARIA DE SELVA/RR,7: Inexigibilidade,,0,64307003761202011,,"R$ 90,000.00",,Objeto: Fornecimento de água e esgoto para áre...,Justificativa: Destina-se ao serviço de fornec...,30/04/2020,05/05/2020,07/05/2020,/compraSemLicitacao/id/item_slicitacao/1604820...
8,52121: COMANDO DO EXERCITO,160272: 21 GRUPO DE ARTILHARIA CAMPANHA/RJ,7: Inexigibilidade,,1,64555006775202057,,"R$ 13,574.00",,"Objeto: Contratação de serviço de instalação, ...","Justificativa: Art. 25º, Inciso I da Lei nº 8....",29/10/2020,,,/compraSemLicitacao/id/item_slicitacao/1602720...
10,"26420: INST.FED.DE EDUC.,CIENC. E TEC.FARROUPILHA",154628: INST.FED.DE EDUC.CIENC.E TEC.CÂMPUS JA...,7: Inexigibilidade,,2,26420000129/20200,,"R$ 1,200.00",,Objeto: Contratação de Palestrante Sra. Isabel...,Justificativa: Para a contratação de serviços ...,18/02/2020,,,/compraSemLicitacao/id/item_slicitacao/1546280...
15,"26405: INST.FED.DE EDUC.,CIENC.E TEC.DO CEARÁ",158965: IFCE - CAMPUS ITAPIPOCA,7: Inexigibilidade,,2,23812000445202092,,R$ 980.00,,Objeto: Pagamento de inscrição no curso de cap...,"Justificativa: Inciso II, do art. 25 da Lei nº...",19/11/2020,,,/compraSemLicitacao/id/item_slicitacao/1589650...
17,"26420: INST.FED.DE EDUC.,CIENC. E TEC.FARROUPILHA","158127: INST.FEDERAL DE EDUC.,CIENC.E TEC.FARR...",7: Inexigibilidade,,2,23243001385202027,,R$ 600.00,,Objeto: Inscrição no curso de OJS 3: CONFIGUR...,Justificativa: Lei 8666/93 ...,07/04/2020,,,/compraSemLicitacao/id/item_slicitacao/1581270...
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
95999,26271: FUNDACAO UNIVERSIDADE DE BRASILIA,154040: FUNDAÇÃO UNIVERSIDADE DE BRASÍLIA - FUB,7: Inexigibilidade,,0,23106099983202001,,R$ 342.00,,Objeto: Despesa bancária com contratação cambi...,Justificativa: Empresa de economia mista admin...,23/11/2020,,,/compraSemLicitacao/id/item_slicitacao/1540400...
96000,26271: FUNDACAO UNIVERSIDADE DE BRASILIA,154040: FUNDAÇÃO UNIVERSIDADE DE BRASÍLIA - FUB,7: Inexigibilidade,,0,23106099835202088,,R$ 450.00,,Objeto: Pagamento de Inscrição em Evento. ...,"Justificativa: Inexigibilidade de licitação, v...",16/10/2020,,,/compraSemLicitacao/id/item_slicitacao/1540400...
96001,26271: FUNDACAO UNIVERSIDADE DE BRASILIA,154040: FUNDAÇÃO UNIVERSIDADE DE BRASÍLIA - FUB,7: Inexigibilidade,,0,23106099884202011,,R$ 340.00,,Objeto: Pagamento de Inscrição em Evento. ...,"Justificativa: Inexigibilidade de licitação, v...",15/10/2020,,,/compraSemLicitacao/id/item_slicitacao/1540400...
96002,26271: FUNDACAO UNIVERSIDADE DE BRASILIA,154040: FUNDAÇÃO UNIVERSIDADE DE BRASÍLIA - FUB,7: Inexigibilidade,,0,23106099991202049,,"R$ 6,300.00",,Objeto: Publicação do artigo científico intitu...,Justificativa: Tratar de publicação de artigo ...,21/10/2020,,,/compraSemLicitacao/id/item_slicitacao/1540400...




Categorias como Orgão e Código da modalidade da compra servem para classificar os dados. 

Assim, podemos fazer perguntas como: *quais são os órgãos que mais frequentemente fazem compras sem licitação e quais são as modalidades de compra mais frequentes*. 

Para responder essas perguntas, podemos usar o método `.value_counts()`.

In [23]:
compras_2020["Orgão"].value_counts()

52121: COMANDO DO EXERCITO                            33760
52131: COMANDO DA MARINHA                              9741
26443: EMPRESA BRASILEIRA DE SERVIÇOS HOSPITALARES     3688
52111: COMANDO DA AERONAUTICA                          2432
25000: MINISTERIO DA ECONOMIA                          2128
                                                      ...  
38646: CONSELHO REG.DE ADMINISTRAÇÃO DE TOCANTINS         1
38599: CONSELHO REG. DE MEDICINA DO ESTADO DO TO          1
93120: ESTADO DO ACRE                                     1
38742: CONSELHO REGIONAL DE ENFERMAGEM DO ACRE            1
49901: FUNDO DA MARINHA MERCANTE                          1
Name: Orgão, Length: 316, dtype: int64

In [24]:
compras_2020["Código da modalidade da compra"].value_counts()

6: Dispensa           83732
7: Inexigibilidade    12273
Name: Código da modalidade da compra, dtype: int64



### <a id='toc2_3_6_'></a>[Criando novas colunas](#toc0_)

Podemos adicionar colunas a um `DataFrame` usando a seguinte sintaxe:

`nome_do_dataframe['nome_da_nova_coluna'] = novo_valor`

Se `novo_valor` for uma constante, os dados vão ser replicados para todas as linhas do `DataFrame`:

In [25]:
compras_2020["Data de extração"] = "04/02/2021"
compras_2020.head()

Unnamed: 0,Orgão,UASG,Código da modalidade da compra,Descrição Lei,Número Inciso,Número processo,Quantidade item,Valor total da compra,Número da compra,Descrição objeto licitação,Descrição justificativa,Data de reconhecimento da compra sem licitação,Data da ratificação da compra sem licitação,Data da publicação da compra sem licitação,Itens > uri,Data de extração
0,52111: COMANDO DA AERONAUTICA,120641: GRUPAMENTO DE APOIO DE PORTO VELHO,6: Dispensa,,2,67206014598202031,,R$ 313.00,,Objeto: Contratação do serviço de prestação de...,"Justificativa: Despesa de pequeno vulto, confo...",06/03/2020,,,/compraSemLicitacao/id/item_slicitacao/1206410...,04/02/2021
1,29208: COMPANHIA DE PESQUISA DE RECURSOS MINERAIS,495500: COMPANHIA DE PESQUISA DE RECURSOS MINE...,6: Dispensa,,2,48048.000613/2020,,"R$ 20,716.00",,Objeto: Aquisição de dispenser para álcool gel...,Justificativa: Aquisição de produtos e/ou serv...,29/05/2020,,,/compraSemLicitacao/id/item_slicitacao/4955000...,04/02/2021
2,25000: MINISTERIO DA ECONOMIA,170198: DELEGACIA DA REC.FEDERAL EM GOIANIA/GO,6: Dispensa,,2,10120759636201977,,"R$ 14,245.00",,Objeto: Contratação de serviços de confecção d...,Justificativa: Pequeno valor. ...,27/12/2019,,,/compraSemLicitacao/id/item_slicitacao/1701980...,04/02/2021
3,22202: EMPRESA BRASILEIRA DE PESQUISA AGROPECU...,135020: EMBRAPA/CTAA,6: Dispensa,,4,21152.000208/2020,,"R$ 137,104.00",,Objeto: Contratação de Prestação de Serviços d...,"Justificativa: Contratação temporária, em cará...",27/02/2020,27/02/2020,28/02/2020,/compraSemLicitacao/id/item_slicitacao/1350200...,04/02/2021
4,37202: INSTITUTO NACIONAL DO SEGURO SOCIAL,511359: GERÊNCIA EXECUTIVA CAMPINAS/SP,6: Dispensa,,2,35014040275202063,,"R$ 8,760.00",,Objeto: Contratação de Companhia de Seguros pa...,Justificativa: Procedimento simplificado e de ...,14/04/2020,,,/compraSemLicitacao/id/item_slicitacao/5113590...,04/02/2021


In [26]:
compras_2020.tail()

Unnamed: 0,Orgão,UASG,Código da modalidade da compra,Descrição Lei,Número Inciso,Número processo,Quantidade item,Valor total da compra,Número da compra,Descrição objeto licitação,Descrição justificativa,Data de reconhecimento da compra sem licitação,Data da ratificação da compra sem licitação,Data da publicação da compra sem licitação,Itens > uri,Data de extração
96000,26271: FUNDACAO UNIVERSIDADE DE BRASILIA,154040: FUNDAÇÃO UNIVERSIDADE DE BRASÍLIA - FUB,7: Inexigibilidade,,0,23106099835202088,,R$ 450.00,,Objeto: Pagamento de Inscrição em Evento. ...,"Justificativa: Inexigibilidade de licitação, v...",16/10/2020,,,/compraSemLicitacao/id/item_slicitacao/1540400...,04/02/2021
96001,26271: FUNDACAO UNIVERSIDADE DE BRASILIA,154040: FUNDAÇÃO UNIVERSIDADE DE BRASÍLIA - FUB,7: Inexigibilidade,,0,23106099884202011,,R$ 340.00,,Objeto: Pagamento de Inscrição em Evento. ...,"Justificativa: Inexigibilidade de licitação, v...",15/10/2020,,,/compraSemLicitacao/id/item_slicitacao/1540400...,04/02/2021
96002,26271: FUNDACAO UNIVERSIDADE DE BRASILIA,154040: FUNDAÇÃO UNIVERSIDADE DE BRASÍLIA - FUB,7: Inexigibilidade,,0,23106099991202049,,"R$ 6,300.00",,Objeto: Publicação do artigo científico intitu...,Justificativa: Tratar de publicação de artigo ...,21/10/2020,,,/compraSemLicitacao/id/item_slicitacao/1540400...,04/02/2021
96003,26271: FUNDACAO UNIVERSIDADE DE BRASILIA,154040: FUNDAÇÃO UNIVERSIDADE DE BRASÍLIA - FUB,7: Inexigibilidade,,0,23106099991202049,,R$ 315.00,,Objeto: Despesa bancária com contratação cambi...,Justificativa: Empresa de economia mista admin...,21/10/2020,,,/compraSemLicitacao/id/item_slicitacao/1540400...,04/02/2021
96004,52131: COMANDO DA MARINHA,773000: DIRETORIA DE FINANCAS DA MARINHA,6: Dispensa,,2,99973/2020,,R$ 10.00,,Objeto: Serviço de telefonia ...,"Justificativa: Art. 24º, Inciso II da Lei nº 8...",27/01/2020,,,/compraSemLicitacao/id/item_slicitacao/7730000...,04/02/2021




Se `novo_valor` for uma lista, ela precisa ter um número de elementos igual ao número de linhas do `DataFrame` (nesse caso, 96.005).

In [27]:
compras_2020["Número aleatório"] = [123454, 35345634]

ValueError: Length of values (2) does not match length of index (96005)

In [28]:
from random import randint

numeros_aleatorios = []

tamanho_df = compras_2020.shape[0]

# executamos abaixo a função que gera um número aleatório o número de vezes igual ao de linhas no dataframe
for i in range(tamanho_df):
    numeros_aleatorios.append(randint(0, 1000000))

In [29]:
compras_2020["Número aleatório"] = numeros_aleatorios

In [30]:
compras_2020.head()

Unnamed: 0,Orgão,UASG,Código da modalidade da compra,Descrição Lei,Número Inciso,Número processo,Quantidade item,Valor total da compra,Número da compra,Descrição objeto licitação,Descrição justificativa,Data de reconhecimento da compra sem licitação,Data da ratificação da compra sem licitação,Data da publicação da compra sem licitação,Itens > uri,Data de extração,Número aleatório
0,52111: COMANDO DA AERONAUTICA,120641: GRUPAMENTO DE APOIO DE PORTO VELHO,6: Dispensa,,2,67206014598202031,,R$ 313.00,,Objeto: Contratação do serviço de prestação de...,"Justificativa: Despesa de pequeno vulto, confo...",06/03/2020,,,/compraSemLicitacao/id/item_slicitacao/1206410...,04/02/2021,354369
1,29208: COMPANHIA DE PESQUISA DE RECURSOS MINERAIS,495500: COMPANHIA DE PESQUISA DE RECURSOS MINE...,6: Dispensa,,2,48048.000613/2020,,"R$ 20,716.00",,Objeto: Aquisição de dispenser para álcool gel...,Justificativa: Aquisição de produtos e/ou serv...,29/05/2020,,,/compraSemLicitacao/id/item_slicitacao/4955000...,04/02/2021,521766
2,25000: MINISTERIO DA ECONOMIA,170198: DELEGACIA DA REC.FEDERAL EM GOIANIA/GO,6: Dispensa,,2,10120759636201977,,"R$ 14,245.00",,Objeto: Contratação de serviços de confecção d...,Justificativa: Pequeno valor. ...,27/12/2019,,,/compraSemLicitacao/id/item_slicitacao/1701980...,04/02/2021,73168
3,22202: EMPRESA BRASILEIRA DE PESQUISA AGROPECU...,135020: EMBRAPA/CTAA,6: Dispensa,,4,21152.000208/2020,,"R$ 137,104.00",,Objeto: Contratação de Prestação de Serviços d...,"Justificativa: Contratação temporária, em cará...",27/02/2020,27/02/2020,28/02/2020,/compraSemLicitacao/id/item_slicitacao/1350200...,04/02/2021,181802
4,37202: INSTITUTO NACIONAL DO SEGURO SOCIAL,511359: GERÊNCIA EXECUTIVA CAMPINAS/SP,6: Dispensa,,2,35014040275202063,,"R$ 8,760.00",,Objeto: Contratação de Companhia de Seguros pa...,Justificativa: Procedimento simplificado e de ...,14/04/2020,,,/compraSemLicitacao/id/item_slicitacao/5113590...,04/02/2021,192258




Já que criamos uma coluna numérica, é interessante ver também que podemos usar operações normais usando essas colunas. Por exemplo:

In [31]:
compras_2020["Número aleatório"]/10

0        35436.9
1        52176.6
2         7316.8
3        18180.2
4        19225.8
          ...   
96000    51897.8
96001    64429.2
96002    53854.6
96003    28332.8
96004    50959.7
Name: Número aleatório, Length: 96005, dtype: float64

Podemos salvar o resultado da operação em uma nova coluna

In [32]:
compras_2020["Aleatório mais 10"] = compras_2020["Número aleatório"] + 10
compras_2020.head()

Unnamed: 0,Orgão,UASG,Código da modalidade da compra,Descrição Lei,Número Inciso,Número processo,Quantidade item,Valor total da compra,Número da compra,Descrição objeto licitação,Descrição justificativa,Data de reconhecimento da compra sem licitação,Data da ratificação da compra sem licitação,Data da publicação da compra sem licitação,Itens > uri,Data de extração,Número aleatório,Aleatório mais 10
0,52111: COMANDO DA AERONAUTICA,120641: GRUPAMENTO DE APOIO DE PORTO VELHO,6: Dispensa,,2,67206014598202031,,R$ 313.00,,Objeto: Contratação do serviço de prestação de...,"Justificativa: Despesa de pequeno vulto, confo...",06/03/2020,,,/compraSemLicitacao/id/item_slicitacao/1206410...,04/02/2021,354369,354379
1,29208: COMPANHIA DE PESQUISA DE RECURSOS MINERAIS,495500: COMPANHIA DE PESQUISA DE RECURSOS MINE...,6: Dispensa,,2,48048.000613/2020,,"R$ 20,716.00",,Objeto: Aquisição de dispenser para álcool gel...,Justificativa: Aquisição de produtos e/ou serv...,29/05/2020,,,/compraSemLicitacao/id/item_slicitacao/4955000...,04/02/2021,521766,521776
2,25000: MINISTERIO DA ECONOMIA,170198: DELEGACIA DA REC.FEDERAL EM GOIANIA/GO,6: Dispensa,,2,10120759636201977,,"R$ 14,245.00",,Objeto: Contratação de serviços de confecção d...,Justificativa: Pequeno valor. ...,27/12/2019,,,/compraSemLicitacao/id/item_slicitacao/1701980...,04/02/2021,73168,73178
3,22202: EMPRESA BRASILEIRA DE PESQUISA AGROPECU...,135020: EMBRAPA/CTAA,6: Dispensa,,4,21152.000208/2020,,"R$ 137,104.00",,Objeto: Contratação de Prestação de Serviços d...,"Justificativa: Contratação temporária, em cará...",27/02/2020,27/02/2020,28/02/2020,/compraSemLicitacao/id/item_slicitacao/1350200...,04/02/2021,181802,181812
4,37202: INSTITUTO NACIONAL DO SEGURO SOCIAL,511359: GERÊNCIA EXECUTIVA CAMPINAS/SP,6: Dispensa,,2,35014040275202063,,"R$ 8,760.00",,Objeto: Contratação de Companhia de Seguros pa...,Justificativa: Procedimento simplificado e de ...,14/04/2020,,,/compraSemLicitacao/id/item_slicitacao/5113590...,04/02/2021,192258,192268




### <a id='toc2_3_7_'></a>[Excluindo colunas](#toc0_)

Podemos excluir colunas usando o método `.drop()` e passando as colunas que queremos remover com o argumento `columns`.

In [33]:
compras_2020.drop(columns=["Data de extração", "Número aleatório", "Aleatório mais 10"], inplace=True)

compras_2020.head(3)

Unnamed: 0,Orgão,UASG,Código da modalidade da compra,Descrição Lei,Número Inciso,Número processo,Quantidade item,Valor total da compra,Número da compra,Descrição objeto licitação,Descrição justificativa,Data de reconhecimento da compra sem licitação,Data da ratificação da compra sem licitação,Data da publicação da compra sem licitação,Itens > uri
0,52111: COMANDO DA AERONAUTICA,120641: GRUPAMENTO DE APOIO DE PORTO VELHO,6: Dispensa,,2,67206014598202031,,R$ 313.00,,Objeto: Contratação do serviço de prestação de...,"Justificativa: Despesa de pequeno vulto, confo...",06/03/2020,,,/compraSemLicitacao/id/item_slicitacao/1206410...
1,29208: COMPANHIA DE PESQUISA DE RECURSOS MINERAIS,495500: COMPANHIA DE PESQUISA DE RECURSOS MINE...,6: Dispensa,,2,48048.000613/2020,,"R$ 20,716.00",,Objeto: Aquisição de dispenser para álcool gel...,Justificativa: Aquisição de produtos e/ou serv...,29/05/2020,,,/compraSemLicitacao/id/item_slicitacao/4955000...
2,25000: MINISTERIO DA ECONOMIA,170198: DELEGACIA DA REC.FEDERAL EM GOIANIA/GO,6: Dispensa,,2,10120759636201977,,"R$ 14,245.00",,Objeto: Contratação de serviços de confecção d...,Justificativa: Pequeno valor. ...,27/12/2019,,,/compraSemLicitacao/id/item_slicitacao/1701980...




### <a id='toc2_3_8_'></a>[Executando operações permanentes](#toc0_)

Se você voltar à última célula de código, pode verificar que passamos o argumento `inplace` para o método `drop`.

Esse argumento tem um significado especial de instruir que a alteração resultante deve alterar **permanentemente** a variável sobre a qual foi executada. Assim, essa operação não retorna nenhum resultado e se tentarmos salvá-lo em uma nova variável, semelhante ao que ocorre com listas se usarmos `append`.

O argumento `inplace` é aceito por grande parte dos métodos que são executados sobre um dataframe, como o `query`, que vimos anteriormente. 

<b>CUIDADO:Ao executar uma operação inplace, a mudança é permanente. Assim, para voltar ao estado anterior é necessário recarregar os dados daquela variável como foi feito originalmente. No nosso exemplo, se deletarmos uma coluna seria necessário recarregar o arquivo original.

Além disso, isso pode gerar erros em certos casos. Se tentarmos executar o drop novamente da célula anterior o pandas irá informar que as colunas não existem e não podem ser removidas. </b>

In [34]:
compras_2020["teste"] = 'a'

df_teste = compras_2020.drop(columns=["teste"], inplace=True)

print(df_teste)

None


In [35]:
compras_2020.drop(columns=["Data de extração", "Número aleatório", "Aleatório mais 10"], inplace=True)

KeyError: "['Data de extração', 'Número aleatório', 'Aleatório mais 10'] not found in axis"

## <a id='toc2_4_'></a>[Retornando ao caso: encontrando casos onde há compra de cloroquina](#toc0_)

O que queremos fazer, no final das contas, é encontrar as compras envolvendo cloroquina. Ao contrário da busca pela UFRJ ou por um determinado código de modalidade de compra, as informações sobre a cloroquina não estão estruturadas da mesma forma. provavelmente, vamos encontrar menções à cloroquina na coluna que descreve o objeto da licitação. Mas a menção à cloroquina pode se dar em qualquer lugar dentro deste campo e de várias formas diferentes.

Para encontrar o que estamos procurando, precisamos usar as habilidades adquiridas em programação para advogados. 

Sabemos, por exemplo, que podemos usar o operador `is in` com objetos do tipo `str` para saber se uma determinada substring está contida naquele objeto. 

A dúvida é: como fazer uso dessa operação no `pandas`? Existem algumas opções. A primeira dela envolve um `for loop`.

In [36]:
cloroquina_bin = []

for index, value in compras_2020["Descrição objeto licitação"].items(): # assim como com dicionários, precisamos adicionar esse método
    if type(value) == str and "cloroquina" in value.lower():
        cloroquina_bin.append(1)
    else:
        cloroquina_bin.append(0)
        
compras_2020["cloroquina_bin"] = cloroquina_bin

In [37]:
compras_2020.query("cloroquina_bin == 1")

Unnamed: 0,Orgão,UASG,Código da modalidade da compra,Descrição Lei,Número Inciso,Número processo,Quantidade item,Valor total da compra,Número da compra,Descrição objeto licitação,Descrição justificativa,Data de reconhecimento da compra sem licitação,Data da ratificação da compra sem licitação,Data da publicação da compra sem licitação,Itens > uri,cloroquina_bin
9280,97320: ESTADO DE GOIAS,989631: PREFEITURA MUNICIPAL DE TURVANIA,6: Dispensa,,2,4006/2020,,"R$ 10,740.00",,Objeto: Aquisição de Medicamentos em caráter d...,Justificativa: Aquisição de produtos e/ou serv...,10/07/2020,,,/compraSemLicitacao/id/item_slicitacao/9896310...,1
18939,52121: COMANDO DO EXERCITO,160328: LABORATORIO QUIMICO FARMACEUTICO DO EX...,6: Dispensa,,4,64614001085202060,,"R$ 35,136.00",,Objeto: Aquisição de Cloroquina ...,Justificativa: Aquisição de Material conf. Inc...,20/03/2020,,,/compraSemLicitacao/id/item_slicitacao/1603280...,1
22191,52121: COMANDO DO EXERCITO,160328: LABORATORIO QUIMICO FARMACEUTICO DO EX...,6: Dispensa,,4,64614001085202060,,"R$ 35,136.00",,Objeto: Aquisição de Cloroquina ...,Justificativa: Aquisição de Material conf. Inc...,20/03/2020,,,/compraSemLicitacao/id/item_slicitacao/1603280...,1
22448,52121: COMANDO DO EXERCITO,160328: LABORATORIO QUIMICO FARMACEUTICO DO EX...,6: Dispensa,,4,64614001085202060,,"R$ 30,744.00",,Objeto: Aquisição de Cloroquina ...,Justificativa: Aquisição de Material conf. Inc...,20/03/2020,,,/compraSemLicitacao/id/item_slicitacao/1603280...,1
26081,52121: COMANDO DO EXERCITO,160328: LABORATORIO QUIMICO FARMACEUTICO DO EX...,6: Dispensa,,4,64614001104202058,,"R$ 34,648.00",,Objeto: Aquisição de insumo para a produção de...,Justificativa: Compra de caráter emergencial n...,23/03/2020,,,/compraSemLicitacao/id/item_slicitacao/1603280...,1
27071,52121: COMANDO DO EXERCITO,160328: LABORATORIO QUIMICO FARMACEUTICO DO EX...,6: Dispensa,,4,64614001104202058,,"R$ 34,648.00",,Objeto: Aquisição de insumo para a produção de...,Justificativa: Compra de caráter emergencial n...,23/03/2020,,,/compraSemLicitacao/id/item_slicitacao/1603280...,1
27568,52121: COMANDO DO EXERCITO,160328: LABORATORIO QUIMICO FARMACEUTICO DO EX...,6: Dispensa,,4,64614001104202058,,"R$ 31,720.00",,Objeto: Aquisição de insumo para a produção de...,Justificativa: Compra de caráter emergencial n...,23/03/2020,,,/compraSemLicitacao/id/item_slicitacao/1603280...,1
28847,52121: COMANDO DO EXERCITO,160328: LABORATORIO QUIMICO FARMACEUTICO DO EX...,6: Dispensa,,4,64614.001111/2020,,R$ 680.00,,Objeto: Alumínio Duro de Cloroquina. ...,Justificativa: Aquisição de Insumos para produ...,23/03/2020,,,/compraSemLicitacao/id/item_slicitacao/1603280...,1
35952,52121: COMANDO DO EXERCITO,160328: LABORATORIO QUIMICO FARMACEUTICO DO EX...,6: Dispensa,,0,64614001499202099,,"R$ 11,494.00",,Objeto: Aquisição de material para produção de...,Justificativa: Utilizados no tratamento e prev...,16/04/2020,,,/compraSemLicitacao/id/item_slicitacao/1603280...,1
40557,52121: COMANDO DO EXERCITO,160328: LABORATORIO QUIMICO FARMACEUTICO DO EX...,6: Dispensa,,0,64614001810202008,,"R$ 652,000.00",,Objeto: Aquisição de insumo farmacêutico Ativo...,Justificativa: Compra de caráter emergencial d...,06/05/2020,,,/compraSemLicitacao/id/item_slicitacao/1603280...,1




Outra forma de fazer a mesma coisa que usaremos ao longo do curso é utilizar operações "vetorizadas", que são aplicadas sobre toda a coluna. No caso, queremos fazer operações de `string`, assim devemos adicionar o indicador `.str` após a coluna acessada.

Primeiro vamos converter toda a coluna para letras minúsculas, e então descobrir se ela contém a palavra cloroquina (veja que usamos `.str` novamente).

In [38]:
compras_2020["Descrição objeto licitação"].str.lower().str.contains("cloroquina")

0        False
1        False
2        False
3        False
4        False
         ...  
96000    False
96001    False
96002    False
96003    False
96004    False
Name: Descrição objeto licitação, Length: 96005, dtype: object

Como comentamos no início do notebook, estamos subindo no ombro de gigantes e boa parte do que precisamos fazer para tratar dados já foi feito e disponibilizado de forma ainda mais simples. Assim, podemos simplificar essa operação e pedir que o método `contains` ignore a diferença de capitalização nas letras com o argumento `case=False`.

Case é a expressão inglesa para se referir a capitalização.

In [39]:
compras_2020["cloroquina_bin"] = compras_2020["Descrição objeto licitação"].str.contains("cloroquina", case=False)
compras_2020.query("cloroquina_bin == True")

Unnamed: 0,Orgão,UASG,Código da modalidade da compra,Descrição Lei,Número Inciso,Número processo,Quantidade item,Valor total da compra,Número da compra,Descrição objeto licitação,Descrição justificativa,Data de reconhecimento da compra sem licitação,Data da ratificação da compra sem licitação,Data da publicação da compra sem licitação,Itens > uri,cloroquina_bin
9280,97320: ESTADO DE GOIAS,989631: PREFEITURA MUNICIPAL DE TURVANIA,6: Dispensa,,2,4006/2020,,"R$ 10,740.00",,Objeto: Aquisição de Medicamentos em caráter d...,Justificativa: Aquisição de produtos e/ou serv...,10/07/2020,,,/compraSemLicitacao/id/item_slicitacao/9896310...,True
18939,52121: COMANDO DO EXERCITO,160328: LABORATORIO QUIMICO FARMACEUTICO DO EX...,6: Dispensa,,4,64614001085202060,,"R$ 35,136.00",,Objeto: Aquisição de Cloroquina ...,Justificativa: Aquisição de Material conf. Inc...,20/03/2020,,,/compraSemLicitacao/id/item_slicitacao/1603280...,True
22191,52121: COMANDO DO EXERCITO,160328: LABORATORIO QUIMICO FARMACEUTICO DO EX...,6: Dispensa,,4,64614001085202060,,"R$ 35,136.00",,Objeto: Aquisição de Cloroquina ...,Justificativa: Aquisição de Material conf. Inc...,20/03/2020,,,/compraSemLicitacao/id/item_slicitacao/1603280...,True
22448,52121: COMANDO DO EXERCITO,160328: LABORATORIO QUIMICO FARMACEUTICO DO EX...,6: Dispensa,,4,64614001085202060,,"R$ 30,744.00",,Objeto: Aquisição de Cloroquina ...,Justificativa: Aquisição de Material conf. Inc...,20/03/2020,,,/compraSemLicitacao/id/item_slicitacao/1603280...,True
26081,52121: COMANDO DO EXERCITO,160328: LABORATORIO QUIMICO FARMACEUTICO DO EX...,6: Dispensa,,4,64614001104202058,,"R$ 34,648.00",,Objeto: Aquisição de insumo para a produção de...,Justificativa: Compra de caráter emergencial n...,23/03/2020,,,/compraSemLicitacao/id/item_slicitacao/1603280...,True
27071,52121: COMANDO DO EXERCITO,160328: LABORATORIO QUIMICO FARMACEUTICO DO EX...,6: Dispensa,,4,64614001104202058,,"R$ 34,648.00",,Objeto: Aquisição de insumo para a produção de...,Justificativa: Compra de caráter emergencial n...,23/03/2020,,,/compraSemLicitacao/id/item_slicitacao/1603280...,True
27568,52121: COMANDO DO EXERCITO,160328: LABORATORIO QUIMICO FARMACEUTICO DO EX...,6: Dispensa,,4,64614001104202058,,"R$ 31,720.00",,Objeto: Aquisição de insumo para a produção de...,Justificativa: Compra de caráter emergencial n...,23/03/2020,,,/compraSemLicitacao/id/item_slicitacao/1603280...,True
28847,52121: COMANDO DO EXERCITO,160328: LABORATORIO QUIMICO FARMACEUTICO DO EX...,6: Dispensa,,4,64614.001111/2020,,R$ 680.00,,Objeto: Alumínio Duro de Cloroquina. ...,Justificativa: Aquisição de Insumos para produ...,23/03/2020,,,/compraSemLicitacao/id/item_slicitacao/1603280...,True
35952,52121: COMANDO DO EXERCITO,160328: LABORATORIO QUIMICO FARMACEUTICO DO EX...,6: Dispensa,,0,64614001499202099,,"R$ 11,494.00",,Objeto: Aquisição de material para produção de...,Justificativa: Utilizados no tratamento e prev...,16/04/2020,,,/compraSemLicitacao/id/item_slicitacao/1603280...,True
40557,52121: COMANDO DO EXERCITO,160328: LABORATORIO QUIMICO FARMACEUTICO DO EX...,6: Dispensa,,0,64614001810202008,,"R$ 652,000.00",,Objeto: Aquisição de insumo farmacêutico Ativo...,Justificativa: Compra de caráter emergencial d...,06/05/2020,,,/compraSemLicitacao/id/item_slicitacao/1603280...,True




### <a id='toc2_4_1_'></a>[Tratando os dados](#toc0_)

Já vimos que quando temos colunas numéricas, podemos fazer operações. Poderíamos, por exemplo, pedir a soma de todos os valores pagos em compras de cloroquina. Infelizmente, a coluna "Valor total da compra" não é numérica. Precisamos transformar essa coluna em numérica.

In [40]:
compras_2020

Unnamed: 0,Orgão,UASG,Código da modalidade da compra,Descrição Lei,Número Inciso,Número processo,Quantidade item,Valor total da compra,Número da compra,Descrição objeto licitação,Descrição justificativa,Data de reconhecimento da compra sem licitação,Data da ratificação da compra sem licitação,Data da publicação da compra sem licitação,Itens > uri,cloroquina_bin
0,52111: COMANDO DA AERONAUTICA,120641: GRUPAMENTO DE APOIO DE PORTO VELHO,6: Dispensa,,2,67206014598202031,,R$ 313.00,,Objeto: Contratação do serviço de prestação de...,"Justificativa: Despesa de pequeno vulto, confo...",06/03/2020,,,/compraSemLicitacao/id/item_slicitacao/1206410...,False
1,29208: COMPANHIA DE PESQUISA DE RECURSOS MINERAIS,495500: COMPANHIA DE PESQUISA DE RECURSOS MINE...,6: Dispensa,,2,48048.000613/2020,,"R$ 20,716.00",,Objeto: Aquisição de dispenser para álcool gel...,Justificativa: Aquisição de produtos e/ou serv...,29/05/2020,,,/compraSemLicitacao/id/item_slicitacao/4955000...,False
2,25000: MINISTERIO DA ECONOMIA,170198: DELEGACIA DA REC.FEDERAL EM GOIANIA/GO,6: Dispensa,,2,10120759636201977,,"R$ 14,245.00",,Objeto: Contratação de serviços de confecção d...,Justificativa: Pequeno valor. ...,27/12/2019,,,/compraSemLicitacao/id/item_slicitacao/1701980...,False
3,22202: EMPRESA BRASILEIRA DE PESQUISA AGROPECU...,135020: EMBRAPA/CTAA,6: Dispensa,,4,21152.000208/2020,,"R$ 137,104.00",,Objeto: Contratação de Prestação de Serviços d...,"Justificativa: Contratação temporária, em cará...",27/02/2020,27/02/2020,28/02/2020,/compraSemLicitacao/id/item_slicitacao/1350200...,False
4,37202: INSTITUTO NACIONAL DO SEGURO SOCIAL,511359: GERÊNCIA EXECUTIVA CAMPINAS/SP,6: Dispensa,,2,35014040275202063,,"R$ 8,760.00",,Objeto: Contratação de Companhia de Seguros pa...,Justificativa: Procedimento simplificado e de ...,14/04/2020,,,/compraSemLicitacao/id/item_slicitacao/5113590...,False
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
96000,26271: FUNDACAO UNIVERSIDADE DE BRASILIA,154040: FUNDAÇÃO UNIVERSIDADE DE BRASÍLIA - FUB,7: Inexigibilidade,,0,23106099835202088,,R$ 450.00,,Objeto: Pagamento de Inscrição em Evento. ...,"Justificativa: Inexigibilidade de licitação, v...",16/10/2020,,,/compraSemLicitacao/id/item_slicitacao/1540400...,False
96001,26271: FUNDACAO UNIVERSIDADE DE BRASILIA,154040: FUNDAÇÃO UNIVERSIDADE DE BRASÍLIA - FUB,7: Inexigibilidade,,0,23106099884202011,,R$ 340.00,,Objeto: Pagamento de Inscrição em Evento. ...,"Justificativa: Inexigibilidade de licitação, v...",15/10/2020,,,/compraSemLicitacao/id/item_slicitacao/1540400...,False
96002,26271: FUNDACAO UNIVERSIDADE DE BRASILIA,154040: FUNDAÇÃO UNIVERSIDADE DE BRASÍLIA - FUB,7: Inexigibilidade,,0,23106099991202049,,"R$ 6,300.00",,Objeto: Publicação do artigo científico intitu...,Justificativa: Tratar de publicação de artigo ...,21/10/2020,,,/compraSemLicitacao/id/item_slicitacao/1540400...,False
96003,26271: FUNDACAO UNIVERSIDADE DE BRASILIA,154040: FUNDAÇÃO UNIVERSIDADE DE BRASÍLIA - FUB,7: Inexigibilidade,,0,23106099991202049,,R$ 315.00,,Objeto: Despesa bancária com contratação cambi...,Justificativa: Empresa de economia mista admin...,21/10/2020,,,/compraSemLicitacao/id/item_slicitacao/1540400...,False


Para que os valores possam ser interpretados adequadamente como numéricos precisamos realizar 2 alterações:

1. Remover o R$ que antecede o valor de cada célula (sabemos pelo nome da coluna que se trata de um valor monetário).
2. Remover a vírgula que é utilizada como separador de milhares na tabela.

Novamente uma primeira opção é usar os instrumentos apresentados em Programação para Advogados, a partir de um for loop:

In [41]:
#opção 1
valor_em_numero = []

for index, value in compras_2020["Valor total da compra"].items():
    if type(value) == str: # impedir que o código abaixo rode quando a célula está vazia
        valor_em_numero.append(float(value.replace("R$ ", "").replace(",", "")))
    else:
        valor_em_numero.append(value)
        
compras_2020["valor_numerico"] = valor_em_numero

Ou podemos simplificar realizando a operação diretamente sobre a coluna, sem a necessidade de um for loop.

In [44]:
#opção 2
compras_2020["valor_numerico"] = compras_2020["Valor total da compra"].str.replace("R$ ", "", regex=False).str.replace(",", "", regex=False).astype(float)

# ou ainda simplificando com uma única regex
compras_2020["valor_numerico"] = compras_2020["Valor total da compra"].str.replace("R\$ |,", "", regex=True).astype(float)

Agora podemos somar usando o método `sum`!

In [45]:
compras_2020["valor_numerico"].sum()

21618270804.0

In [46]:
compras_2020.query("cloroquina_bin == 1")["valor_numerico"].sum()

2496197.0

Poderíamos também facilmente acessar a média com o método que possui o nome da operação em inglês: `mean`

In [47]:
compras_2020.query("cloroquina_bin == 1")["valor_numerico"].mean()

166413.13333333333

Podemos calcular quanto do total sem licitação os gastos com cloroquina representam.

In [48]:
# Multiplicamos por 100 para ter o resultado em porcentagem
(compras_2020.query("cloroquina_bin == True")["valor_numerico"].sum() / compras_2020["valor_numerico"].sum()) * 100

0.011546700578559374

### <a id='toc2_4_2_'></a>[Conclusão](#toc0_)

Os gastos com cloroquina foram elevados em termos absolutos, mas modestos em termos relativos.

#### Rodada bônus: guloseimas

In [49]:
compras_2020["leite_condensado_bin"] = compras_2020["Descrição objeto licitação"].str.contains("leite condensado", case=False)

In [50]:
compras_2020.query("leite_condensado_bin == True")

Unnamed: 0,Orgão,UASG,Código da modalidade da compra,Descrição Lei,Número Inciso,Número processo,Quantidade item,Valor total da compra,Número da compra,Descrição objeto licitação,Descrição justificativa,Data de reconhecimento da compra sem licitação,Data da ratificação da compra sem licitação,Data da publicação da compra sem licitação,Itens > uri,cloroquina_bin,valor_numerico,leite_condensado_bin
80910,52131: COMANDO DA MARINHA,782801: BASE NAVAL DE ARATU - BA,6: Dispensa,,2,256,,R$ 450.00,,Objeto: Leite condensado e bombom serenata de ...,Justificativa: Aquisição em função do valor. ...,18/11/2020,,,/compraSemLicitacao/id/item_slicitacao/7828010...,False,450.0,True




#### Rodada bônus 2: ivermectina

In [51]:
compras_2020["ivermectina_bin"] = compras_2020["Descrição objeto licitação"].str.contains("ivermectina", case=False)

In [52]:
compras_2020.query("ivermectina_bin == True")

Unnamed: 0,Orgão,UASG,Código da modalidade da compra,Descrição Lei,Número Inciso,Número processo,Quantidade item,Valor total da compra,Número da compra,Descrição objeto licitação,Descrição justificativa,Data de reconhecimento da compra sem licitação,Data da ratificação da compra sem licitação,Data da publicação da compra sem licitação,Itens > uri,cloroquina_bin,valor_numerico,leite_condensado_bin,ivermectina_bin
9280,97320: ESTADO DE GOIAS,989631: PREFEITURA MUNICIPAL DE TURVANIA,6: Dispensa,,2,4006/2020,,"R$ 10,740.00",,Objeto: Aquisição de Medicamentos em caráter d...,Justificativa: Aquisição de produtos e/ou serv...,10/07/2020,,,/compraSemLicitacao/id/item_slicitacao/9896310...,True,10740.0,False,True
31275,30907: FUNDO PENITENCIARIO NACIONAL,200604: PENITENCIÁRIA FEDERAL EM BRASILIA,6: Dispensa,,2,08016016505202081,,"R$ 1,200.00",,Objeto: Aquisição de medicamentos (Azitromicin...,Justificativa: Aquisição de produtos e/ou serv...,10/09/2020,,,/compraSemLicitacao/id/item_slicitacao/2006040...,False,1200.0,False,True
32849,52121: COMANDO DO EXERCITO,160191: CENTRO PREPARACAO OFICIAIS DA RESERVA/...,6: Dispensa,,2,64215004500202030,,"R$ 3,114.00",,Objeto: Aquisição de insumos de saúde para ate...,Justificativa: Aquisição de produtos e/ou serv...,01/07/2020,,,/compraSemLicitacao/id/item_slicitacao/1601910...,False,3114.0,False,True
37306,52131: COMANDO DA MARINHA,782700: HOSPITAL NAVAL_DE SALVADOR,6: Dispensa,,0,63607002489202051,,"R$ 20,000.00",,Objeto: Aquisição de ivermectina 6 mg e azitro...,Justificativa: Ações para o enfrentamento da e...,21/07/2020,,,/compraSemLicitacao/id/item_slicitacao/7827000...,False,20000.0,False,True
63977,93420: ESTADO DO PARA,927872: FUNDO MUNICIPAL DE SAÚDE DE BARCARENA,6: Dispensa,,0,7-110/2020,,"R$ 147,000.00",,Objeto: Contratação de empresa especializada p...,Justificativa: Aquisição emergencial de medica...,12/05/2020,,,/compraSemLicitacao/id/item_slicitacao/9278720...,False,147000.0,False,True
66893,52111: COMANDO DA AERONAUTICA,120195: CENTRO DE AQUISIÇÕES ESPECIFICAS,6: Dispensa,,2,67106001818202094,,"R$ 1,360.00",,Objeto: Aquisição emergencial de IVERMECTINA C...,Justificativa: Aquisição de produtos e/ou serv...,28/05/2020,,,/compraSemLicitacao/id/item_slicitacao/1201950...,False,1360.0,False,True
78284,26443: EMPRESA BRASILEIRA DE SERVIÇOS HOSPITAL...,155011: HOSPITAL DE CLINICAS DO TRIANGULO MINEIRO,6: Dispensa,,0,23521010146202031,,"R$ 3,490.00",,Objeto: Aquisição do medicamento Ivermectina 6...,Justificativa: O item se trata de medicamento ...,30/07/2020,,,/compraSemLicitacao/id/item_slicitacao/1550110...,False,3490.0,False,True
79013,52121: COMANDO DO EXERCITO,160470: 12 GRUPO DE ARTILHARIA DE CAMPANHA,6: Dispensa,,2,64547013695202057,,"R$ 1,624.00",,"Objeto: Aquisição de medicamento, Ivermectina....",Justificativa: Aquisição de produtos e/ou serv...,13/10/2020,,,/compraSemLicitacao/id/item_slicitacao/1604700...,False,1624.0,False,True


In [53]:
compras_2020.query("ivermectina_bin == True").valor_numerico.sum()

188528.0