# CPV

Fonte: https://ted.europa.eu/pt/simap/cpv

«O CPV estabelece um sistema único de classificação aplicável aos contratos públicos, com o objetivo de normalizar as referências que as autoridades e entidades adjudicantes utilizam para caracterizar o objeto dos seus contratos públicos.

O CPV contém um vocabulário principal para a definição do objeto de um contrato e um vocabulário suplementar para se acrescentar qualquer informação qualitativa. O vocabulário principal assenta numa estrutura de códigos em árvore de até 9 algarismos (um código de 8 algarismos e um algarismo de controlo) associados a uma designação que descreve o tipo de fornecimentos, obras ou serviços objeto do contrato.

- os primeiros 2 algarismos identificam as divisões (XX000000-Y);
- os primeiros 3 algarismos identificam os grupos (XXX00000-Y);
- os primeiros 4 algarismos identificam as classes (XXXX0000-Y);
- os primeiros 5 algarismos identificam as categorias (XXXXX000-Y).

Cada um dos 3 algarismos finais acrescenta um grau de precisão suplementar dentro de cada categoria.

O nono algarismo serve para verificação dos algarismos precedentes.

O vocabulário suplementar pode ser utilizado para completar a descrição do objeto dos contratos.

É constituído por um código alfanumérico, ao qual corresponde uma designação que permite acrescentar precisões adicionais sobre a natureza ou o destino do bem a adquirir.

O código alfanumérico contém:
- um primeiro nível, constituído por uma letra que corresponde a uma secção;
- um segundo nível, constituído por 4 algarismos, correspondendo os primeiros 3 a uma subdivisão e o último a um alagrismo de controlo.

# Libraries

In [1]:
import pandas as pd
import os

# Methods

## List Divisions

In [2]:
def list_divisions(dftolist, number_of_rows, columns_to_display, id_start=0):
    pattern = r'^\d{2}000000-\d$'
    filtered_df = dftolist[dftolist['CPVcode'].str.match(pattern)]
    filtered_df = filtered_df.sort_values('ID')
    filtered_df = filtered_df[filtered_df['ID'] >= id_start]
    missing_cols = [col for col in columns_to_display if col not in filtered_df.columns]
    if missing_cols:
        raise ValueError(f"The following columns are not in the DataFrame: {missing_cols}")
    with pd.option_context('display.max_colwidth', 100):
        display(filtered_df[columns_to_display].head(number_of_rows))

## Remove CPV divisions

In [3]:
def remove_cpv_divisions(df, divisions_to_eliminate):
    pattern = '^(' + '|'.join(divisions_to_eliminate) + ')'
    filtered_df = df[~df['CPVcode'].str.match(pattern)]
    return filtered_df

## List Groups

In [4]:
def list_groups(dftolist, number_of_rows, columns_to_display, id_start=0):
    pattern = r'^\d{3}00000-\d$'  # Match group-level CPV codes
    filtered_df = dftolist[dftolist['CPVcode'].str.match(pattern)]
    filtered_df = filtered_df.sort_values('ID')
    filtered_df = filtered_df[filtered_df['ID'] >= id_start]
    missing_cols = [col for col in columns_to_display if col not in filtered_df.columns]
    if missing_cols:
        raise ValueError(f"The following columns are not in the DataFrame: {missing_cols}")
    with pd.option_context('display.max_colwidth', 100):
        display(filtered_df[columns_to_display].head(number_of_rows))

## Remove CPV groups

In [5]:
def remove_cpv_groups(df, groups_to_eliminate):
    pattern = '^(' + '|'.join(groups_to_eliminate) + ')'
    filtered_df = df[~df['CPVcode'].str.match(pattern)]
    return filtered_df

## List Classes

In [6]:
def list_classes(dftolist, number_of_rows, columns_to_display, id_start=0):
    pattern = r'^\d{4}0000-\d$'  # Match group-level CPV codes
    filtered_df = dftolist[dftolist['CPVcode'].str.match(pattern)]
    filtered_df = filtered_df.sort_values('ID')
    filtered_df = filtered_df[filtered_df['ID'] >= id_start]
    missing_cols = [col for col in columns_to_display if col not in filtered_df.columns]
    if missing_cols:
        raise ValueError(f"The following columns are not in the DataFrame: {missing_cols}")
    with pd.option_context('display.max_colwidth', 100):
        display(filtered_df[columns_to_display].head(number_of_rows))

## Remove CPV classes

In [7]:
def remove_cpv_classes(df, classes_to_eliminate):
    pattern = '^(' + '|'.join(classes_to_eliminate) + ')'
    filtered_df = df[~df['CPVcode'].str.match(pattern)]
    return filtered_df

## List Categories

In [8]:
def list_categories(dftolist, number_of_rows, columns_to_display, id_start=0):
    pattern = r'^\d{5}000-\d$'  # Match group-level CPV codes
    filtered_df = dftolist[dftolist['CPVcode'].str.match(pattern)]
    filtered_df = filtered_df.sort_values('ID')
    filtered_df = filtered_df[filtered_df['ID'] >= id_start]
    missing_cols = [col for col in columns_to_display if col not in filtered_df.columns]
    if missing_cols:
        raise ValueError(f"The following columns are not in the DataFrame: {missing_cols}")
    with pd.option_context('display.max_colwidth', 100):
        display(filtered_df[columns_to_display].head(number_of_rows))

## Remove CPV categories

In [9]:
def remove_cpv_categories(df, categories_to_eliminate):
    pattern = '^(' + '|'.join(categories_to_eliminate) + ')'
    filtered_df = df[~df['CPVcode'].str.match(pattern)]
    return filtered_df

# List Rows

In [10]:
def list_rows(dftolist, number_of_rows=None, columns_to_display=None, id_start=0):
    filtered_df = dftolist.sort_values('ID')
    filtered_df = filtered_df[filtered_df['ID'] >= id_start]
    if columns_to_display:
        missing_cols = [col for col in columns_to_display if col not in filtered_df.columns]
        if missing_cols:
            raise ValueError(f"The following columns are not in the DataFrame: {missing_cols}")
        filtered_df = filtered_df[columns_to_display]
    with pd.option_context('display.max_colwidth', 100):
        display(filtered_df if number_of_rows is None else filtered_df.head(number_of_rows))

# XLSX 'Rótulos de linha' and 'contagem de tipo de contrato'

## Upload xlsx

In [11]:
input_folder = r"16_CPV"
file='TiposContrato_CPV_TED_V1.0.xlsx'
file_path = os.path.join(input_folder, file)
df_count = pd.read_excel(file_path, engine='openpyxl', sheet_name='Folha1', skiprows=2)

## Number of rows

In [12]:
print(f"\nNúmero total de linhas: {df_count.shape[0]}")


Número total de linhas: 10


## First 20 rows

In [13]:
pd.set_option('display.max_columns', None)  # Sem limite de colunas
display(df_count.head(30))

Unnamed: 0,Rótulos de Linha,Contagem de Tipo de Contrato
0,Aquisição de bens móveis,6543.0
1,Aquisição de serviços,2087.0
2,Concessão de obras públicas,822.0
3,Concessão de serviços públicos,2074.0
4,Empreitadas de obras públicas,822.0
5,Locação de bens móveis,6543.0
6,Outros,2089.0
7,Sociedade,9454.0
8,(em branco),
9,Total Geral,30434.0


## XLSX with CPV codes

In [14]:
input_folder = r"16_CPV"
file='TiposContrato_CPV_TED_V1.0.xlsx'
file_path = os.path.join(input_folder, file)
df = pd.read_excel(file_path, engine='openpyxl', sheet_name='TiposContrato_CPV', skiprows=0)

# Count 'Tipo de Contrato'

In [15]:
count_by_tipo = df.groupby('Tipo de Contrato').size()
print(count_by_tipo)
total = count_by_tipo.sum()
print("Total rows:", total)

Tipo de Contrato
Aquisição de bens móveis          6543
Aquisição de serviços             2087
Concessão de obras públicas        822
Concessão de serviços públicos    2074
Empreitadas de obras públicas      822
Locação de bens móveis            6543
Outros                            2089
Sociedade                         9454
dtype: int64
Total rows: 30434


## Number of rows

In [16]:
print(f"\nNúmero total de linhas: {df.shape[0]}")


Número total de linhas: 30434


## First 20 rows

In [17]:
pd.set_option('display.max_columns', None)  # Sem limite de colunas
display(df.head(30))

Unnamed: 0,ID,Tipo de Contrato,CPV,Ativo
0,1,Aquisição de bens móveis,"03000000-1 - Produtos da agricultura, da pesca...",1
1,2,Aquisição de bens móveis,03100000-2 - Produtos agrícolas e hortofrutícolas,1
2,3,Aquisição de bens móveis,"03110000-5 - Cereais, produtos de culturas ind...",1
3,4,Aquisição de bens móveis,03111000-2 - Sementes,1
4,5,Aquisição de bens móveis,03111100-3 - Soja,1
5,6,Aquisição de bens móveis,03111200-4 - Amendoins,1
6,7,Aquisição de bens móveis,03111300-5 - Sementes de girassol,1
7,8,Aquisição de bens móveis,03111400-6 - Sementes de algodão,1
8,9,Aquisição de bens móveis,03111500-7 - Sementes de sésamo,1
9,10,Aquisição de bens móveis,03111600-8 - Sementes de mostarda,1


## Column Types

In [18]:
df.info(verbose=True)

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 30434 entries, 0 to 30433
Data columns (total 4 columns):
 #   Column            Non-Null Count  Dtype 
---  ------            --------------  ----- 
 0   ID                30434 non-null  int64 
 1   Tipo de Contrato  30434 non-null  object
 2   CPV               30434 non-null  object
 3   Ativo             30434 non-null  int64 
dtypes: int64(2), object(2)
memory usage: 951.2+ KB


In [19]:
df['Tipo de Contrato'] = df['Tipo de Contrato'].astype("string")
df['CPV'] = df['CPV'].astype("string")

In [20]:
df.info(verbose=True)

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 30434 entries, 0 to 30433
Data columns (total 4 columns):
 #   Column            Non-Null Count  Dtype 
---  ------            --------------  ----- 
 0   ID                30434 non-null  int64 
 1   Tipo de Contrato  30434 non-null  string
 2   CPV               30434 non-null  string
 3   Ativo             30434 non-null  int64 
dtypes: int64(2), string(2)
memory usage: 951.2 KB


## Two new features 'CPVcode' and 'CPVdescription'

In [21]:
df[['CPVcode', 'CPVdescription']] = df['CPV'].str.split(' - ', n=1, expand=True)

In [22]:
display(df.head(30))

Unnamed: 0,ID,Tipo de Contrato,CPV,Ativo,CPVcode,CPVdescription
0,1,Aquisição de bens móveis,"03000000-1 - Produtos da agricultura, da pesca...",1,03000000-1,"Produtos da agricultura, da pesca, da silvicul..."
1,2,Aquisição de bens móveis,03100000-2 - Produtos agrícolas e hortofrutícolas,1,03100000-2,Produtos agrícolas e hortofrutícolas
2,3,Aquisição de bens móveis,"03110000-5 - Cereais, produtos de culturas ind...",1,03110000-5,"Cereais, produtos de culturas industriais e da..."
3,4,Aquisição de bens móveis,03111000-2 - Sementes,1,03111000-2,Sementes
4,5,Aquisição de bens móveis,03111100-3 - Soja,1,03111100-3,Soja
5,6,Aquisição de bens móveis,03111200-4 - Amendoins,1,03111200-4,Amendoins
6,7,Aquisição de bens móveis,03111300-5 - Sementes de girassol,1,03111300-5,Sementes de girassol
7,8,Aquisição de bens móveis,03111400-6 - Sementes de algodão,1,03111400-6,Sementes de algodão
8,9,Aquisição de bens móveis,03111500-7 - Sementes de sésamo,1,03111500-7,Sementes de sésamo
9,10,Aquisição de bens móveis,03111600-8 - Sementes de mostarda,1,03111600-8,Sementes de mostarda


In [23]:
df.info(verbose=True)

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 30434 entries, 0 to 30433
Data columns (total 6 columns):
 #   Column            Non-Null Count  Dtype 
---  ------            --------------  ----- 
 0   ID                30434 non-null  int64 
 1   Tipo de Contrato  30434 non-null  string
 2   CPV               30434 non-null  string
 3   Ativo             30434 non-null  int64 
 4   CPVcode           30434 non-null  string
 5   CPVdescription    30434 non-null  string
dtypes: int64(2), string(4)
memory usage: 1.4 MB


## Save this new dataset

In [24]:
folder = '16_CPV'
parquet_filename = 'TiposContrato_CPV_TED_V1.0_new.parquet'
csv_filename = 'TiposContrato_CPV_TED_V1.0_new.csv'

parquet_path = os.path.join(folder, parquet_filename)
csv_path = os.path.join(folder, csv_filename)

os.makedirs(folder, exist_ok=True)

df.to_parquet(parquet_path, index=False)
df.to_csv(csv_path, index=False)

print(f"Arquivos salvos:\n- {parquet_path}\n- {csv_path}")

Arquivos salvos:
- 16_CPV\TiposContrato_CPV_TED_V1.0_new.parquet
- 16_CPV\TiposContrato_CPV_TED_V1.0_new.csv


# Only CPV of 'Aquisição de serviços' 

In [25]:
filter_values = ['Aquisição de serviços', 'Outros', '(em branco)']
df = df[df['Tipo de Contrato'].isin(filter_values)]

# Divisions

## List divisions 1

In [26]:
list_divisions(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=0)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
6543,6544,Aquisição de serviços,50000000-5,Serviços de reparação e manutenção
6767,6768,Aquisição de serviços,51000000-9,Serviços de instalação (excepto software)
6877,6878,Aquisição de serviços,55000000-0,"Serviços de hotelaria, restauração e comércio a retalho"
6916,6917,Aquisição de serviços,60000000-8,Serviços de transporte (excl. transporte de resíduos)
6971,6972,Aquisição de serviços,63000000-9,Serviços anexos e auxiliares dos transportes; serviços de agências de viagens
7056,7057,Aquisição de serviços,64000000-6,Serviços postais e de telecomunicações
7111,7112,Aquisição de serviços,65000000-3,Serviços públicos
7128,7129,Aquisição de serviços,66000000-0,Serviços de finanças e seguros
7217,7218,Aquisição de serviços,70000000-1,Serviços imobiliários
7253,7254,Aquisição de serviços,71000000-8,"Serviços de arquitectura, construção, engenharia e inspecção"


In [27]:
lt_divisions_to_eliminate = ['50','51','55','64','66','70','71','72','76','77']
df = remove_cpv_divisions(df, lt_divisions_to_eliminate)

## List divisions 2

In [28]:
list_divisions(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=7841)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
7893,7894,Aquisição de serviços,79000000-4,"Serviços a empresas: direito, comercialização, consultoria, recrutamento, impressão e segurança"
8092,8093,Aquisição de serviços,80000000-4,Serviços de ensino e formação
8147,8148,Aquisição de serviços,85000000-9,Serviços de saúde e acção social
8245,8246,Aquisição de serviços,90000000-7,"Serviços relativos a águas residuais, resíduos, limpeza e ambiente"
8440,8441,Aquisição de serviços,92000000-1,"Serviços recreativos, culturais e desportivos"
8545,8546,Aquisição de serviços,98000000-3,"Outros serviços comunitários, sociais e pessoais"
19264,19850,Outros,60000000-8,Serviços de transporte (excl. transporte de resíduos)
19319,19905,Outros,63000000-9,Serviços anexos e auxiliares dos transportes; serviços de agências de viagens
19459,20045,Outros,65000000-3,Serviços públicos
20037,20623,Outros,73000000-2,Serviços de investigação e desenvolvimento e serviços de consultoria conexos


In [29]:
lt_divisions_to_eliminate = ['90']
df = remove_cpv_divisions(df, lt_divisions_to_eliminate)

## List divisions 3

In [30]:
list_divisions(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=21180)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
20790,21376,Outros,92000000-1,"Serviços recreativos, culturais e desportivos"
20895,21481,Outros,98000000-3,"Outros serviços comunitários, sociais e pessoais"


In [31]:
lt_divisions_to_eliminate = ['92']
df = remove_cpv_divisions(df, lt_divisions_to_eliminate)

# Groups

## List groups 1

In [32]:
list_groups(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=0)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
6916,6917,Aquisição de serviços,60000000-8,Serviços de transporte (excl. transporte de resíduos)
6917,6918,Aquisição de serviços,60100000-9,Serviços de transporte rodoviário
6932,6933,Aquisição de serviços,60200000-0,Serviços de transporte ferroviário
6935,6936,Aquisição de serviços,60300000-1,Serviços de transporte por condutas de longa distância
6936,6937,Aquisição de serviços,60400000-2,Serviços de transporte aéreo
6954,6955,Aquisição de serviços,60500000-3,Serviços de transporte espacial
6957,6958,Aquisição de serviços,60600000-4,Transporte por vias navegáveis
6971,6972,Aquisição de serviços,63000000-9,Serviços anexos e auxiliares dos transportes; serviços de agências de viagens
6972,6973,Aquisição de serviços,63100000-0,Serviços de movimentação e armazenagem de carga
6983,6984,Aquisição de serviços,63500000-4,"Serviços de agências de viagens, de operadores turísticos e de assistência a turistas"


In [33]:
lt_groups_to_eliminate = ['602','603','605','606','631','635']
df = remove_cpv_groups(df, lt_groups_to_eliminate)

## List groups 2

In [34]:
list_groups(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=7112)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
7111,7112,Aquisição de serviços,65000000-3,Serviços públicos
7112,7113,Aquisição de serviços,65100000-4,Serviços de distribuição de água e serviços conexos
7120,7121,Aquisição de serviços,65200000-5,Serviços de distribuição de gás e serviços conexos
7122,7123,Aquisição de serviços,65300000-6,Serviços de distribuição de electricidade e serviços conexos
7125,7126,Aquisição de serviços,65400000-7,Aprovisionamento e distribuição de outras fontes de energia
7127,7128,Aquisição de serviços,65500000-8,Serviços de leitura de contadores
7689,7690,Aquisição de serviços,73000000-2,Serviços de investigação e desenvolvimento e serviços de consultoria conexos
7690,7691,Aquisição de serviços,73100000-3,Serviços de desenvolvimento experimental e de investigação
7695,7696,Aquisição de serviços,73200000-4,Serviços de consultoria em matéria de investigação e desenvolvimento
7698,7699,Aquisição de serviços,73300000-5,Concepção e execução em matéria de investigação e desenvolvimento


In [35]:
lt_divisions_to_eliminate = ['65']
df = remove_cpv_divisions(df, lt_divisions_to_eliminate)
lt_groups_to_eliminate = ['734']
df = remove_cpv_groups(df, lt_groups_to_eliminate)

## List groups 3

In [36]:
list_groups(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=7716)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
7715,7716,Aquisição de serviços,75000000-6,"Serviços relacionados com a administração pública, a defesa e a segurança social"
7716,7717,Aquisição de serviços,75100000-7,Serviços relacionados com a administração pública
7732,7733,Aquisição de serviços,75200000-8,Prestação de serviços à comunidade
7762,7763,Aquisição de serviços,75300000-9,Serviços relacionados com a segurança social obrigatória
7893,7894,Aquisição de serviços,79000000-4,"Serviços a empresas: direito, comercialização, consultoria, recrutamento, impressão e segurança"
7894,7895,Aquisição de serviços,79100000-5,Serviços jurídicos
7907,7908,Aquisição de serviços,79200000-6,"Serviços de contabilidade, de auditoria e fiscais"
7925,7926,Aquisição de serviços,79300000-7,Pesquisa de mercado e económica; sondagem e estatísticas
7956,7957,Aquisição de serviços,79400000-8,Serviços de consultoria em matéria comercial e de gestão e serviços conexos
7977,7978,Aquisição de serviços,79500000-9,Serviços auxiliares de escritório


In [37]:
lt_groups_to_eliminate = ['753','791','792','793','794','795','798','799']
df = remove_cpv_groups(df, lt_groups_to_eliminate)

## List groups 4

In [38]:
list_groups(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=8093)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
8092,8093,Aquisição de serviços,80000000-4,Serviços de ensino e formação
8093,8094,Aquisição de serviços,80100000-5,Serviços de ensino primário
8095,8096,Aquisição de serviços,80200000-6,Serviços de ensino secundário
8099,8100,Aquisição de serviços,80300000-7,Serviços de ensino superior
8104,8105,Aquisição de serviços,80400000-8,Serviços de ensino para adultos e outros serviços relacionados com educação
8116,8117,Aquisição de serviços,80500000-9,Serviços de formação
8140,8141,Aquisição de serviços,80600000-0,Serviços de formação em material de defesa e segurança
8147,8148,Aquisição de serviços,85000000-9,Serviços de saúde e acção social
8148,8149,Aquisição de serviços,85100000-0,Serviços de saúde
8221,8222,Aquisição de serviços,85200000-1,Serviços de veterinária


In [39]:
lt_groups_to_eliminate = ['801','802','804','806','852','853']
df = remove_cpv_groups(df, lt_groups_to_eliminate)

## List groups 5

In [40]:
list_groups(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=8546)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
8545,8546,Aquisição de serviços,98000000-3,"Outros serviços comunitários, sociais e pessoais"
8546,8547,Aquisição de serviços,98100000-4,Serviços das organizações associativas
8559,8560,Aquisição de serviços,98200000-5,Serviços de consultoria para a igualdade de oportunidades
8560,8561,Aquisição de serviços,98300000-6,Serviços diversos
8618,8619,Aquisição de serviços,98500000-8,Residências particulares com empregados domésticos
8628,8629,Aquisição de serviços,98900000-2,Serviços prestados por organizações e entidades extraterritoriais
19264,19850,Outros,60000000-8,Serviços de transporte (excl. transporte de resíduos)
19265,19851,Outros,60100000-9,Serviços de transporte rodoviário
19284,19870,Outros,60400000-2,Serviços de transporte aéreo
19319,19905,Outros,63000000-9,Serviços anexos e auxiliares dos transportes; serviços de agências de viagens


In [41]:
lt_divisions_to_eliminate = ['98']
df = remove_cpv_divisions(df, lt_divisions_to_eliminate)

## List groups 6

In [42]:
list_groups(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=20623)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
20037,20623,Outros,73000000-2,Serviços de investigação e desenvolvimento e serviços de consultoria conexos
20038,20624,Outros,73100000-3,Serviços de desenvolvimento experimental e de investigação
20043,20629,Outros,73200000-4,Serviços de consultoria em matéria de investigação e desenvolvimento
20046,20632,Outros,73300000-5,Concepção e execução em matéria de investigação e desenvolvimento
20063,20649,Outros,75000000-6,"Serviços relacionados com a administração pública, a defesa e a segurança social"
20064,20650,Outros,75100000-7,Serviços relacionados com a administração pública
20080,20666,Outros,75200000-8,Prestação de serviços à comunidade
20241,20827,Outros,79000000-4,"Serviços a empresas: direito, comercialização, consultoria, recrutamento, impressão e segurança"
20340,20926,Outros,79600000-0,Serviços de recrutamento
20357,20943,Outros,79700000-1,Serviços de investigação e segurança


## List groups 7

In [43]:
list_groups(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=21081)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
20495,21081,Outros,85000000-9,Serviços de saúde e acção social
20496,21082,Outros,85100000-0,Serviços de saúde


# Classes

## List classes 1

In [44]:
list_classes(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=0)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
6916,6917,Aquisição de serviços,60000000-8,Serviços de transporte (excl. transporte de resíduos)
6917,6918,Aquisição de serviços,60100000-9,Serviços de transporte rodoviário
6919,6920,Aquisição de serviços,60120000-5,Serviços de táxis
6920,6921,Aquisição de serviços,60130000-8,Serviços de transporte rodoviário de passageiros com finalidade específica
6921,6922,Aquisição de serviços,60140000-1,Transportes não regulares de passageiros
6922,6923,Aquisição de serviços,60150000-4,Transporte de passageiros em veículos de tracção animal
6923,6924,Aquisição de serviços,60160000-7,Transporte rodoviário de correio
6925,6926,Aquisição de serviços,60170000-0,Aluguer de veículos para transporte de passageiros com condutor
6928,6929,Aquisição de serviços,60180000-3,Aluguer de veículos para transporte de mercadorias com condutor
6936,6937,Aquisição de serviços,60400000-2,Serviços de transporte aéreo


In [45]:
lt_classes_to_eliminate = ['6012','6015','6016','6017','6018']
df = remove_cpv_classes(df, lt_classes_to_eliminate)

## List classes 2

In [46]:
list_classes(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=6972)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
6971,6972,Aquisição de serviços,63000000-9,Serviços anexos e auxiliares dos transportes; serviços de agências de viagens
6996,6997,Aquisição de serviços,63700000-6,"Serviços de apoio a transportes por terra, água e ar"
6997,6998,Aquisição de serviços,63710000-9,Serviços auxiliares dos transportes terrestres
7015,7016,Aquisição de serviços,63720000-2,Serviços auxiliares dos transportes por vias navegáveis
7050,7051,Aquisição de serviços,63730000-5,Serviços auxiliares dos transportes aéreos
7689,7690,Aquisição de serviços,73000000-2,Serviços de investigação e desenvolvimento e serviços de consultoria conexos
7690,7691,Aquisição de serviços,73100000-3,Serviços de desenvolvimento experimental e de investigação
7691,7692,Aquisição de serviços,73110000-6,Serviços de investigação
7694,7695,Aquisição de serviços,73120000-9,Serviços de desenvolvimento experimental
7695,7696,Aquisição de serviços,73200000-4,Serviços de consultoria em matéria de investigação e desenvolvimento


## List classes 3

In [47]:
list_classes(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=7716)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
7715,7716,Aquisição de serviços,75000000-6,"Serviços relacionados com a administração pública, a defesa e a segurança social"
7716,7717,Aquisição de serviços,75100000-7,Serviços relacionados com a administração pública
7717,7718,Aquisição de serviços,75110000-0,Serviços públicos gerais
7723,7724,Aquisição de serviços,75120000-3,Serviços administrativos das agências
7729,7730,Aquisição de serviços,75130000-6,Serviços de apoio às entidades governamentais
7732,7733,Aquisição de serviços,75200000-8,Prestação de serviços à comunidade
7733,7734,Aquisição de serviços,75210000-1,Serviços relacionados com os negócios estrangeiros e serviços afins
7739,7740,Aquisição de serviços,75220000-4,Serviços relacionados com a defesa
7742,7743,Aquisição de serviços,75230000-7,Serviços relacionados com a justiça
7750,7751,Aquisição de serviços,75240000-0,Serviços de segurança e ordem pública


In [48]:
lt_classes_to_eliminate = ['7512','7513','7521','7522','7523','7524']
df = remove_cpv_classes(df, lt_classes_to_eliminate)

## List classes 4

In [49]:
list_classes(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=7894)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
7893,7894,Aquisição de serviços,79000000-4,"Serviços a empresas: direito, comercialização, consultoria, recrutamento, impressão e segurança"
7992,7993,Aquisição de serviços,79600000-0,Serviços de recrutamento
7993,7994,Aquisição de serviços,79610000-3,Serviços de colocação de pessoal
7997,7998,Aquisição de serviços,79620000-6,"Serviços de fornecimento de pessoal, inclusive temporário"
8003,8004,Aquisição de serviços,79630000-9,Serviços relacionados com o pessoal excepto serviços de colocação e fornecimento de pessoal
8009,8010,Aquisição de serviços,79700000-1,Serviços de investigação e segurança
8010,8011,Aquisição de serviços,79710000-4,Serviços de segurança
8018,8019,Aquisição de serviços,79720000-7,Serviços de pesquisa e investigação
8092,8093,Aquisição de serviços,80000000-4,Serviços de ensino e formação
8099,8100,Aquisição de serviços,80300000-7,Serviços de ensino superior


In [50]:
lt_classes_to_eliminate = ['7971','8033']
df = remove_cpv_classes(df, lt_classes_to_eliminate)

## List classes 5

In [51]:
list_classes(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=8093)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
8092,8093,Aquisição de serviços,80000000-4,Serviços de ensino e formação
8099,8100,Aquisição de serviços,80300000-7,Serviços de ensino superior
8100,8101,Aquisição de serviços,80310000-0,Serviços de formação de jovens
8101,8102,Aquisição de serviços,80320000-3,Serviços de ensino médico
8103,8104,Aquisição de serviços,80340000-9,Serviços de ensino especial
8116,8117,Aquisição de serviços,80500000-9,Serviços de formação
8117,8118,Aquisição de serviços,80510000-2,Serviços de formação especializada
8121,8122,Aquisição de serviços,80520000-5,Instalações para formação
8124,8125,Aquisição de serviços,80530000-8,Serviços de formação profissional
8132,8133,Aquisição de serviços,80540000-1,Serviços de formação em matéria de ambiente


In [52]:
lt_classes_to_eliminate = ['8052','8054','8055','8058','8059']
df = remove_cpv_classes(df, lt_classes_to_eliminate)

## List classes 6

In [53]:
list_classes(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=8117)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
8116,8117,Aquisição de serviços,80500000-9,Serviços de formação
8117,8118,Aquisição de serviços,80510000-2,Serviços de formação especializada
8124,8125,Aquisição de serviços,80530000-8,Serviços de formação profissional
8134,8135,Aquisição de serviços,80560000-7,Serviços de formação em matéria de saúde e primeiros socorros
8137,8138,Aquisição de serviços,80570000-0,Serviços de formação para aperfeiçoamento pessoal
8147,8148,Aquisição de serviços,85000000-9,Serviços de saúde e acção social
8148,8149,Aquisição de serviços,85100000-0,Serviços de saúde
8149,8150,Aquisição de serviços,85110000-3,Serviços hospitalares e afins
8167,8168,Aquisição de serviços,85120000-6,Serviços de prática médica e serviços conexos
8190,8191,Aquisição de serviços,85130000-9,Serviços de medicina dentária e serviços conexos


## List classes 7

In [54]:
list_classes(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=19850)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
19264,19850,Outros,60000000-8,Serviços de transporte (excl. transporte de resíduos)
19265,19851,Outros,60100000-9,Serviços de transporte rodoviário
19268,19854,Outros,60130000-8,Serviços de transporte rodoviário de passageiros com finalidade específica
19269,19855,Outros,60140000-1,Transportes não regulares de passageiros
19284,19870,Outros,60400000-2,Serviços de transporte aéreo
19285,19871,Outros,60410000-5,Serviços de transporte aéreo regular
19287,19873,Outros,60420000-8,Serviços de transporte aéreo não regular
19294,19880,Outros,60440000-4,Serviços aéreos e afins
19319,19905,Outros,63000000-9,Serviços anexos e auxiliares dos transportes; serviços de agências de viagens
19344,19930,Outros,63700000-6,"Serviços de apoio a transportes por terra, água e ar"


## List classes 8

In [55]:
list_classes(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=20623)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
20037,20623,Outros,73000000-2,Serviços de investigação e desenvolvimento e serviços de consultoria conexos
20038,20624,Outros,73100000-3,Serviços de desenvolvimento experimental e de investigação
20039,20625,Outros,73110000-6,Serviços de investigação
20042,20628,Outros,73120000-9,Serviços de desenvolvimento experimental
20043,20629,Outros,73200000-4,Serviços de consultoria em matéria de investigação e desenvolvimento
20044,20630,Outros,73210000-7,Serviços de consultoria em matéria de investigação
20045,20631,Outros,73220000-0,Serviços de consultoria em matéria de desenvolvimento
20046,20632,Outros,73300000-5,Concepção e execução em matéria de investigação e desenvolvimento
20063,20649,Outros,75000000-6,"Serviços relacionados com a administração pública, a defesa e a segurança social"
20064,20650,Outros,75100000-7,Serviços relacionados com a administração pública


## List classes 9

In [56]:
list_classes(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=20827)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
20241,20827,Outros,79000000-4,"Serviços a empresas: direito, comercialização, consultoria, recrutamento, impressão e segurança"
20340,20926,Outros,79600000-0,Serviços de recrutamento
20341,20927,Outros,79610000-3,Serviços de colocação de pessoal
20345,20931,Outros,79620000-6,"Serviços de fornecimento de pessoal, inclusive temporário"
20351,20937,Outros,79630000-9,Serviços relacionados com o pessoal excepto serviços de colocação e fornecimento de pessoal
20357,20943,Outros,79700000-1,Serviços de investigação e segurança
20366,20952,Outros,79720000-7,Serviços de pesquisa e investigação
20440,21026,Outros,80000000-4,Serviços de ensino e formação
20447,21033,Outros,80300000-7,Serviços de ensino superior
20448,21034,Outros,80310000-0,Serviços de formação de jovens


## List classes 10

In [57]:
list_classes(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=21050)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
20464,21050,Outros,80500000-9,Serviços de formação
20465,21051,Outros,80510000-2,Serviços de formação especializada
20472,21058,Outros,80530000-8,Serviços de formação profissional
20482,21068,Outros,80560000-7,Serviços de formação em matéria de saúde e primeiros socorros
20485,21071,Outros,80570000-0,Serviços de formação para aperfeiçoamento pessoal
20495,21081,Outros,85000000-9,Serviços de saúde e acção social
20496,21082,Outros,85100000-0,Serviços de saúde
20497,21083,Outros,85110000-3,Serviços hospitalares e afins
20515,21101,Outros,85120000-6,Serviços de prática médica e serviços conexos
20538,21124,Outros,85130000-9,Serviços de medicina dentária e serviços conexos


## List classes 11

In [58]:
list_classes(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=21081)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
20495,21081,Outros,85000000-9,Serviços de saúde e acção social
20496,21082,Outros,85100000-0,Serviços de saúde
20497,21083,Outros,85110000-3,Serviços hospitalares e afins
20515,21101,Outros,85120000-6,Serviços de prática médica e serviços conexos
20538,21124,Outros,85130000-9,Serviços de medicina dentária e serviços conexos
20542,21128,Outros,85140000-2,Serviços de saúde diversos
20564,21150,Outros,85150000-5,Serviços de imagiologia médica
20565,21151,Outros,85160000-8,Serviços de óptica
20566,21152,Outros,85170000-1,Serviços de acupunctura e quiropraxia


# Categories

## List categories 1

In [59]:
list_categories(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=0)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
6916,6917,Aquisição de serviços,60000000-8,Serviços de transporte (excl. transporte de resíduos)
6917,6918,Aquisição de serviços,60100000-9,Serviços de transporte rodoviário
6918,6919,Aquisição de serviços,60112000-6,Serviços de transporte público rodoviário
6920,6921,Aquisição de serviços,60130000-8,Serviços de transporte rodoviário de passageiros com finalidade específica
6921,6922,Aquisição de serviços,60140000-1,Transportes não regulares de passageiros
6936,6937,Aquisição de serviços,60400000-2,Serviços de transporte aéreo
6937,6938,Aquisição de serviços,60410000-5,Serviços de transporte aéreo regular
6938,6939,Aquisição de serviços,60411000-2,Serviços de transporte de correio aéreo regular
6939,6940,Aquisição de serviços,60420000-8,Serviços de transporte aéreo não regular
6940,6941,Aquisição de serviços,60421000-5,Serviços de transporte de correio aéreo não regular


In [60]:
lt_groups_to_eliminate = ['601']
df = remove_cpv_groups(df, lt_groups_to_eliminate)
lt_classes_to_eliminate = ['6011','6013','6041']
df = remove_cpv_classes(df, lt_classes_to_eliminate)
lt_categories_to_eliminate = ['60421','60423']
df = remove_cpv_categories(df, lt_categories_to_eliminate)

## List categories 2

In [61]:
list_categories(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=0)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
6916,6917,Aquisição de serviços,60000000-8,Serviços de transporte (excl. transporte de resíduos)
6936,6937,Aquisição de serviços,60400000-2,Serviços de transporte aéreo
6939,6940,Aquisição de serviços,60420000-8,Serviços de transporte aéreo não regular
6942,6943,Aquisição de serviços,60424000-6,"Aluguer de equipamento para transporte aéreo, com tripulação"
6946,6947,Aquisição de serviços,60440000-4,Serviços aéreos e afins
6947,6948,Aquisição de serviços,60441000-1,Serviços de pulverização aérea
6948,6949,Aquisição de serviços,60442000-8,Serviços aéreos de combate a incêndios florestais
6949,6950,Aquisição de serviços,60443000-5,Serviços de socorro aéreo
6951,6952,Aquisição de serviços,60444000-2,Serviços de operação de aeronaves
6953,6954,Aquisição de serviços,60445000-9,Serviços de exploração de aeronaves


In [62]:
lt_categories_to_eliminate = ['60441','60442','60444','60445','63721','63711']
df = remove_cpv_categories(df, lt_categories_to_eliminate)

## List categories 3

In [63]:
list_categories(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=0)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
6916,6917,Aquisição de serviços,60000000-8,Serviços de transporte (excl. transporte de resíduos)
6936,6937,Aquisição de serviços,60400000-2,Serviços de transporte aéreo
6939,6940,Aquisição de serviços,60420000-8,Serviços de transporte aéreo não regular
6942,6943,Aquisição de serviços,60424000-6,"Aluguer de equipamento para transporte aéreo, com tripulação"
6946,6947,Aquisição de serviços,60440000-4,Serviços aéreos e afins
6949,6950,Aquisição de serviços,60443000-5,Serviços de socorro aéreo
6971,6972,Aquisição de serviços,63000000-9,Serviços anexos e auxiliares dos transportes; serviços de agências de viagens
6996,6997,Aquisição de serviços,63700000-6,"Serviços de apoio a transportes por terra, água e ar"
6997,6998,Aquisição de serviços,63710000-9,Serviços auxiliares dos transportes terrestres
7001,7002,Aquisição de serviços,63712000-3,Serviços auxiliares dos transportes rodoviários


In [64]:
lt_classes_to_eliminate = ['6042','6371']
df = remove_cpv_classes(df, lt_classes_to_eliminate)

## List categories 4

In [65]:
list_categories(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=6972)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
6971,6972,Aquisição de serviços,63000000-9,Serviços anexos e auxiliares dos transportes; serviços de agências de viagens
6996,6997,Aquisição de serviços,63700000-6,"Serviços de apoio a transportes por terra, água e ar"
7015,7016,Aquisição de serviços,63720000-2,Serviços auxiliares dos transportes por vias navegáveis
7022,7023,Aquisição de serviços,63722000-6,Serviços de pilotagem de navios
7023,7024,Aquisição de serviços,63723000-3,Serviços de acostagem
7024,7025,Aquisição de serviços,63724000-0,Serviços de navegação
7031,7032,Aquisição de serviços,63725000-7,Serviços de salvamento e de reflutuação
7035,7036,Aquisição de serviços,63726000-4,Serviços diversos auxiliares dos transportes por vias navegáveis
7047,7048,Aquisição de serviços,63727000-1,Serviços de reboque e tracção de barcos
7050,7051,Aquisição de serviços,63730000-5,Serviços auxiliares dos transportes aéreos


In [66]:
lt_divisions_to_eliminate = ['63']
df = remove_cpv_divisions(df, lt_divisions_to_eliminate)

## List categories 5

In [67]:
list_categories(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=7690)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
7689,7690,Aquisição de serviços,73000000-2,Serviços de investigação e desenvolvimento e serviços de consultoria conexos
7690,7691,Aquisição de serviços,73100000-3,Serviços de desenvolvimento experimental e de investigação
7691,7692,Aquisição de serviços,73110000-6,Serviços de investigação
7692,7693,Aquisição de serviços,73111000-3,Serviços relacionados com laboratórios de investigação
7693,7694,Aquisição de serviços,73112000-0,Serviços de investigação marinha
7694,7695,Aquisição de serviços,73120000-9,Serviços de desenvolvimento experimental
7695,7696,Aquisição de serviços,73200000-4,Serviços de consultoria em matéria de investigação e desenvolvimento
7696,7697,Aquisição de serviços,73210000-7,Serviços de consultoria em matéria de investigação
7697,7698,Aquisição de serviços,73220000-0,Serviços de consultoria em matéria de desenvolvimento
7698,7699,Aquisição de serviços,73300000-5,Concepção e execução em matéria de investigação e desenvolvimento


In [68]:
lt_categories_to_eliminate = ['73112']
df = remove_cpv_categories(df, lt_categories_to_eliminate)

## List categories 6

In [69]:
list_categories(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=7716)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
7715,7716,Aquisição de serviços,75000000-6,"Serviços relacionados com a administração pública, a defesa e a segurança social"
7716,7717,Aquisição de serviços,75100000-7,Serviços relacionados com a administração pública
7717,7718,Aquisição de serviços,75110000-0,Serviços públicos gerais
7718,7719,Aquisição de serviços,75111000-7,Serviços executivos e legislativos
7721,7722,Aquisição de serviços,75112000-4,Serviços administrativos relacionados com actividades comerciais
7732,7733,Aquisição de serviços,75200000-8,Prestação de serviços à comunidade
7756,7757,Aquisição de serviços,75250000-3,Serviços de socorro e de incêndios
7757,7758,Aquisição de serviços,75251000-0,Serviços de incêndios
7761,7762,Aquisição de serviços,75252000-7,Serviços de socorro
7893,7894,Aquisição de serviços,79000000-4,"Serviços a empresas: direito, comercialização, consultoria, recrutamento, impressão e segurança"


In [70]:
lt_classes_to_eliminate = ['7511']
df = remove_cpv_classes(df, lt_classes_to_eliminate)
lt_categories_to_eliminate = ['75251','79611','79612','79613']
df = remove_cpv_categories(df, lt_categories_to_eliminate)

## List categories 7

In [71]:
list_categories(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=7894)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
7893,7894,Aquisição de serviços,79000000-4,"Serviços a empresas: direito, comercialização, consultoria, recrutamento, impressão e segurança"
7992,7993,Aquisição de serviços,79600000-0,Serviços de recrutamento
7993,7994,Aquisição de serviços,79610000-3,Serviços de colocação de pessoal
7997,7998,Aquisição de serviços,79620000-6,"Serviços de fornecimento de pessoal, inclusive temporário"
7998,7999,Aquisição de serviços,79621000-3,Serviços de fornecimento de pessoal de escritório
7999,8000,Aquisição de serviços,79622000-0,Serviços de fornecimento de pessoal auxiliar doméstico
8000,8001,Aquisição de serviços,79623000-7,Serviços de fornecimento de trabalhadores para comércio ou indústria
8001,8002,Aquisição de serviços,79624000-4,Serviços de fornecimento de pessoal de enfermagem
8002,8003,Aquisição de serviços,79625000-1,Serviços de fornecimento de pessoal médico
8003,8004,Aquisição de serviços,79630000-9,Serviços relacionados com o pessoal excepto serviços de colocação e fornecimento de pessoal


In [72]:
lt_categories_to_eliminate = ['79621','79622','79623','79631','79634']
df = remove_cpv_categories(df, lt_categories_to_eliminate)

## List categories 8

In [73]:
list_categories(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=7894)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
7893,7894,Aquisição de serviços,79000000-4,"Serviços a empresas: direito, comercialização, consultoria, recrutamento, impressão e segurança"
7992,7993,Aquisição de serviços,79600000-0,Serviços de recrutamento
7993,7994,Aquisição de serviços,79610000-3,Serviços de colocação de pessoal
7997,7998,Aquisição de serviços,79620000-6,"Serviços de fornecimento de pessoal, inclusive temporário"
8001,8002,Aquisição de serviços,79624000-4,Serviços de fornecimento de pessoal de enfermagem
8002,8003,Aquisição de serviços,79625000-1,Serviços de fornecimento de pessoal médico
8003,8004,Aquisição de serviços,79630000-9,Serviços relacionados com o pessoal excepto serviços de colocação e fornecimento de pessoal
8005,8006,Aquisição de serviços,79632000-3,Serviços de formação de pessoal
8006,8007,Aquisição de serviços,79633000-0,Serviços de desenvolvimento do pessoal
8008,8009,Aquisição de serviços,79635000-4,Serviços de avaliação para recrutamento


In [74]:
lt_categories_to_eliminate = ['79721','79722','79723']
df = remove_cpv_categories(df, lt_categories_to_eliminate)

## List categories 9

In [75]:
list_categories(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=8010)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
8009,8010,Aquisição de serviços,79700000-1,Serviços de investigação e segurança
8018,8019,Aquisição de serviços,79720000-7,Serviços de pesquisa e investigação
8092,8093,Aquisição de serviços,80000000-4,Serviços de ensino e formação
8099,8100,Aquisição de serviços,80300000-7,Serviços de ensino superior
8100,8101,Aquisição de serviços,80310000-0,Serviços de formação de jovens
8101,8102,Aquisição de serviços,80320000-3,Serviços de ensino médico
8103,8104,Aquisição de serviços,80340000-9,Serviços de ensino especial
8116,8117,Aquisição de serviços,80500000-9,Serviços de formação
8117,8118,Aquisição de serviços,80510000-2,Serviços de formação especializada
8118,8119,Aquisição de serviços,80511000-9,Serviços de formação de quadros


In [76]:
lt_categories_to_eliminate = ['80512','80513','80531','80532']
df = remove_cpv_categories(df, lt_categories_to_eliminate)

## List categories 10

In [77]:
list_categories(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=8117)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
8116,8117,Aquisição de serviços,80500000-9,Serviços de formação
8117,8118,Aquisição de serviços,80510000-2,Serviços de formação especializada
8118,8119,Aquisição de serviços,80511000-9,Serviços de formação de quadros
8124,8125,Aquisição de serviços,80530000-8,Serviços de formação profissional
8129,8130,Aquisição de serviços,80533000-9,Serviços de familiarização e formação para o utilizador de informática
8134,8135,Aquisição de serviços,80560000-7,Serviços de formação em matéria de saúde e primeiros socorros
8135,8136,Aquisição de serviços,80561000-4,Serviços de formação em matéria de saúde
8136,8137,Aquisição de serviços,80562000-1,Serviços de formação em matéria de primeiros socorros
8137,8138,Aquisição de serviços,80570000-0,Serviços de formação para aperfeiçoamento pessoal
8147,8148,Aquisição de serviços,85000000-9,Serviços de saúde e acção social


In [78]:
lt_classes_to_eliminate = ['8053']
df = remove_cpv_classes(df, lt_classes_to_eliminate)

## List categories 11

In [79]:
list_categories(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=8148)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
8147,8148,Aquisição de serviços,85000000-9,Serviços de saúde e acção social
8148,8149,Aquisição de serviços,85100000-0,Serviços de saúde
8149,8150,Aquisição de serviços,85110000-3,Serviços hospitalares e afins
8150,8151,Aquisição de serviços,85111000-0,Serviços hospitalares
8164,8165,Aquisição de serviços,85112000-7,Serviços de assistência hospitalar
8167,8168,Aquisição de serviços,85120000-6,Serviços de prática médica e serviços conexos
8168,8169,Aquisição de serviços,85121000-3,Serviços de prática médica
8190,8191,Aquisição de serviços,85130000-9,Serviços de medicina dentária e serviços conexos
8191,8192,Aquisição de serviços,85131000-6,Serviços de medicina dentária
8194,8195,Aquisição de serviços,85140000-2,Serviços de saúde diversos


## List categories 12

In [80]:
list_categories(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=8210)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
8209,8210,Aquisição de serviços,85145000-7,Serviços prestados por laboratórios médicos
8210,8211,Aquisição de serviços,85146000-4,Serviços prestados por bancos de sangue
8213,8214,Aquisição de serviços,85147000-1,Serviços de medicina do trabalho
8214,8215,Aquisição de serviços,85148000-8,Serviços de análises clínicas
8215,8216,Aquisição de serviços,85149000-5,Serviços farmacêuticos
8216,8217,Aquisição de serviços,85150000-5,Serviços de imagiologia médica
8217,8218,Aquisição de serviços,85160000-8,Serviços de óptica
8218,8219,Aquisição de serviços,85170000-1,Serviços de acupunctura e quiropraxia
8219,8220,Aquisição de serviços,85171000-8,Serviços de acupunctura
8220,8221,Aquisição de serviços,85172000-5,Serviços de quiropraxia


## List categories 13

In [81]:
list_categories(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=20623)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
20037,20623,Outros,73000000-2,Serviços de investigação e desenvolvimento e serviços de consultoria conexos
20038,20624,Outros,73100000-3,Serviços de desenvolvimento experimental e de investigação
20039,20625,Outros,73110000-6,Serviços de investigação
20040,20626,Outros,73111000-3,Serviços relacionados com laboratórios de investigação
20042,20628,Outros,73120000-9,Serviços de desenvolvimento experimental
20043,20629,Outros,73200000-4,Serviços de consultoria em matéria de investigação e desenvolvimento
20044,20630,Outros,73210000-7,Serviços de consultoria em matéria de investigação
20045,20631,Outros,73220000-0,Serviços de consultoria em matéria de desenvolvimento
20046,20632,Outros,73300000-5,Concepção e execução em matéria de investigação e desenvolvimento
20063,20649,Outros,75000000-6,"Serviços relacionados com a administração pública, a defesa e a segurança social"


## List categories 14

In [82]:
list_categories(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=20827)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
20241,20827,Outros,79000000-4,"Serviços a empresas: direito, comercialização, consultoria, recrutamento, impressão e segurança"
20340,20926,Outros,79600000-0,Serviços de recrutamento
20341,20927,Outros,79610000-3,Serviços de colocação de pessoal
20345,20931,Outros,79620000-6,"Serviços de fornecimento de pessoal, inclusive temporário"
20349,20935,Outros,79624000-4,Serviços de fornecimento de pessoal de enfermagem
20350,20936,Outros,79625000-1,Serviços de fornecimento de pessoal médico
20351,20937,Outros,79630000-9,Serviços relacionados com o pessoal excepto serviços de colocação e fornecimento de pessoal
20353,20939,Outros,79632000-3,Serviços de formação de pessoal
20354,20940,Outros,79633000-0,Serviços de desenvolvimento do pessoal
20356,20942,Outros,79635000-4,Serviços de avaliação para recrutamento


## List categories 15

In [83]:
list_categories(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=21034)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
20448,21034,Outros,80310000-0,Serviços de formação de jovens
20449,21035,Outros,80320000-3,Serviços de ensino médico
20451,21037,Outros,80340000-9,Serviços de ensino especial
20464,21050,Outros,80500000-9,Serviços de formação
20465,21051,Outros,80510000-2,Serviços de formação especializada
20466,21052,Outros,80511000-9,Serviços de formação de quadros
20482,21068,Outros,80560000-7,Serviços de formação em matéria de saúde e primeiros socorros
20483,21069,Outros,80561000-4,Serviços de formação em matéria de saúde
20484,21070,Outros,80562000-1,Serviços de formação em matéria de primeiros socorros
20485,21071,Outros,80570000-0,Serviços de formação para aperfeiçoamento pessoal


## List categories 16

In [84]:
list_categories(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=21081)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
20495,21081,Outros,85000000-9,Serviços de saúde e acção social
20496,21082,Outros,85100000-0,Serviços de saúde
20497,21083,Outros,85110000-3,Serviços hospitalares e afins
20498,21084,Outros,85111000-0,Serviços hospitalares
20512,21098,Outros,85112000-7,Serviços de assistência hospitalar
20515,21101,Outros,85120000-6,Serviços de prática médica e serviços conexos
20516,21102,Outros,85121000-3,Serviços de prática médica
20538,21124,Outros,85130000-9,Serviços de medicina dentária e serviços conexos
20539,21125,Outros,85131000-6,Serviços de medicina dentária
20542,21128,Outros,85140000-2,Serviços de saúde diversos


## List categories 17

In [85]:
list_categories(df,15,['ID','Tipo de Contrato','CPVcode','CPVdescription'],id_start=21143)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
20557,21143,Outros,85145000-7,Serviços prestados por laboratórios médicos
20558,21144,Outros,85146000-4,Serviços prestados por bancos de sangue
20561,21147,Outros,85147000-1,Serviços de medicina do trabalho
20562,21148,Outros,85148000-8,Serviços de análises clínicas
20563,21149,Outros,85149000-5,Serviços farmacêuticos
20564,21150,Outros,85150000-5,Serviços de imagiologia médica
20565,21151,Outros,85160000-8,Serviços de óptica
20566,21152,Outros,85170000-1,Serviços de acupunctura e quiropraxia
20567,21153,Outros,85171000-8,Serviços de acupunctura
20568,21154,Outros,85172000-5,Serviços de quiropraxia


# Verify all list

In [86]:
print("Total number of rows:", len(df))

Total number of rows: 234


In [87]:
list_rows(df, number_of_rows=15, columns_to_display=['ID','Tipo de Contrato','CPVcode','CPVdescription'], id_start=0)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
6916,6917,Aquisição de serviços,60000000-8,Serviços de transporte (excl. transporte de resíduos)
6936,6937,Aquisição de serviços,60400000-2,Serviços de transporte aéreo
6946,6947,Aquisição de serviços,60440000-4,Serviços aéreos e afins
6949,6950,Aquisição de serviços,60443000-5,Serviços de socorro aéreo
6950,6951,Aquisição de serviços,60443100-6,Serviços de socorro aero-naval
7689,7690,Aquisição de serviços,73000000-2,Serviços de investigação e desenvolvimento e serviços de consultoria conexos
7690,7691,Aquisição de serviços,73100000-3,Serviços de desenvolvimento experimental e de investigação
7691,7692,Aquisição de serviços,73110000-6,Serviços de investigação
7692,7693,Aquisição de serviços,73111000-3,Serviços relacionados com laboratórios de investigação
7694,7695,Aquisição de serviços,73120000-9,Serviços de desenvolvimento experimental


In [88]:
lt_divisions_to_eliminate = ['60']
df = remove_cpv_divisions(df, lt_divisions_to_eliminate)

In [89]:
list_rows(df, number_of_rows=15, columns_to_display=['ID','Tipo de Contrato','CPVcode','CPVdescription'], id_start=7716)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
7715,7716,Aquisição de serviços,75000000-6,"Serviços relacionados com a administração pública, a defesa e a segurança social"
7716,7717,Aquisição de serviços,75100000-7,Serviços relacionados com a administração pública
7732,7733,Aquisição de serviços,75200000-8,Prestação de serviços à comunidade
7756,7757,Aquisição de serviços,75250000-3,Serviços de socorro e de incêndios
7761,7762,Aquisição de serviços,75252000-7,Serviços de socorro
7893,7894,Aquisição de serviços,79000000-4,"Serviços a empresas: direito, comercialização, consultoria, recrutamento, impressão e segurança"
7992,7993,Aquisição de serviços,79600000-0,Serviços de recrutamento
7993,7994,Aquisição de serviços,79610000-3,Serviços de colocação de pessoal
7997,7998,Aquisição de serviços,79620000-6,"Serviços de fornecimento de pessoal, inclusive temporário"
8001,8002,Aquisição de serviços,79624000-4,Serviços de fornecimento de pessoal de enfermagem


In [90]:
list_rows(df, number_of_rows=15, columns_to_display=['ID','Tipo de Contrato','CPVcode','CPVdescription'], id_start=7894)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
7893,7894,Aquisição de serviços,79000000-4,"Serviços a empresas: direito, comercialização, consultoria, recrutamento, impressão e segurança"
7992,7993,Aquisição de serviços,79600000-0,Serviços de recrutamento
7993,7994,Aquisição de serviços,79610000-3,Serviços de colocação de pessoal
7997,7998,Aquisição de serviços,79620000-6,"Serviços de fornecimento de pessoal, inclusive temporário"
8001,8002,Aquisição de serviços,79624000-4,Serviços de fornecimento de pessoal de enfermagem
8002,8003,Aquisição de serviços,79625000-1,Serviços de fornecimento de pessoal médico
8003,8004,Aquisição de serviços,79630000-9,Serviços relacionados com o pessoal excepto serviços de colocação e fornecimento de pessoal
8005,8006,Aquisição de serviços,79632000-3,Serviços de formação de pessoal
8006,8007,Aquisição de serviços,79633000-0,Serviços de desenvolvimento do pessoal
8008,8009,Aquisição de serviços,79635000-4,Serviços de avaliação para recrutamento


In [91]:
list_rows(df, number_of_rows=15, columns_to_display=['ID','Tipo de Contrato','CPVcode','CPVdescription'], id_start=8093)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
8092,8093,Aquisição de serviços,80000000-4,Serviços de ensino e formação
8099,8100,Aquisição de serviços,80300000-7,Serviços de ensino superior
8100,8101,Aquisição de serviços,80310000-0,Serviços de formação de jovens
8101,8102,Aquisição de serviços,80320000-3,Serviços de ensino médico
8103,8104,Aquisição de serviços,80340000-9,Serviços de ensino especial
8116,8117,Aquisição de serviços,80500000-9,Serviços de formação
8117,8118,Aquisição de serviços,80510000-2,Serviços de formação especializada
8118,8119,Aquisição de serviços,80511000-9,Serviços de formação de quadros
8134,8135,Aquisição de serviços,80560000-7,Serviços de formação em matéria de saúde e primeiros socorros
8135,8136,Aquisição de serviços,80561000-4,Serviços de formação em matéria de saúde


In [92]:
list_rows(df, number_of_rows=15, columns_to_display=['ID','Tipo de Contrato','CPVcode','CPVdescription'], id_start=8117)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
8116,8117,Aquisição de serviços,80500000-9,Serviços de formação
8117,8118,Aquisição de serviços,80510000-2,Serviços de formação especializada
8118,8119,Aquisição de serviços,80511000-9,Serviços de formação de quadros
8134,8135,Aquisição de serviços,80560000-7,Serviços de formação em matéria de saúde e primeiros socorros
8135,8136,Aquisição de serviços,80561000-4,Serviços de formação em matéria de saúde
8136,8137,Aquisição de serviços,80562000-1,Serviços de formação em matéria de primeiros socorros
8137,8138,Aquisição de serviços,80570000-0,Serviços de formação para aperfeiçoamento pessoal
8147,8148,Aquisição de serviços,85000000-9,Serviços de saúde e acção social
8148,8149,Aquisição de serviços,85100000-0,Serviços de saúde
8149,8150,Aquisição de serviços,85110000-3,Serviços hospitalares e afins


In [93]:
list_rows(df, number_of_rows=15, columns_to_display=['ID','Tipo de Contrato','CPVcode','CPVdescription'], id_start=8156)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
8155,8156,Aquisição de serviços,85111320-9,Serviços hospitalares de obstetrícia
8156,8157,Aquisição de serviços,85111400-4,Serviços hospitalares de reabilitação
8157,8158,Aquisição de serviços,85111500-5,Serviços hospitalares de psiquiatria
8158,8159,Aquisição de serviços,85111600-6,Serviços de ortoterapia
8159,8160,Aquisição de serviços,85111700-7,Serviços de oxigenoterapia
8160,8161,Aquisição de serviços,85111800-8,Serviços de patologia
8161,8162,Aquisição de serviços,85111810-1,Serviços de análise sanguínea
8162,8163,Aquisição de serviços,85111820-4,Serviços de análise bacteriológica
8163,8164,Aquisição de serviços,85111900-9,Serviços de diálise hospitalar
8164,8165,Aquisição de serviços,85112000-7,Serviços de assistência hospitalar


In [94]:
df = df[df['ID'] != 8166]

In [95]:
list_rows(df, number_of_rows=15, columns_to_display=['ID','Tipo de Contrato','CPVcode','CPVdescription'], id_start=8170)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
8169,8170,Aquisição de serviços,85121100-4,Serviços de médicos de clínica geral
8170,8171,Aquisição de serviços,85121200-5,Serviços de medicina especializada
8171,8172,Aquisição de serviços,85121210-8,Serviços de ginecologia ou obstetrícia
8172,8173,Aquisição de serviços,85121220-1,Serviços especializados de nefrologia ou do sistema nervoso
8173,8174,Aquisição de serviços,85121230-4,Serviços de cardiologia ou serviços especializados pulmonares
8174,8175,Aquisição de serviços,85121231-1,Serviços de cardiologia
8175,8176,Aquisição de serviços,85121232-8,Serviços especializados pulmonares
8176,8177,Aquisição de serviços,85121240-7,Serviços de otorrinolaringologia ou audiologia
8177,8178,Aquisição de serviços,85121250-0,Serviços de gastroenterologia e geriatria
8178,8179,Aquisição de serviços,85121251-7,Serviços de gastroenterologia


In [96]:
list_rows(df, number_of_rows=15, columns_to_display=['ID','Tipo de Contrato','CPVcode','CPVdescription'], id_start=8184)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
8183,8184,Aquisição de serviços,85121281-6,Serviços de oftalmologia
8184,8185,Aquisição de serviços,85121282-3,Serviços de dermatologia
8185,8186,Aquisição de serviços,85121283-0,Serviços de ortopedia
8186,8187,Aquisição de serviços,85121290-2,Serviços de pediatria ou urologia
8187,8188,Aquisição de serviços,85121291-9,Serviços de pediatria
8188,8189,Aquisição de serviços,85121292-6,Serviços de urologia
8189,8190,Aquisição de serviços,85121300-6,Serviços de cirurgia especializada
8190,8191,Aquisição de serviços,85130000-9,Serviços de medicina dentária e serviços conexos
8191,8192,Aquisição de serviços,85131000-6,Serviços de medicina dentária
8192,8193,Aquisição de serviços,85131100-7,Serviços de ortodôncia


In [97]:
list_rows(df, number_of_rows=15, columns_to_display=['ID','Tipo de Contrato','CPVcode','CPVdescription'], id_start=8198)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
8197,8198,Aquisição de serviços,85141200-1,Serviços prestados pelo pessoal de enfermagem
8198,8199,Aquisição de serviços,85141210-4,Serviços de tratamento médico ao domicílio
8199,8200,Aquisição de serviços,85141211-1,Serviços de diálise ao domicílio
8200,8201,Aquisição de serviços,85141220-7,Serviços de assessoria prestados pelo pessoal de enfermagem
8201,8202,Aquisição de serviços,85142000-6,Serviços paramédicos
8202,8203,Aquisição de serviços,85142100-7,Serviços de fisioterapia
8203,8204,Aquisição de serviços,85142200-8,Serviços de homeopatia
8204,8205,Aquisição de serviços,85142300-9,Serviços de higiene
8205,8206,Aquisição de serviços,85142400-0,Entrega ao domicílio de produtos para incontinência
8206,8207,Aquisição de serviços,85143000-3,Serviços de ambulâncias


In [98]:
df = df[df['ID'] != 8206]

In [99]:
list_rows(df, number_of_rows=15, columns_to_display=['ID','Tipo de Contrato','CPVcode','CPVdescription'], id_start=8213)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
8212,8213,Aquisição de serviços,85146200-6,Serviços prestados por bancos de órgãos
8213,8214,Aquisição de serviços,85147000-1,Serviços de medicina do trabalho
8214,8215,Aquisição de serviços,85148000-8,Serviços de análises clínicas
8215,8216,Aquisição de serviços,85149000-5,Serviços farmacêuticos
8216,8217,Aquisição de serviços,85150000-5,Serviços de imagiologia médica
8217,8218,Aquisição de serviços,85160000-8,Serviços de óptica
8218,8219,Aquisição de serviços,85170000-1,Serviços de acupunctura e quiropraxia
8219,8220,Aquisição de serviços,85171000-8,Serviços de acupunctura
8220,8221,Aquisição de serviços,85172000-5,Serviços de quiropraxia
20037,20623,Outros,73000000-2,Serviços de investigação e desenvolvimento e serviços de consultoria conexos


In [100]:
list_rows(df, number_of_rows=15, columns_to_display=['ID','Tipo de Contrato','CPVcode','CPVdescription'], id_start=20630)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
20044,20630,Outros,73210000-7,Serviços de consultoria em matéria de investigação
20045,20631,Outros,73220000-0,Serviços de consultoria em matéria de desenvolvimento
20046,20632,Outros,73300000-5,Concepção e execução em matéria de investigação e desenvolvimento
20063,20649,Outros,75000000-6,"Serviços relacionados com a administração pública, a defesa e a segurança social"
20064,20650,Outros,75100000-7,Serviços relacionados com a administração pública
20080,20666,Outros,75200000-8,Prestação de serviços à comunidade
20104,20690,Outros,75250000-3,Serviços de socorro e de incêndios
20109,20695,Outros,75252000-7,Serviços de socorro
20241,20827,Outros,79000000-4,"Serviços a empresas: direito, comercialização, consultoria, recrutamento, impressão e segurança"
20340,20926,Outros,79600000-0,Serviços de recrutamento


In [101]:
list_rows(df, number_of_rows=15, columns_to_display=['ID','Tipo de Contrato','CPVcode','CPVdescription'], id_start=20937)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
20351,20937,Outros,79630000-9,Serviços relacionados com o pessoal excepto serviços de colocação e fornecimento de pessoal
20353,20939,Outros,79632000-3,Serviços de formação de pessoal
20354,20940,Outros,79633000-0,Serviços de desenvolvimento do pessoal
20356,20942,Outros,79635000-4,Serviços de avaliação para recrutamento
20357,20943,Outros,79700000-1,Serviços de investigação e segurança
20366,20952,Outros,79720000-7,Serviços de pesquisa e investigação
20440,21026,Outros,80000000-4,Serviços de ensino e formação
20447,21033,Outros,80300000-7,Serviços de ensino superior
20448,21034,Outros,80310000-0,Serviços de formação de jovens
20449,21035,Outros,80320000-3,Serviços de ensino médico


In [102]:
list_rows(df, number_of_rows=15, columns_to_display=['ID','Tipo de Contrato','CPVcode','CPVdescription'], id_start=21069)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
20483,21069,Outros,80561000-4,Serviços de formação em matéria de saúde
20484,21070,Outros,80562000-1,Serviços de formação em matéria de primeiros socorros
20485,21071,Outros,80570000-0,Serviços de formação para aperfeiçoamento pessoal
20495,21081,Outros,85000000-9,Serviços de saúde e acção social
20496,21082,Outros,85100000-0,Serviços de saúde
20497,21083,Outros,85110000-3,Serviços hospitalares e afins
20498,21084,Outros,85111000-0,Serviços hospitalares
20499,21085,Outros,85111100-1,Serviços hospitalares de cirurgia
20500,21086,Outros,85111200-2,Serviços hospitalares de medicina
20501,21087,Outros,85111300-3,Serviços hospitalares de ginecologia


In [103]:
list_rows(df, number_of_rows=15, columns_to_display=['ID','Tipo de Contrato','CPVcode','CPVdescription'], id_start=21093)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
20507,21093,Outros,85111700-7,Serviços de oxigenoterapia
20508,21094,Outros,85111800-8,Serviços de patologia
20509,21095,Outros,85111810-1,Serviços de análise sanguínea
20510,21096,Outros,85111820-4,Serviços de análise bacteriológica
20511,21097,Outros,85111900-9,Serviços de diálise hospitalar
20512,21098,Outros,85112000-7,Serviços de assistência hospitalar
20513,21099,Outros,85112100-8,Serviços de fornecimento de roupa de cama a hospitais
20514,21100,Outros,85112200-9,Serviços de cuidados a doentes ambulatórios
20515,21101,Outros,85120000-6,Serviços de prática médica e serviços conexos
20516,21102,Outros,85121000-3,Serviços de prática médica


In [104]:
list_rows(df, number_of_rows=15, columns_to_display=['ID','Tipo de Contrato','CPVcode','CPVdescription'], id_start=21108)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
20522,21108,Outros,85121231-1,Serviços de cardiologia
20523,21109,Outros,85121232-8,Serviços especializados pulmonares
20524,21110,Outros,85121240-7,Serviços de otorrinolaringologia ou audiologia
20525,21111,Outros,85121250-0,Serviços de gastroenterologia e geriatria
20526,21112,Outros,85121251-7,Serviços de gastroenterologia
20527,21113,Outros,85121252-4,Serviços de geriatria
20528,21114,Outros,85121270-6,Serviços de psiquiatria ou psicologia
20529,21115,Outros,85121271-3,Serviços ao domicílio para pessoas com perturbações psicológicas
20530,21116,Outros,85121280-9,"Serviços de oftalmologia, dermatologia ou ortopedia"
20531,21117,Outros,85121281-6,Serviços de oftalmologia


In [105]:
list_rows(df, number_of_rows=15, columns_to_display=['ID','Tipo de Contrato','CPVcode','CPVdescription'], id_start=21123)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
20537,21123,Outros,85121300-6,Serviços de cirurgia especializada
20538,21124,Outros,85130000-9,Serviços de medicina dentária e serviços conexos
20539,21125,Outros,85131000-6,Serviços de medicina dentária
20540,21126,Outros,85131100-7,Serviços de ortodôncia
20541,21127,Outros,85131110-0,Serviços cirúrgicos de ortodôncia
20542,21128,Outros,85140000-2,Serviços de saúde diversos
20543,21129,Outros,85141000-9,Serviços prestados pelo pessoal médico
20544,21130,Outros,85141100-0,Serviços prestados por parteiras
20545,21131,Outros,85141200-1,Serviços prestados pelo pessoal de enfermagem
20546,21132,Outros,85141210-4,Serviços de tratamento médico ao domicílio


In [106]:
list_rows(df, number_of_rows=15, columns_to_display=['ID','Tipo de Contrato','CPVcode','CPVdescription'], id_start=21138)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
20552,21138,Outros,85142300-9,Serviços de higiene
20553,21139,Outros,85142400-0,Entrega ao domicílio de produtos para incontinência
20554,21140,Outros,85143000-3,Serviços de ambulâncias
20555,21141,Outros,85144000-0,Serviços de saúde com alojamento
20556,21142,Outros,85144100-1,Serviços de enfermagem com alojamento
20557,21143,Outros,85145000-7,Serviços prestados por laboratórios médicos
20558,21144,Outros,85146000-4,Serviços prestados por bancos de sangue
20559,21145,Outros,85146100-5,Serviços prestados por bancos de esperma
20560,21146,Outros,85146200-6,Serviços prestados por bancos de órgãos
20561,21147,Outros,85147000-1,Serviços de medicina do trabalho


In [107]:
list_rows(df, number_of_rows=15, columns_to_display=['ID','Tipo de Contrato','CPVcode','CPVdescription'], id_start=21153)

Unnamed: 0,ID,Tipo de Contrato,CPVcode,CPVdescription
20567,21153,Outros,85171000-8,Serviços de acupunctura
20568,21154,Outros,85172000-5,Serviços de quiropraxia


# Dataset analysis

In [108]:
print(f"\nNúmero total de linhas: {df.shape[0]}")


Número total de linhas: 222


# Export Dataset

In [109]:
folder = '16_CPV'
parquet_filename = 'TiposContrato_CPV_TED_V1.0_filtered.parquet'
csv_filename = 'TiposContrato_CPV_TED_V1.0_filtered.csv'

parquet_path = os.path.join(folder, parquet_filename)
csv_path = os.path.join(folder, csv_filename)

os.makedirs(folder, exist_ok=True)

df.to_parquet(parquet_path, index=False)
df.to_csv(csv_path, index=False)

print(f"Arquivos salvos:\n- {parquet_path}\n- {csv_path}")

Arquivos salvos:
- 16_CPV\TiposContrato_CPV_TED_V1.0_filtered.parquet
- 16_CPV\TiposContrato_CPV_TED_V1.0_filtered.csv


# Create file with the excluded CPV codes

In [110]:
# Paths
input_folder = "16_CPV"
parquet_original_file = "TiposContrato_CPV_TED_V1.0_new.parquet"
parquet_filtered_file = "TiposContrato_CPV_TED_V1.0_filtered.parquet"
parquet_filtered_out_file = "TiposContrato_CPV_TED_V1.0_filtered_out.parquet"

# Load original dataset (from Parquet)
df_original = pd.read_parquet(os.path.join(input_folder, parquet_original_file))

# Load filtered dataset (from Parquet)
df_filtered = pd.read_parquet(os.path.join(input_folder, parquet_filtered_file))

# Ensure CPVcode column is string and clean
df_original['CPVcode'] = df_original['CPVcode'].astype(str).str.strip()
df_filtered['CPVcode'] = df_filtered['CPVcode'].astype(str).str.strip()

# Identify CPV codes excluded from the filtered dataset
excluded_cpvs = set(df_original['CPVcode']) - set(df_filtered['CPVcode'])

# Filter the original dataset for those excluded CPVs
df_filtered_out = df_original[df_original['CPVcode'].isin(excluded_cpvs)].copy()

# Save to Parquet
df_filtered_out.to_parquet(os.path.join(input_folder, parquet_filtered_out_file), index=False)
df_filtered_out.to_csv(os.path.join(input_folder, "TiposContrato_CPV_TED_V1.0_filtered_out.csv"), index=False)

print(f"Saved excluded CPV codes to {parquet_filtered_out_file} ({len(df_filtered_out)} rows)")


Saved excluded CPV codes to TiposContrato_CPV_TED_V1.0_filtered_out.parquet (29986 rows)


In [111]:
print(f"\nNúmero total de linhas dataset original: {df_original.shape[0]}")
print(f"\nNúmero total de linhas dataset in: {df_filtered.shape[0]}")
print(f"\nNúmero total de linhas dataset out: {df_filtered_out.shape[0]}")



Número total de linhas dataset original: 30434

Número total de linhas dataset in: 222

Número total de linhas dataset out: 29986
