In [1]:
import os
os.chdir("..")
os.chdir("src")
from data_cleaning import DataCleaning
import polars as pl
os.chdir("..")
import nltk
from unidecode import unidecode
import re
nltk.download('stopwords')
from nltk.corpus import stopwords

[nltk_data] Downloading package stopwords to /home/bruno/nltk_data...
[nltk_data]   Package stopwords is already up-to-date!


In [2]:
cleaning_pipeline = DataCleaning()
df = cleaning_pipeline.run()

2024-03-26 17:12:47 - INFO - Data loaded!
2024-03-26 17:12:47 - INFO - Data types asserted!
2024-03-26 17:12:47 - INFO - Null values cleaned!
2024-03-26 17:12:47 - INFO - Full data cleaned!


In [3]:
df.collect()

CD_ORGAO,NM_ORGAO,ANO_LICITACAO,DS_OBJETO,VL_LICITACAO,DT_HOMOLOGACAO,VL_HOMOLOGADO
i64,str,i64,str,f64,date,f64
69900,"""PM DE PINHAL""",2017,"""AQUISIÇÃO DE M…",28942.06,2017-01-25,28942.06
72300,"""PM DE TRÊS PAL…",2017,"""""AQUISIÇÃO DE …",161220.0,2017-02-06,161220.0
78200,"""PM DE NOVA SAN…",2017,"""Produtos alime…",342691.0,2017-02-09,38505.0
66600,"""PM DE DOUTOR M…",2017,"""CONTRATAÇÃO DE…",18560.0,2017-02-01,24000.0
84100,"""PM DE ESPERANÇ…",2017,"""aquisição de m…",18100.5,2017-01-24,9644.2
…,…,…,…,…,…,…
1204,"""SUSEPE - SUPER…",2021,"""Contratação de…",11687.97,2021-03-05,11687.97
1204,"""SUSEPE - SUPER…",2021,""" Contrataçã…",28942.58,2021-04-28,28500.0
88419,"""SJCDH - SECRET…",2021,"""Aquisição de f…",3544.0,2022-03-17,3544.0
4000,"""BRDE - BANCO R…",2021,"""Prestação de a…",300842.4,2023-01-24,300842.4


# 3. **Feature Engineering**

Three features will be created to assist in the analysis:

- tp_orgao: Indicates the type of public agency, there are a total of 17 types
- dt_homologacao_mes: Number of the month in which the bidding was approved
- dt_homologacao_semana_do_ano: Number of the week of the year in which the bidding was approved

## 3.1. **tp_orgao**

In [4]:
nm_orgao_list = [item[0] for item in df.select("NM_ORGAO").collect().rows()]

In [5]:
stop_words = stopwords.words('portuguese')

In [6]:
def remove_stop_words(words):
    return [word for word in words if word.lower() not in stop_words]

In [7]:
from typing import AnyStr
def preprocess(x: AnyStr) -> str:

    special_chars = "¨'!#$%&()*+,./:;<=>?@[\]^_`{|}~"
    new_x = x.replace('"',' ')
    for c in special_chars:
        new_x = new_x.replace(c,' ') # Removes special characters
    new_x = re.sub(r'[^\w\s]', ' ', new_x) # Removes punctuation
    new_x = re.sub("http\S+", ' ',new_x) # Removes links
    new_x = re.sub("@\w+", ' ',new_x) # Removes @
    new_x = re.sub('#\S+', ' ',new_x) # Removes hashtags
    new_x = re.sub('[0-9]+', ' ',new_x) # Removes numbers
    new_x = unidecode(new_x) # Removes accents
    new_x = re.sub("\s+", ' ',new_x) # Removes spaces
    new_x = new_x.strip()
    return new_x


In [8]:
df = df.with_columns(
    pl.col("NM_ORGAO")
    .map_elements(lambda x: nltk.word_tokenize(x.lower(), language='portuguese')) # Tokenize
    .map_elements(remove_stop_words, return_dtype=pl.List(pl.String)) # Removes stop words
    .map_elements(lambda x: [preprocess(word) for word in x]) # Other preprocessing
    .map_elements(lambda arr: list(filter(None, arr))) # Removes items with none
    .alias("NM_ORGAO_NLP")
)

In [9]:
def contains_substring(lst, substrings):
    for item in lst:
        if any(substring in item for substring in substrings):
            return True
    return False

In [10]:
# City Halls
city_halls = [
    " ".join(sub_array[0])
    for sub_array in df.filter(
        pl.col("NM_ORGAO_NLP").map_elements(
            lambda x: contains_substring(x, ["pm", "pref", "prefeitura"])
        )
    )
    .select(pl.col("NM_ORGAO_NLP"))
    .collect()
    .to_numpy()
]


# City Councils
city_councils = [
    " ".join(sub_array[0])
    for sub_array in df.filter(
        pl.col("NM_ORGAO_NLP").map_elements(
            lambda x: contains_substring(x, ["cm", "camara"])
        )
    )
    .select(pl.col("NM_ORGAO_NLP"))
    .collect()
    .to_numpy()
]

# Police
police = ['POLÍCIA CIVIL', 'BRIGADA MILITAR',
          'IGP - INSTITUTO-GERAL DE PERÍCIAS',
          'PC - POLÍCIA CIVIL',

          ]

# Banks
banks = ['BANCO REGIONAL DE DESENVOLVIMENTO DO EXTREMO SUL',
          'BANCO DO ESTADO DO RIO GRANDE DO SUL S.A.',
          'BANRISUL CARTÕES S.A.',
          'BANRISUL S.A. CORRETORA DE VALORES MOBILIÁRIOS E CÂMBIO',
          'BANRISUL S.A. - ADMINISTRADORA DE CONSÓRCIOS',
          'BADESUL DESENVOLVIMENTO S.A. - AGÊNCIA DE FOMENTO/RS',
          'BANRISUL CORRETORA DE SEGUROS S.A.',
          'BRDE - BANCO REGIONAL DE DESENVOLVIMENTO DO EXTREMO SUL',
          'BANRISUL - BANCO DO ESTADO DO RIO GRANDE DO SUL S.A.',
          'BANRISUL SOLUÇÕES EM PAGAMENTOS S.A. - INSTITUIÇÃO DE PAGAMENTO',
          


          ]

# # Social Security and Welfare Institutions
# social_security = ['INST. PREV. ASSIST. SERV. MUN. DE CANOAS',
#          'FUND. DE ASSIST. SOCIAL - CAXIAS DO SUL',
#          'INST. DE PREV. E ASSIST. DOS SERV. MUNIC. DE N. HAMBURGO',
#          'INST. PREV. ASSIST. MUN. - CAXIAS DO SUL',
#          'INST. PREV. SERV. PUBL. MUNIC. DE IJUÍ',
#          'INST. PREV.  ASSIST. À SAÚDE SERV. PÚBL. MUN. DE S. MARIA',
#          'INSTITUTO ERECHINENSE DE PREVIDÊNCIA - IEP',
#          'SISTEMA DE PREVIDÊNCIA MUNICIPAL - S. LIVRAMENTO',
#          'FUNDAÇÃO DE PREVIDÊNCIA COMPLEMENTAR DO SERV. PÚBLIC. DO ESTADO DO RS',
#          'INST. PREV. DOS SERV. PÚBL. MUN. DE SÃO GABRIEL',
#          'FUND. DE ASSIST. SOCIAL E CIDADANIA - PORTO ALEGRE',
#          'INST. PREV. ASSIST. SERV. MUN. CAMPO BOM',
#          'INST. APOS. PENSÕES SERV. MUN. - SÃO LEOPOLDO',
#          'INST. PREV. DOS SERV. PÚBL. DO MUNIC. - TRÊS PASSOS',
#          'FUND. GAÚCHA DO TRABALHO E AÇÃO SOCIAL',
#          'PREV-XANGRI-LÁ',
#          'FUND. DE ATENDIMENTO SÓCIO-EDUCATIVO DO RGS',
#          'DEP. MUNICIPAL DE HABITAÇÃO - PORTO ALEGRE',
#          'INST. PREV. SERV. PÚBL. MUN. DE CACHOEIRINHA - IPREC',
#          'FUND. DE PROTEÇÃO ESPECIAL DO RIO GRANDE DO SUL',
#          'FUND. VENÂNCIO RAMOS DA SILVA - ITAQUI',
#          'INST. MUN. ASSIST. SERV. DE NOVA SANTA RITA'
#          'IPREV - INSTITUTO DE PREVIDÊNCIA DOS SERVIDORES DE VIAMÃO',
#          'URUPREV - URUGUAIANA PREVIDENCIA SOCIAL',
#          'STAS - SECRETARIA DE TRABALHO E ASSISTÊNCIA SOCIAL',
         

# ]
# Social Security and Welfare Institutions
social_security = [
    " ".join(sub_array[0])
    for sub_array in df.filter(
        pl.col("NM_ORGAO_NLP").map_elements(
            lambda x: contains_substring(x, ["pev", "previdencia", "iprev", "assistencia", "acao"])
        )
    )
    .select(pl.col("NM_ORGAO_NLP"))
    .collect()
    .to_numpy()
]

# social_security = [item[0] for item in df.filter(pl.col("NM_ORGAO_NLP").str.contains_any(["pev", "previdencia", "iprev", "assistencia", "acao"])).select(pl.col("NM_ORGAO_NLP")).collect().rows()]

# Health Care institutions
# health_care = ['FUND. DE SAÚDE PÚBLICA DE NOVO HAMBURGO',
#         'FUND. HOSPITAL MUNICIPAL GETÚLIO VARGAS',
#         'HOSP. MUNICIPAL SÃO JOSÉ DE IBIRAIARAS',
#         'HOSP. NOSSA SRA. DO CARMO - AUTARQUIA MUNICIPAL - TAPES',
#         'CONS. INTERM. DE SAÚDE DO VALE DO RIO TAQUARI',
#         'CONS. INTERM. SAÚDE DO NOROESTE DO ESTADO DO RS',
#         'FUND. HOSPITALAR SANTA TEREZINHA DE ERECHIM',
#         'CONS. INTERM. DE SAÚDE - CONISA',
#         'FUND. DE SAÚDE PÚBLICA SÃO CAMILO DE ESTEIO - FSPSCE',
#         'CONSORCIO DE SAUDE INTER-MUNICIPAL',
#         'CONS. INTERM. DE SAÚDE DA REGIÃO DAS MISSÕES',
#         'SECRETARIA DA SAÚDE DO RS',
#         'INST. MUN. DE ESTRAT.  DE SAÚDE DA FAMÍLIA - IMESF',
#         'CAIXA PREST. ASSIST. SERV. SAÚDE DOS SERV. MUN. DE P. FUNDO',
#         'FHGV - FUNDAÇÃO HOSPITALAR GETÚLIO VARGAS',
#         'SES - SECRETARIA DA SAÚDE DO RS',

#         ]

health_care = [
    " ".join(sub_array[0])
    for sub_array in df.filter(
        pl.col("NM_ORGAO_NLP").map_elements(
            lambda x: contains_substring(x, ["hospital", "hospitalar", "saude", "hosp"])
        )
    )
    .select(pl.col("NM_ORGAO_NLP"))
    .collect()
    .to_numpy()
]


# Energy companies
energy = ['CENTRAIS ELÉTRICAS DE CARAZINHO S/A.',
           'CIA. DE GÁS DO ESTADO DO RIO GRANDE DO SUL',
           'DEP. MUNICIPAL DE ENERGIA - IJUÍ',
           'DEP. MUNICIPAL DE ENERGIA DE IJUÍ - DEMEI GERAÇÃO']

# Transportation companies
transportation = ['CIA. CARRIS PORTO-ALEGRENSE',
              'EMPRESA PÚBLICA DE TRANSPORTE E CIRCULAÇÃO S/A',
              'DEP. AUTÁRQUICO TRANSP. COLETIVOS - RIO GRANDE',
              'DEP. ESTADUAL DE TRÂNSITO',
              'FUND. PASSO FUNDO DE TURISMO PASSOTUR',
              'EMPRESA GAÚCHA DE RODOVIAS S.A.']

# # Water and Sewer companies
# water_sewer = ['SERVIÇO AUTÔN. MUN. DE ÁGUA E ESGOTO - CX.SUL',
#                'COMUSA - SERVIÇOS DE ÁGUA E ESGOTO DE NOVO HAMBURGO',
#                'DEP. DE ÁGUA E ESGOTOS - SANT\'ANA DO LIVRAMENTO',
#                'SERVIÇO AUTÔN. DE SANEAMENTO DE PELOTAS',
#                'CONS. PÚBL. SAN. BÁSICO DA BACIA HIDROG. DO RIO DOS SINOS',
#                'DEP. MUNICIPAL DE ÁGUAS E SANEAMENTO DE IJUÍ - DEMASI',
#                'FUND. MUNICIPAL DE SAÚDE DE CANOAS',
#                'FUND. MÉD.-HOSP. DR. HONOR T. COSTA - LAVRAS DO SUL',
#                'CIA. RIOGRANDENSE DE SANEAMENTO',
#                'DEPARTAMENTO DE ÁGUA, ARROIOS E ESGOTO DE BAGÉ',
#                'DEP. MUNICIPAL DE ÁGUA E ESGOTOS - PORTO ALEGRE',
#                'EMPRESA FARROUPILHENSE DE SANEAMENTO E DESENVOLVIMENTO AMBIENTAL S.A.',
#                'ÁGUAS DA NASCENTE - SERV. MUN. DE SANEAMENTO AMBIENTAL',
#                'ÁGUA DE IVOTI',
#                'TERMASA - CIA. ÁGUAS TERMAIS MARCELINO RAMOS',
#                'SEMAE - SERVIÇO MUN. DE ÁGUA E ESGOTOS - S. LEOPOLDO',
#                'DEMASI - DEP. MUNICIPAL DE ÁGUAS E SANEAMENTO DE IJUÍ',
#                'DMAE - DEP. MUNICIPAL DE ÁGUA E ESGOTOS - PORTO ALEGRE',
#                'DAEB - DEPARTAMENTO DE ÁGUA, ARROIOS E ESGOTO DE BAGÉ',
#                'DAE - DEP. DE ÁGUA E ESGOTOS - SANTANA DO LIVRAMENTO',
#                'SAMAE - SERVIÇO AUTÔN. MUN. DE ÁGUA E ESGOTO - CX.SUL',
#                ]


water_sewer = [
    " ".join(sub_array[0])
    for sub_array in df.filter(
        pl.col("NM_ORGAO_NLP").map_elements(
            lambda x: contains_substring(x, ["agua", "esgoto", "aguas", "esgotos", "saneamento"])
        )
    )
    .select(pl.col("NM_ORGAO_NLP"))
    .collect()
    .to_numpy()
]


# Universities
universities = ['UNIVERSIDADE ESTADUAL DO RIO GRANDE DO SUL',
                'UERGS - UNIVERSIDADE ESTADUAL DO RIO GRANDE DO SUL',
                ]

# Intermunicipal Associations
intermunicipal_associations = [
    " ".join(sub_array[0])
    for sub_array in df.filter(
        pl.col("NM_ORGAO_NLP").map_elements(
            lambda x: contains_substring(x, ["cons", "consorcio", "consorcios"])
        )
    )
    .select(pl.col("NM_ORGAO_NLP"))
    .collect()
    .to_numpy()
]


# intermunicipal_associations = ['CONS. INTERM. DO VALE DO JACUÍ - CI/JACUÍ'
#               'CONS. PÚBL. INTERM. P/ ASSUNTOS ESTRATÉGICOS DO G8 - CIPAE G8',
#               'CONS. INTERM. - CI - CENTRO SUL',
#               'CONS. INTERM. ABRIGO INSTITUCIONAL DA PAZ - CIAIP',
#               'CONS. INTERM. DA REGIÃO CENTRO DO ESTADO DO RS - CI/CENTRO STA. MARIA',
#               'CONS. INTERM. DA REGIÃO NORDESTE',
#               'CONS. INTERM. DE COOP. EM GESTÃO PÚBLICA - CONIGEPU',
#               'CONS. INTERM. DE DESENV. SUSTENT. DA SERRA GAÚCHA - CISGA',
#               'CONS. INTERM. DE GESTÃO AMPLIADA DA REGIÃO CARBONÍFERA - CIGA',
#               'CONS. INTERM. DE SERVIÇOS DO VALE DO RIO PARDO',
#               'CONS. INTERM. DO MÉDIO ALTO URUGUAI',
#               'CONS. INTERM. DO VALE DO RIO CAÍ - CIS/CAÍ',
#               'CONS. INTERM. ESMERALDA / PINHAL DA SERRA',
#               'CONS. INTERM. LAR DE ACOLHIMENTO SÃO FRANCISCO',
#               'ADM. DE  CONSÓRCIOS  INTERMUNIC. S/A. - CAXIAS DO SUL',
#               'CONS. PÚBL. INTERM. DA REGIÃO DO ALTO URUGUAI - CIRAU',
#               'CONS. PÚBL. INTERM. DESENV. ECON., SOC. E AMB. MUN. BACIA RIO JAGUARÃO',
#               'CONS. DE DESENV. INTERM. DOS MUNIC. DO ALTO JACUÍ',
#               'CONS. DE DESENV. SUSTENT. DA QUARTA COLÔNIA - CONDESUS/QUARTA COLÔNIA',
#               'CONS. PÚBL. DA ASSOC. DOS MUNIC. DA REGIÃO METR. DE POA - CP GRANPAL',
#               'CONS. PÚBL. DO EXTREMO SUL', 'CONS. PÚBL. FRONTEIRA NOROESTE',
#               'CONSÓRCIO INTERMUNICIPAL DA REGIÃO DO PLANALTO MÉDIO',
#               'CONSÓRCIO PÚBLICO DA ASSOCIAÇÃO DOS MUNICÍPIOS DO VALE DO RIO DOS SINO',
#               'CONSÓRCIO PÚBLICO INTERMUNICIPAL DE INCLUSÃO SOCIAL E PRODUTIVA',
#               'CI/CENTRO - CONS. INTERM. DA REGIÃO CENTRO  ESTADO DO RS - STA. MARIA',
#               'COMANDAÍ - CONS. INTERM. DE GERENCIAMENTO DE RESÍDUOS SÓLIDOS URBANOS',
#               'CIEPS - CONS. INTERM. ESMERALDA / PINHAL DA SERRA',
#               'CONIGEPU - CONS. INTERM. DE COOP. EM GESTÃO PÚBLICA',
#               'CONISA - CONS. INTERM. DE SAÚDE',
#               'CIMAU - CONS. INTERM. DO MÉDIO ALTO URUGUAI',
#              'CIGRES - CONS. INTERM. DE GESTÃO DE RESÍDUOS SÓLIDOS',
#              'CISA - CONS. INTERM. SAÚDE DO NOROESTE DO ESTADO DO RS',
#              'CONSISA - CONS. INTERM. DE SERVIÇOS DO VALE DO TAQUARI',
#              'CIGA - CONS. INTERM. DE GESTÃO AMPLIADA DA REGIÃO CARBONÍFERA',
#              'CI-CS - CONS. INTERM. - CI - CENTRO SUL',
#              'CIS/CAÍ - CONS. INTERM. DO VALE DO RIO CAÍ',
#              'CIRENOR - CONS. INTERM. DA REGIÃO NORDESTE',
#              'CISMISSÕES - CONS. INTERM. DE SAÚDE DA REGIÃO DAS MISSÕES',
#              'CISGS - CONS. INTERM. DE SAÚDE DO GRANDE SARANDI',
#              'CONDESUS - CONS. INTERM. DE DESENV. SUSTENT. CAMINHO DAS ORIGENS',
#              'CI/JACUÍ - CONS. INTERM. DO VALE DO JACUÍ',
#              'CONDESUS - CONS. INTERM. DE DESENV. SUSTENT.- REGIÃO CAMPOS CIMA SERRA',
#              'CITEGEM - CONS. INTERM. DE GESTÃO MULTIFUNCIONAL',
#              'CIAIP - CONS. INTERM. ABRIGO INSTITUCIONAL DA PAZ',
#              'CILASFRA - CONS. INTERM. LAR DE ACOLHIMENTO SÃO FRANCISCO',
#              'CRESU - CONS. INTERM. DE RESÍDUOS SÓLIDOS',
#              'SDR - SECRETARIA DE DESENVOLVIMENTO RURAL',
#              'CISGA - CONS. INTERM. DE DESENV. SUSTENT. DA SERRA GAÚCHA - CISGA',
#              'COIS - CONS. INTERM. DE SAÚDE',
#              'CISVALE - CONS. INTERM. DE SERVIÇOS DO VALE DO RIO PARDO',
#              'CIRAU - CONS. PÚBL. INTERM. DA REGIÃO DO ALTO URUGUAI - CIRAU',
#              'CISP - CONSÓRCIO PÚBLICO INTERMUNICIPAL DE INCLUSÃO SOCIAL E PRODUTIVA',
#              'COMAJA - CONS. DE DESENV. INTERM. DOS MUNIC. DO ALTO JACUÍ',
#              'CP GRANPAL - CONS. PÚBL. DA ASSOC. DOS MUNIC. DA REGIÃO METR. DE POA',
#              'CIPLAM - CONSÓRCIO INTERMUNICIPAL DA REGIÃO DO PLANALTO MÉDIO',
#              'CP AMLINOR - CONS. PÚBL. DA ASSOC. DOS MUNIC. DO LITORAL NORTE',
#              'YUCUMÃ - CONS. ROTA DO YUCUMÃ',
#              'CONSIM - CONSORCIO DE SAUDE INTER-MUNICIPAL',
#              'COMUNORS - CONSÓRCIO DE DESENV. DOS MUNICÍPIOS DO NORTE DO RS',
#              'CIPAE G8 - CONS. PÚBL. INTERM. P/ ASSUNTOS ESTRATÉGICOS DO G8',
#              'COFRON - CONS. PÚBL. FRONTEIRA NOROESTE',
#              'CP SINOS - CONS. PÚBLICO DA ASSOC. MUNICÍPIOS DO VALE RIO DOS SINOS',
#              'CONDESUS/QUARTA COLÔNIA - CONS. DE DESENV. SUSTENT. DA QUARTA COLÔNIA',
#              'PRÓ-SINOS - CONS. PÚBL. SAN. BÁSICO DA BACIA HIDROG. DO RIO DOS SINOS',
#              'ADCOINTER - ADM. DE  CONSÓRCIOS  INTERMUNIC. S/A. - CAXIAS DO SUL',
#              'CPES - CONS. PÚBL. DO EXTREMO SUL',
#              'CONREPAR - CONS. REGIONAL DO PARANHANA',]


# Regulatory Agencies
regulatory_agencies = ['AGÊNCIA EST. DE REGULAÇÃO DOS SERV. PÚBL. DELEG. DO RGS',
                  'AGÊNCIA MUN. REGULAÇÃO  DOS SERV. PÚBL. DELEG. DE S. GABRIEL',
                  'AGÊNCIA REGULADORA DE SERVIÇOS PÚBLICOS DELEGADOS DE SANTA CRUZ DO SUL',
                  'AGÊNCIA REGULADORA DOS SERV. PÚBL. MUNIC. DE ERECHIM']

# Technology Agencies
technology_agencies = ['CIA. DE PROCESSAMENTO DE DADOS DO RS',
              'EMPRESA MUNICIPAL DE INFORMÁTICA DE PELOTAS',
              'CIA. PROC. DE DADOS DO MUNIC. PORTO ALEGRE']

# Cultural Organizations
cultural_organizations = ['FENAC S.A. FEIRAS E EMPREEND. TURÍSTICOS - N. HAMBURGO',
           'CIA. ÁGUAS TERMAIS MARCELINO RAMOS - TERMASA',
           'FESTA NACIONAL DA UVA TURISMO E EMPREENDIMENTOS S/A.',
           'FUND. CULT. AFIF JORGE SIMÕES FILHO - SÃO SEPÉ',
           'FUND. MUN. DE ARTES DE MONTENEGRO',
           'CIA. RIOGRANDENSE DE ARTES GRÁFICAS',
           'SEL - SECRETARIA DO ESPORTE E LAZER',
           'FUNDARC - FUND. MUN. DE ARTE E CULTURA - GRAVATAÍ',
           'FCAJSF - FUND. CULT. AFIF JORGE SIMÕES FILHO - SÃO SEPÉ',          
           ]

# Agricultural Institutions
agricultural_institutions = ['ASSOCIAÇÃO SULINA DE CRÉDITO E ASSISTÊNCIA RURAL',
               'CIA. ESTADUAL DE SILOS E ARMAZÉNS',
               'CIA. RIOGRANDENSE DE MINERAÇÃO',
               'INSTITUTO RIOGRANDENSE DO ARROZ',
               'FUND. MUN. DE MEIO AMBIENTE - GRAVATAÍ']

# State Agencies (Secretarias do Estado, Tribunais, Assembléia, etc)
state_agencies = ['PROCURADORIA-GERAL DE JUSTIÇA',
                     'SECRETARIA DA FAZENDA DO RS',
                     'SECRETARIA DA SEGURANÇA PÚBLICA',
                     'SECRETARIA DE JUSTIÇA, CIDADANIA E DIREITOS HUMANOS',
                     'SECRETARIA DO MEIO AMBIENTE E INFRAESTRUTURA',
                     'TRIBUNAL DE CONTAS DO ESTADO DO RS',
                     'TRIBUNAL DE JUSTIÇA MILITAR',
                     'DEFENSORIA PÚBLICA DO ESTADO',
                     'ASSEMBLEIA LEGISLATIVA']

# Other Institutions/Organizations
others = ['SUPERINTENDÊNCIA DO PORTO DE RIO GRANDE',
          'CENTRAL DE LICITAÇÕES DO ESTADO',
          'CENTRAIS DE ABASTECIMENTO DO RIO GRANDE DO SUL S.A.',
          'CIA. DE DESENV. DE CAXIAS DO SUL',
          'CIA. DE DESENV. DE PASSO FUNDO',
          'CIA. INDUSTRIAL E DE DESENV. URBANO - CRUZ ALTA',
          'INST. DE PLANEJAMENTO DE SANTA MARIA',
          'CIA. MUNICIPAL DE URBANISMO - NOVO HAMBURGO',
          'CODEPAS-P. - CIA. DE DESENV. DE PASSO FUNDO']

<!-- 

       ['IRGA - INSTITUTO RIOGRANDENSE DO ARROZ'],


 
       [''],
       [''],
       ['PASSOTUR - FUND. PASSO FUNDO DE TURISMO'],
       ['SETUR - SECRETARIA DE TURISMO'],
       ['CIDUSA - CIA. INDUSTRIAL E DE DESENV. URBANO - CRUZ ALTA'],

       ['FHSTE - FUND. HOSPITALAR SANTA TEREZINHA DE ERECHIM'],
       ['FMSC - FUND. MUNICIPAL DE SAÚDE DE CANOAS'],
       ['IPPASSO - INST. PREV. SOCIAL SERV. MUN. DE PASSO FUNDO'],
       [],
       ['ECOFAR S.A - EMP. FARROUPILHENSE SANEAMENTO E DESENVOLV. AMBIENTAL S.A'],
       ['PREVIRG - PREVIDÊNCIA DO RIO GRANDE'],
       ['SEDAC - SECRETARIA DA CULTURA'],
   
       ['AGESG - AGÊNCIA MUN. REGULAÇÃO  DOS SERV. PÚBL. DELEG. DE S. GABRIEL'],
       ['HBCS-P.F. - HOSP. BENEF. DR. CÉSAR SANTOS - P. FUNDO'],
       ['ISSEG - INSTITUTO DE SAUDE DOS SERVIDORES DE GRAVATAÍ'],
  
       ['DMLU - DEP. MUNICIPAL DE LIMPEZA URBANA - PORTO ALEGRE'],
       ['FASC - FUND. DE ASSIST. SOCIAL E CIDADANIA - PORTO ALEGRE'],
       ['AGERGS - AGÊNCIA EST. DE REGULAÇÃO DOS SERV. PÚBL. DELEG. DO RGS'],

       ['E-LOG- EMPRESA PÚBLICA DE LOGÍSTICA'],
       ['HMSJ-IBIRA - HOSP. MUNICIPAL SÃO JOSÉ DE IBIRAIARAS'],
       ['FSPSCE - FUND. DE SAÚDE PÚBLICA SÃO CAMILO DE ESTEIO'],

       ['AGER - AGÊNCIA REGULADORA DOS SERV. PÚBL. MUNIC. DE ERECHIM'],
 
       ['IPE SAUDE - INST. DE ASSISTENCIA A SAUDE DOS SERVIDORES DO EST. DO RS'],

       ['FOSPA - FUND. ORQUESTRA SINFÔNICA DE PORTO ALEGRE'],
       ['FETLSVC - FUND. ESCOLA TÉCNICA LIBERATO SALZANO VIEIRA DA CUNHA'],
       ['IMPAS/SM - INST. MUN. PREV. ASSIST. SERV. - SALDANHA MARINHO'],
       ['FSNH - FUND. DE SAÚDE PÚBLICA DE NOVO HAMBURGO'],

       ['FHOESFA - FUND. HOSPITALAR E EDUC. SÃO FRANCISCO DE ASSIS - MACHADINHO'],
       ['IMPAS - INST. MUN. PREV. ASSIST. SERV. S. BÁRBARA DO SUL'],
       ['ETERPEL - EMPRESA MUNICIPAL TERM. RODOV. DE PELOTAS LTDA.'],

       ['ASCAR - ASSOCIAÇÃO SULINA DE CRÉDITO E ASSISTÊNCIA RURAL'],

       ['IMESF - INST. MUN. DE ESTRAT.  DE SAÚDE DA FAMÍLIA - IMESF'],
       [''],
       ['PREV-ESTEIO - INST. DE PREVIDENCIA DOS SERVIDORES PUBLICOS DE ESTEIO'],
       ['FMS-SL\r - FUNDACAO MUNICIPAL DE SAUDE DE SAO LEOPOLDO'],
       ['SPGG - SECRETARIA DE PLANEJAMENTO, GOVERNANÇA E GESTÃO'],
       ['CBMRS - CORPO DE BOMBEIROS MILITAR DO RIO GRANDE DO SUL'],
       ['PREVIMPA - DEP. MUNICIPAL PREV. SERV. PÚBL. MUNICIPIO DE PORTO ALEGRE'],
       ['IPREC - INST. PREV. SERV. PÚBL. MUN. DE CACHOEIRINHA'],
       ['FEPAM - FUND. ESTADUAL DE PROTEÇÃO AMBIENTAL HENRIQUE LUIZ ROESSLER'],
       ['SEFAZ - SECRETARIA DA FAZENDA DO RS'],
       ['PGJ/MP - PROCURADORIA-GERAL DE JUSTIÇA'],
       ['SEAPI -SECRETARIA DA AGRICULTURA, PECUÁRIA, PRODUÇÃO SUST. E IRRIGAÇÃO'],
       ['AL - ASSEMBLEIA LEGISLATIVA'],
       ['STDP - SECRETARIA DE TRABALHO E DESENVOLVIMENTO PROFISSIONAL'],
       ['BM - BRIGADA MILITAR'],
       ['PREVIROSA - INST. PREV. SERV. PÚBL. MUN. - SANTA ROSA'],
       [''],
       ['FHSJ - FUND. HOSPITALAR SÃO JOSÉ - CAMBARÁ DO SUL'],
       [],
       ['FHCSL-HC - FUND. HOSPITAL CENTENÁRIO - SÃO LEOPOLDO'],
       ['TJRS - TRIBUNAL DE JUSTIÇA'],
       ['FMHHTC - FUND. MÉD.-HOSP. DR. HONOR T. COSTA - LAVRAS DO SUL'],
       ['CAPASEMU-P - CAIXA PREST. ASSIST. SERV. SAÚDE SERV. MUN. DE P. FUNDO'],
       [''],
       ['DEMEI GERAÇÃO - DEP. MUNICIPAL DE ENERGIA DE IJUÍ'],
       ['HNSC - HOSP. NOSSA SRA. DO CARMO - AUTARQUIA MUNICIPAL - TAPES'],
       [''],
       ['FUNDARTE - FUND. MUN. DE ARTES DE MONTENEGRO'],
       ['PGE-RS - PROCURADORIA-GERAL DO ESTADO'],
       ['PROARTE - FUND. DE CULTURA E ARTE DE CARLOS BARBOSA'],
       ['JUCISRS - JUNTA COMERCIAL, INDUSTRIAL E SERVIÇOS DO RIO GRANDE DO SUL'],
       ['CIDEJA - C. PUB. INTERM. DES. EC., SOC. E AMB. MUN. BACIA RIO JAGUARÃO'],
       ['CORSAN - CIA. RIOGRANDENSE DE SANEAMENTO'],
       ['COMUR-NH - CIA. MUNICIPAL DE URBANISMO - NOVO HAMBURGO'],
       ['FPERGS - FUND. DE PROTEÇÃO ESPECIAL DO RIO GRANDE DO SUL'],
       ['FGTAS - FUND. GAÚCHA DO TRABALHO E AÇÃO SOCIAL'],
       ['IMSS - INST. MUN. SEGURIDADE SOCIAL - CAPÃO DA  CANOA'],
       ['IMAS - INST. MUN. ASSIST. SERV. DE NOVA SANTA RITA'],
       ['CASA MILITAR'],
       [],
       ['DEMEEP - DEP. MUNICIPAL DE ENERGIA ELÉTRICA DE PUTINGA'],
       ['BADESUL - BADESUL DESENVOLVIMENTO S.A. - AGÊNCIA DE FOMENTO/RS'],
       ['PREVPEL - INST. PREV. DOS SERV. PÚBL. MUN. - PELOTAS'],
       [''],
       [''],
       ['CANOASPREV - INST. PREV. ASSIST. SERV. MUN. DE CANOAS'],
       [],
       ['DATC - DEP. AUTÁRQUICO TRANSP. COLETIVOS - RIO GRANDE'],
       ['PROCEMPA - CIA. PROC. DE DADOS DO MUNIC. PORTO ALEGRE'],
       ['SEDUC - SECRETARIA DA EDUCAÇÃO DO RS'],
       ['SEMA - SECRETARIA DO MEIO AMBIENTE E INFRAESTRUTURA'],
       ['SJCDH - SECRET. IGUALDADE, CIDADANIA, DIREITOS HUMANOS ASSISTÊNCIA SOC'],
       [''],

       ['DEMHAB - DEP. MUNICIPAL DE HABITAÇÃO - PORTO ALEGRE'],

       ['FARMACIA DO IPAM S.A. - CAXIAS DO SUL'],
       ['EMATER - ASSOCIAÇÃO RIOGR. DE EMPREEND. DE ASSIST. TÉC. E EXT. RURAL'],
       ['EPTC - EMPRESA PÚBLICA DE TRANSPORTE E CIRCULAÇÃO S/A.'],
       ['CEASA - CENTRAIS DE ABASTECIMENTO DO RIO GRANDE DO SUL S.A.'],
       ['CAPSEM - CENTRO DE ASSIST. E PREST. À SAÚDE DOS SERV. MUN.'],
       ['SDS - SECRETARIA DE DESENVOLVIMENTO SOCIAL'],
       ['IPG - INSTITUTO DE PREVIDÊNCIA DOS SERVIDORES MUNICIPAIS DE GRAVATAÍ'],
       ['SSP - SECRETARIA DA SEGURANÇA PÚBLICA'],
       [],
       ['IPRAM - INST. PREV. ASSIST. MUN. - NOVA PRATA'],

       [],
       ['GUAIBAPREV - INST. DE PREVID. DOS SERV. PÚBL. DO MUNIC. DE GUAÍBA'],

       [],
       ['SUSEPE - SUPERINTENDÊNCIA DOS SERVIÇOS PENITENCIÁRIOS'],
       [],
       ['SISPREM - SISTEMA DE PREVIDÊNCIA MUNICIPAL - S. LIVRAMENTO'],
       ['TJM - TRIBUNAL DE JUSTIÇA MILITAR'],

       ['CODECA - CIA. DE DESENV. DE CAXIAS DO SUL'],
       ['FUND. CASA DAS ARTES DE BENTO GONÇALVES'],
       ['SEAPDR - SECRETARIA DA AGRICULTURA, PECUÁRIA E DESENVOLVIMENTO RURAL'],
       ['CRM - CIA. RIOGRANDENSE DE MINERAÇÃO'],
       ['SELT - SECRETARIA DE LOGÍSTICA E TRANSPORTES'],
       ['IPASEMCB - INST. PREV. ASSIST. SERV. MUN. CAMPO BOM'],
       ['DEMEI - DEP. MUNICIPAL DE ENERGIA - IJUÍ'],

       ['RMTP - RÁDIO MUNICIPAL DE TENENTE PORTELA'],
       ['BAGERGS - BANRISUL ARMAZÉNS GERAIS S.A.'],
       ['ELETROCAR - CENTRAIS ELÉTRICAS DE CARAZINHO S/A.'],
      ['PORTOS RS - AUTORIDADE PORTUÁRIA DOS PORTOS DO RIO GRANDE DO SUL S.A.'],
       ['FUMSSAR - FUND. MUN. DE SAÚDE - SANTA ROSA'],
       ['INSTITUTO DE PREVIDÊNCIA DOS SERVIDORES PÚBLICOS DE NOVA HARTZ'],
       ['CAPESER - CAIXA DE ASSIST. E PENSÕES DOS SERV. MUNIC. - ERNESTINA'],
       [],

       ['TMC - TERMAS DE MUITOS CAPÕES S.A.'],
       [''],
       ['FUNVERS - FUND. VENÂNCIO RAMOS DA SILVA - ITAQUI'],
       ['SECOM - SECRETARIA DE COMUNICAÇÃO'],
       ['FESTUVA - FESTA NACIONAL DA UVA TURISMO E EMPREENDIMENTOS S/A.'],
       ['FASE - FUNDAÇÃO DE ATENDIMENTO SÓCIO-EDUCATIVO DO RGS'],
       ['IMPASI - INST. MUN. PREV. E ASSIST. SERV. PÚBLICO IBIRUBÁ'],
       ['SCC - SECRETARIA DA CASA CIVIL'],

       ['CORAG - CIA. RIOGRANDENSE DE ARTES GRÁFICAS'],

       ['GRAMADOTUR - AUTARQUIA MUNICIPAL DE TURISMO'],
       ['CANOASTEC - FUND. MUN. DE TECNOL. DA INFORM. E COMUNIC. DE CANOAS'],
       ['IPRAM - INST. PREV. MUNICIPAL - CARLOS BARBOSA'],
       ['CADIP - CAIXA DE ADMINISTRAÇÃO DA DÍVIDA PÚBLICA ESTADUAL S.A.'],
       ['SUPRG - SUPERINTENDÊNCIA DO PORTO DE RIO GRANDE'],
       ['IPLAN - INST. DE PLANEJAMENTO DE SANTA MARIA'],
       ['IPERGS - INST. DE PREVIDÊNCIA DO ESTADO RS'],
       ['],

       ['IAPS - INST. APOS. PENSÕES SERV. MUN. - SÃO LEOPOLDO'],
       ['BANRISUL SEGURIDADE PARTICIPAÇÕES S.A.'],
       ['],
       ['CESA - CIA. ESTADUAL DE SILOS E ARMAZÉNS'],
       ['IPAM - INST. PREV. ASSIST. MUN. - CAXIAS DO SUL'],
       ['PREVICARAZ - INST. PREV. SERV. TIT. CARGO EFET. MUN. CARAZINHO'],
       ['EGR - EMPRESA GAÚCHA DE RODOVIAS S.A.'],

       ['FUNMISSÕES - FUND. DOS MUNICÍPIOS DAS MISSÕES'],
       ['FAS - FUND. DE ASSIST. SOCIAL - CAXIAS DO SUL'],
       ['FMMA - FUND. MUN. DE MEIO AMBIENTE - GRAVATAÍ'],
       ['IEP - INSTITUTO ERECHINENSE DE PREVIDÊNCIA'],

       ['SOP - SECRETARIA DE OBRAS E HABITAÇÃO - EXTINTO'],
       ['PROCERGS - CENTRO DE TI E COMUNICACAO DO ESTADO DO RS S.A.'],
       ['IPASSP-SM - INST. PREV.  ASSIST. À SAÚDE SERV. PÚBL. MUN. DE S. MARIA'],
       ['SULGAS - CIA. DE GÁS DO ESTADO DO RIO GRANDE DO SUL'],
       ['AGESAN - AGÊNCIA REGULADORA INTERMUNICIPAL DE SANEAMENTO'],
       ['SANEP - SERVIÇO AUTÔN. DE SANEAMENTO DE PELOTAS'],
       ['AGASA - CIA. DE DESENV. ECON. E SOCIAL - S. A. PATRULHA'],
       ['TCE - TRIBUNAL DE CONTAS DO ESTADO DO RS'],
       ['IPASEM - INST. DE PREV. E ASSIST. DOS SERV. MUNIC. DE N. HAMBURGO'],
       ['RS PREV - FUNDAÇÃO PREVIDÊNCIA COMPLEMENTAR SERV. PÚBLIC. DO ESTADO RS'],
       ['COINPEL - EMPRESA MUNICIPAL DE INFORMÁTICA DE PELOTAS'],
       ['EPTV - EMPRESA PÚBLICA DE TRÂNSITO DE VIAMÃO'],

       ['CARRIS - CIA. CARRIS PORTO-ALEGRENSE'],
       ['IPSTP - INST. PREV. DOS SERV. PÚBL. DO MUNIC. - TRÊS PASSOS'],
       ['DEFPUB - DEFENSORIA PÚBLICA DO ESTADO'],
       ['SEDEC - SECRETARIA DE DESENVOLVIMENTO ECONÔMICO'],

       ['IPRESG - INST. PREV. DOS SERV. PÚBL. MUN. DE SÃO GABRIEL'] -->

In [15]:
type(banks)

list

In [17]:
df.collect()

CD_ORGAO,NM_ORGAO,ANO_LICITACAO,DS_OBJETO,VL_LICITACAO,DT_HOMOLOGACAO,VL_HOMOLOGADO,NM_ORGAO_NLP
i64,str,i64,str,f64,date,f64,list[str]
55700,"""PM DE RIO PARD…",2017,"""Pregão Presenc…",115996.0,2017-02-01,115996.0,"[""pm"", ""rio"", ""pardo""]"
84000,"""PM DE DOUTOR R…",2017,"""contratação de…",6000.0,2017-01-17,4600.0,"[""pm"", ""doutor"", ""ricardo""]"
66500,"""PM DE DOIS LAJ…",2017,"""Aquisição de m…",57474.0,2017-01-30,44828.42,"[""pm"", ""dois"", ""lajeados""]"
58701,"""CM DE SÃO LEOP…",2017,"""Registro de pr…",92848.55,2017-02-07,92848.55,"[""cm"", ""leopoldo""]"
62700,"""PM DE VERA CRU…",2017,"""Aquisição e re…",322958.0,2017-01-23,322958.0,"[""pm"", ""vera"", ""cruz""]"
…,…,…,…,…,…,…,…
46601,"""CM DE DONA FRA…",2021,"""Contratação de…",2400.0,2021-09-08,2400.0,"[""cm"", ""dona"", ""francisca""]"
88263,"""CRESU - CONS. …",2021,"""Contratação de…",72000.0,2022-01-03,72000.0,"[""cresu"", ""cons"", … ""solidos""]"
44500,"""PM DE CANOAS""",2021,"""A Prefeitura M…",300000.0,,300000.0,"[""pm"", ""canoas""]"
43400,"""PM DE CAIÇARA""",2021,"""CONTRATAÇÃO DE…",2.0675e6,2021-12-09,2.2471e6,"[""pm"", ""caicara""]"


## OLHAR ALGUM MODELO PRA FAZER ZERO SHOT CLASSIFICATION
https://huggingface.co/models?pipeline_tag=zero-shot-classification&sort=downloads

OBS: OS TESTES QUE FIZ PARECEM INTERESSANTES

In [19]:
city_councils

['cm porto alegre',
 'cm caxias sul',
 'cm porto alegre',
 'cm porto alegre',
 'cm leopoldo',
 'cm porto alegre',
 'cm bossoroca',
 'cm leopoldo',
 'cm viamao',
 'cm porto alegre',
 'cm ajuricaba',
 'cm guaiba',
 'cm lagoa tres cantos',
 'cm pelotas',
 'cm leopoldo',
 'cm arroio padre',
 'cm tramandai',
 'cm porto alegre',
 'cm guaiba',
 'cm tres passos',
 'cm porto alegre',
 'cm fazenda vilanova',
 'cm macambara',
 'cm santa maria',
 'cm carlos barbosa',
 'cm gabriel',
 'cm nova esperanca sul',
 'cm igrejinha',
 'cm uruguaiana',
 'cm teutonia',
 'cm bage',
 'cm bom jesus',
 'cm fazenda vilanova',
 'cm pelotas',
 'cm cacique doble',
 'cm vacaria',
 'cm capao leao',
 'cm bento goncalves',
 'cm boa vista missoes',
 'pm general camara',
 'pm general camara',
 'cm campinas sul',
 'cm santa maria',
 'cm novo hamburgo',
 'cm santiago',
 'cm canoas',
 'cm xangri la',
 'cm cangucu',
 'cm rio indios',
 'cm alegrete',
 'cm charqueadas',
 'cm porto alegre',
 'pm general camara',
 'cm sapiranga',


In [20]:
police

['POLÍCIA CIVIL',
 'BRIGADA MILITAR',
 'IGP - INSTITUTO-GERAL DE PERÍCIAS',
 'PC - POLÍCIA CIVIL']

In [11]:
df_polars = df.with_columns(
    pl.when(pl.col("NM_ORGAO_NLP").is_in(city_halls)).then(pl.lit("city_halls"))
    .when(pl.col("NM_ORGAO_NLP").is_in(city_councils)).then(pl.lit("city_councils"))
    .when(pl.col("NM_ORGAO_NLP").is_in(police)).then(pl.lit("police"))
    .when(pl.col("NM_ORGAO_NLP").is_in(banks)).then(pl.lit("banks"))
    .when(pl.col("NM_ORGAO_NLP").is_in(social_security)).then(pl.lit("social_security"))
    .when(pl.col("NM_ORGAO_NLP").is_in(health_care)).then(pl.lit("health_care"))
    .when(pl.col("NM_ORGAO_NLP").is_in(energy)).then(pl.lit("energy"))
    .when(pl.col("NM_ORGAO_NLP").is_in(transportation)).then(pl.lit("transportation"))
    .when(pl.col("NM_ORGAO_NLP").is_in(water_sewer)).then(pl.lit("water_sewer"))
    .when(pl.col("NM_ORGAO_NLP").is_in(universities)).then(pl.lit("universities"))
    .when(pl.col("NM_ORGAO_NLP").is_in(intermunicipal_associations)).then(pl.lit("intermunicipal_associations"))
    .when(pl.col("NM_ORGAO_NLP").is_in(regulatory_agencies)).then(pl.lit("regulatory_agencies"))
    .when(pl.col("NM_ORGAO_NLP").is_in(technology_agencies)).then(pl.lit("technology_agencies"))
    .when(pl.col("NM_ORGAO_NLP").is_in(cultural_organizations)).then(pl.lit("cultural_organizations"))
    .when(pl.col("NM_ORGAO_NLP").is_in(agricultural_institutions)).then(pl.lit("agricultural_institutions"))
    .when(pl.col("NM_ORGAO_NLP").is_in(state_agencies)).then(pl.lit("state_agencies"))
    .when(pl.col("NM_ORGAO_NLP").is_in(others)).then(pl.lit("others"))   
    .otherwise(pl.lit("NAO_TEM")).alias("TP_ORGAO")
)


In [12]:
df_polars.collect()

InvalidOperationError: `is_in` operation not supported for dtype `list[str]`

In [12]:
df_polars.filter(pl.col("TP_ORGAO")=="NAO_TEM").collect().select("NM_ORGAO").unique().to_numpy()

array([['IPREV - INSTITUTO DE PREVIDÊNCIA DOS SERVIDORES DE VIAMÃO'],
       ['URUPREV - URUGUAIANA PREVIDENCIA SOCIAL'],
       ['STAS - SECRETARIA DE TRABALHO E ASSISTÊNCIA SOCIAL'],
       ['TERMASA - CIA. ÁGUAS TERMAIS MARCELINO RAMOS'],
       ['IRGA - INSTITUTO RIOGRANDENSE DO ARROZ'],
       ['SEL - SECRETARIA DO ESPORTE E LAZER'],
       ['CONREPAR - CONS. REGIONAL DO PARANHANA'],
       ['FUNDARC - FUND. MUN. DE ARTE E CULTURA - GRAVATAÍ'],
       ['FHGV - FUNDAÇÃO HOSPITALAR GETÚLIO VARGAS'],
       ['IGP - INSTITUTO-GERAL DE PERÍCIAS'],
       ['FCAJSF - FUND. CULT. AFIF JORGE SIMÕES FILHO - SÃO SEPÉ'],
       ['CODEPAS-P. - CIA. DE DESENV. DE PASSO FUNDO'],
       ['PREVIJUÍ - INST. PREV. SERV. PUBL. MUNIC. DE IJUÍ'],
       ['BANRISUL SOLUÇÕES EM PAGAMENTOS S.A. - INSTITUIÇÃO DE PAGAMENTO'],
       ['PASSOTUR - FUND. PASSO FUNDO DE TURISMO'],
       ['SETUR - SECRETARIA DE TURISMO'],
       ['CIDUSA - CIA. INDUSTRIAL E DE DESENV. URBANO - CRUZ ALTA'],
       ['ADCOINTER - 

## 3.2. **dt_homologacao_mes e dt_homologacao_semana_do_ano**

In [25]:
df_lic['dt_homologacao_mes'] = df_lic['dt_homologacao'].dt.month
df_lic['dt_homologacao_semana_do_ano'] = df_lic['dt_homologacao'].dt.isocalendar().week