# Pacotes

In [1]:
from ReceitaCNPJApi import ReceitaCNPJApi
from ReceitaLT import ReceitaLT
from pyspark.sql import SparkSession
import findspark
from concurrent.futures import ThreadPoolExecutor

In [2]:
findspark.init()

# Versão

In [3]:
import os
import sys
print(os.environ.get("SPARK_HOME"))
print(os.environ.get("HADOOP_HOME"))
print(os.environ.get("JAVA_HOME"))
os.environ["PYARROW_IGNORE_TIMEZONE"] = "1"

C:\Users\pedro\Spark\spark-3.5.0-bin-hadoop3
C:\Users\pedro\hadoop\bin
C:\Program Files\Java\jdk1.8.0_202


# Spark Session

In [4]:
spark = (SparkSession.builder
    .master("local[*]")  
    .config("spark.driver.cores", "3") 
    .config("spark.driver.memory", "12g") 
    .config("spark.default.parallelism", "100") 
    .config("spark.executor.cores", "2")  
    .config("spark.executor.instances", "2") 
    .config("spark.executor.memory", "4g") 
    .config("spark.memory.fraction", "0.8") 
    .config("spark.memory.storageFraction", "0.5")
    .config("spark.memory.offHeap.enabled", "true") 
    .config("spark.memory.offHeap.size", "2g")  
    .config("spark.executor.memoryOverhead", "1g")  
    .config('spark.sql.repl.eagerEval.enabled', True)
    .config("spark.sql.repl.eagerEval.maxNumRows", 10)
    .appName('dataset_cnpj')
    .getOrCreate())


# Iniciando as classes

In [11]:
# Inicializa a classe sem parâmetros
api = ReceitaCNPJApi()


receitaLT_processor = ReceitaLT(spark) 

# Urls

In [12]:
# Especifica o ano e o mês desejados
year = 2024
month = 9

# Gera a lista de URLs para todos os prefixos no período especificado
urls = api.lista_urls_receita(year=year, month=month)

for url in urls:
    print(f"Result for {url}")

In [13]:
urls

['https://dadosabertos.rfb.gov.br/CNPJ/Estabelecimentos0.zip',
 'https://dadosabertos.rfb.gov.br/CNPJ/Estabelecimentos1.zip',
 'https://dadosabertos.rfb.gov.br/CNPJ/Estabelecimentos2.zip',
 'https://dadosabertos.rfb.gov.br/CNPJ/Estabelecimentos3.zip',
 'https://dadosabertos.rfb.gov.br/CNPJ/Estabelecimentos4.zip',
 'https://dadosabertos.rfb.gov.br/CNPJ/Estabelecimentos5.zip',
 'https://dadosabertos.rfb.gov.br/CNPJ/Estabelecimentos6.zip',
 'https://dadosabertos.rfb.gov.br/CNPJ/Estabelecimentos7.zip',
 'https://dadosabertos.rfb.gov.br/CNPJ/Estabelecimentos8.zip',
 'https://dadosabertos.rfb.gov.br/CNPJ/Estabelecimentos9.zip',
 'https://dadosabertos.rfb.gov.br/CNPJ/Municipios.zip',
 'https://dadosabertos.rfb.gov.br/CNPJ/Simples.zip',
 'https://dadosabertos.rfb.gov.br/CNPJ/Empresas0.zip',
 'https://dadosabertos.rfb.gov.br/CNPJ/Empresas1.zip',
 'https://dadosabertos.rfb.gov.br/CNPJ/Empresas2.zip',
 'https://dadosabertos.rfb.gov.br/CNPJ/Empresas3.zip',
 'https://dadosabertos.rfb.gov.br/CNPJ/Em

# Fazendo download e deszipando os dados

In [8]:
urls = api.lista_urls_receita('Municipios')

def process_url(url):
    return api.download_and_unzip(url)

with ThreadPoolExecutor(max_workers=3) as executor:  # Altere o `max_workers` conforme o número desejado de threads.
    results = list(executor.map(process_url, urls))

for url, result in zip(urls, results):
    print(f"Result for {url}: {result[1]}")

INFO:ReceitaCNPJApi:Trying to unzip ./temp\Municipios.zip
INFO:ReceitaCNPJApi:File https://dadosabertos.rfb.gov.br/CNPJ/Municipios.zip has been unzipped successfully to ./output


Result for https://dadosabertos.rfb.gov.br/CNPJ/Municipios.zip: Success


In [9]:
urls = api.lista_urls_receita('Municipios', 'Cnaes', 'Naturezas', 'Qualificacoes', 'Paises','Motivos')

def process_url(url):
    return api.download_and_unzip(url)

with ThreadPoolExecutor(max_workers=3) as executor:  # Altere o `max_workers` conforme o número desejado de threads.
    results = list(executor.map(process_url, urls))

for url, result in zip(urls, results):
    print(f"Result for {url}: {result[1]}")

INFO:ReceitaCNPJApi:Trying to unzip ./temp\Naturezas.zip
INFO:ReceitaCNPJApi:File https://dadosabertos.rfb.gov.br/CNPJ/Naturezas.zip has been unzipped successfully to ./output
INFO:ReceitaCNPJApi:Trying to unzip ./temp\Cnaes.zip
INFO:ReceitaCNPJApi:File https://dadosabertos.rfb.gov.br/CNPJ/Cnaes.zip has been unzipped successfully to ./output
INFO:ReceitaCNPJApi:Trying to unzip ./temp\Municipios.zip
INFO:ReceitaCNPJApi:File https://dadosabertos.rfb.gov.br/CNPJ/Municipios.zip has been unzipped successfully to ./output
INFO:ReceitaCNPJApi:Trying to unzip ./temp\Qualificacoes.zip
INFO:ReceitaCNPJApi:File https://dadosabertos.rfb.gov.br/CNPJ/Qualificacoes.zip has been unzipped successfully to ./output
INFO:ReceitaCNPJApi:Trying to unzip ./temp\Paises.zip
INFO:ReceitaCNPJApi:File https://dadosabertos.rfb.gov.br/CNPJ/Paises.zip has been unzipped successfully to ./output
INFO:ReceitaCNPJApi:Trying to unzip ./temp\Motivos.zip
INFO:ReceitaCNPJApi:File https://dadosabertos.rfb.gov.br/CNPJ/Motivos

Result for https://dadosabertos.rfb.gov.br/CNPJ/Municipios.zip: Success
Result for https://dadosabertos.rfb.gov.br/CNPJ/Cnaes.zip: Success
Result for https://dadosabertos.rfb.gov.br/CNPJ/Naturezas.zip: Success
Result for https://dadosabertos.rfb.gov.br/CNPJ/Qualificacoes.zip: Success
Result for https://dadosabertos.rfb.gov.br/CNPJ/Paises.zip: Success
Result for https://dadosabertos.rfb.gov.br/CNPJ/Motivos.zip: Success


In [None]:
urls = api.lista_urls_receita('Empresas')

def process_url(url):
    return api.download_and_unzip(url)

with ThreadPoolExecutor(max_workers=3) as executor:  # Altere o `max_workers` conforme o número desejado de threads.
    results = list(executor.map(process_url, urls))

for url, result in zip(urls, results):
    print(f"Result for {url}: {result[1]}")

# Tratando os dados

## Mei

In [9]:
df = receitaLT_processor.read_data(schema_name='empresas').cache()
df_mei = receitaLT_processor.process_mei(df)

INFO:ReceitaLT:Detected encodings: {'./output\\Empresas\\Empresas0.csv': 'ascii', './output\\Empresas\\Empresas1.csv': 'ascii', './output\\Empresas\\Empresas2.csv': 'ascii', './output\\Empresas\\Empresas3.csv': 'ascii', './output\\Empresas\\Empresas4.csv': 'ascii', './output\\Empresas\\Empresas5.csv': 'ascii', './output\\Empresas\\Empresas6.csv': 'ascii', './output\\Empresas\\Empresas7.csv': 'ascii', './output\\Empresas\\Empresas8.csv': 'ascii', './output\\Empresas\\Empresas9.csv': 'ascii'}
INFO:ReceitaLT:Detected encodings: {'./output\\Naturezas\\Naturezas.csv': 'ISO-8859-1'}
INFO:ReceitaLT:Detected encodings: {'./output\\Qualificacoes\\Qualificacoes.csv': 'ISO-8859-1'}


In [10]:
df_mei

CNPJ,NOME_EMPRESA,CAP_SOCIAL,NM_PORTE,NAT_JURICA,ENTE_FEDERATIVO,NM_QUALIFICACAO,CPF_CRIPTOGRAFADO,CPF_LEN,PROBABILIDADE_DE_SER_CPF,PRIMEIRO_NOME,GRUPO_NOME,PROBABILIDADE_CLASSIFICACAO,CLASSIFICACAO
29201616,RODRIGO DOS SANTO...,200000,MICRO EMPRESA,Empresário (Indiv...,,Empresário,++/LgNYWe8RDKwe9k...,11,SIM,RODRIGO,RODRIGO,1.0,M
44987059,BRUNA RENATA RAMO...,100000,MICRO EMPRESA,Empresário (Indiv...,,Empresário,++1BgII0vOHoFtTZ2...,11,SIM,BRUNA,BRUNA,1.0,F
31406636,REGIANE FERREIRA ...,500000,MICRO EMPRESA,Empresário (Indiv...,,Empresário,++3FssKAaBIsSLC94...,11,SIM,REGIANE,REGIANE,1.0,F
30385632,CRISTIANO RESCHKE...,150000,MICRO EMPRESA,Empresário (Indiv...,,Empresário,++46AddwPMIi8CgPH...,11,SIM,CRISTIANO,CRISTIANO,1.0,M
47505583,LAURA COELHO ASCA...,100000,MICRO EMPRESA,Empresário (Indiv...,,Empresário,++5g/yiFFi1aPYdza...,11,SIM,LAURA,LAURA,1.0,F
23159295,FRANCISCO CLEITON...,300000,MICRO EMPRESA,Empresário (Indiv...,,Empresário,++7d3A7ET98/LPyME...,11,SIM,FRANCISCO,FRANCISCO,1.0,M
23869732,RAFAEL BARBACOVI ...,300000,MICRO EMPRESA,Empresário (Indiv...,,Empresário,++7ygM/2K4OW8ti+8...,11,SIM,RAFAEL,RAFAEL,1.0,M
39831429,JOYCE VANDERLEI D...,700000,MICRO EMPRESA,Empresário (Indiv...,,Empresário,++8/mR6L01msS+vev...,11,SIM,JOYCE,JOICE,1.0,F
42812567,ROMENILDO DA SILV...,200000,MICRO EMPRESA,Empresário (Indiv...,,Empresário,++8FxhR+0NQFwi4Ah...,11,SIM,ROMENILDO,ROMENILDO,1.0,M
39448828,CAROLAINY DA SILV...,1100000,MICRO EMPRESA,Empresário (Indiv...,,Empresário,++92x4mRPEjquT9z+...,11,SIM,CAROLAINY,KAROLAINY,1.0,F


## Empresas

In [8]:
df = receitaLT_processor.read_data(schema_name='empresas').cache()
df_empresas = receitaLT_processor.process_empresas(df)

INFO:ReceitaLT:Detected encodings: {'./output\\Empresas\\Empresas0.csv': 'ascii', './output\\Empresas\\Empresas1.csv': 'ascii', './output\\Empresas\\Empresas2.csv': 'ascii', './output\\Empresas\\Empresas3.csv': 'ascii', './output\\Empresas\\Empresas4.csv': 'ascii', './output\\Empresas\\Empresas5.csv': 'ascii', './output\\Empresas\\Empresas6.csv': 'ascii', './output\\Empresas\\Empresas7.csv': 'ascii', './output\\Empresas\\Empresas8.csv': 'ascii', './output\\Empresas\\Empresas9.csv': 'ascii'}
INFO:ReceitaLT:Detected encodings: {'./output\\Naturezas\\Naturezas.csv': 'ISO-8859-1'}
INFO:ReceitaLT:Detected encodings: {'./output\\Qualificacoes\\Qualificacoes.csv': 'ISO-8859-1'}


In [9]:
df_empresas

CNPJ,NOME_EMPRESA,CAP_SOCIAL,PORTE,ENTE_FEDERATIVO,NAT_JURICA,NM_QUALIFICACAO,CPF_LEN,NM_PORTE,PROBABILIDADE_DE_SER_CPF,CPF_CRIPTOGRAFADO
41273594,OZINETE DELFINO C...,500000,1,,Empresário (Indiv...,Empresário,11.0,MICRO EMPRESA,SIM,ofSDJMxzFJmcZwyhp...
41273595,GILVAN PEREIRA XA...,300000,1,,Empresário (Indiv...,Empresário,11.0,MICRO EMPRESA,SIM,sFsVa2XgMuJ0DjZNq...
41273596,RODRIGO JOSE FERR...,1000000,1,,Empresário (Indiv...,Empresário,11.0,MICRO EMPRESA,SIM,aTEqRIRVZWuRTLVpp...
41273597,PACHARRUS QUEIROZ...,500000,1,,Empresário (Indiv...,Empresário,11.0,MICRO EMPRESA,SIM,kiu64La6RmA/tAPsY...
41273598,GLORIA VIANA DIAS...,110000,1,,Empresário (Indiv...,Empresário,11.0,MICRO EMPRESA,SIM,5LN2FYYUvhVwystje...
41273599,ANA PAULA DA SILV...,200000,1,,Empresário (Indiv...,Empresário,11.0,MICRO EMPRESA,SIM,mO0mdj45h5xVP6Oww...
41273600,41.273.600 AVANIL...,5000000,1,,Empresário (Indiv...,Empresário,8.0,MICRO EMPRESA,NAO,oumbtiBmufuRKKx+N...
41273601,GABRIELA HELENA F...,200000,1,,Empresário (Indiv...,Empresário,11.0,MICRO EMPRESA,SIM,Bn/aCXZL4XWDRjZxZ...
41273602,FABIO SOUZA DO RO...,1500000,1,,Empresário (Indiv...,Empresário,11.0,MICRO EMPRESA,SIM,f9QFmB03K99JUQpeg...
41273603,GRAFLINE ACESSORI...,1000000,1,,Sociedade Empresá...,Sócio-Administrador,,MICRO EMPRESA,NAO,


# Estabelecimentos

In [5]:
df = receitaLT_processor.read_data(schema_name='estabelecimentos').cache()

INFO:ReceitaLT:Detected encodings: {'./output\\Estabelecimentos\\Estabelecimentos.csv': 'ascii', './output\\Estabelecimentos\\Estabelecimentos0.csv': 'ascii', './output\\Estabelecimentos\\Estabelecimentos1.csv': 'ascii', './output\\Estabelecimentos\\Estabelecimentos2.csv': 'ascii', './output\\Estabelecimentos\\Estabelecimentos3.csv': 'ascii', './output\\Estabelecimentos\\Estabelecimentos4.csv': 'ascii', './output\\Estabelecimentos\\Estabelecimentos5.csv': 'ascii', './output\\Estabelecimentos\\Estabelecimentos6.csv': 'ascii', './output\\Estabelecimentos\\Estabelecimentos7.csv': 'ascii', './output\\Estabelecimentos\\Estabelecimentos8.csv': 'ascii', './output\\Estabelecimentos\\Estabelecimentos9.csv': 'ISO-8859-1'}


In [6]:
df

CNPJ_BASICO,CNPJ_ORDEM,CNPJ_DV,MATRIZ_FILIAL,NOME_FANTASIA,SIT_CADASTRAL,DT_SIT_CADASTRAL,MOTIVO_CADASTRAL,NOME_CIDADE_EXTERIOR,PAIS,DT_INICIO_ATIVIDADE,CNAE_1,CNAE_2,TIPO_LOUGRADOURO,LOGRADOURO,NUMERO,COMPLEMENTO,BAIRRO,CEP,UF,MUNICIPIO,DDD1,TEL1,DDD2,TEL2,DDD_FAX,FAX,EMAIL,SIT_ESPECIAL,DT_SIT_ESPECIAL
19551234,1,55,1,,8,20140424,1,,,20140120,9602502,,RUA,PRINCIPAL 2,10.0,,PEDRO ROSENO,69917650,AC,139,68,99819198,,,,,,,
19551248,1,79,1,L NUNES MANUTENCOES,8,20180201,67,,,20140120,4330404,"4322301,4321500,4...",RUA,PROFESSORA MYRIAM...,78.0,,JARDIM RESIDENCIA...,12422490,SP,6861,12,35276011,,,,,,,
19551261,1,28,1,TATY BABY,8,20160303,1,,,20140120,4781400,"4755503,4755502,4...",AVENIDA,JOAO RIBEIRO,,,DISTRITO CASA DE ...,68565973,PA,599,94,33191373,,,,,sandra-amaral2010...,,
17239220,1,75,1,,4,20210409,63,,,20121130,4120400,"2599301,4213800,4...",RUA,CAPITAO MANUEL DE...,217.0,,CORDEIRO,50640230,PE,2531,81,32270376,,,,,ATLANTICOSCONTABI...,,
19551285,1,87,1,ABREU DESIGNER DECOR,2,20140120,0,,,20140120,4789002,8230001,AVENIDA,BELO HORIZONTE,2761.0,QUADRA 099/A;LOTE...,CIDADE PRIMAVERA II,78850000,MT,9871,66,96563658,,,,,DAYRON.SA@GMAIL.COM,,
19551295,1,12,1,LEILANE BRITO DES...,8,20140410,1,,,20140120,4789099,,RUA,CAPITAO AFRODIZIO...,367.0,,CENTRO,63475000,CE,1439,88,35221576,,,,,LEILA.NI.M@HOTMAI...,,
19551306,1,64,1,,2,20140120,0,,,20140120,4330404,,RUA,MANOEL PAULO,149.0,,LOMANTO JUNIOR,45601150,BA,3597,73,88174188,,,,,,,
19551319,1,33,1,,8,20180201,67,,,20140120,4399103,,RUA,ANTONIO ADAIL DA ...,206.0,,TRIANGULO,63041040,CE,1447,88,88676903,,,,,,,
19551329,1,79,1,ELIANA LILIA,8,20150324,1,,,20140120,4781400,,PRACA,JOAO PAULO,1740.0,CASA,BARROS FILHO,21512250,RJ,6001,21,32524652,,,,,elianalilia@gmail...,,
19551342,1,28,1,BORRACHARIA DO AS...,8,20180425,1,,,20140120,4520006,4530705,AVENIDA,BRASIL,992.0,,SANTA EUGENIA,35590000,MG,4743,37,91403555,,,,,brasital10@gmail.com,,


In [7]:
df_estabelecimentos = receitaLT_processor.process_estabelecimentos(df)

INFO:ReceitaLT:Detected encodings: {'./output\\Paises\\Paises.csv': 'ISO-8859-1'}
INFO:ReceitaLT:Detected encodings: {'./output\\Municipios\\Municipios.csv': 'ascii'}
INFO:ReceitaLT:Detected encodings: {'./output\\Cnaes\\Cnaes.csv': 'ISO-8859-1'}
INFO:ReceitaLT:Detected encodings: {'./output\\Motivos\\Motivos.csv': 'ascii'}


In [8]:
df_estabelecimentos

CNPJ_BASICO,CNPJ_ORDEM,CNPJ_DV,MATRIZ_FILIAL,NOME_FANTASIA,SIT_CADASTRAL,DT_SIT_CADASTRAL,NOME_CIDADE_EXTERIOR,DT_INICIO_ATIVIDADE,CNAE_2,TIPO_LOUGRADOURO,LOGRADOURO,NUMERO,COMPLEMENTO,BAIRRO,CEP,UF,DDD1,TEL1,DDD2,TEL2,DDD_FAX,FAX,EMAIL,SIT_ESPECIAL,DT_SIT_ESPECIAL,NM_MOTIVO,CNAE,MUNICIPIO,NM_PAIS,PROVEDOR,ano_cadastro,mes_cadastro,ano_sit_cadastral,mes_sit_cadastral,NM_SIT_CADASTRAL,VALILD_EMAIL,NM_MATRIZ_FILIAL,ENDERECO_COMPLETO,COORDENADAS
19551234,1,55,1,,8,2014-04-24,,2014-01-20,,RUA,PRINCIPAL 2,10.0,,PEDRO ROSENO,69917650,AC,68,99819198,,,,,,,,EXTINCAO POR ENCE...,Atividades de est...,RIO BRANCO,,,2014,1,2014,4,BAIXADA,,MATRIZ,"RUA PRINCIPAL 2, ...","{-9.979038, -67.8..."
19551248,1,79,1,L NUNES MANUTENCOES,8,2018-02-01,,2014-01-20,"4322301,4321500,4...",RUA,PROFESSORA MYRIAM...,78.0,,JARDIM RESIDENCIA...,12422490,SP,12,35276011,,,,,,,,REGISTRO CANCELADO,Serviços de pintu...,PINDAMONHANGABA,,,2014,1,2018,2,BAIXADA,,MATRIZ,RUA PROFESSORA MY...,"{-22.939669, -45...."
19551261,1,28,1,TATY BABY,8,2016-03-03,,2014-01-20,"4755503,4755502,4...",AVENIDA,JOAO RIBEIRO,,,DISTRITO CASA DE ...,68565973,PA,94,33191373,,,,,sandra-amaral2010...,,,EXTINCAO POR ENCE...,Comércio varejist...,SANTA MARIA DAS B...,,HOTMAIL,2014,1,2016,3,BAIXADA,sandra-amaral2010...,MATRIZ,AVENIDA JOAO RIBE...,"{-8.779131, -50.4..."
17239220,1,75,1,,4,2021-04-09,,2012-11-30,"2599301,4213800,4...",RUA,CAPITAO MANUEL DE...,217.0,,CORDEIRO,50640230,PE,81,32270376,,,,,atlanticoscontabi...,,,OMISSAO DE DECLAR...,Construção de edi...,RECIFE,,GMAIL,2012,11,2021,4,INAPTA,atlanticoscontabi...,MATRIZ,RUA CAPITAO MANUE...,"{-8.059178, -34.9..."
19551285,1,87,1,ABREU DESIGNER DECOR,2,2014-01-20,,2014-01-20,8230001,AVENIDA,BELO HORIZONTE,2761.0,QUADRA 099/A;LOTE...,CIDADE PRIMAVERA II,78850000,MT,66,96563658,,,,,dayron.sa@gmail.com,,,SEM MOTIVO,Comércio varejist...,PRIMAVERA DO LESTE,,GMAIL,2014,1,2014,1,ATIVA,dayron.sa@gmail.com,MATRIZ,AVENIDA BELO HORI...,"{-15.536981, -54...."
19551295,1,12,1,LEILANE BRITO DES...,8,2014-04-10,,2014-01-20,,RUA,CAPITAO AFRODIZIO...,367.0,,CENTRO,63475000,CE,88,35221576,,,,,leila.ni.m@hotmai...,,,EXTINCAO POR ENCE...,Comércio varejist...,JAGUARIBE,,HOTMAIL,2014,1,2014,4,BAIXADA,leila.ni.m@hotmai...,MATRIZ,RUA CAPITAO AFROD...,"{-5.8932853, -38...."
19551306,1,64,1,,2,2014-01-20,,2014-01-20,,RUA,MANOEL PAULO,149.0,,LOMANTO JUNIOR,45601150,BA,73,88174188,,,,,,,,SEM MOTIVO,Serviços de pintu...,ITABUNA,,,2014,1,2014,1,ATIVA,,MATRIZ,"RUA MANOEL PAULO,...","{NULL, NULL}"
19551319,1,33,1,,8,2018-02-01,,2014-01-20,,RUA,ANTONIO ADAIL DA ...,206.0,,TRIANGULO,63041040,CE,88,88676903,,,,,,,,REGISTRO CANCELADO,Obras de alvenaria,JUAZEIRO DO NORTE,,,2014,1,2018,2,BAIXADA,,MATRIZ,RUA ANTONIO ADAIL...,"{NULL, NULL}"
19551329,1,79,1,ELIANA LILIA,8,2015-03-24,,2014-01-20,,PRACA,JOAO PAULO,1740.0,CASA,BARROS FILHO,21512250,RJ,21,32524652,,,,,elianalilia@gmail...,,,EXTINCAO POR ENCE...,Comércio varejist...,RIO DE JANEIRO,,GMAIL,2014,1,2015,3,BAIXADA,elianalilia@gmail...,MATRIZ,"PRACA JOAO PAULO,...","{NULL, NULL}"
19551342,1,28,1,BORRACHARIA DO AS...,8,2018-04-25,,2014-01-20,4530705,AVENIDA,BRASIL,992.0,,SANTA EUGENIA,35590000,MG,37,91403555,,,,,brasital10@gmail.com,,,EXTINCAO POR ENCE...,Serviços de borra...,LAGOA DA PRATA,,GMAIL,2014,1,2018,4,BAIXADA,brasital10@gmail.com,MATRIZ,"AVENIDA BRASIL, 9...","{-20.023216, -45...."


## Simples

In [None]:
df = receitaLT_processor.read_data(schema_name='simples').cache()
df_simples = receitaLT_processor.process_mei(df)

In [10]:
df_simples

CNPJ,NOME_EMPRESA,CAP_SOCIAL,NM_PORTE,NAT_JURICA,ENTE_FEDERATIVO,NM_QUALIFICACAO,CPF_CRIPTOGRAFADO,CPF_LEN,PROBABILIDADE_DE_SER_CPF,PRIMEIRO_NOME,GRUPO_NOME,PROBABILIDADE_CLASSIFICACAO,CLASSIFICACAO
46491426,SERGIO LUIZ BISPO...,350000,MICRO EMPRESA,Empresário (Indiv...,,Empresário,++6B3MoERWw3ye37D...,11,SIM,SERGIO,SERGIO,1.0,M
43691557,ERICK VINICIUS BR...,500000,MICRO EMPRESA,Empresário (Indiv...,,Empresário,++6Gfo0SgJhlY0e/V...,11,SIM,ERICK,ERICK,1.0,M
12315218,MARIANE PONTES DA...,100,MICRO EMPRESA,Empresário (Indiv...,,Empresário,++9om51gTFu0cOLO2...,11,SIM,MARIANE,MARIANE,1.0,F
27304967,FELIPE TRAJANO DE...,200000,MICRO EMPRESA,Empresário (Indiv...,,Empresário,++AZq9oGL8+HAFOls...,11,SIM,FELIPE,FELIPE,1.0,M
25280592,ANDERSON FERRAZ D...,200000,MICRO EMPRESA,Empresário (Indiv...,,Empresário,++DLorKs0viF97bG4...,11,SIM,ANDERSON,ANDERSON,0.9925793596262196,M
14433503,LUCIONE APARECIDA...,100,MICRO EMPRESA,Empresário (Indiv...,,Empresário,++IirqpFsJyouN6CY...,11,SIM,LUCIONE,LUCIONE,0.6943620178041543,F
33210206,FERNANDO DENEZ MO...,500000,MICRO EMPRESA,Empresário (Indiv...,,Empresário,++Js4C5deZl7nWTHX...,11,SIM,FERNANDO,FERNANDO,1.0,M
30214848,LETICIA APARECIDA...,1000000,MICRO EMPRESA,Empresário (Indiv...,,Empresário,++LffTg9fVwz4eZgM...,11,SIM,LETICIA,LETICIA,1.0,F
28713292,FERNANDO MACHADO ...,100000,MICRO EMPRESA,Empresário (Indiv...,,Empresário,++Nr/102PI7Y8dYtk...,11,SIM,FERNANDO,FERNANDO,1.0,M
40859832,RICARDO ALESSANDR...,100000,MICRO EMPRESA,Empresário (Indiv...,,Empresário,++SFK9kkxkiyNT4w4...,11,SIM,RICARDO,RICARDO,1.0,M
