# Coleta e Carga

Neste trabalho utilizaremos uma abordagem ELTL(Extract-Load-Transform-Load), onde os dados de interesse serão primeiro extraídos e carregados crus, depois faremos dois modelos derivados deste, um com dados granulares e outro agregado.

Todos os dados crus que iremos utilizar neste trabalho são dados públicos, sem qq restrição de uso e sem dados pessoais envolvidos.

## 1 - QSA / RFB

Iremos utilizar como ponto de partida para a resolução das questões postas a base pública de dados de empresas (CNPJ, QSA) da RFB, porque é a base que contém os dados oficiais de empresas, de onde podemos fazer uma pesquisa de mercado mais fidedigna possível.

Os dados da base estão disponíveis como arquivos zip em pastas no endereço base abaixo:
https://arquivos.receitafederal.gov.br/dados/cnpj/dados_abertos_cnpj/

Os dados mais recentes disponíveis quando da realização deste trabalho são os de fev/2025, disponíveis em:

https://arquivos.receitafederal.gov.br/dados/cnpj/dados_abertos_cnpj/2025-02/

Estaremos baixando os dados de Empresas, Estabelecimentos e as tabelas de domínio de CNAEs, Municípios, Motivos de Situação e Natureza Jurídica.

IMPORTANTE:
- Esta é uma base GRANDE, com mais de 15 milhões de empresas ativas cadastradas e mais de 16 GB de tamanho. Vamos tentar baixar todos os dados e carregar no Spark
- Apesar de não dizer claramente na sua doc, é possível constatar que os arquivos da RFB vem em encoding ISO-8859-1. É importante no processamento dos arquivos no Spark utilizar este encoding correto na leitura e persistência dos dados

### Coleta / Extração (geral)

O processamento no Databricks Community Edition parece ser limitado a 1 h. Como baixar os arquivos, dezipar e processar no Spark dentro da plataforma estava levando muito tempo, não foi possível fazer tudo dentro da plataforma.

A solução encontrada foi baixar os arquivos offline no meu computador pessoal, dezipar os arquivos localmente e subí-los para um bucket S3 (no caso do Tigris (https://www.tigrisdata.com/), que parece ser mais barato que o S3 da AWS) e de lá ler no Spark do Databricks e salvar em uma Spark Table.

In [0]:
# instalar libs necessárias:
# dotenv -> para leitura de variáveis de ambiente, para não deixar secrets explícitos no código
# boto3 -> para interação com storages S3-like 

!pip install dotenv
!pip install boto3

Collecting dotenv
  Using cached dotenv-0.9.9-py2.py3-none-any.whl (1.9 kB)
Collecting python-dotenv
  Using cached python_dotenv-1.0.1-py3-none-any.whl (19 kB)
Installing collected packages: python-dotenv, dotenv
Successfully installed dotenv-0.9.9 python-dotenv-1.0.1
You should consider upgrading via the '/local_disk0/.ephemeral_nfs/envs/pythonEnv-e2138243-6b66-4d28-a44d-6b03143ea468/bin/python -m pip install --upgrade pip' command.[0m
You should consider upgrading via the '/local_disk0/.ephemeral_nfs/envs/pythonEnv-e2138243-6b66-4d28-a44d-6b03143ea468/bin/python -m pip install --upgrade pip' command.[0m


In [0]:
# copiando arquivo .env do dbfs para o dir local, para que a lib dotenv consiga ler
dbutils.fs.cp("dbfs:/FileStore/.env", "file:/tmp/env/", True) 

Out[2]: True

In [0]:
# configurações preliminares

import os
import gc
from pyspark.sql import SparkSession
from dotenv import load_dotenv

load_dotenv(dotenv_path="/tmp/env") # ler arquivo .env do dir local
print("Variáveis de ambiente carregadas")

Variáveis de ambiente carregadas


In [0]:
# configuração geral do Spark

spark = SparkSession.builder.appName("CargaMVP") \
    .getOrCreate()

# setar variáveis para acessar o Tigris
spark.sparkContext._jsc.hadoopConfiguration().set("fs.s3a.endpoint", os.getenv("AWS_ENDPOINT_URL_S3"))
spark.sparkContext._jsc.hadoopConfiguration().set("fs.s3a.access.key", os.getenv("AWS_ACCESS_KEY_ID"))
spark.sparkContext._jsc.hadoopConfiguration().set("fs.s3a.secret.key", os.getenv("AWS_SECRET_ACCESS_KEY"))
spark.sparkContext._jsc.hadoopConfiguration().set("fs.s3a.path.style.access", "true")
spark.sparkContext._jsc.hadoopConfiguration().set("fs.s3a.connection.ssl.enabled", "true")



### 1.1 - Dados de Empresas (CNPJ raiz, 8 dígitos)

#### Carga

In [0]:

# path S3 no Tigris onde estão os dados de Empresas
s3_dir = "s3a://pos-pucrio-dados/mvp_sprint_eng_dados/emp/"

# os arquivos da RFB estão vindo sem header - ler primeiro sem headers e acrescentar na mão depois
# OBS: infelizmente, em alguns dos registros há um caracter '\' no nome da empresa escapando indevidamente as aspas duplas ('"') do fim da razao social... mudar caracter de escape para '"'
df_sem_headers = spark.read.option("delimiter", ";").option("escape", "\"").option("multiLine", True).option("encoding", "iso-8859-1").csv(s3_dir, header=False, inferSchema=True) 

# headers segundo doc (https://www.gov.br/receitafederal/dados/cnpj-metadados.pdf)
headers = ["cnpj_raiz", "razao_social", "natureza_jur", "qualificacao_resp", "capital_soc", "porte", "ente_fed_resp"]

#df_sem_headers.show()
df = df_sem_headers.toDF(*headers) # acrescenta os headers no df original

In [0]:
# finalmente, carrega os dados em uma tabela Spark
df.write.option("encoding", "iso-8859-1").option("overwriteSchema", "true").mode("overwrite").saveAsTable("empresas")

In [0]:
%sql
select * from empresas where cnpj_raiz = 2209756

cnpj_raiz,razao_social,natureza_jur,qualificacao_resp,capital_soc,porte,ente_fed_resp
2209756,SOLANGE DA S.LEITE GOES\,2135,50,0,5,


In [0]:
%sql
-- verificando que inseriu corretamente, fazer select simples
select porte, count(distinct cnpj_raiz) from empresas group by porte

porte,count(DISTINCT cnpj_raiz)
,71850
1.0,45171542
3.0,1772439
5.0,14464944


In [0]:
# apagar dfs sem uso, liberar memória
del df
del df_sem_headers
gc.collect()

Out[9]: 477

### 1.2 - Dados de Estabelecimentos (CNPJ full, 11 dígitos)

#### Carga

In [0]:

# path S3 no Tigris onde estão os dados de Empresas
s3_dir = "s3a://pos-pucrio-dados/mvp_sprint_eng_dados/estab/"

# os arquivos da RFB estão vindo sem header - ler primeiro sem headers e acrescentar na mão depois
# OBS: infelizmente, em alguns dos registros há um caracter '\' no nome da empresa escapando indevidamente as aspas duplas ('"') do fim da razao social... mudar caracter de escape para '"'
df_sem_headers = spark.read.option("delimiter", ";").option("escape", "\"").option("multiLine", True).option("encoding", "iso-8859-1").csv(s3_dir, header=False, inferSchema=True) 

# headers segundo doc (https://www.gov.br/receitafederal/dados/cnpj-metadados.pdf)
headers = ["cnpj_raiz", "cnpj_ordem", "cnpj_dv", "ind_matriz_filial", "nome_fantasia", "situacao", "dat_situacao", "mot_situacao", "cidade_exterior", "pais", "dat_inicio_atividade", "CNAE_principal", "CNAEs_secundarios", "tip_logradouro", "logradouro", "num_logradouro", "compl_logradouro", "bairro", "CEP", "UF", "municipio", "ddd1", "tel1", "ddd2", "tel2", "ddd_fax", "fax", "email", "sit_especial", "dat_sit_especial"]

#df_sem_headers.show()
df = df_sem_headers.toDF(*headers) # acrescenta os headers no df original

In [0]:
# finalmente, carrega os dados em uma tabela Spark
df.write.option("encoding", "iso-8859-1").option("overwriteSchema", "true").mode("overwrite").saveAsTable("estabelecimentos")

In [0]:
%sql
select * from estabelecimentos where cnpj_raiz = "28645283"

cnpj_raiz,cnpj_ordem,cnpj_dv,ind_matriz_filial,nome_fantasia,situacao,dat_situacao,mot_situacao,cidade_exterior,pais,dat_inicio_atividade,CNAE_principal,CNAEs_secundarios,tip_logradouro,logradouro,num_logradouro,compl_logradouro,bairro,CEP,UF,municipio,ddd1,tel1,ddd2,tel2,ddd_fax,fax,email,sit_especial,dat_sit_especial
28645283,1,48,1,"""MAIZE AKISOPA""ALIMENTOS DOCES E SAGADOS ;DIET & LIGHT",8,20171202,1,,,20170914,5620104,1091102,RUA,DO IRERE,158,APT,BANGU,21875230,RJ,6001,21,39029277,,,,,dearaujosilvamariajose@yahoo.com.br,,


In [0]:
%sql
-- verificando que inseriu corretamente, fazer select simples
select CNAE_principal, count(concat(cnpj_raiz, cnpj_ordem, cnpj_dv) ) from estabelecimentos group by CNAE_principal

CNAE_principal,"count(concat(cnpj_raiz, cnpj_ordem, cnpj_dv))"
113000,191761
4322301,71801
7733100,10743
1041400,1633
8730199,7383
9602502,643801
7739099,53718
8690901,24879
4399199,56001
3839499,15498


In [0]:
# apagar dfs sem uso, liberar memória
del df
del df_sem_headers
gc.collect()

Out[14]: 485

### 1.3 - Dados de CNAEs

#### Carga

In [0]:

# path S3 no Tigris onde estão os dados de Empresas
s3_dir = "s3a://pos-pucrio-dados/mvp_sprint_eng_dados/cnae/"

# os arquivos da RFB estão vindo sem header
# ler primeiro sem headers e acrescentar na mão depois
df_sem_headers = spark.read.option("delimiter", ";").option("encoding", "iso-8859-1").csv(s3_dir, header=False, inferSchema=True) 

# headers segundo doc (https://www.gov.br/receitafederal/dados/cnpj-metadados.pdf)
headers = ["codigo", "descricao"]

#df_sem_headers.show()
df = df_sem_headers.toDF(*headers) # acrescenta os headers no df original

In [0]:
# finalmente, carrega os dados em uma tabela Spark
df.write.option("encoding", "iso-8859-1").option("overwriteSchema", "true").mode("overwrite").saveAsTable("cnae")

In [0]:
%sql
-- verificando que inseriu corretamente, fazer select simples
select * from cnae

codigo,descricao
111301,Cultivo de arroz
111302,Cultivo de milho
111303,Cultivo de trigo
111399,Cultivo de outros cereais não especificados anteriormente
112101,Cultivo de algodão herbáceo
112102,Cultivo de juta
112199,Cultivo de outras fibras de lavoura temporária não especificadas anteriormente
113000,Cultivo de cana-de-açúcar
114800,Cultivo de fumo
115600,Cultivo de soja


### 1.4 - Dados de Municípios

#### Carga

In [0]:

# path S3 no Tigris onde estão os dados de Empresas
s3_dir = "s3a://pos-pucrio-dados/mvp_sprint_eng_dados/mun/"

# os arquivos da RFB estão vindo sem header
# ler primeiro sem headers e acrescentar na mão depois
df_sem_headers = spark.read.option("delimiter", ";").option("encoding", "iso-8859-1").csv(s3_dir, header=False, inferSchema=True) 

# headers segundo doc (https://www.gov.br/receitafederal/dados/cnpj-metadados.pdf)
headers = ["codigo", "descricao"]

#df_sem_headers.show()
df = df_sem_headers.toDF(*headers) # acrescenta os headers no df original

In [0]:
# finalmente, carrega os dados em uma tabela Spark
df.write.option("encoding", "iso-8859-1").option("overwriteSchema", "true").mode("overwrite").saveAsTable("municipio")

In [0]:
%sql
-- verificando que inseriu corretamente, fazer select simples
select * from municipio

codigo,descricao
1,GUAJARA-MIRIM
2,ALTO ALEGRE DOS PARECIS
3,PORTO VELHO
4,BURITIS
5,JI-PARANA
6,CHUPINGUAIA
7,ARIQUEMES
8,CUJUBIM
9,CACOAL
10,NOVA UNIAO


### 1.5 - Dados de Motivo de Situação


#### Carga

In [0]:

# path S3 no Tigris onde estão os dados de Empresas
s3_dir = "s3a://pos-pucrio-dados/mvp_sprint_eng_dados/mot/"

# os arquivos da RFB estão vindo sem header
# ler primeiro sem headers e acrescentar na mão depois
df_sem_headers = spark.read.option("delimiter", ";").option("encoding", "iso-8859-1").csv(s3_dir, header=False, inferSchema=True) 

# headers segundo doc (https://www.gov.br/receitafederal/dados/cnpj-metadados.pdf)
headers = ["codigo", "descricao"]

#df_sem_headers.show()
df = df_sem_headers.toDF(*headers) # acrescenta os headers no df original

In [0]:
# finalmente, carrega os dados em uma tabela Spark
df.write.option("encoding", "iso-8859-1").option("overwriteSchema", "true").mode("overwrite").saveAsTable("motivo_situacao")

In [0]:
%sql
-- verificando que inseriu corretamente, fazer select simples
select * from motivo_situacao

codigo,descricao
0,SEM MOTIVO
1,EXTINCAO POR ENCERRAMENTO LIQUIDACAO VOLUNTARIA
2,INCORPORACAO
3,FUSAO
4,CISAO TOTAL
5,ENCERRAMENTO DA FALENCIA
6,ENCERRAMENTO DA LIQUIDACAO
7,ELEVACAO A MATRIZ
8,TRANSPASSE
9,NAO INICIO DE ATIVIDADE


### 1.6 - Dados de Natureza Jurídica


#### Carga

In [0]:

# path S3 no Tigris onde estão os dados de Empresas
s3_dir = "s3a://pos-pucrio-dados/mvp_sprint_eng_dados/nat/"

# os arquivos da RFB estão vindo sem header
# ler primeiro sem headers e acrescentar na mão depois
df_sem_headers = spark.read.option("delimiter", ";").option("encoding", "iso-8859-1").csv(s3_dir, header=False, inferSchema=True) 

# headers segundo doc (https://www.gov.br/receitafederal/dados/cnpj-metadados.pdf)
headers = ["codigo", "descricao"]

#df_sem_headers.show()
df = df_sem_headers.toDF(*headers) # acrescenta os headers no df original

In [0]:
# finalmente, carrega os dados em uma tabela Spark
df.write.option("encoding", "iso-8859-1").option("overwriteSchema", "true").mode("overwrite").saveAsTable("natureza_juridica")

In [0]:
%sql
-- verificando que inseriu corretamente, fazer select simples
select * from natureza_juridica

codigo,descricao
0,Natureza Jurídica não informada
3271,Órgão de Direção Local de Partido Político
3280,Comitê Financeiro de Partido Político
3298,Frente Plebiscitária ou Referendária
3301,Organização Social (OS)
3999,Associação Privada
4014,Empresa Individual Imobiliária
4090,Candidato a Cargo Político Eletivo
4120,Produtor Rural (Pessoa Física)
5010,Organização Internacional


## 2 - Base dos Dados

### 2.1 - Municípios, Regiões Imediatas, Regiões Intermediárias (Base dos Dados / IBGE)

Para fazer análises regionalizadas, não restritas exclusivamente a um município alvo mas considerando também os municípios no entorno (região imediata e região intermediária, antigas micro e mesorregiões), podemos utilizar a base de DTB (Divisão Territorial) do IBGE. Entretanto, o código de município da RFB não é o mesmo do IBGE, que faria com que tivéssemos que fazer algum match por nome de município. Para contornar esta questão, vamos utilizar uma base já tratada, a base de Municípios na Base dos Dados (https://basedosdados.org/), site que agrega e trata dados de várias fontes brasileiras e traz o id da RFB e o do IBGE numa mesma tabela de municípios. 

Os dados da base de Municípios estão disponíveis como arquivos csv.gz no endereço abaixo:

https://basedosdados.org/dataset/33b49786-fb5f-496f-bb7c-9811c985af8e?table=dffb65ac-9df9-4151-94bf-88c45bfcb056

Os dados mais recentes disponíveis são os de set/2023.


#### Coleta / Extração

Apesar do pequeno tamanho, seguiremos o mesmo estilo utilizado para a base do QSA, i.e. baixar o zip localmente, processá-lo e subí-lo para um bucket S3 do Tigris, de onde o Spark lerá os dados e salvará numa Spark Table.

#### Carga


In [0]:

# path S3 no Tigris onde estão os dados de Empresas
s3_dir = "s3a://pos-pucrio-dados/mvp_sprint_eng_dados/mun-bd/"

# os arquivos da BD já vem com headers, então só ler
df = spark.read.option("delimiter", ",").csv(s3_dir, header=True, inferSchema=True) 

In [0]:
# finalmente, carrega os dados em uma tabela Spark
df.write.mode("overwrite").saveAsTable("municipio_bd")

In [0]:
%sql
-- verificando que inseriu corretamente, fazer select simples
select * from municipio_bd

id_municipio,id_municipio_6,id_municipio_tse,id_municipio_rf,id_municipio_bcb,nome,capital_uf,id_comarca,id_regiao_saude,nome_regiao_saude,id_regiao_imediata,nome_regiao_imediata,id_regiao_intermediaria,nome_regiao_intermediaria,id_microrregiao,nome_microrregiao,id_mesorregiao,nome_mesorregiao,id_regiao_metropolitana,nome_regiao_metropolitana,ddd,id_uf,sigla_uf,nome_uf,nome_regiao,amazonia_legal,centroide
1100338,110033,434,47,44516,Nova Mamoré,0,1100106,11004,Madeira-Mamoré,110001,Porto Velho,1101,Porto Velho,11001,Porto Velho,1101,Madeira-Guaporé,,,69,11,RO,Rondônia,Norte,1,POINT(-64.6295025002404 -10.3822863210755)
1100205,110020,35,3,30719,Porto Velho,1,1100205,11004,Madeira-Mamoré,110001,Porto Velho,1101,Porto Velho,11001,Porto Velho,1101,Madeira-Guaporé,101,Região Metropolitana de Porto Velho,69,11,RO,Rondônia,Norte,1,POINT(-64.3041357999869 -9.15394033687075)
1101104,110110,493,683,46851,Itapuã do Oeste,0,1100205,11004,Madeira-Mamoré,110001,Porto Velho,1101,Porto Velho,11001,Porto Velho,1101,Madeira-Guaporé,,,69,11,RO,Rondônia,Norte,1,POINT(-63.044960463046 -9.17019402601564)
1100809,110080,477,681,46961,Candeias do Jamari,0,1100205,11004,Madeira-Mamoré,110001,Porto Velho,1101,Porto Velho,11001,Porto Velho,1101,Madeira-Guaporé,101,Região Metropolitana de Porto Velho,69,11,RO,Rondônia,Norte,1,POINT(-63.3254198532114 -8.88702392955617)
1100940,110094,680,8,56652,Cujubim,0,1100023,11001,Vale do Jamari,110002,Ariquemes,1101,Porto Velho,11001,Porto Velho,1101,Madeira-Guaporé,,,69,11,RO,Rondônia,Norte,1,POINT(-62.5652673033848 -9.1709863446154)
1100452,110045,779,4,56638,Buritis,0,1100452,11001,Vale do Jamari,110002,Ariquemes,1101,Porto Velho,11001,Porto Velho,1101,Madeira-Guaporé,,,69,11,RO,Rondônia,Norte,1,POINT(-63.9412277150937 -10.052095567536)
1100700,110070,671,679,46947,Campo Novo de Rondônia,0,1100452,11001,Vale do Jamari,110002,Ariquemes,1101,Porto Velho,11001,Porto Velho,1101,Madeira-Guaporé,,,69,11,RO,Rondônia,Norte,1,POINT(-63.7997903925811 -10.484878565906)
1100106,110010,19,1,22882,Guajará-Mirim,0,1100106,11004,Madeira-Mamoré,110001,Porto Velho,1101,Porto Velho,11002,Guajará-Mirim,1101,Madeira-Guaporé,,,69,11,RO,Rondônia,Norte,1,POINT(-64.537710733004 -11.3055098790143)
1100080,110008,213,21,41117,Costa Marques,0,1100080,11007,Vale do Guaporé,110004,Ji-Paraná,1102,Ji-Paraná,11002,Guajará-Mirim,1101,Madeira-Guaporé,,,69,11,RO,Rondônia,Norte,1,POINT(-64.0586026986492 -12.1470859394294)
1101492,110149,795,20,56717,São Francisco do Guaporé,0,1101492,11007,Vale do Guaporé,110004,Ji-Paraná,1102,Ji-Paraná,11002,Guajará-Mirim,1101,Madeira-Guaporé,,,69,11,RO,Rondônia,Norte,1,POINT(-63.1226712699562 -12.3688265389959)


### 2.2 - CNAEs (Base dos Dados / IBGE)

A classificação de CNAEs em si é organizada de forma hierárquica, mas a base apresentada pela RFB não traz os níveis intermediários de Divisão, Grupo ou Classe, que seriam úteis para uma análise ou busca em nível mais agregado. Para suprir esse gap, vamos utilizar uma base já tratada, a base de CNAEs na Base dos Dados (https://basedosdados.org/), site que agrega e trata dados de várias fontes brasileiras e traz esta base de CNAEs do IBGE com estas dimensões de níveis agregados já computadas para cada CNAE. 

Os dados da base de CNAEs estão disponíveis como arquivos csv.gz no endereço abaixo:

https://basedosdados.org/dataset/33b49786-fb5f-496f-bb7c-9811c985af8e?table=8a02c4e5-1718-41e7-8891-d0fa09265d58


Os dados mais recentes disponíveis são os de ago/2024.



#### Coleta / Extração

Apesar do pequeno tamanho, seguiremos o mesmo estilo utilizado para a base do QSA, i.e. baixar o zip localmente, processá-lo e subí-lo para um bucket S3 do Tigris, de onde o Spark lerá os dados e salvará numa Spark Table.

#### Carga


In [0]:

# path S3 no Tigris onde estão os dados de Empresas
s3_dir = "s3a://pos-pucrio-dados/mvp_sprint_eng_dados/cnae-bd/"

# os arquivos da BD já vem com headers, então só ler
# apenas um cuidado: alguns registros estão espalhados por mais de 1 linha de cada vez - habilitar opção de multiline
df = spark.read.option("delimiter", ",").option("multiLine", "true").csv(s3_dir, header=True, inferSchema=True) 

In [0]:
# finalmente, carrega os dados em uma tabela Spark
df.write.mode("overwrite").saveAsTable("cnae_bd")

In [0]:
%sql
-- verificando que inseriu corretamente, fazer select simples
select * from cnae_bd

subclasse,descricao_subclasse,classe,descricao_classe,grupo,descricao_grupo,divisao,descricao_divisao,secao,descricao_secao,indicador_cnae_2_0,indicador_cnae_2_1,indicador_cnae_2_2,indicador_cnae_2_3
9700500,Serviços domésticos,97005,Serviços domésticos,970,Serviços domésticos,97,Serviços Domésticos,T,Serviços Domésticos,1,1,1,1
9900800,Organismos internacionais e outras instituições extraterritoriais,99008,Organismos internacionais e outras instituições extraterritoriais,990,Organismos internacionais e outras instituições extraterritoriais,99,Organismos Internacionais E Outras Instituições Extraterritoriais,U,Organismos Internacionais E Outras Instituições Extraterritoriais,1,1,1,0
111301,Cultivo de arroz,1113,Cultivo de cereais,11,Produção de lavouras temporárias,1,"Agricultura, Pecuária E Serviços Relacionados",A,"Agricultura, Pecuária, Produção Florestal, Pesca E Aquicultura",1,1,1,1
111399,Cultivo de outros cereais não especificados anteriormente,1113,Cultivo de cereais,11,Produção de lavouras temporárias,1,"Agricultura, Pecuária E Serviços Relacionados",A,"Agricultura, Pecuária, Produção Florestal, Pesca E Aquicultura",1,1,1,1
111302,Cultivo de milho,1113,Cultivo de cereais,11,Produção de lavouras temporárias,1,"Agricultura, Pecuária E Serviços Relacionados",A,"Agricultura, Pecuária, Produção Florestal, Pesca E Aquicultura",1,1,1,1
111303,Cultivo de trigo,1113,Cultivo de cereais,11,Produção de lavouras temporárias,1,"Agricultura, Pecuária E Serviços Relacionados",A,"Agricultura, Pecuária, Produção Florestal, Pesca E Aquicultura",1,1,1,1
112102,Cultivo de juta,1121,Cultivo de algodão herbáceo e de outras fibras de lavoura temporária,11,Produção de lavouras temporárias,1,"Agricultura, Pecuária E Serviços Relacionados",A,"Agricultura, Pecuária, Produção Florestal, Pesca E Aquicultura",1,1,1,1
112101,Cultivo de algodão herbáceo,1121,Cultivo de algodão herbáceo e de outras fibras de lavoura temporária,11,Produção de lavouras temporárias,1,"Agricultura, Pecuária E Serviços Relacionados",A,"Agricultura, Pecuária, Produção Florestal, Pesca E Aquicultura",1,1,1,1
112199,Cultivo de outras fibras de lavoura temporária não especificadas anteriormente,1121,Cultivo de algodão herbáceo e de outras fibras de lavoura temporária,11,Produção de lavouras temporárias,1,"Agricultura, Pecuária E Serviços Relacionados",A,"Agricultura, Pecuária, Produção Florestal, Pesca E Aquicultura",1,1,1,1
113000,Cultivo de cana-de-açúcar,1130,Cultivo de cana-de-açúcar,11,Produção de lavouras temporárias,1,"Agricultura, Pecuária E Serviços Relacionados",A,"Agricultura, Pecuária, Produção Florestal, Pesca E Aquicultura",1,1,1,1
