In [1]:
import json
import urllib.request


class _Response:
    def __init__(self, data):
        self._data = data

    def json(self):
        return self._data


class requests:
    @staticmethod
    def get(url, *args, **kwargs):
        with urllib.request.urlopen(url) as resp:
            return _Response(json.load(resp))


dados = requests.get("https://servicodados.ibge.gov.br/api/v2/cnae/classes").json()

dados[0]

{'id': '01113',
 'descricao': 'CULTIVO DE CEREAIS',
 'grupo': {'id': '011',
  'descricao': 'PRODUÇÃO DE LAVOURAS TEMPORÁRIAS',
  'divisao': {'id': '01',
   'descricao': 'AGRICULTURA, PECUÁRIA E SERVIÇOS RELACIONADOS',
   'secao': {'id': 'A',
    'descricao': 'AGRICULTURA, PECUÁRIA, PRODUÇÃO FLORESTAL, PESCA E AQÜICULTURA'}}},
 'observacoes': ['Esta classe compreende - o cultivo de alpiste, arroz, aveia, centeio, cevada, milho, milheto, painço, sorgo, trigo, trigo preto, triticale e outros cereais não especificados anteriormente',
  'Esta classe compreende ainda - o beneficiamento de cereais em estabelecimento agrícola, quando atividade complementar ao cultivo\r\n- a produção de sementes de cereais, quando atividade complementar ao cultivo',
  'Esta classe NÃO compreende - a produção de sementes certificadas dos cereais desta classe, inclusive modificadas geneticamente (01.41-5)\r\n- os serviços de preparação de terreno, cultivo e colheita realizados sob contrato (01.61-0)\r\n- o benefi

In [2]:
qtde_atividades_distintas = len(dados)

In [3]:
grupos = []

for registro in dados:
    grupos.append(registro["grupo"]["descricao"])

grupos[:10]

['PRODUÇÃO DE LAVOURAS TEMPORÁRIAS',
 'PRODUÇÃO DE LAVOURAS TEMPORÁRIAS',
 'PRODUÇÃO DE LAVOURAS TEMPORÁRIAS',
 'PRODUÇÃO DE LAVOURAS TEMPORÁRIAS',
 'PRODUÇÃO DE LAVOURAS TEMPORÁRIAS',
 'PRODUÇÃO DE LAVOURAS TEMPORÁRIAS',
 'PRODUÇÃO DE LAVOURAS TEMPORÁRIAS',
 'HORTICULTURA E FLORICULTURA',
 'HORTICULTURA E FLORICULTURA',
 'EXTRAÇÃO DE MINERAIS METÁLICOS NÃO-FERROSOS']

In [4]:
qtde_grupos_distintos = len(set(grupos))

In [5]:
grupos_count = [(grupo, grupos.count(grupo)) for grupo in set(grupos)]

grupos_count[:5]

[('COMÉRCIO VAREJISTA NÃO-ESPECIALIZADO', 3),
 ('ACABAMENTOS EM FIOS, TECIDOS E ARTEFATOS TÊXTEIS', 1),
 ('FABRICAÇÃO DE EQUIPAMENTO BÉLICO PESADO, ARMAS E MUNIÇÕES', 1),
 ('PRODUÇÃO DE LAVOURAS TEMPORÁRIAS', 7),
 ('DESCONTAMINAÇÃO E OUTROS SERVIÇOS DE GESTÃO DE RESÍDUOS', 1)]

In [6]:
grupos_count = dict(grupos_count)

In [7]:
valor_maximo = max(grupos_count.values())

grupos_mais_atividades = [
    chave for (chave, valor) in grupos_count.items() if valor == valor_maximo
]

print(len(grupos_mais_atividades))
print(grupos_mais_atividades)

1
['REPRESENTANTES COMERCIAIS E AGENTES DO COMÉRCIO, EXCETO DE VEÍCULOS AUTOMOTORES E MOTOCICLETAS']


In [8]:
import urllib.request
import json

from datetime import datetime

class ETL:
    def __init__(self):
        self.url = None

    def extract_cnae_data(self, url):
        self.url = url

        data_extracao = datetime.today().strftime("%Y/%m/%d - %H:%M:%S")

        dados = requests.get(self.url).json()

        grupos = []

        for registro in dados:
            grupos.append(registro["grupo"]["descricao"])

        grupos_count = [(grupo, grupos.count(grupo)) for grupo in set(grupos)]
        grupos_count = dict(grupos_count)

        valor_maximo = max(grupos_count.values())

        grupos_mais_atividades = [
            chave for (chave, valor) in grupos_count.items() if valor == valor_maximo
        ]

        qtde_atividades_distintas = len(dados)

        qtde_grupos_distintos = len(set(grupos))

        print(f"Dados extraídos em: {data_extracao}")
        print(f"Quantidade de atividades distintas = {qtde_atividades_distintas}")
        print(f"Quantidade de grupos distintos = {qtde_grupos_distintos}")
        print(
            f"Grupos com o maior número de atividades = {grupos_mais_atividades}, atividades = {valor_maximo}"
        )

        return None


ETL().extract_cnae_data("https://servicodados.ibge.gov.br/api/v2/cnae/classes")

Dados extraídos em: 2025/11/07 - 14:10:01
Quantidade de atividades distintas = 673
Quantidade de grupos distintos = 285
Grupos com o maior número de atividades = ['REPRESENTANTES COMERCIAIS E AGENTES DO COMÉRCIO, EXCETO DE VEÍCULOS AUTOMOTORES E MOTOCICLETAS'], atividades = 9
