Skip to content

Criação da API para disponibilização dos dados de CNPJ

Notifications You must be signed in to change notification settings

pedrounes1/fastapi_cnpj

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

44 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

FastAPI CNPJ - Trabalho em progresso

Container para o backend da análise de CNPJs

Contexto:

No fim de 2019, a Receita Federal disponibilizou os dados abertos de todos os CNPJs, ativos e inativos. Os dados incluem todas as informações disponíveis no cartão CNPJ, o que permite diversas análises. Os dados foram disponibilizados em um formato proprietário e o pessoal do Observatório Social do Brasil - Município de Santo Antônio de Jesus - Estado da Bahia tratou e disponibizou esses dados em formatos mais legíveis. Você pode encontrar os dados e as ferramentas para tratativas no repositório deles no GitHub. Ao descobrir esses dados e, principalmente, esse repositório, decidi realizar minhas próprias análises exploratórias nos dados, tentando, primeiramente, praticar minhas habilidades de análise e, consequentemente, obter insights sobre a realidade das empresas do Brasil.

Objetivos:

Gerais:

Esse repositório foi criado com o objetivo de ser um back-end que disponibiliza um endpoint REST contendo:

  • As informações demográficas do Brasil (Estados, Mesorregiões, Microrregiões e Cidades);
  • As informações de CNAEs (Seção, Divisão, Grupo, Classe e Subclasse);
  • As informações das empresas do Estado do Paraná.

Específicos:

  • Entender o contexto atual das empresas do Estado do Paraná;
  • Obter insights sobre mercados em expansão, mercados em retração, concentração de empresas de certos segmentos, entre outros;

Limitações:

Como o volume de dados é massivo, optei por trabalhar apenas com as empresas que estão ativas ou que fecharam a partir de 01/01/2013.

Uso:

O repositório contém apenas o código fonte para processamento e exibição dos dados. Os dados geográficos e de CNAEs são obtidos diretamente de outros repositórios do github. Já os de CNPJ precisam ser baixados, conforme abaixo:

Dados geográficos:

Os dados geográficos são importados diretamente do repositório Municipios-Brasileiros

Dados CNAEs:

Os dados de Cnaes e suas subdivisões são obtidos diretamente no repositório CNAES-IBGE-2_3.

Dados CNPJs:

Os dados de CNPJ podem ser obtidos no repositorio do George Santiago. Nesse repo, você deve baixar a Base de dados do CNPJ - CSV, extrair os arquivos e salvar o arquivo cnpj_dados_cadastrais_pj.csv em ./app/seeders/cnpjs como cnpjs.csv

Instalação:

Depois de baixar todos os arquivos, renomeie o arquivo docker-config.yml para docker-compose.yml (ou mova o conteúdo do arquivo para o seu docker-compose.yml) e rode o comando docker-compose up no terminal de dentro da pasta com o código fonte.

Após a criação dos containers, execute o arquivo app/seeder.py para inserir todos os dados no banco. Esse processo só precisa ser realizado uma vez.

O container, por padrão, responde a requisições REST na porta 65432.

Até o momento, os endpoints funcionais são:

  • /geo/
  • /geo/estados
  • /geo/mesorregioes
  • /geo/microrregiões
  • /geo/cidades
  • /cnaes/secoes
  • /cnaes/divisoes
  • /cnaes/grupos
  • /cnaes/classes
  • /cnaes/cnaes

TODO:

  • Finalizar os endpoints para CNAEs e CNPJs;
  • Documentar a API;
  • Finalizar a análise dos dados;
  • Criar uma rotina de testes;

About

Criação da API para disponibilização dos dados de CNPJ

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published