-
Notifications
You must be signed in to change notification settings - Fork 76
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Nova base disponível da Receita #17
Comments
Eu executei o código nessa base nova, mas aparentemente alguma coisa estranha aconteceu. Gerei o arquivo do sqlite usando o código:
Porém o número de cnpjs está um pouco estranho. Na base mais recente disponível no repositório, eu tinha 43.887.581 cnpjs na tabela O que poderia ter ocorrido? obrigado |
@georgevbsantiago olhando um pouco mais a fundo, encontrei muitos registros duplicados, porém eles apresentam as seguintes diferenças, p. ex. trata-se de um mesmo CNPJ. Outros registros estão simplesmente duplicados na tabela mesmo, sem diferenças em alguns campos. |
Olá, @cmmp , até o próximo final de semana, disponibilizarei a nova base de dados do CNPJ tratada. Em relação aos problemas enfrentados por você durante a execução do código, não conseguiria indicar a causa, pois precisaria de diversas informações sobre a sua máquina (Windows ou Linux) e a versão dos pacotes R que vocês está utilizando. |
Olá @georgevbsantiago ! Show! A máquina que usei foi esta aqui:
Instalei o pacote do github usando o remotes. abs |
Acabei de realizar o tratamento dos dados. Comandos utilizados para verificar se existem dados duplicados na tabela dos dados cadastrais do CNPJ |
Existe uma base do dia 04/07/2020 disponível no site da Receita agora:
https://receita.economia.gov.br/orientacao/tributaria/cadastros/cadastro-nacional-de-pessoas-juridicas-cnpj/dados-publicos-cnpj
seria interessante termos a versão em sqlite disponibilizada pelo pacote :)
The text was updated successfully, but these errors were encountered: