In [None]:
#|hide
import pandas as pd
from validate_docbr import CPF, CNPJ
from nbdev.showdoc import show_doc

# Receita-WS

> Este reposit√≥rio possui uma Classe e fun√ß√µes auxiliares para efetuar requisi√ß√µes REST √† API para acesso aos dados atualizados da Receita Federal relativos a pessoas f√≠sicas e jur√≠dicas. 

Para tal, ele acessa o servi√ßo web [Receita WS](https://anatel365.sharepoint.com/sites/WikiAnatel/SitePages/Web-Service--ReceitaWS-.aspx?OR=Teams-HL&CT=1660241010872&clickparams=eyJBcHBOYW1lIjoiVGVhbXMtRGVza3RvcCIsIkFwcFZlcnNpb24iOiIyNy8yMjA3MDMwMDgxNSIsIkhhc0ZlZGVyYXRlZFVzZXIiOmZhbHNlfQ%3D%3D) desenvolvido na Anatel. Este por sua vez √© um encapsulamento, com cache em banco de dados corporativo, do Servi√ßo Web [Infoconv](https://acesso.infoconv.receita.fazenda.gov.br/docInfoconv/), disponibilizado pela Serpro/Receita Federal, por meio de conv√™nio firmado com a Anatel.

## Instala√ß√£o

### python

Caso n√£o tenha o python instalado, baixe a vers√£o para a sua plataforma neste [link](https://www.python.org/downloads/) e siga as instru√ß√µes.


‚ùó Alternativamente, para uma plataforma de desenvolvimento mais vers√°til recomendamos que seja instalado o [miniconda](https://docs.conda.io/en/latest/miniconda.html), que √© uma vers√£o m√≠nima do Anaconda.

‚ö° Para uma vers√£o otimizada do _miniconda_, com excelentes _defaults_, recomendamos ainda que seja instalado o [miniforge](https://github.com/conda-forge/miniforge/releases),  

### Ambiente Virtual

Primeiramente √© recomendado a cria√ß√£o de ambiente virtual para instalar o m√≥dulo, assim a vers√£o python deste e suas depend√™ncias n√£o afetam a instala√ß√£o do python padr√£o:

__Modo 1 - Utilizando o m√≥dulo venv (dispon√≠vel em qualquer instala√ß√£o padr√£o do python3):__
```bash
python -m venv <pasta>
```   
Desse modo ser√° criado o ambiente virtual na `<pasta>`


__Para ativar o ambiente virtual__:

__Windows__

Utilizando o Prompt de Comando: `cmd.exe`

```
<pasta>\Scripts\activate.bat
```
Utilizando o `PowerShell`:

```
<pasta>\Scripts\Activate.ps1
```

__Linux e MacOS__

```
source <pasta>/bin/activate
```

__Modo 2 (Recomendado) - Utilizando o conda (dispon√≠vel em qualquer uma das instala√ß√µes: `Anaconda | Miniconda | Miniforge`):__

```
conda create -n <nome> python=3.10 -y
```
Desse modo ser√° criado um ambiente virtual designado `<nome>` criado na pasta interna do conda.

__Para ativar o ambiente virtual `conda`:__
```bash
conda activate <nome>
```

Troque o comando `conda` por `mamba`, caso este tenha sido instalado

### Instala√ß√£o do m√≥dulo `receitaws`

Com o ambiente virtual criado e ativado, em qualquer um dos modos mostrados no par√°grafo anterior, basta efetuar o comando:
```
python -m pip install git+https://git.anatel.gov.br/rsilva/receitaws.git
```

> ‚òù Como este √© um servi√ßo de uso exclusivo na rede interna da Anatel e por logins autorizados, a instala√ß√£o √© feita diretamente pelo reposit√≥rio: 

## Como utilizar

#### Chave de Acesso
> O _web service_ ReceitaWs da ANATEL consome o _web service_ Infoconv da SERPRO/Receita Federal. Este servi√ßo √© taxado e somente √© disponibilizado via contrato entre ambas as partes, al√©m de expor dados pessoais sens√≠veis, al√©m de dados n√£o dispon√≠veis publicamente de empresas.

Por esta raz√£o, al√©m de estar logado na intranet da Anatel via VPN √© preciso ter autoriza√ß√£o de acesso disponibilizada por meio de uma chave de acesso pessoal, a ser solicitada √† GIDS.

Essa chave de acesso √© lida como uma _vari√°vel de ambiente_, existem 2 chaves poss√≠veis:
* KEY_HM - Chave de Acesso para requisi√ß√µes no ambiente de homologa√ß√£o
* KEY_PD - Chave de Acesso par requisi√ß√µes no ambiente de produ√ß√£o (**‚ö†Ô∏èIncide cobran√ßa!‚ö†Ô∏è**)

#### Defini√ß√£o da Chave de Acesso


Antes de executar o script em linha de comando ou importar o m√≥dulo dentro de um ambiente python, crie um arquivo com o nome `.env` e coloque-o na pasta raiz onde ser√° executado ou importado o m√≥dulo. O arquivo deve ter o seguinte formato:
```
KEY_HM=<chave de acesso homologa√ß√£o>
KEY_PD=<chave de acesso produ√ß√£o>
```

Com a chave liberada e com as vari√°veis de ambiente definidas no arquivo `.env` como mostrado no passo anterior, a API est√° pronta para ser utilizada.

A presente biblioteca `receitaws` possui somente 1 m√≥dulo: `consultas`, cuja API principal √© a fun√ß√£o `requisitar_em_lote`:

### Script em linha de comando

A API principal `requisitar_em _lote` √© exposta em linha de comando chamando diretamente o m√≥dulo da seguinte maneira:
```
python -m receitaws [OPTIONS] FILENAME CPF_USUARIO
```

<img src="cli.png" alt="Requisi√ß√£o em Lote na Linha de Comando" />

### Dentro de outro m√≥dulo ou script python

In [None]:
from receitaws.consultas import requisitar_em_lote

In [None]:
#|echo: false
show_doc(requisitar_em_lote)

---

### requisitar_em_lote

>      requisitar_em_lote (entrada:str, cpf_usuario:str, tipo:str, origem:str,
>                          ambiente:str='hm', cache:int=36, saida:str=None,
>                          n_workers:int=2)

L√™ o arquivo `entrada` com um CPF | CPNJ por linha ou o objeto python iter√°vel.
Faz a requisi√ß√£o no `ambiente` do receita-ws e salva os resultados em `saida`

|    | **Type** | **Default** | **Details** |
| -- | -------- | ----------- | ----------- |
| entrada | str |  | Arquivo texto de entrada: 1 CPF \| CNPJ por linha ou objeto python iter√°vel |
| cpf_usuario | str |  | CPF do usu√°rio requisitante |
| tipo | str |  | Tipo de Requisi√ß√£o CPF \| CNPJ |
| origem | str |  | Texto com identifica√ß√£o da requisi√ß√£o: e.g. 'Teste' |
| ambiente | str | hm | Ambiente onde realizar a requisi√ß√£o: hm \| pd |
| cache | int | 36 | Tempo de expira√ß√£o do cache em meses |
| saida | str | None | Arquivo de sa√≠da da requisi√ß√£o |
| n_workers | int | 2 | N√∫mero de requisi√ß√µes a serem efetuadas em paralelo |
| **Returns** | **DataFrame** |  |  |

**Par√¢metros obrigat√≥rios:**

  - `entrada`: Arquivo texto de entrada: 1 CPF | CNPJ por linha OU objeto python iter√°vel
  - `cpf_usuario`: CPF do usu√°rio requisitante
  - `tipo`: Tipo de Requisi√ß√£o CPF | CNPJ
  - `origem`: Texto com identifica√ß√£o da requisi√ß√£o: e.g. 'Teste'

In [None]:
#|eval: false
cpf = CPF()
cpf_usuario = cpf.generate()

> ‚ö†Ô∏è Como arquivo de entrada √© esperado um arquivo _texto_, e.g. `csv | txt | tsv etc...` com 1 registro por linha!

In [None]:
#|eval: false
requisitar_em_lote(entrada=r'D:\Code\receitaws\dados\cpf.csv', 
                     cpf_usuario=cpf_usuario,
                     tipo='cpf',
                     origem='Teste HM',
                     ambiente='hm',
                     cache=3,
                     saida=r'D:\Code\receitaws\dados\resultados_cpf_hm.csv')

Unnamed: 0,cpf,nome,situacaoCadastral.codigo,situacaoCadastral.valor,paisResidencia.residenteExterior,paisResidencia.codigoPais,nomeMae,dataNascimento,sexo.codigo,sexo.valor,...,telefone.numero,unidadeAdministrativaCodigo,anoObito,estrangeiro,tituloEleitor,dataAtualizacao,dataRegistroAnatel,resultado,erro,ocupacao.naturezaOcupacaoDescricao
0,33481695268,Ls Ifmqinlkurrssezna,2,Suspensa,True,0,Cqyqxgqgumqinlkurrssezna,1997-09-12,1,Masculino,...,97219728,7439828,0,False,0,1937-04-06,2022-09-27,CPF encontrado,,
1,47819847034,Tuxktnciwueq Koithctjx,0,Regular,True,0,Abpcgqu Koithctjx,1980-01-13,9,Sem informacao,...,15966520,6976220,0,False,0,1928-09-13,2022-09-27,CPF encontrado,,Membro ou servidor p√∫blico da administra√ß√£o di...
2,18876126880,Nyopkqyx Rwdykddcmmro,8,Nula,True,0,Edcgltyiqsprxfddcmmro,1986-12-22,9,Sem informacao,...,32104647,5700228,0,False,0,1965-09-17,2022-09-27,CPF encontrado,,
3,58201343204,J Y Ubevpjgbcvzubibdhvje,0,Regular,True,0,Razgqipmdwypegctupbrzubibdhvje,1924-12-17,9,Sem informacao,...,60991414,21524,0,False,0,1965-05-22,2022-09-27,CPF encontrado,,
4,21996857134,Zzhpkuwfqwqlckrmbguszqfcfbb,4,Pendente de Regularizacao,True,0,Byezpzzzlckrmbguszqfcfbb,1963-12-08,2,Feminino,...,3848341,8697223,0,False,0,1930-03-25,2022-09-27,CPF encontrado,,Membro ou servidor p√∫blico da administra√ß√£o di...
5,25367495842,Tdexnrovkjpylffcuua,8,Nula,True,0,Wycxfbgojbksdxzjllffcuua,1985-07-31,1,Masculino,...,63426936,6092170,0,False,0,2006-08-24,2022-09-27,CPF encontrado,,
6,58948023691,Cxdb Nqfhnlutcni Cti,9,Cancelada de Oficio,False,0,,1961-09-21,9,Sem informacao,...,1723291,1333898,0,True,0,1962-11-25,2022-09-27,CPF encontrado,,Empregado de institui√ß√µes financeiras p√∫blicas...
7,9465085693,Qzztsrsjcnsmtob Nzkiktjm,5,Cancelada por Multiplicidade,False,0,Pig Fdidrejqnfqcjlqttsiyxsv,1972-08-18,1,Masculino,...,96816835,6426935,0,True,0,1948-05-14,2022-09-27,CPF encontrado,,
8,83792430487,Vcm Ntdwndjxdxsxovdy,1,Cancelada por Encerramento de Espolio,False,0,Efmyumjtdwndjxdxsxovdy,1932-02-23,1,Masculino,...,92991603,3370473,0,True,0,2007-02-03,2022-09-27,CPF encontrado,,
9,58066098200,Mvggvgmtra Wpgxdrrgeu,2,Suspensa,True,0,Jlgabppbailxftfdevggl,1938-10-04,9,Sem informacao,...,85120080,1864416,0,False,0,1954-02-15,2022-09-27,CPF encontrado,,


> üß† Ao importar a fun√ß√£o acima dentro de um m√≥dulo python, o seu uso √© mais vers√°til. O argumento `entrada` pode ser tanto o caminho para um arquivo texte com 1 registro por linha quanto um objeto python iter√°vel, como uma lista por exemplo

In [None]:
#|eval: false
entrada = [cpf.generate() for _ in range(10)]

requisitar_em_lote(entrada=entrada, 
                     cpf_usuario=cpf_usuario,
                     tipo='cpf',
                     ambiente='hm',
                     origem='Teste HM',
                     cache=3,
                     saida=r'D:\Code\receitaws\dados\resultados_cpf_hm.csv')

Unnamed: 0,cpf,nome,situacaoCadastral.codigo,situacaoCadastral.valor,paisResidencia.residenteExterior,paisResidencia.codigoPais,nomeMae,dataNascimento,sexo.codigo,sexo.valor,...,telefone.ddd,telefone.numero,unidadeAdministrativaCodigo,anoObito,estrangeiro,tituloEleitor,dataAtualizacao,dataRegistroAnatel,resultado,erro
0,5057557262,Zgu Wxgwawlnjmgluhqp,3.0,Cancelada por Obito sem Espolio,False,0.0,Lmvbfjkntngwawlnjmgluhqp,1964-05-21,9.0,Sem informacao,...,3.0,29434313.0,9654413.0,0,True,0.0,1957-07-31,2022-10-05,CPF encontrado,
1,7056996094,,,,,,,1900-01-01,,,...,,,,0,False,,1900-01-01,1900-01-01,Erro INFOCONV: CPF - Erro 04 - CPF n√£o encontr...,E04
2,11075083206,,,,,,,1900-01-01,,,...,,,,0,False,,1900-01-01,1900-01-01,Erro INFOCONV: CPF - Erro 04 - CPF n√£o encontr...,E04
3,20718665503,,,,,,,1900-01-01,,,...,,,,0,False,,1900-01-01,1900-01-01,Erro INFOCONV: CPF - Erro 04 - CPF n√£o encontr...,E04
4,64208996480,,,,,,,1900-01-01,,,...,,,,0,False,,1900-01-01,1900-01-01,Erro INFOCONV: CPF - Erro 04 - CPF n√£o encontr...,E04
5,11857448863,Nxvummi Uztqqja,3.0,Cancelada por Obito sem Espolio,False,0.0,Vtvgqiijjzyczi Uztqqja,1909-09-10,2.0,Feminino,...,3.0,894523.0,603123.0,0,True,0.0,1998-06-26,2022-10-05,CPF encontrado,
6,69050644759,,,,,,,1900-01-01,,,...,,,,0,False,,1900-01-01,1900-01-01,Erro INFOCONV: CPF - Erro 04 - CPF n√£o encontr...,E04
7,65670773870,,,,,,,1900-01-01,,,...,,,,0,False,,1900-01-01,1900-01-01,Erro INFOCONV: CPF - Erro 04 - CPF n√£o encontr...,E04
8,23750763461,,,,,,,1900-01-01,,,...,,,,0,False,,1900-01-01,1900-01-01,Erro INFOCONV: CPF - Erro 04 - CPF n√£o encontr...,E04
9,24951994704,Gpbjcbmmzeluopwktlzksaehpge,9.0,Cancelada de Oficio,False,0.0,Qetrfujyurlnzotflkbsaehpge,1997-08-21,1.0,Masculino,...,65.0,63758088.0,757745.0,0,True,0.0,1900-07-30,2022-10-05,CPF encontrado,


__Ambientes__

A mesma requisi√ß√£o pode ser feita nos ambientes: 
* Homologa√ß√£o: `hm` (Padr√£o)
* Produ√ß√£o: `pd`

__Utiliza√ß√£o do Cache em Banco__

O argumento `cache` √© o n√∫mero de meses que devemos considerar antes de fazer a requisi√ß√£o. 

Caso o intervalo de tempo entre a data da requisi√ß√£o e a data de atualiza√ß√£o do registro em banco corporativo for inferior ao `cache`, o registro do banco √© retornado em lugar de se fazer a requisi√ß√£o ao Infoconv da receita federal üòé

> Isso foi uma solu√ß√£o para evitar requisi√ß√µes, e por conseguinte cobran√ßas desnecess√°rias, de registros que j√° est√£o com atualiza√ß√£o recente em banco ü§ë  

__Arquivo de Sa√≠da__

O formato do arquivo de sa√≠da √© automaticamente identificado pela extens√£o do argumento `saida`, os valores poss√≠veis s√£o `csv | xlsx | html | md`, para salvamento em formato tabular, ou no formato `json`. Caso seja fornecido uma extens√£o n√£o suportada ou _n√£o_ seja fornecido um nome de arquivo de sa√≠da, ser√° salvo um  `csv` na pasta onde √© feita a requisi√ß√£o.


> üíØ Todos os dados retornados pelo web service s√£o salvos!