In [None]:
#|hide
import pandas as pd
from nbdev.showdoc import show_doc

# Receita-WS

> Este reposit√≥rio possui fun√ß√µes auxiliares para fazer requisi√ß√µes REST √† API para acesso aos dados atualizados da Receita Federal relativos a pessoas f√≠sicas e jur√≠dicas. 

Para tal, ele acessa o servi√ßo web [Receita WS](https://anatel365.sharepoint.com/sites/WikiAnatel/SitePages/Web-Service--ReceitaWS-.aspx?OR=Teams-HL&CT=1660241010872&clickparams=eyJBcHBOYW1lIjoiVGVhbXMtRGVza3RvcCIsIkFwcFZlcnNpb24iOiIyNy8yMjA3MDMwMDgxNSIsIkhhc0ZlZGVyYXRlZFVzZXIiOmZhbHNlfQ%3D%3D) desenvolvido na Anatel. Este por sua vez √© um encapsulamento, com cache em banco, do Servi√ßo Web [Infoconv](https://acesso.infoconv.receita.fazenda.gov.br/docInfoconv/), disponibilizado pela Serpro/Receita Federal, por meio de conv√™nio firmado com a Anatel.

## Instala√ß√£o

### python

Caso n√£o tenha o python instalado, baixe a vers√£o para a sua plataforma neste [link](https://www.python.org/downloads/) e siga as instru√ß√µes.


‚ùó Alternativamente, para uma plataforma de desenvolvimento mais vers√°til recomendamos que seja instalado o [miniconda](https://docs.conda.io/en/latest/miniconda.html), que √© uma vers√£o m√≠nima do Anaconda.

‚ö° Para uma vers√£o otimizada do _miniconda_, com excelentes _defaults_, recomendamos ainda que seja instalado o [miniforge](https://github.com/conda-forge/miniforge/releases),  

### Ambiente Virtual

Primeiramente √© recomendado a cria√ß√£o de ambiente virtual para instalar o m√≥dulo, assim a vers√£o python deste e suas depend√™ncias n√£o afetam a instala√ß√£o do python padr√£o:

__Modo 1 - Utilizando o m√≥dulo venv (dispon√≠vel em qualquer instala√ß√£o padr√£o do python3):__
```bash
python -m venv <pasta>
```   
Desse modo ser√° criado o ambiente virtual na `<pasta>`


__Para ativar o ambiente virtual__:

__Windows__

Utilizando o Prompt de Comando: `cmd.exe`

```
<pasta>\Scripts\activate.bat
```
Utilizando o `PowerShell`:

```
<pasta>\Scripts\Activate.ps1
```

__Linux e MacOS__

```
source <pasta>/bin/activate
```

__Modo 2 (Recomendado) - Utilizando o conda (dispon√≠vel em qualquer uma das instala√ß√µes: `Anaconda | Miniconda | Miniforge`):__

```
conda create -n <nome> python=3.10 -y
```
Desse modo ser√° criado um ambiente virtual com o nome `<nome>` criado na pasta interna do conda.

__Para ativar o ambiente virtual `conda`:__
```bash
conda activate <nome>
```

### Instala√ß√£o do m√≥dulo `receitaws`

Com o ambiente virtual criado e ativado, em qualquer um dos modos mostrados no par√°grafo anterior, basta efetuar o comando:
```
python -m pip install git+https://git.anatel.gov.br/rsilva/receitaws.git
```

> ‚òù Como este √© um servi√ßo de uso exclusivo na rede interna da Anatel e por logins autorizados, a instala√ß√£o √© feita diretamente pelo reposit√≥rio: 

## Como utilizar
A biblioteca `nbdev` possui somente 1 m√≥dulo `consultas`, cuja API principal √© a fun√ß√£o `requisitar_em_lote`:

### Script em linha de comando

A API principal `requisitar_em _lote` mostrada acima pode ser executada programaticamente em linha de comando:
```
python -m receitaws [OPTIONS] FILENAME CPF_USUARIO
```

<img src="cli.png" alt="Requisi√ß√£o em Lote na Linha de Comando" />

### Uso em outros m√≥dulos python

In [None]:
from receitaws.consultas import requisitar_em_lote

In [None]:
#|echo: false
show_doc(requisitar_em_lote)

---

### requisitar_em_lote

>      requisitar_em_lote (filename:str, cpf_usuario:str, ambiente:str='ds',
>                          origem:str=None, cache:int=36, saida:str=None)

L√™ o arquivo `filename` com um CPF | CPNJ por linha. Faz a requisi√ß√£o no `ambiente` do receita-ws e salva os resultados em `saida`

|    | **Type** | **Default** | **Details** |
| -- | -------- | ----------- | ----------- |
| filename | str |  | Arquivo texto de entrada: 1 CPF \| CNPJ por linha |
| cpf_usuario | str |  | CPF do usu√°rio requisitante |
| ambiente | str | ds | Ambiente onde realizar a requisi√ß√£o: ds \| hm \| su \| pd |
| origem | str | None | Texto com identifica√ß√£o da requisi√ß√£o: e.g. 'Teste' |
| cache | int | 36 | Tempo de expira√ß√£o do cache em meses |
| saida | str | None | Arquivo de sa√≠da da requisi√ß√£o |
| **Returns** | **None** |  |  |

> ‚ö†Ô∏è Como arquivo de entrada √© esperado um arquivo _texto_, e.g. `csv | txt | tsv etc...` com 1 registro por linha!

In [None]:
#|eval: false
cpf_usuario = input('Digite seu CPF para Identifica√ß√£o: ')
requisitar_em_lote(filename=r'D:\Code\receitaws\dados\cpf.csv', 
                     cpf_usuario=cpf_usuario, 
                     ambiente='ds',
                     origem='Teste DS',
                     cache=3,
                     saida=r'D:\Code\receitaws\dados\resultados_cpf.csv')

__Arquivo de Sa√≠da__

O formato do arquivo de sa√≠da √© automaticamente identificado pela extens√£o do argumento `saida`, os valores poss√≠veis s√£o `csv | xlsx | html | md`, para salvamento em formato tabular, ou no formato `json`. Caso seja fornecido uma extens√£o n√£o suportada ou _n√£o_ seja fornecido um nome de arquivo de sa√≠da, ser√° salvo um  `csv` na pasta onde √© feita a requisi√ß√£o.


> üíØ Todos os dados retornados pelo web service s√£o salvos!

In [None]:
resultados = pd.read_csv(r'D:\Code\receitaws\dados\resultados_cpf.csv')
resultados.iloc[:, 1:] # Ocultar o CPF requisitado

Unnamed: 0,nome,situacaoCadastral.codigo,situacaoCadastral.valor,paisResidencia.residenteExterior,paisResidencia.codigoPais,nomeMae,dataNascimento,sexo.codigo,sexo.valor,ocupacao.naturezaOcupacaoCodigo,...,telefone.ddd,telefone.numero,unidadeAdministrativaCodigo,anoObito,estrangeiro,tituloEleitor,dataAtualizacao,dataRegistroAnatel,resultado,erro
0,Tuwpoxtzyzzruazdjdsqmaewylowhy,2,Suspensa,True,0,Sjflu Ifgemqkhdjvpgcjewylowhy,1937-10-25,1,Masculino,36,...,25,31297214,1008514,0,False,0,1962-02-17,2022-08-16,CPF encontrado,
1,Tow Dh Vrmadfgixfxaxqupjkfp,8,Nula,True,0,Bvgoxicrewhewdrt,1917-06-28,2,Feminino,5,...,25,97620714,7431014,0,False,0,1964-12-23,2022-08-16,CPF encontrado,
2,Tuwpoxtzyzzruazdjdsqmaewylowhy,2,Suspensa,True,0,Sjflu Ifgemqkhdjvpgcjewylowhy,1937-10-25,1,Masculino,36,...,25,31297214,1008514,0,False,0,1962-02-17,2022-08-16,CPF encontrado,
3,Tow Dh Vrmadfgixfxaxqupjkfp,8,Nula,True,0,Bvgoxicrewhewdrt,1917-06-28,2,Feminino,5,...,25,97620714,7431014,0,False,0,1964-12-23,2022-08-16,CPF encontrado,
4,Tuwpoxtzyzzruazdjdsqmaewylowhy,2,Suspensa,True,0,Sjflu Ifgemqkhdjvpgcjewylowhy,1937-10-25,1,Masculino,36,...,25,31297214,1008514,0,False,0,1962-02-17,2022-08-16,CPF encontrado,
5,Tow Dh Vrmadfgixfxaxqupjkfp,8,Nula,True,0,Bvgoxicrewhewdrt,1917-06-28,2,Feminino,5,...,25,97620714,7431014,0,False,0,1964-12-23,2022-08-16,CPF encontrado,
6,Tuwpoxtzyzzruazdjdsqmaewylowhy,2,Suspensa,True,0,Sjflu Ifgemqkhdjvpgcjewylowhy,1937-10-25,1,Masculino,36,...,25,31297214,1008514,0,False,0,1962-02-17,2022-08-16,CPF encontrado,
7,Tow Dh Vrmadfgixfxaxqupjkfp,8,Nula,True,0,Bvgoxicrewhewdrt,1917-06-28,2,Feminino,5,...,25,97620714,7431014,0,False,0,1964-12-23,2022-08-16,CPF encontrado,
8,Tuwpoxtzyzzruazdjdsqmaewylowhy,2,Suspensa,True,0,Sjflu Ifgemqkhdjvpgcjewylowhy,1937-10-25,1,Masculino,36,...,25,31297214,1008514,0,False,0,1962-02-17,2022-08-16,CPF encontrado,
9,Tow Dh Vrmadfgixfxaxqupjkfp,8,Nula,True,0,Bvgoxicrewhewdrt,1917-06-28,2,Feminino,5,...,25,97620714,7431014,0,False,0,1964-12-23,2022-08-16,CPF encontrado,


__Ambientes__

A mesma requisi√ß√£o pode ser feita nos ambientes: 
* Desenvolvimento: `ds` (padr√£o)
* Homologa√ß√£o: `hm`
* Sustenta√ß√£o: `su`
* Produ√ß√£o: `pd`

__Tipo de Requisi√ß√£o: `CPF` ou `CNPJ`__

> üß† O tipo de requisi√ß√£o √© automaticamente identificado pelo tamanho do identificador no arquivo:


* 11 üëâ `CPF`
* 14 üëâ `CNPJ`

__Utiliza√ß√£o do Cache em Banco__

O argumento `cache` √© o n√∫mero de meses que devemos considerar antes de fazer a requisi√ß√£o. 

Caso o intervalo de tempo entre a data da requisi√ß√£o e a data de atualiza√ß√£o do registro em banco corporativo for inferior ao `cache`, o registro do banco √© retornado em lugar de se fazer a requisi√ß√£o ao Infoconv da receita federal üòé

> Isso foi uma solu√ß√£o para evitar requisi√ß√µes, e por conseguinte cobran√ßas desnecess√°rias, de registros que j√° est√£o com atualiza√ß√£o recente em banco ü§ë  