In [None]:
import pandas as pd

from pendulum import now

In [None]:
dataset_name = 'sidra_tab5457_fixbioN'
raiz = '../databases'

### Bronze

Quantidade produzida (t)

In [None]:
contador = 1

ano_inicial = 1990

ultimo_ano = now().year - 1
for ano in range(ano_inicial, ultimo_ano):
    if contador == 1:
        df_5457 = pd.read_json(f'https://apisidra.ibge.gov.br/values/t/5457/n6/all/v/214/p/{ano}/c782/40101,40106,40110,40112,40124')
        contador += 1
    else:
        df_5457 = pd.concat(
            [df_5457,
            (pd.read_json(f'https://apisidra.ibge.gov.br/values/t/5457/n6/all/v/214/p/{ano}/c782/40101,40106,40110,40112,40124')
             .iloc[1:])],
            ignore_index=True            
        )
        contador += 1

df_5457.to_json(f'{raiz}/bronze_{dataset_name}.json')

### Prata

In [None]:
(pd.read_json(f'{raiz}/bronze_{dataset_name}.json')
 .drop(0, axis = 0)
 .filter(['D1C', 'D3C', 'D4C', 'V'])
 .assign(**{
        'uf': lambda df: df['D1C'].str.slice(0,2).astype(int),
        'safra_t': lambda df: pd.to_numeric(df['V'], errors='coerce'),
        'municipio': lambda df: df['D1C'].astype(int),
        'ano': lambda df: df['D3C'].astype(int),
        'cultura': lambda df: df['D4C'].astype(int),
        'fonte': 'Fixação biológica de N'
        })
 .dropna(subset='safra_t')
 .convert_dtypes()
 .groupby(['uf', 'municipio', 'ano', 'cultura', 'fonte'])
 .agg({'safra_t':sum})
 .to_parquet(f'{raiz}/prata_{dataset_name}.parquet')
 )

| CÓDIGO | CULTURA AGRÍCOLA |
|--------|------------------|
| 40112  |      Feijão      |
| 40106  |  Cana-de-açúcar  |
| 40124  |       Soja       |
| 40101  |     Amendoim     |
| 40110  |     Ervilha      |


### Ouro

Parâmetros para cálculos
| Fonte               | Teor | Unidade             | Fonte              | Teor | Unidade             |
|---------------------|------|---------------------|--------------------|------|---------------------|
| N-planta            | 2    | kg N/kg N produto   |
| N-planta Soja       | 80   | kg N/t de soja      | Pfix%-Soja         | 80   | % do N planta       |
| N-Amendoim          | 59,5 | kg N/t de produto   | Pfix%-Amendoim     | 65   | % do N planta       |
| N-Ervilha           | 36   | kg N/t de produto   | Pfix%-Ervilha      | 65   | % do N planta       |
| N-Cana-de-açúcar    | 0,8  | kg N/t de produto   | Pfix%-Cana-de-açúcar | 35  | % do N planta      |
| N-Feijão            | 38,5 | kg N/t de produto   | Pfix%-Feijão        | 36   | % do N planta      |

Específico para soja -> (Safra_ton(soja) * N-planta soja * (Pfix%-soja/100))/1000

Para outras culturas -> (Safra_ton * N-planta * N-cultura{código} * (Pfix%-cultura/100))/1000

In [None]:
n_planta = 2 # fator geral

parametro = {
    40124: {'n': 80, 'pfix': 0.80}, # soja
    40101: {'n': 59.5, 'pfix': 0.65}, # amendoim
    40106: {'n': 0.8, 'pfix': 0.35}, # cana-de-açúcar
    40110: {'n': 36, 'pfix': 0.65}, # ervilha
    40112: {'n': 38.5, 'pfix': 0.36} # feijão
}

In [None]:
df = (
    pd.read_parquet(f'{raiz}/prata_{dataset_name}.parquet')
    .groupby(['uf', 'ano', 'cultura', 'fonte'])
    .agg({'safra_t': 'sum'})
    .reset_index()
    .assign(
        elemento = 'N',
        valor=lambda x: x.apply
        (lambda linha: (linha['safra_t'] * parametro[linha['cultura']]['n'] * parametro[linha['cultura']]['pfix'])/1000
        if linha['cultura'] == 40124 else 
        (linha['safra_t'] * n_planta * parametro[linha['cultura']]['n'] * parametro[linha['cultura']]['pfix'])/1000, 
        axis = 1))
    .drop('safra_t', axis = 1)
    .convert_dtypes()
    .groupby(['uf', 'ano', 'fonte'])
    .agg({'elemento': 'max', 'valor': 'sum'})
    .set_index("elemento", append=True)
    .squeeze()
)

df.to_csv(f'{raiz}/ouro_npk_fixbioN.csv')
df