# pySidraData Examples

This notebook provides a comprehensive overview of how to use the `pySidraData` package to interact with the IBGE API. You'll learn how to:
- Initialize the `Client`
- Fetch and explore root data
- Retrieve metadata for specific aggregate IDs
- Convert data to a Pandas DataFrame
- Use additional functionalities

## Installation

If you haven't installed `pySidraData` yet, you can install it using pip:

```bash
pip install pySidraData
```

Alternatively, if you're working from the source:

```bash
git clone https://github.com/yourusername/pySidraData.git
cd pySidraData
pip install .
```

## Importing the Package

Let's start by importing the `Client` class from the `pySidraData` package.

In [4]:
# Import the Client class
from pySidraData import Client

## Initializing the Client

Create an instance of the `Client` to start interacting with the IBGE API.

In [5]:
# Initialize the client
client = Client()

## Fetching Root Data

Use the `get_root_data` method to fetch and explore the root data from the IBGE API.

In [6]:
# Fetch root data
root_data = client.get_root_data()

# Display the first few research items
for research in root_data.research_list[:5]:
    print(f"Research ID: {research.id}, Name: {research.nome}")
    for aggregate in research.agregados[:3]:  # Limiting to 3 aggregates for brevity
        print(f"  Aggregate ID: {aggregate.id}, Name: {aggregate.nome}")

Research ID: D5, Name: Áreas Urbanizadas
  Aggregate ID: 8418, Name: Áreas urbanizadas, Loteamento vazio, Área total mapeada e Subcategorias
Research ID: CL, Name: Cadastro Central de Empresas
  Aggregate ID: 1685, Name: Unidades locais, empresas e outras organizações atuantes, pessoal ocupado total, pessoal ocupado assalariado, pessoal assalariado médio, salários e outras remunerações e salário médio mensal – série encerrada em 2021
  Aggregate ID: 1732, Name: Dados gerais das empresas por faixas de pessoal ocupado total, segundo seção, divisão e grupo da classificação de atividades, em nível Brasil, Grandes Regiões e Unidades da Federação da sede da empresa
  Aggregate ID: 1733, Name: Dados gerais das unidades locais por faixas de pessoal ocupado total, segundo seção, divisão e grupo da classificação de atividades, em nível Brasil, Grandes Regiões e Unidades da Federação
Research ID: CA, Name: Censo Agropecuário
  Aggregate ID: 1005, Name: Número de estabelecimentos agropecuários com

## Retrieving Metadata

Fetch metadata for a specific aggregate ID using the `get_metadata` method. If you don't have a specific ID, you can use a random one.

In [7]:
# Fetch metadata for a specific aggregate ID
aggregate_id = '8418'  # Replace with an actual ID from the list
metadata = client.get_metadata(aggregate_id)
metadata

{'id': 8418,
 'nome': 'Áreas urbanizadas, Loteamento vazio, Área total mapeada e Subcategorias',
 'URL': 'https://sidra.ibge.gov.br/tabela/8418',
 'pesquisa': 'Áreas Urbanizadas',
 'assunto': 'Geral',
 'periodicidade': {'frequencia': 'anual', 'inicio': 2019, 'fim': 2019},
 'nivelTerritorial': {'Administrativo': ['N2', 'N6', 'N3'],
  'Especial': ['N23', 'N132'],
  'IBGE': []},
 'variaveis': [{'id': 12747,
   'nome': 'Áreas urbanizadas densas',
   'unidade': 'Quilômetros quadrados',
   'sumarizacao': ['nivelTerritorial']},
  {'id': 12748,
   'nome': 'Áreas urbanizadas pouco densas',
   'unidade': 'Quilômetros quadrados',
   'sumarizacao': ['nivelTerritorial']},
  {'id': 12749,
   'nome': 'Total de áreas urbanizadas',
   'unidade': 'Quilômetros quadrados',
   'sumarizacao': ['nivelTerritorial']},
  {'id': 12750,
   'nome': 'Loteamento vazio',
   'unidade': 'Quilômetros quadrados',
   'sumarizacao': ['nivelTerritorial']},
  {'id': 12751,
   'nome': 'Área total mapeada',
   'unidade': 'Quil

## Converting Root Data to a Pandas DataFrame

Use the `get_root_data_as_dataframe` method to convert the root data into a Pandas DataFrame for easier analysis.

In [8]:
# Convert root data to a DataFrame
df = client.get_root_data_as_dataframe()
df.head()

Unnamed: 0,research_id,research_name,aggregate_id,aggregate_name
0,D5,Áreas Urbanizadas,8418,"Áreas urbanizadas, Loteamento vazio, Área tota..."
1,CL,Cadastro Central de Empresas,1685,"Unidades locais, empresas e outras organizaçõe..."
2,CL,Cadastro Central de Empresas,1732,Dados gerais das empresas por faixas de pessoa...
3,CL,Cadastro Central de Empresas,1733,Dados gerais das unidades locais por faixas de...
4,CL,Cadastro Central de Empresas,1734,Dados gerais das unidades locais por faixas de...


## Listing All Aggregate IDs

You can list all available aggregate IDs using the `list_all_aggregate_ids` method.

In [9]:
# List all aggregate IDs
aggregate_ids = client.list_all_aggregate_ids()
aggregate_ids[:10]  # Display first 10 aggregate IDs

['8418',
 '1685',
 '1732',
 '1733',
 '1734',
 '1735',
 '2869',
 '2933',
 '2934',
 '2937']

## Fetching Metadata for a Random Aggregate ID

If you don't have a specific aggregate ID, you can fetch metadata for a random aggregate ID.

In [11]:
# Fetch metadata for a random aggregate ID
random_metadata = client.get_metadata()
random_metadata

{'id': 2227,
 'nome': 'Número de municípios, total e os que possuem instrumentos reguladores do serviço de manejo de águas pluviais, por tipo de instrumento',
 'URL': 'https://sidra.ibge.gov.br/tabela/2227',
 'pesquisa': 'Pesquisa Nacional de Saneamento Básico',
 'assunto': 'Manejo de águas pluviais',
 'periodicidade': {'frequencia': 'anual', 'inicio': 2000, 'fim': 2000},
 'nivelTerritorial': {'Administrativo': ['N1', 'N2', 'N6', 'N14', 'N13', 'N3'],
  'Especial': [],
  'IBGE': []},
 'variaveis': [{'id': 1161,
   'nome': 'Municípios que possuem instrumentos reguladores do serviço de manejo de águas pluviais',
   'unidade': 'Unidades',
   'sumarizacao': []},
  {'id': 1001161,
   'nome': 'Municípios que possuem instrumentos reguladores do serviço de manejo de águas pluviais - percentual do total geral',
   'unidade': '%',
   'sumarizacao': []}],
 'classificacoes': [{'id': 12126,
   'nome': 'Tipo de instrumento regulador do serviço',
   'sumarizacao': {'status': True, 'excecao': []},
   '

## Conclusion

This notebook has covered the basic usage of the `pySidraData` package. You now know how to:
- Initialize and use the `Client` to interact with the IBGE API
- Fetch and explore root data
- Retrieve metadata for specific or random aggregate IDs
- Convert data to a Pandas DataFrame for analysis

For more information, please refer to the full documentation or the source code repository.