# Download dos dados de setores sensitários do IBGE

Os dados de setores sensitários são baixados diretamente do ftp do IBGE.

In [1]:
# Importando Bibliotecas necessárias
from os import path, sep, makedirs
from ftplib import FTP
import re
from tqdm import tqdm
import pandas as pd
import geopandas as gpd


In [2]:
ano = 2010
base_path = "./SETORES_CENSITARIOS"

ftp = {
    2010: {
        "ftp_host": "geoftp.ibge.gov.br",
        "directory": "organizacao_do_territorio/malhas_territoriais/malhas_de_setores_censitarios__divisoes_intramunicipais/censo_2010/setores_censitarios_shp",
    },
    2022: {
        "ftp_host": "ftp.ibge.gov.br",
        "directory": "/Censos/Censo_Demografico_2022/Agregados_por_Setores_Censitarios/malha_com_atributos/setores/gpkg/UF",
    },
}

states = [
    "AC",
    "AL",
    "AM",
    "AP",
    "BA",
    "CE",
    "DF",
    "ES",
    "GO",
    "MA",
    "MG",
    "MS",
    "MT",
    "PA",
    "PB",
    "PE",
    "PI",
    "PR",
    "RJ",
    "RN",
    "RO",
    "RR",
    "RS",
    "SC",
    "SE",
    "SP",
    "TO",
    "SP",
]

# Baixando os dados de setores censitários

Agora vamos baixar os arquivos georreferenciados dos setores sensitários, para utilizar menos memória RAM durante o processo de geração de pontos, vamos baixar cada estado separadamente.

In [3]:
pattern = re.compile(
    r"^[A-Z]{2}$", re.IGNORECASE
)  # padrao para filtrar arquivos que iniciam com a sigla do estado
folder = path.join(base_path, str(ano))  # pasta onde os arquivos serao salvos
if ano == 2022:
    folder = path.join(folder, "gpkg")

# Criar pasta para salvar os arquivos caso não exista
makedirs(folder, exist_ok=True)


def download_ftp_files(ftp_host, directory="/", dest_folder=folder, chunk_size=1024):
    """Lista arquivos em um diretório FTP e baixa os arquivos .zip retornando uma lista de arquivos baixados

    ARGS:
        ftp_host (str): Endereço do servidor FTP
        directory (str, optional): Diretório a ser listado. Defaults to "/".
        dest_folder (str, optional): Pasta onde os arquivos serão salvos. Defaults to folder.
        chunk_size (int, optional): Tamanho do buffer para download. Defaults to 1024.
    RETURNS:
        list: Lista de arquivos baixados
        None: Se ocorrer um erro

    """
    try:
        # Conectar ao servidor FTP
        ftp = FTP(ftp_host)
        ftp.login()  # Login anônimo

        # Navegar para o diretório desejado
        ftp.cwd(directory)

        items = []
        # listando todas as pastas no diretório
        ftp.retrlines("LIST", items.append)
        files = []
        count = 0
        for item in tqdm(items, desc="Baixando arquivos", unit="arquivos", leave=True):
            count += 1
            parts = item.split()
            item_name = parts[-1]
            # Verifica se o item é um diretório e se o nome for a sigla do estado
            if item.startswith("d") and re.match(pattern, item_name):
                # entra no diretório do estado
                ftp.cwd(item_name)
                # listar arquivos no diretório
                state_files = ftp.nlst()
                # Filtrar arquivos que contenham "setores" no nome
                state_files = [f for f in state_files if "setores" in f]
                # Baixa os arquivos localmente
                for file in state_files:
                    tqdm.write(file)
                    local_path = path.join(dest_folder, file)
                    with open(local_path, "wb") as f:
                        ftp.retrbinary(
                            f"RETR {file}",
                            lambda data: f.write(data),
                            blocksize=chunk_size,
                        )
                    files.append(local_path)
                # sair do diretório do estado para diretório principal
                ftp.cwd("..")
        ftp.quit()
        print(f" {len(files)} arquivos baixados com sucesso!")
        return files
    except Exception as e:
        print(f"Erro: {e}")
        return None


# Endereço do servidor FTP e diretório
ftp_host = ftp[ano]["ftp_host"]
directory = ftp[ano]["directory"]

# Baixa os arquivos do FTP
files_to_download = download_ftp_files(ftp_host, directory)

Baixando arquivos:   0%|          | 0/28 [00:00<?, ?arquivos/s]

ac_setores_censitarios.zip


Baixando arquivos:   7%|▋         | 2/28 [00:00<00:06,  3.76arquivos/s]

al_setores_censitarios.zip


Baixando arquivos:  11%|█         | 3/28 [00:01<00:13,  1.88arquivos/s]

am_setores_censitarios.zip


Baixando arquivos:  14%|█▍        | 4/28 [00:02<00:20,  1.16arquivos/s]

ap_setores_censitarios.zip


Baixando arquivos:  18%|█▊        | 5/28 [00:03<00:15,  1.46arquivos/s]

ba_setores_censitarios.zip


Baixando arquivos:  21%|██▏       | 6/28 [00:04<00:20,  1.08arquivos/s]

ce_setores_censitarios.zip


Baixando arquivos:  25%|██▌       | 7/28 [00:05<00:17,  1.20arquivos/s]

df_setores_censitarios.zip


Baixando arquivos:  29%|██▊       | 8/28 [00:05<00:14,  1.41arquivos/s]

es_setores_censitarios.zip


Baixando arquivos:  32%|███▏      | 9/28 [00:06<00:12,  1.47arquivos/s]

go_setores _censitarios.zip


Baixando arquivos:  36%|███▌      | 10/28 [00:07<00:12,  1.40arquivos/s]

ma_setores_censitarios.zip


Baixando arquivos:  39%|███▉      | 11/28 [00:07<00:11,  1.46arquivos/s]

mg_setores_censitarios.zip


Baixando arquivos:  43%|████▎     | 12/28 [00:10<00:19,  1.21s/arquivos]

ms_setores_censitarios.zip


Baixando arquivos:  46%|████▋     | 13/28 [00:10<00:14,  1.01arquivos/s]

mt_setores_censitarios.zip


Baixando arquivos:  50%|█████     | 14/28 [00:11<00:12,  1.09arquivos/s]

pa_setores_censitarios.zip


Baixando arquivos:  54%|█████▎    | 15/28 [00:12<00:10,  1.20arquivos/s]

pb_setores_censitarios.zip


Baixando arquivos:  57%|█████▋    | 16/28 [00:12<00:08,  1.41arquivos/s]

pe_setores_censitarios.zip


Baixando arquivos:  61%|██████    | 17/28 [00:13<00:07,  1.50arquivos/s]

pi_setores_censitarios.zip


Baixando arquivos:  64%|██████▍   | 18/28 [00:13<00:06,  1.60arquivos/s]

pr_setores_censitarios.zip


Baixando arquivos:  68%|██████▊   | 19/28 [00:14<00:06,  1.33arquivos/s]

rj_setores_censitarios.zip


Baixando arquivos:  71%|███████▏  | 20/28 [00:17<00:09,  1.23s/arquivos]

rn_setores_censitarios.zip


Baixando arquivos:  75%|███████▌  | 21/28 [00:19<00:11,  1.65s/arquivos]

ro_setores_censitarios.zip


Baixando arquivos:  79%|███████▊  | 22/28 [00:20<00:08,  1.46s/arquivos]

rr_setores_censitarios.zip


Baixando arquivos:  82%|████████▏ | 23/28 [00:21<00:06,  1.22s/arquivos]

rs_setores_censitarios.zip


Baixando arquivos:  86%|████████▌ | 24/28 [00:22<00:05,  1.35s/arquivos]

sc_setores_censitarios.zip


Baixando arquivos:  89%|████████▉ | 25/28 [00:38<00:16,  5.53s/arquivos]

se_setores_censitarios.zip


Baixando arquivos:  93%|█████████▎| 26/28 [00:39<00:08,  4.19s/arquivos]

sp_setores_censitarios.zip


Baixando arquivos:  96%|█████████▋| 27/28 [00:42<00:03,  3.83s/arquivos]

to_setores_censitarios.zip


Baixando arquivos: 100%|██████████| 28/28 [00:42<00:00,  1.53s/arquivos]

 27 arquivos baixados com sucesso!





# Gerando o arquivo geopackage com os setores sensitários

Caso o ano seja 2010, o arquivo geopackage é gerado a partir dos arquivos shapefiles baixados. 
Caso o ano seja 2020, o arquivo geopackage é baixado diretamente do ftp do IBGE e não necessita conversão e nem descompactação do mesmo.

In [5]:
# Gera geopacakge com os arquivos baixados
if ano == 2010:
    for file in tqdm(
        files_to_download, desc="Descompactando arquivos", unit="arquivo", leave=True
    ):
        zip_file = f"zip://{file}"
        filename = file.split(sep)[-1]
        tqdm.write(filename)
        otp_file = filename.replace(".zip", ".gpkg").replace(" ", "")
        makedirs(path.join(folder, "gpkg"), exist_ok=True)
        otp_file = path.join(folder, "gpkg", otp_file)
        df = gpd.read_file(zip_file)
        df.to_file(otp_file, driver="GPKG")

        # abre o arquivo zip com geopandas

    print("Arquivos descompactados com sucesso!")
else:
    print(f"O ano de {ano} não precisa descompactar")

Descompactando arquivos:   0%|          | 0/27 [00:00<?, ?arquivo/s]

ac_setores_censitarios.zip


Descompactando arquivos:   4%|▎         | 1/27 [00:00<00:09,  2.76arquivo/s]

al_setores_censitarios.zip


Descompactando arquivos:   7%|▋         | 2/27 [00:00<00:10,  2.35arquivo/s]

am_setores_censitarios.zip


Descompactando arquivos:  15%|█▍        | 4/27 [00:01<00:10,  2.14arquivo/s]

ap_setores_censitarios.zip
ba_setores_censitarios.zip


Descompactando arquivos:  19%|█▊        | 5/27 [00:05<00:33,  1.54s/arquivo]

ce_setores_censitarios.zip


Descompactando arquivos:  22%|██▏       | 6/27 [00:06<00:31,  1.52s/arquivo]

df_setores_censitarios.zip


Descompactando arquivos:  26%|██▌       | 7/27 [00:07<00:23,  1.20s/arquivo]

es_setores_censitarios.zip


Descompactando arquivos:  30%|██▉       | 8/27 [00:08<00:21,  1.14s/arquivo]

go_setores _censitarios.zip


Descompactando arquivos:  33%|███▎      | 9/27 [00:09<00:21,  1.21s/arquivo]

ma_setores_censitarios.zip


Descompactando arquivos:  37%|███▋      | 10/27 [00:11<00:20,  1.23s/arquivo]

mg_setores_censitarios.zip


Descompactando arquivos:  41%|████      | 11/27 [00:17<00:45,  2.83s/arquivo]

ms_setores_censitarios.zip


Descompactando arquivos:  44%|████▍     | 12/27 [00:18<00:33,  2.21s/arquivo]

mt_setores_censitarios.zip


Descompactando arquivos:  48%|████▊     | 13/27 [00:19<00:25,  1.84s/arquivo]

pa_setores_censitarios.zip


Descompactando arquivos:  52%|█████▏    | 14/27 [00:20<00:21,  1.62s/arquivo]

pb_setores_censitarios.zip


Descompactando arquivos:  56%|█████▌    | 15/27 [00:21<00:16,  1.33s/arquivo]

pe_setores_censitarios.zip


Descompactando arquivos:  59%|█████▉    | 16/27 [00:22<00:15,  1.39s/arquivo]

pi_setores_censitarios.zip


Descompactando arquivos:  63%|██████▎   | 17/27 [00:23<00:12,  1.28s/arquivo]

pr_setores_censitarios.zip


Descompactando arquivos:  67%|██████▋   | 18/27 [00:26<00:14,  1.63s/arquivo]

rj_setores_censitarios.zip


Descompactando arquivos:  70%|███████   | 19/27 [00:29<00:16,  2.04s/arquivo]

rn_setores_censitarios.zip


Descompactando arquivos:  74%|███████▍  | 20/27 [00:29<00:11,  1.63s/arquivo]

ro_setores_censitarios.zip


Descompactando arquivos:  81%|████████▏ | 22/27 [00:30<00:04,  1.08arquivo/s]

rr_setores_censitarios.zip


Descompactando arquivos:  81%|████████▏ | 22/27 [00:30<00:04,  1.08arquivo/s]

rs_setores_censitarios.zip


Descompactando arquivos:  85%|████████▌ | 23/27 [00:32<00:05,  1.40s/arquivo]

sc_setores_censitarios.zip


Descompactando arquivos:  89%|████████▉ | 24/27 [00:34<00:04,  1.53s/arquivo]

se_setores_censitarios.zip


Descompactando arquivos:  93%|█████████▎| 25/27 [00:35<00:02,  1.25s/arquivo]

sp_setores_censitarios.zip


Descompactando arquivos:  96%|█████████▋| 26/27 [00:47<00:04,  4.43s/arquivo]

to_setores_censitarios.zip


Descompactando arquivos: 100%|██████████| 27/27 [00:47<00:00,  1.77s/arquivo]

Arquivos descompactados com sucesso!



