In [2]:
from pymongo import MongoClient
import json

# Conexão com o MongoDB usando usuário e senha
client = MongoClient("mongodb://mongo:mongo@localhost:27017/")
db = client['dm_odsr']
collection = db['cities']

# pipeline mongo


In [34]:
#localidades
collection = db['cities']

# --- 2. Definição da Pipeline de Agregação ---
# Mapeamento de id_state para as informações da sua respectiva região
# Este mapeamento é necessário pois a informação de Região não está na sua coleção `cities`
map_regioes = {
    "Norte": {"sigla": "N", "ids_uf": [11, 12, 13, 14, 15, 16, 17]},
    "Nordeste": {"sigla": "NE", "ids_uf": [21, 22, 23, 24, 25, 26, 27, 28, 29]},
    "Sudeste": {"sigla": "SE", "ids_uf": [31, 32, 33, 35]},
    "Sul": {"sigla": "S", "ids_uf": [41, 42, 43]},
    "Centro-Oeste": {"sigla": "CO", "ids_uf": [50, 51, 52, 53]}
}

pipeline = [
    # Estágio 1: Adicionar a informação de Região a cada documento de cidade
    {
        '$addFields': {
            'info_regiao': {
                '$switch': {
                    'branches': [
                        {'case': {'$in': ['$id_state', map_regioes['Norte']['ids_uf']]}, 'then': {'nome': 'Norte', 'sigla': 'N'}},
                        {'case': {'$in': ['$id_state', map_regioes['Nordeste']['ids_uf']]}, 'then': {'nome': 'Nordeste', 'sigla': 'NE'}},
                        {'case': {'$in': ['$id_state', map_regioes['Sudeste']['ids_uf']]}, 'then': {'nome': 'Sudeste', 'sigla': 'SE'}},
                        {'case': {'$in': ['$id_state', map_regioes['Sul']['ids_uf']]}, 'then': {'nome': 'Sul', 'sigla': 'S'}},
                        {'case': {'$in': ['$id_state', map_regioes['Centro-Oeste']['ids_uf']]}, 'then': {'nome': 'Centro-Oeste', 'sigla': 'CO'}},
                    ],
                    'default': 'Desconhecida'
                }
            }
        }
    },
    # Estágio 2: Usar $facet para criar 3 pipelines paralelas
    {
        '$facet': {
            # Faceta para os Municípios (Nível 3)
            'municipios': [
                {
                    '$project': {
                        '_id': 0,
                        'id': {'$toString': '$id_city'},
                        # 'nome': {'$concat': ['$name', ', ', '$short_name_state']},
                        'nome': '$name',
                        'uf': '$short_name_state',
                        'nivel': { "$literal": 3},
                        'ordem': {'$concat': ['$info_regiao.nome', '_', '$name_state', '_', '$name']}
                    }
                }
            ],
            # Faceta para os Estados (Nível 2)
            'estados': [
                {'$addFields': {'nome_regiao': '$info_regiao.nome'}},
                {
                    '$group': {
                        '_id': '$id_state',
                        'nome_estado': {'$first': '$name_state'},
                        'sigla_uf': {'$first': '$short_name_state'},
                        'nome_regiao': {'$first': '$nome_regiao'}
                    }
                },
                {
                    '$project': {
                        '_id': 0,
                        'id': {'$toString': '$_id'},
                        'nome': {'$concat': ['$nome_estado', ' (UF)']},
                        'uf': '$sigla_uf',
                        'nivel': { "$literal": 2},
                        'ordem': {'$concat': ['$nome_regiao', '_', '$nome_estado']}
                    }
                }
            ],
            # Faceta para as Regiões (Nível 1)
            'regioes': [
                {
                    '$group': {
                        '_id': '$info_regiao.sigla',
                        'nome_regiao': {'$first': '$info_regiao.nome'}
                    }
                },
                {
                    '$project': {
                        '_id': 0,
                        'id': '$_id',
                        'nome': '$nome_regiao',
                        'uf': '$_id',
                        'nivel': { "$literal": 1},
                        'ordem': '$nome_regiao'
                    }
                }
            ]
        }
    },
    # Estágio 3: Unir os resultados das 3 facetas em um único array
    {
        '$project': {
            'localidades': {
                '$concatArrays': ['$municipios', '$estados', '$regioes']
            }
        }
    },
    # Estágio 4: Desconstruir o array para ter um fluxo de documentos
    {
        '$unwind': '$localidades'
    },
    # Estágio 5: Promover cada documento do array para a raiz
    {
        '$replaceRoot': {
            'newRoot': '$localidades'
        }
    },
    # Estágio 6: Ordenar o resultado final
    {
        '$sort': {
            'ordem': 1 # Ordena pela chave hierárquica que criamos
        }
    },
    # Estágio 7: Remover o campo temporário de ordenação do output final
    {
        '$project': {
            'ordem': 0
        }
    }
]

# --- 3. Execução da Pipeline e Geração do JSON ---
print("Executando a pipeline de agregação...")

# Executa a agregação
resultados = list(collection.aggregate(pipeline))
resultados
# Adiciona o documento do Brasil (Nível 0) no início da lista
brasil_doc = {"id": "BR", "nome": "Brasil", "uf": "BR", "nivel": 0}
resultados.insert(0, brasil_doc)

print(f"Pipeline executada. {len(resultados)} documentos gerados (BR, Regiões, UFs e Municípios).")

# Salva o resultado final em um arquivo JSON
with open('../localidades_from_mongo.json', 'w', encoding='utf-8') as f:
    json.dump(resultados, f, ensure_ascii=False, indent=2)

print("Arquivo 'localidades_from_mongo.json' criado com sucesso!")
print(resultados[0])


Executando a pipeline de agregação...
Pipeline executada. 5603 documentos gerados (BR, Regiões, UFs e Municípios).
Arquivo 'localidades_from_mongo.json' criado com sucesso!
{'id': 'BR', 'nome': 'Brasil', 'uf': 'BR', 'nivel': 0}


In [None]:
import json

# Definindo o pipeline com filtro por município e ano
municipio = "NomeDoMunicipio"  # Substitua pelo nome do município desejado
ano = 2023  # Substitua pelo ano desejado

pipeline = [
    {"$match": {"_id.id": 1100015, "_id.id_indicator": 'sinan_5_1'}},
    {"$limit": 10}
]

# Executando o pipeline e obtendo a saída em JSON
result = list(collection.aggregate(pipeline))
result

# json_result = json.dumps(result, default=str, ensure_ascii=False, indent=2)
# print(json_result)

[{'_id': {'id_indicator': 'sinan_5_1',
   'id_race': 1,
   'year': 2015,
   'id_local': 1100015.0,
   'ds_local': 'city'},
  'weight': 9032.1494370522,
  'value': 0.0,
  'value_num': 0.0,
  'id_goal': 5,
  'value_eff': 1.0,
  'status': 'top',
  'trend': 'up'},
 {'_id': {'id_indicator': 'sinan_5_1',
   'id_race': 4,
   'year': 2015,
   'id_local': 1100015.0,
   'ds_local': 'city'},
  'weight': 14095.627151763283,
  'value': 7.0944,
  'value_num': 1.0,
  'id_goal': 5,
  'value_eff': 0.868,
  'status': 'higher',
  'trend': 'up'},
 {'_id': {'id_indicator': 'sinan_5_1',
   'id_race': 0,
   'year': 2015,
   'id_local': 1100015.0,
   'ds_local': 'city'},
  'weight': 25578.0,
  'value': 3.9096,
  'value_num': 1.0,
  'id_goal': 5,
  'value_eff': 0.9272,
  'status': 'top',
  'trend': 'up'},
 {'_id': {'id_indicator': 'sinan_5_1',
   'id_race': 4,
   'year': 2016,
   'id_local': 1100015.0,
   'ds_local': 'city'},
  'weight': 14055.949102075,
  'value': 35.5721,
  'value_num': 5.0,
  'id_goal': 5,
