# Trabalho Final da Disciplina de Banco de Dados NoSQL

## Integrantes
Benedito Carlos Somaio - RA 130004701, 
Luiz Alexandre F. Martinez - RA 200012299, 
Stefano Brisotto - RA 200014719, 
Victor Goto - RA 200014471.

## Objetivo
O objetivo desse trabalho é demonstrar os procedimentos para a obtenção de informações e realização de análises a partir de uma fonte de dados utilizando um banco de dados NoSQL. Para a realização desse trabalho foi utilizado o MongoDB.

## Introdução
Não há dúvidas da importância da energia elétrica para a humanidade. Ela é necessária para praticamente tudo que fazemos durante todo o nosso dia e há uma cadeia de processos enorme implementada para que ela seja disponibilizada de forma segura e com qualidade. Várias empresas são responsáveis por gerar, transmitir e distribuir energia elétrica. No Brasil há uma gama muito grande de instalações que geram energia elétrica diariamente em diferentes regiões do Brasil. Utilizando o SIN - Sistema Interligado Nacional toda essa energia é transmitida para as mais variadas localidades, até que finalmente seja distribuida ao consumidor final. 

## Base de Dados
A base de dados utilizada para a realização desse trabalho traz informações básicas sobre os empreendimentos de geração centralizada no Brasil, informação essa disponível no site da ANEEL - Agencia Nacional de Energia Elétrica, orgão regulador do setor, por meio do Portal Brasileiro de Dados Abertos - https://dados.gov.br/.

## Carga de Dados
Para carregar a massa de dados no Jupyter foi necessário o tratamento do arquivo JSON disponibilizado pelo site, pois o arquivo não foi salvo utilizando a formatação UTF-8. Para esse tratamento do arquivo foi utilizado o Visual Studio Code. Após essa correção foi feito o upload do aquivo na pasta /labs/ no Jupyter na plataforma on-line disponibilizada em aula.


## Geração do Banco
Para gerar o banco foram utilizado os seguintes comandos:

In [1]:
!mongoimport --db aneel --collection geracao --drop --jsonArray --file $(pwd)/EmpreendimentoOperacao.json

2020-10-10T11:03:23.804+0000	connected to: mongodb://localhost/
2020-10-10T11:03:23.804+0000	dropping: aneel.geracao
2020-10-10T11:03:26.825+0000	[#################.......] aneel.geracao	3.82MB/5.12MB (74.6%)
2020-10-10T11:03:28.029+0000	[########################] aneel.geracao	5.12MB/5.12MB (100.0%)
2020-10-10T11:03:28.029+0000	9007 document(s) imported successfully. 0 document(s) failed to import.


## Usando python para consultas

In [2]:
from pymongo import MongoClient
from pprintpp import pprint
import warnings
warnings.filterwarnings('ignore')
mongoclient = MongoClient('localhost', 27017)
db = mongoclient.aneel
print(db)

Database(MongoClient(host=['localhost:27017'], document_class=dict, tz_aware=False, connect=True), 'aneel')


In [3]:
db.geracao.find({}).count()

9007

## Exibição um documento da collection geracao

In [4]:
db.geracao.find_one({})

{'_id': ObjectId('5f8194fc338bd18a350831f3'),
 'nomFonteNivel1': 'Petróleo',
 'datOperacao': '07/10/2008 00:00:00',
 'nomFonteNivel2': 'Óleo Diesel',
 'codNucleoCEG': '029920',
 'sigDestinoEnergia': ' REG',
 'sigTipoGeracao': 'UTE',
 'dscParticipacaoProprietario': ' 100.00% para Condomínio Residencial 29 de Outubro',
 'dthProcessamento': '05/10/2020 00:00:00',
 'nomEmpreendimento': '29 de Outubro',
 'dscMunicipio': ' Jaraguá do Sul - SC - CodIbge: 4208906',
 'mdaPotenciaFiscalizadakW': '0.00',
 'mdaPotenciaOutorgadakW': 62,
 'dscOrigemCombustivel': 'Fóssil',
 'codCEG': 'UTE.PE.SC.029920-0.01',
 'anoReferencia': 2020,
 'mesReferencia': 10,
 'UF': 'SC',
 'ano': '2008'}

## Lista de Empreendimentos de Geração no município de Fernando de Noronha

In [6]:
result = db.geracao.find({"dscMunicipio": {"$regex" : "Noronha"}})

pprint( list(result) )

[
    {
        'UF': 'PE',
        '_id': ObjectId('5f8194ff338bd18a3508526e'),
        'ano': '2007',
        'anoReferencia': 2020,
        'codCEG': 'UTE.PE.PE.002887-8.01',
        'codNucleoCEG': '002887',
        'datOperacao': '15/07/2007 00:00:00',
        'dscMunicipio': ' Fernando de Noronha - PE - CodIbge: 2605459',
        'dscOrigemCombustivel': 'Fóssil',
        'dscParticipacaoProprietario': ' 100.00% para COMPANHIA ENERGÉTICA DE PERNAMBUCO',
        'dthProcessamento': '05/10/2020 00:00:00',
        'mdaPotenciaFiscalizadakW': '0.00',
        'mdaPotenciaOutorgadakW': 4759,
        'mesReferencia': 10,
        'nomEmpreendimento': 'Tubarão',
        'nomFonteNivel1': 'Petróleo',
        'nomFonteNivel2': 'Óleo Diesel',
        'sigDestinoEnergia': ' SP',
        'sigTipoGeracao': 'UTE',
    },
]


## Exibição um documento que no nome do proprietário contenha Dardanelos

In [8]:
result = db.geracao.find({"dscParticipacaoProprietario": {"$regex" : "Dardanelos"}})
pprint(list(result))

[
    {
        'UF': 'MT',
        '_id': ObjectId('5f8194fd338bd18a35083e67'),
        'ano': '1997',
        'anoReferencia': 2020,
        'codCEG': 'PCH.PH.MT.000935-0.01',
        'codNucleoCEG': '000935',
        'datOperacao': '13/03/1997 00:00:00',
        'dscMunicipio': ' Aripuanã - MT - CodIbge: 5101407',
        'dscOrigemCombustivel': 'Hídrica',
        'dscParticipacaoProprietario': ' 100.00% para Centrais Elétricas Salto dos Dardanelos S.A',
        'dthProcessamento': '05/10/2020 00:00:00',
        'mdaPotenciaFiscalizadakW': '0.00',
        'mdaPotenciaOutorgadakW': 2788,
        'mesReferencia': 10,
        'nomEmpreendimento': 'Faxinal l',
        'nomFonteNivel1': 'Potencial hidráulico',
        'nomFonteNivel2': 'Potencial hidráulico',
        'sigDestinoEnergia': ' APE',
        'sigTipoGeracao': 'PCH',
    },
    {
        'UF': 'MT',
        '_id': ObjectId('5f8194fd338bd18a35083e7c'),
        'ano': '2005',
        'anoReferencia': 2020,
        'codCEG': 'PCH

## Inserindo, editando e excluindo registros 

In [6]:
db.geracao.insert(
    {
        "nomFonteNivel1":"Petróleo",
        "datOperacao":"09/10/2020 00:00:00",
        "nomFonteNivel2":"Óleo Diesel",
        "codNucleoCEG":"301194",
        "sigDestinoEnergia":"REG",
        "sigTipoGeracao":"UTE",
        "dscParticipacaoProprietario":" 100.00% para UNISAL SAO JOSE CAMPINAS",
        "dthProcessamento":"10/10/2020 00:00:00",
        "nomEmpreendimento":"UNISAL",
        "dscMunicipio":" Campinas - SP - CodIbge: 3522307",
        "mdaPotenciaFiscalizadakW":0.00,
        "mdaPotenciaOutorgadakW":9999.00,
        "dscOrigemCombustivel":"Fóssil",
        "codCEG":"UTE.PE.SP.301194-7.01",
        "anoReferencia":2020,
        "mesReferencia":10,
        "UF":"SP",
        "ano":"2020"
    }
        )

ObjectId('5f818f5dead1664fb0ef5cee')

In [7]:
result = db.geracao.find({"dscParticipacaoProprietario": {"$regex" : "UNISAL"}})
pprint(list(result))

[
    {
        'UF': 'SP',
        '_id': ObjectId('5f818f5dead1664fb0ef5cee'),
        'ano': '2020',
        'anoReferencia': 2020,
        'codCEG': 'UTE.PE.SP.301194-7.01',
        'codNucleoCEG': '301194',
        'datOperacao': '09/10/2020 00:00:00',
        'dscMunicipio': ' Campinas - SP - CodIbge: 3522307',
        'dscOrigemCombustivel': 'Fóssil',
        'dscParticipacaoProprietario': ' 100.00% para UNISAL SAO JOSE CAMPINAS',
        'dthProcessamento': '10/10/2020 00:00:00',
        'mdaPotenciaFiscalizadakW': 0.0,
        'mdaPotenciaOutorgadakW': 9999.0,
        'mesReferencia': 10,
        'nomEmpreendimento': 'UNISAL',
        'nomFonteNivel1': 'Petróleo',
        'nomFonteNivel2': 'Óleo Diesel',
        'sigDestinoEnergia': 'REG',
        'sigTipoGeracao': 'UTE',
    },
]


In [8]:
db.geracao.update({"nomEmpreendimento": "UNISAL"},{"$set": {"mdaPotenciaOutorgadakW": "7777"}})

{'n': 1, 'nModified': 1, 'ok': 1.0, 'updatedExisting': True}

In [9]:
result = db.geracao.find({"dscParticipacaoProprietario": {"$regex" : "UNISAL"}})
pprint(list(result))

[
    {
        'UF': 'SP',
        '_id': ObjectId('5f818f5dead1664fb0ef5cee'),
        'ano': '2020',
        'anoReferencia': 2020,
        'codCEG': 'UTE.PE.SP.301194-7.01',
        'codNucleoCEG': '301194',
        'datOperacao': '09/10/2020 00:00:00',
        'dscMunicipio': ' Campinas - SP - CodIbge: 3522307',
        'dscOrigemCombustivel': 'Fóssil',
        'dscParticipacaoProprietario': ' 100.00% para UNISAL SAO JOSE CAMPINAS',
        'dthProcessamento': '10/10/2020 00:00:00',
        'mdaPotenciaFiscalizadakW': 0.0,
        'mdaPotenciaOutorgadakW': '7777.0',
        'mesReferencia': 10,
        'nomEmpreendimento': 'UNISAL',
        'nomFonteNivel1': 'Petróleo',
        'nomFonteNivel2': 'Óleo Diesel',
        'sigDestinoEnergia': 'REG',
        'sigTipoGeracao': 'UTE',
    },
]


In [10]:
db.geracao.remove({"nomEmpreendimento":"UNISAL"})

{'n': 1, 'ok': 1.0}

In [11]:
result = db.geracao.find({"dscParticipacaoProprietario": {"$regex" : "UNISAL"}})
pprint(list(result))

[]


## Quantidade de empreendimentos por Tipo de Geração 

In [12]:
pipeline = [
            {"$unwind": "$sigTipoGeracao"},
            {"$group": {"_id": "$sigTipoGeracao", "count": {"$sum": 1}}},
            {"$sort":  {"count": -1}}  
]

result = db.geracao.aggregate(pipeline)
list(result)

[{'_id': 'UFV', 'count': 3904},
 {'_id': 'UTE', 'count': 3066},
 {'_id': 'CGH', 'count': 737},
 {'_id': 'EOL', 'count': 657},
 {'_id': 'PCH', 'count': 421},
 {'_id': 'UHE', 'count': 219},
 {'_id': 'UTN', 'count': 2},
 {'_id': 'CGU', 'count': 1}]

## Quantidade de Geração por Tipo de Insumo

In [13]:
pipeline = [
            {"$unwind": "$nomFonteNivel1"},
            {"$group": {"_id": "$nomFonteNivel1", "count": {"$sum": 1}}},
            {"$sort":  {"count": -1}}  
]

result = db.geracao.aggregate(pipeline)
list(result)

[{'_id': 'Radiação solar', 'count': 3904},
 {'_id': 'Petróleo', 'count': 2299},
 {'_id': 'Potencial hidráulico', 'count': 1377},
 {'_id': 'Cinética do vento', 'count': 657},
 {'_id': 'Agroindustriais', 'count': 425},
 {'_id': 'Gás natural', 'count': 167},
 {'_id': 'Floresta', 'count': 107},
 {'_id': 'Resíduos sólidos urbanos', 'count': 25},
 {'_id': 'Carvão mineral', 'count': 22},
 {'_id': 'Resíduos animais', 'count': 14},
 {'_id': 'Outros Fósseis', 'count': 4},
 {'_id': 'Biocombustíveis líquidos', 'count': 3},
 {'_id': 'Urânio', 'count': 2},
 {'_id': 'Cinética da água', 'count': 1}]

## Quantidade de Geração por Estado

In [14]:
pipeline = [
            {"$group": {"_id": "$UF", "n_usina": {"$sum": 1}}},
            {"$sort":  {"n_usina": -1}}
]

result = db.geracao.aggregate(pipeline)
list(result)

[{'_id': 'PA', 'n_usina': 3812},
 {'_id': 'SP', 'n_usina': 1082},
 {'_id': 'MG', 'n_usina': 755},
 {'_id': 'SC', 'n_usina': 400},
 {'_id': 'RS', 'n_usina': 352},
 {'_id': 'BA', 'n_usina': 349},
 {'_id': 'MT', 'n_usina': 230},
 {'_id': 'PR', 'n_usina': 222},
 {'_id': 'AM', 'n_usina': 215},
 {'_id': 'RN', 'n_usina': 209},
 {'_id': 'RJ', 'n_usina': 203},
 {'_id': 'GO', 'n_usina': 152},
 {'_id': 'RR', 'n_usina': 135},
 {'_id': 'CE', 'n_usina': 134},
 {'_id': 'PE', 'n_usina': 126},
 {'_id': 'PI', 'n_usina': 104},
 {'_id': 'MS', 'n_usina': 85},
 {'_id': 'RO', 'n_usina': 84},
 {'_id': 'ES', 'n_usina': 64},
 {'_id': 'TO', 'n_usina': 58},
 {'_id': 'MA', 'n_usina': 50},
 {'_id': 'AL', 'n_usina': 45},
 {'_id': 'SE', 'n_usina': 43},
 {'_id': 'PB', 'n_usina': 35},
 {'_id': 'AC', 'n_usina': 26},
 {'_id': 'DF', 'n_usina': 22},
 {'_id': 'AP', 'n_usina': 15}]

## Quantidade de Geração por Proprietário

In [15]:
pipeline = [
            {"$group": {"_id": "$dscParticipacaoProprietario", "n_proprietario": {"$sum": 1}}},
            {"$sort":  {"n_proprietario": -1}}
]

result = db.geracao.aggregate(pipeline)
list(result)

[{'_id': ' 100.00% para EQUATORIAL PARÁ DISTRIBUIDORA DE ENERGIA S.A.',
  'n_proprietario': 3724},
 {'_id': ' 100.00% para Claro S.A', 'n_proprietario': 145},
 {'_id': '', 'n_proprietario': 133},
 {'_id': ' 100.00% para CENCOSUD BRASIL COMERCIAL LTDA',
  'n_proprietario': 124},
 {'_id': ' 100.00% para AMAZONAS ENERGIA S.A', 'n_proprietario': 120},
 {'_id': ' 100.00% para Companhia Energética de Roraima',
  'n_proprietario': 78},
 {'_id': ' 100.00% para Atacadão S.A', 'n_proprietario': 71},
 {'_id': ' 100.00% para Empresa Brasileira de Infra-Estrutura Aeroportuária',
  'n_proprietario': 55},
 {'_id': ' 100.00% para RORAIMA ENERGIA S.A', 'n_proprietario': 51},
 {'_id': ' 100.00% para Adição Distribuição Express Ltda.',
  'n_proprietario': 34},
 {'_id': ' 100.00% para PETRÓLEO BRASILEIRO S A PETROBRAS',
  'n_proprietario': 33},
 {'_id': ' 100.00% para Stemac Energia S.A.', 'n_proprietario': 30},
 {'_id': ' 100.00% para OLIVEIRA ENERGIA GERAÇÃO E SERVIÇOS LTDA',
  'n_proprietario': 29},
 {

## Entrada em Operação entre 1960 e 1997

In [16]:
result = db.geracao.find({ "$and": [ { "ano": { "$gte": "1960" } }, { "ano": { "$lte": "1997" } } ] }).distinct("nomEmpreendimento")
pprint( list(result) )


[
    'AISA - CABECEIRINHA',
    'ARFIMAC',
    'ATENA',
    'Acearia Frederico Missner (Antiga Rio Luiz Alves)',
    'Aeroporto Internacional Afonso Pena',
    'Aeroporto Internacional Augusto Severo - Sub-Estação Prédio Anexo Operacional',
    'Aeroporto Internacional Eduardo Gomes',
    'Aeroporto Internacional Governador Jorge Teixeira',
    'Aeroporto Internacional Presidente Castro Pinto',
    'Aeroporto Internacional Salgado Filho',
    'Aeroporto Internacional Tancredo Neves',
    'Aeroporto Internacional de Boa Vista',
    'Aeroporto Internacional de Brasília',
    'Aeroporto Internacional de Congonhas - São Paulo',
    'Aeroporto Internacional de Corumbá',
    'Aeroporto Internacional de Foz do Iguaçu - Cataratas',
    'Aeroporto Internacional de São Paulo/Guarulhos-Central Elétrica de Emergência CEE',
    'Aeroporto Internacional de São Paulo/Guarulhos-SE Cabeceira 09',
    'Aeroporto Internacional de São Paulo/Guarulhos-SE Cabeceira 27',
    'Aeroporto Internacional de Taba

## Dez maiores empreendimentos de Geração por Potência Instalada

In [17]:
result = db.geracao.find({"sigTipoGeracao": "UHE"},{"_id": 0, "nomEmpreendimento": 1, "sigTipoGeracao": 1, "mdaPotenciaOutorgadakW": 1}).sort("mdaPotenciaOutorgadakW", -1).limit(10)
pprint (list(result))

[
    {
        'mdaPotenciaOutorgadakW': 11233100,
        'nomEmpreendimento': 'Belo Monte',
        'sigTipoGeracao': 'UHE',
    },
    {
        'mdaPotenciaOutorgadakW': 8535000,
        'nomEmpreendimento': 'Tucuruí',
        'sigTipoGeracao': 'UHE',
    },
    {
        'mdaPotenciaOutorgadakW': 7000000,
        'nomEmpreendimento': 'Itaipu (Parte Brasileira)',
        'sigTipoGeracao': 'UHE',
    },
    {
        'mdaPotenciaOutorgadakW': 3750000,
        'nomEmpreendimento': 'Jirau',
        'sigTipoGeracao': 'UHE',
    },
    {
        'mdaPotenciaOutorgadakW': 3568000,
        'nomEmpreendimento': 'Santo Antônio',
        'sigTipoGeracao': 'UHE',
    },
    {
        'mdaPotenciaOutorgadakW': 3444000,
        'nomEmpreendimento': 'Ilha Solteira',
        'sigTipoGeracao': 'UHE',
    },
    {
        'mdaPotenciaOutorgadakW': 3162000,
        'nomEmpreendimento': 'Xingó',
        'sigTipoGeracao': 'UHE',
    },
    {
        'mdaPotenciaOutorgadakW': 2462400,
        'nomEmpr