##

Limpeza da Base e Agrupamento das bases 

In [42]:
#Biblioteca 

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from pathlib import Path

In [43]:
#Leitura do arquivo

caminho_base = Path.cwd().parent / "data" / "raw" / "owid-energy-data.csv"
base = pd.read_csv(caminho_base, sep=",")
caminho_pais = Path.cwd().parent / "data" / "external" / "PAIS.csv"
pais = pd.read_csv(caminho_pais, sep=";", encoding="latin1")

In [44]:
## Principais informações do arquivo

print(base.info())
print(f'Linhas: {base.shape[0]}')
print(f'Colunas: {base.shape[1]}')
print(base.describe())

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 21812 entries, 0 to 21811
Columns: 129 entries, country to wind_share_energy
dtypes: float64(126), int64(1), object(2)
memory usage: 21.5+ MB
None
Linhas: 21812
Colunas: 129
               year    population           gdp  biofuel_cons_change_pct  \
count  21812.000000  1.844700e+04  1.177500e+04              1806.000000   
mean    1974.195718  1.054051e+08  4.260596e+11                45.489759   
std       35.342860  4.665375e+08  3.508591e+12               266.131064   
min     1900.000000  1.833000e+03  1.642060e+08              -100.000000   
25%     1946.000000  1.714291e+06  1.438637e+10                -0.500000   
50%     1984.000000  6.998022e+06  4.393385e+10                 8.189000   
75%     2004.000000  2.571993e+07  1.830838e+11                26.550000   
max     2023.000000  8.045311e+09  1.301126e+14              5659.328000   

       biofuel_cons_change_twh  biofuel_cons_per_capita  biofuel_consumption  \
count      

In [45]:
#Seleção de colunas

list(base.columns)


['country',
 'year',
 'iso_code',
 'population',
 'gdp',
 'biofuel_cons_change_pct',
 'biofuel_cons_change_twh',
 'biofuel_cons_per_capita',
 'biofuel_consumption',
 'biofuel_elec_per_capita',
 'biofuel_electricity',
 'biofuel_share_elec',
 'biofuel_share_energy',
 'carbon_intensity_elec',
 'coal_cons_change_pct',
 'coal_cons_change_twh',
 'coal_cons_per_capita',
 'coal_consumption',
 'coal_elec_per_capita',
 'coal_electricity',
 'coal_prod_change_pct',
 'coal_prod_change_twh',
 'coal_prod_per_capita',
 'coal_production',
 'coal_share_elec',
 'coal_share_energy',
 'electricity_demand',
 'electricity_generation',
 'electricity_share_energy',
 'energy_cons_change_pct',
 'energy_cons_change_twh',
 'energy_per_capita',
 'energy_per_gdp',
 'fossil_cons_change_pct',
 'fossil_cons_change_twh',
 'fossil_elec_per_capita',
 'fossil_electricity',
 'fossil_energy_per_capita',
 'fossil_fuel_consumption',
 'fossil_share_elec',
 'fossil_share_energy',
 'gas_cons_change_pct',
 'gas_cons_change_twh',
 

In [48]:
## Flag de separação das categorias de energia 
## As categorias de energia foram definidas com base na classificação da EPE (Empresa de Pesquisa Energética) do Brasil.
## As fontes de energia renováveis incluem: eólica, solar, hídrica, biomassa e outras renováveis.
## As fontes de energia não renováveis incluem: carvão, petróleo, gás natural e nuclear.
## Fonte: https://www.epe.gov.br/pt/abcdenergia/fontes-de-energia

# Listas de categorias
renovaveis = ["wind_consumption", "solar_consumption", "hydro_consumption", "biofuel_consumption", "other_renewable_consumption"]
nao_renovaveis = ["coal_consumption", "oil_consumption", "gas_consumption", "nuclear_consumption"]

# Criar colunas para renováveis e não renováveis
base["energia_renovavel"] = base[renovaveis].sum(axis=1, min_count=0)
base["energia_nao_renovavel"] = base[nao_renovaveis].sum(axis=1, min_count=0)


# Criar um filtro para separar os datasets
df_renovavel = base[base["energia_renovavel"] > 0]
df_nao_renovavel = base[base["energia_nao_renovavel"] > 0]

In [53]:
#Criação de uma lista dos nomes das colunas traduzidas para o português e substituir no código

colunas_traduzidas = {
'country' : 'país',
'year' : 'ano',
'iso_code' : 'código_iso',
'population' : 'população',
'gdp' : 'pib',
'biofuel_cons_change_pct' : 'variação_biocombustível_pct',
'biofuel_cons_change_twh' : 'variação_biocombustível_twh',
'biofuel_cons_per_capita' : 'biocombustível_per_capita',
'biofuel_consumption' : 'consumo_biocombustível',
'biofuel_elec_per_capita' : 'eletricidade_biocombustível_per_capita',
'biofuel_electricity' : 'eletricidade_biocombustível',
'biofuel_share_elec' : 'participação_biocombustível_eletricidade',
'biofuel_share_energy' : 'participação_biocombustível_energia',
'carbon_intensity_elec' : 'intensidade_carbono_eletricidade',
'coal_cons_change_pct' : 'variação_carvão_pct',
'coal_cons_change_twh' : 'variação_carvão_twh',
'coal_cons_per_capita' : 'carvão_per_capita',
'coal_consumption' : 'consumo_carvão',
'coal_elec_per_capita' : 'eletricidade_carvão_per_capita',
'coal_electricity' : 'eletricidade_carvão',
'coal_prod_change_pct' : 'variação_produção_carvão_pct',
'coal_prod_change_twh' : 'variação_produção_carvão_twh',
'coal_prod_per_capita' : 'produção_carvão_per_capita',
'coal_production' : 'produção_carvão',
'coal_share_elec' : 'participação_carvão_eletricidade',
'coal_share_energy' : 'participação_carvão_energia',
'electricity_demand' : 'demanda_eletricidade',
'electricity_generation' : 'geração_eletricidade',
'electricity_share_energy' : 'participação_eletricidade_energia',
'energy_cons_change_pct' : 'variação_consumo_energia_pct',
'energy_cons_change_twh' : 'variação_consumo_energia_twh',
'energy_per_capita' : 'energia_per_capita',
'energy_per_gdp' : 'energia_por_pib',
'fossil_cons_change_pct' : 'variação_combustível_fóssil_pct',
'fossil_cons_change_twh' : 'variação_combustível_fóssil_twh',
'fossil_elec_per_capita' : 'eletricidade_fóssil_per_capita',
'fossil_electricity' : 'eletricidade_fóssil',
'fossil_energy_per_capita' : 'energia_fóssil_per_capita',
'fossil_fuel_consumption' : 'consumo_combustível_fóssil',
'fossil_share_elec' : 'participação_fóssil_eletricidade',
'fossil_share_energy' : 'participação_fóssil_energia',
'gas_cons_change_pct' : 'variação_gás_pct',
'gas_cons_change_twh' : 'variação_gás_twh',
'gas_consumption' : 'consumo_gás',
'gas_elec_per_capita' : 'eletricidade_gás_per_capita',
'gas_electricity' : 'eletricidade_gás',
'gas_energy_per_capita' : 'energia_gás_per_capita',
'gas_prod_change_pct' : 'variação_produção_gás_pct',
'gas_prod_change_twh' : 'variação_produção_gás_twh',
'gas_prod_per_capita' : 'produção_gás_per_capita',
'gas_production' : 'produção_gás',
'gas_share_elec' : 'participação_gás_eletricidade',
'gas_share_energy' : 'participação_gás_energia',
'greenhouse_gas_emissions' : 'emissões_gases_efeito_estufa',
'hydro_cons_change_pct' : 'variação_hidrelétrica_pct',
'hydro_cons_change_twh' : 'variação_hidrelétrica_twh',
'hydro_consumption' : 'consumo_hidrelétrica',
'hydro_elec_per_capita' : 'eletricidade_hidrelétrica_per_capita',
'hydro_electricity' : 'eletricidade_hidrelétrica',
'hydro_energy_per_capita' : 'energia_hidrelétrica_per_capita',
'hydro_share_elec' : 'participação_hidrelétrica_eletricidade',
'hydro_share_energy' : 'participação_hidrelétrica_energia',
'low_carbon_cons_change_pct' : 'variação_baixo_carbono_pct',
'low_carbon_cons_change_twh' : 'variação_baixo_carbono_twh',
'low_carbon_consumption' : 'consumo_baixo_carbono',
'low_carbon_elec_per_capita' : 'eletricidade_baixo_carbono_per_capita',
'low_carbon_electricity' : 'eletricidade_baixo_carbono',
'low_carbon_energy_per_capita' : 'energia_baixo_carbono_per_capita',
'low_carbon_share_elec' : 'participação_baixo_carbono_eletricidade',
'low_carbon_share_energy' : 'participação_baixo_carbono_energia',
'net_elec_imports' : 'importação_líquida_eletricidade',
'net_elec_imports_share_demand' : 'participação_importação_eletricidade_demanda',
'nuclear_cons_change_pct' : 'variação_nuclear_pct',
'nuclear_cons_change_twh' : 'variação_nuclear_twh',
'nuclear_consumption' : 'consumo_nuclear',
'nuclear_elec_per_capita' : 'eletricidade_nuclear_per_capita',
'nuclear_electricity' : 'eletricidade_nuclear',
'nuclear_energy_per_capita' : 'energia_nuclear_per_capita',
'nuclear_share_elec' : 'participação_nuclear_eletricidade',
'nuclear_share_energy' : 'participação_nuclear_energia',
'oil_cons_change_pct' : 'variação_petróleo_pct',
'oil_cons_change_twh' : 'variação_petróleo_twh',
'oil_consumption' : 'consumo_petróleo',
'oil_elec_per_capita' : 'eletricidade_petróleo_per_capita',
'oil_electricity' : 'eletricidade_petróleo',
'oil_energy_per_capita' : 'energia_petróleo_per_capita',
'oil_prod_change_pct' : 'variação_produção_petróleo_pct',
'oil_prod_change_twh' : 'variação_produção_petróleo_twh',
'oil_prod_per_capita' : 'produção_petróleo_per_capita',
'oil_production' : 'produção_petróleo',
'oil_share_elec' : 'participação_petróleo_eletricidade',
'oil_share_energy' : 'participação_petróleo_energia',
'other_renewable_consumption' : 'consumo_outras_renováveis',
'other_renewable_electricity' : 'eletricidade_outras_renováveis',
'other_renewable_exc_biofuel_electricity' : 'eletricidade_outras_renováveis_exceto_biocombustível',
'other_renewables_cons_change_pct' : 'variação_outras_renováveis_pct',
'other_renewables_cons_change_twh' : 'variação_outras_renováveis_twh',
'other_renewables_elec_per_capita' : 'eletricidade_outras_renováveis_per_capita',
'other_renewables_elec_per_capita_exc_biofuel' : 'eletricidade_outras_renováveis_per_capita_exceto_biocombustível',
'other_renewables_energy_per_capita' : 'energia_outras_renováveis_per_capita',
'other_renewables_share_elec' : 'participação_outras_renováveis_eletricidade',
'other_renewables_share_elec_exc_biofuel' : 'participação_outras_renováveis_eletricidade_exceto_biocombustível',
'other_renewables_share_energy' : 'participação_outras_renováveis_energia',
'per_capita_electricity' : 'eletricidade_per_capita',
'primary_energy_consumption' : 'consumo_energia_primária',
'renewables_cons_change_pct' : 'variação_renováveis_pct',
'renewables_cons_change_twh' : 'variação_renováveis_twh',
'renewables_consumption' : 'consumo_renováveis',
'renewables_elec_per_capita' : 'eletricidade_renováveis_per_capita',
'renewables_electricity' : 'eletricidade_renováveis',
'renewables_energy_per_capita' : 'energia_renováveis_per_capita',
'renewables_share_elec' : 'participação_renováveis_eletricidade',
'renewables_share_energy' : 'participação_renováveis_energia',
'solar_cons_change_pct' : 'variação_solar_pct',
'solar_cons_change_twh' : 'variação_solar_twh',
'solar_consumption' : 'consumo_solar',
'solar_elec_per_capita' : 'eletricidade_solar_per_capita',
'solar_electricity' : 'eletricidade_solar',
'solar_energy_per_capita' : 'energia_solar_per_capita',
'solar_share_elec' : 'participação_solar_eletricidade',
'solar_share_energy' : 'participação_solar_energia',
'wind_cons_change_pct' : 'variação_eólica_pct',
'wind_cons_change_twh' : 'variação_eólica_twh',
'wind_consumption' : 'consumo_eólica',
'wind_elec_per_capita' : 'eletricidade_eólica_per_capita',
'wind_electricity' : 'eletricidade_eólica',
'wind_energy_per_capita' : 'energia_eólica_per_capita',
'wind_share_elec' : 'participação_eólica_eletricidade',
'wind_share_energy' : 'participação_eólica_energia',

}


base.rename(columns=colunas_traduzidas, inplace=True)

caminho_processado = Path.cwd().parent / "data" / "processed" / "base.csv"
base.to_csv(caminho_processado, index=False, sep=";")


In [50]:
list(base.columns)

['país',
 'ano',
 'código_iso',
 'população',
 'pib',
 'variação_biocombustível_pct',
 'variação_biocombustível_twh',
 'biocombustível_per_capita',
 'consumo_biocombustível',
 'eletricidade_biocombustível_per_capita',
 'eletricidade_biocombustível',
 'participação_biocombustível_eletricidade',
 'participação_biocombustível_energia',
 'intensidade_carbono_eletricidade',
 'variação_carvão_pct',
 'variação_carvão_twh',
 'carvão_per_capita',
 'consumo_carvão',
 'eletricidade_carvão_per_capita',
 'eletricidade_carvão',
 'variação_produção_carvão_pct',
 'variação_produção_carvão_twh',
 'produção_carvão_per_capita',
 'produção_carvão',
 'participação_carvão_eletricidade',
 'participação_carvão_energia',
 'demanda_eletricidade',
 'geração_eletricidade',
 'participação_eletricidade_energia',
 'variação_consumo_energia_pct',
 'variação_consumo_energia_twh',
 'energia_per_capita',
 'energia_por_pib',
 'variação_combustível_fóssil_pct',
 'variação_combustível_fóssil_twh',
 'eletricidade_fóssil_per

In [54]:
## Base de dados somente com país


base_pais = pd.merge(base, pais, left_on='país', right_on='NO_PAIS_ING', how='inner')

caminho_saida_pais = Path.cwd().parent / "data" / "processed" / "base_pais.csv"
base_pais.to_csv(caminho_saida_pais, index=False, sep=";")



In [63]:
## Base de dados somente com continente

lista_continente = pd.DataFrame({
    'continente': ['Europe', 'Asia','North America', 'South America', 'Africa', 'Oceania', 'Central America (EI)'],
})

base_continente = pd.merge(base, lista_continente, left_on='país', right_on='continente', how='inner')

caminho_saida_continente = Path.cwd().parent / "data" / "processed" / "base_continente.csv"
base_continente.to_csv(caminho_saida_continente, index=False, sep=";")

In [64]:


base_pais
base_continente

Unnamed: 0,país,ano,código_iso,população,pib,variação_biocombustível_pct,variação_biocombustível_twh,biocombustível_per_capita,consumo_biocombustível,eletricidade_biocombustível_per_capita,...,variação_eólica_twh,consumo_eólica,eletricidade_eólica_per_capita,eletricidade_eólica,energia_eólica_per_capita,participação_eólica_eletricidade,participação_eólica_energia,energia_renovavel,energia_nao_renovavel,continente
0,Africa,1900,,138752199.0,,,,,,,...,,,,,,,,0.000,0.000,Africa
1,Africa,1901,,139021447.0,,,,,,,...,,,,,,,,0.000,0.000,Africa
2,Africa,1902,,139489077.0,,,,,,,...,,,,,,,,0.000,0.000,Africa
3,Africa,1903,,139992790.0,,,,,,,...,,,,,,,,0.000,0.000,Africa
4,Africa,1904,,140510536.0,,,,,,,...,,,,,,,,0.000,0.000,Africa
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
798,South America,2019,,428318218.0,,9.757,26.680,700.725,300.133,144.495,...,32.814,191.291,169.337,72.53,446.608,6.129,2.713,2555.862,4494.380,South America
799,South America,2020,,431530105.0,,-9.420,-28.272,629.993,271.861,155.841,...,17.578,208.869,184.321,79.54,484.019,6.814,3.194,2532.200,4007.484,South America
800,South America,2021,,434254167.0,,0.087,0.238,626.588,272.099,148.484,...,52.619,261.488,229.359,99.60,602.154,8.176,3.705,2513.574,4544.983,South America
801,South America,2022,,436816679.0,,0.602,1.638,626.663,273.737,141.272,...,30.511,291.999,256.080,111.86,668.470,8.982,3.928,2779.362,4653.581,South America
