##Preparando o ambiente

In [1]:
import pandas as pd
import os #usar funcionalidades que são dependentes de sistema operacional

# Definir o caminho para o diretório temporário onde o repositório será clonado
clone_path = '/tmp/Estudos_Pandas'
excel_file_path = os.path.join(clone_path, '1-SEEG10_GERAL-BR_UF_2022.10.27-FINAL-SITE.xlsx')
repository_url = 'https://github.com/YuriArduino/Estudos_Pandas.git'
branch_name = 'data-tests'

# Remover o diretório do repositório se ele já existir para garantir um clone limpo
# Isso evita o erro "destination path '...' already exists and is not an empty directory"
if os.path.exists(clone_path):
    print(f"Removendo diretório existente: {clone_path}")
    !rm -rf {clone_path}

# Clonar o repositório do GitHub, especificando o branch 'data-tests'
print(f"Clonando repositório do branch '{branch_name}' para {clone_path}...")
!git clone --branch {branch_name} {repository_url} {clone_path}

# Mudar para o diretório do repositório clonado
print(f"Mudando para o diretório: {clone_path}")
%cd {clone_path}

# Puxar os arquivos grandes (LFS) do repositório.
# Este passo é crucial pois o arquivo Excel está armazenado usando Git LFS.
print("Puxando arquivos LFS...")
!git lfs pull

# Voltar para o diretório de conteúdo original do Colab
print("Voltando para o diretório original (/content/)...")
%cd /content/

# Verificar se o arquivo Excel existe no caminho esperado após o clone e LFS pull
if os.path.exists(excel_file_path):
    print(f"Arquivo Excel encontrado em: {excel_file_path}")
    # Ler o arquivo Excel para um DataFrame pandas
    # Motor 'openpyxl' para arquivos .xlsx
    print("Lendo o arquivo Excel com pandas...")
    emissoes_gases = pd.read_excel(excel_file_path, engine='openpyxl', sheet_name = 'GEE Estados',)

    # Exibir as primeiras 5 linhas do DataFrame
    print("Exibindo as primeiras linhas do DataFrame:")
    display(emissoes_gases.head())
else:
    print(f"Erro: O arquivo Excel não foi encontrado em {excel_file_path} após o clone e LFS pull.")
    print("Por favor, verifique se o nome do arquivo e o branch estão corretos.")

Removendo diretório existente: /tmp/Estudos_Pandas
Clonando repositório do branch 'data-tests' para /tmp/Estudos_Pandas...
Cloning into '/tmp/Estudos_Pandas'...
remote: Enumerating objects: 85, done.[K
remote: Counting objects: 100% (85/85), done.[K
remote: Compressing objects: 100% (79/79), done.[K
remote: Total 85 (delta 34), reused 10 (delta 3), pack-reused 0 (from 0)[K
Receiving objects: 100% (85/85), 4.60 MiB | 8.14 MiB/s, done.
Resolving deltas: 100% (34/34), done.
Mudando para o diretório: /tmp/Estudos_Pandas
/tmp/Estudos_Pandas
Puxando arquivos LFS...
Voltando para o diretório original (/content/)...
/content
Arquivo Excel encontrado em: /tmp/Estudos_Pandas/1-SEEG10_GERAL-BR_UF_2022.10.27-FINAL-SITE.xlsx
Lendo o arquivo Excel com pandas...


  warn(msg)


Exibindo as primeiras linhas do DataFrame:


Unnamed: 0,Nível 1 - Setor,Nível 2,Nível 3,Nível 4,Nível 5,Nível 6,Emissão / Remoção / Bunker,Gás,Estado,Atividade Econômica,...,2012,2013,2014,2015,2016,2017,2018,2019,2020,2021
0,Processos Industriais,Indústria Química,Produção de ABS,,,,Emissão,COVNM (t),SP,OUTRA_IND,...,897.6,897.6,897.6,897.6,897.6,897.6,897.6,897.6,897.6,897.6
1,Processos Industriais,Indústria Química,Produção de Ácido Adípico,,,,Emissão,N2O (t),SP,OUTRA_IND,...,130.0,130.0,130.0,130.0,130.0,130.0,130.0,130.0,130.0,130.0
2,Processos Industriais,Indústria Química,Produção de Ácido Adípico,,,,Emissão,CO (t),SP,OUTRA_IND,...,1380.576,1380.576,1380.576,1380.576,1380.576,1380.576,1380.576,1380.576,1380.576,1380.576
3,Processos Industriais,Indústria Química,Produção de Ácido Adípico,,,,Emissão,NOx (t),SP,OUTRA_IND,...,431.43,431.43,431.43,431.43,431.43,431.43,431.43,431.43,431.43,431.43
4,Processos Industriais,Indústria Química,Produção de Ácido Adípico,,,,Emissão,CO2e (t) GWP-AR2,SP,OUTRA_IND,...,40300.0,40300.0,40300.0,40300.0,40300.0,40300.0,40300.0,40300.0,40300.0,40300.0


`Info`

In [2]:
#Verificar os dados e seus respectivos tipos
emissoes_gases.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 103312 entries, 0 to 103311
Data columns (total 63 columns):
 #   Column                      Non-Null Count   Dtype  
---  ------                      --------------   -----  
 0   Nível 1 - Setor             103312 non-null  object 
 1   Nível 2                     103312 non-null  object 
 2   Nível 3                     103253 non-null  object 
 3   Nível 4                     90920 non-null   object 
 4   Nível 5                     100788 non-null  object 
 5   Nível 6                     97691 non-null   object 
 6   Emissão / Remoção / Bunker  103312 non-null  object 
 7   Gás                         103312 non-null  object 
 8   Estado                      97374 non-null   object 
 9   Atividade Econômica         102076 non-null  object 
 10  Produto                     37413 non-null   object 
 11  1970                        103312 non-null  float64
 12  1971                        103312 non-null  float64
 13  1972          

##Ajustando dados

Primeiro, selecionaremos a coluna que categoriza os dados entre cada uma das quatro categorias e usaremos a função unique(), que retorna os dados únicos de uma coluna. Assim, escreveremos emissoes_gases[]. Ao digitar os colchetes, obteremos uma lista de sugestões de colunas para serem selecionadas. Escolheremos a opção "Emissão / Remoção / Bunker". Ao fim dos colchetes, escreveremos .unique() e executaremos a célula.

In [3]:
emissoes_gases['Emissão / Remoção / Bunker'].unique()

array(['Emissão', 'Emissão NCI', 'Remoção NCI', 'Bunker', 'Remoção'],
      dtype=object)

Podemos fazer isso utilizando uma filtragem booleana utilizando "OU". Com ela, selecionaremos os dados de Remoção NCI ou os dados de Remoção.

Para isso, escreveremos emissoes_gases['Emissão / Remoção / Bunker']. Em seguida, colocaremos o sinal de comparação (==), abriremos aspas simples e escreveremos 'Remoção NCI'.

A mesma comparação também será feita com os dados de Remoção. Por isso, colocaremos tudo o que foi escrito até agora entre parênteses. Copiaremos toda a linha de código e inseriremos uma barra vertical depois dos parânteses (|). Colaremos o texto copiado anteriormente e editaremos apenas o campo "Remoção NCI, excluindo a sigla "NCI".

In [4]:
(emissoes_gases['Emissão / Remoção / Bunker'] == 'Remoção NCI') | (emissoes_gases['Emissão / Remoção / Bunker'] == 'Remoção')

Unnamed: 0,Emissão / Remoção / Bunker
0,False
1,False
2,False
3,False
4,False
...,...
103307,False
103308,False
103309,False
103310,False


Na próxima célula, faremos essa filtragem com o texto emissoes_gases[]. Dentro dos colchetes, poderíamos passar toda a filtragem booleana feita agora a pouco copiando e colando a linha anterior.

`Isin`

In [5]:
#isin(), que seleciona diversos valores dentro de uma mesma coluna.
emissoes_gases[emissoes_gases['Emissão / Remoção / Bunker'].isin(['Remoção NCI', 'Remoção'])]

Unnamed: 0,Nível 1 - Setor,Nível 2,Nível 3,Nível 4,Nível 5,Nível 6,Emissão / Remoção / Bunker,Gás,Estado,Atividade Econômica,...,2012,2013,2014,2015,2016,2017,2018,2019,2020,2021
23520,Agropecuária,Solos Manejados,Diretas,Variação dos Estoques de Carbono no Solo,Vegetal,Pastagem Bem Manejada,Remoção NCI,CO2 (t),RO,PEC,...,-1.434540e+07,-1.499358e+07,-1.543196e+07,-1.567070e+07,-1.630063e+07,-1.702215e+07,-1.740074e+07,-1.771914e+07,-1.767632e+07,-1.838895e+07
23521,Agropecuária,Solos Manejados,Diretas,Variação dos Estoques de Carbono no Solo,Vegetal,Pastagem Bem Manejada,Remoção NCI,CO2 (t),AC,PEC,...,-5.382949e+06,-5.524659e+06,-5.632429e+06,-5.765030e+06,-5.867354e+06,-5.942076e+06,-6.022000e+06,-6.002147e+06,-6.035591e+06,-6.459079e+06
23522,Agropecuária,Solos Manejados,Diretas,Variação dos Estoques de Carbono no Solo,Vegetal,Pastagem Bem Manejada,Remoção NCI,CO2 (t),AM,PEC,...,-3.450455e+06,-3.540294e+06,-3.545724e+06,-3.924546e+06,-4.626541e+06,-4.874199e+06,-4.849173e+06,-4.959540e+06,-5.106806e+06,-5.809814e+06
23523,Agropecuária,Solos Manejados,Diretas,Variação dos Estoques de Carbono no Solo,Vegetal,Pastagem Bem Manejada,Remoção NCI,CO2 (t),RR,PEC,...,-1.260166e+06,-1.261895e+06,-1.371664e+06,-1.501452e+06,-1.507705e+06,-1.509919e+06,-1.609826e+06,-1.616980e+06,-1.518397e+06,-1.926000e+06
23524,Agropecuária,Solos Manejados,Diretas,Variação dos Estoques de Carbono no Solo,Vegetal,Pastagem Bem Manejada,Remoção NCI,CO2 (t),PA,PEC,...,-3.429279e+07,-3.317185e+07,-3.281628e+07,-3.350720e+07,-3.557183e+07,-3.755308e+07,-4.134614e+07,-4.229403e+07,-4.275448e+07,-4.443440e+07
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
102751,Mudança de Uso da Terra e Floresta,Remoção por Vegetação Secundária,Pantanal,em Área Protegida,Vegetação nativa estável,Vegetação não florestal secundária -- Vegetaçã...,Remoção,CO2e (t) GWP-AR4,MS,AGROPEC,...,-7.513000e+04,-7.911900e+04,-8.695900e+04,-9.201400e+04,-9.149400e+04,-9.630200e+04,-9.202000e+04,-9.762300e+04,-1.015020e+05,-1.008910e+05
102752,Mudança de Uso da Terra e Floresta,Remoção por Vegetação Secundária,Pantanal,em Área Protegida,Vegetação nativa estável,Vegetação não florestal secundária -- Vegetaçã...,Remoção,CO2e (t) GWP-AR5,MT,AGROPEC,...,-9.523000e+03,-9.667000e+03,-1.000300e+04,-1.024200e+04,-1.027200e+04,-1.019100e+04,-1.046900e+04,-1.090400e+04,-1.104100e+04,-1.109500e+04
102753,Mudança de Uso da Terra e Floresta,Remoção por Vegetação Secundária,Pantanal,em Área Protegida,Vegetação nativa estável,Vegetação não florestal secundária -- Vegetaçã...,Remoção,CO2e (t) GWP-AR5,MS,AGROPEC,...,-7.513000e+04,-7.911900e+04,-8.695900e+04,-9.201400e+04,-9.149400e+04,-9.630200e+04,-9.202000e+04,-9.762300e+04,-1.015020e+05,-1.008910e+05
102754,Mudança de Uso da Terra e Floresta,Remoção por Vegetação Secundária,Pantanal,em Área Protegida,Vegetação nativa estável,Vegetação não florestal secundária -- Vegetaçã...,Remoção,CO2e (t) GWP-AR6,MT,AGROPEC,...,-9.523000e+03,-9.667000e+03,-1.000300e+04,-1.024200e+04,-1.027200e+04,-1.019100e+04,-1.046900e+04,-1.090400e+04,-1.104100e+04,-1.109500e+04


`Loc`

In [6]:
#.loc permite selecionar não só as linhas, mas também as colunas.
emissoes_gases.loc[emissoes_gases['Emissão / Remoção / Bunker'].isin(['Remoção NCI', 'Remoção']), 1970:2021]

Unnamed: 0,1970,1971,1972,1973,1974,1975,1976,1977,1978,1979,...,2012,2013,2014,2015,2016,2017,2018,2019,2020,2021
23520,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,...,-1.434540e+07,-1.499358e+07,-1.543196e+07,-1.567070e+07,-1.630063e+07,-1.702215e+07,-1.740074e+07,-1.771914e+07,-1.767632e+07,-1.838895e+07
23521,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,...,-5.382949e+06,-5.524659e+06,-5.632429e+06,-5.765030e+06,-5.867354e+06,-5.942076e+06,-6.022000e+06,-6.002147e+06,-6.035591e+06,-6.459079e+06
23522,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,...,-3.450455e+06,-3.540294e+06,-3.545724e+06,-3.924546e+06,-4.626541e+06,-4.874199e+06,-4.849173e+06,-4.959540e+06,-5.106806e+06,-5.809814e+06
23523,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,...,-1.260166e+06,-1.261895e+06,-1.371664e+06,-1.501452e+06,-1.507705e+06,-1.509919e+06,-1.609826e+06,-1.616980e+06,-1.518397e+06,-1.926000e+06
23524,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,...,-3.429279e+07,-3.317185e+07,-3.281628e+07,-3.350720e+07,-3.557183e+07,-3.755308e+07,-4.134614e+07,-4.229403e+07,-4.275448e+07,-4.443440e+07
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
102751,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,...,-7.513000e+04,-7.911900e+04,-8.695900e+04,-9.201400e+04,-9.149400e+04,-9.630200e+04,-9.202000e+04,-9.762300e+04,-1.015020e+05,-1.008910e+05
102752,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,...,-9.523000e+03,-9.667000e+03,-1.000300e+04,-1.024200e+04,-1.027200e+04,-1.019100e+04,-1.046900e+04,-1.090400e+04,-1.104100e+04,-1.109500e+04
102753,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,...,-7.513000e+04,-7.911900e+04,-8.695900e+04,-9.201400e+04,-9.149400e+04,-9.630200e+04,-9.202000e+04,-9.762300e+04,-1.015020e+05,-1.008910e+05
102754,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,...,-9.523000e+03,-9.667000e+03,-1.000300e+04,-1.024200e+04,-1.027200e+04,-1.019100e+04,-1.046900e+04,-1.090400e+04,-1.104100e+04,-1.109500e+04


`Max`

In [7]:
#.max(), mostrar o maior valor
emissoes_gases.loc[emissoes_gases['Emissão / Remoção / Bunker'].isin(['Remoção NCI', 'Remoção']), 1970:2021].max()

Unnamed: 0,0
1970,0.0
1971,0.0
1972,0.0
1973,0.0
1974,0.0
1975,0.0
1976,0.0
1977,0.0
1978,0.0
1979,0.0


Por ter dado 0 significa que o maior valor possível daquela coluna é um valor negativo. Assim, confirmaremos que se trata de uma remoção.

------------------

Agora, identificaremos se os valores de Bunker estão corretos. Estes são dados de viagens marítimas e aéreas internacionais. Assim sendo, elas não correspondem a nenhum estado brasileiro. Para verificar estes dados, confirmaremos se a coluna "Estado" não contém nenhuma informação referente aos estados brasileiros para os dados de Bunker.

In [8]:
emissoes_gases.loc[emissoes_gases['Emissão / Remoção / Bunker'] == 'Bunker', 'Estado'].unique()

array([nan], dtype=object)

Assim, para todos os dados em que a coluna de "Emissão / Remoção / Bunker" for igual a "Bunker", a coluna "Estado" está vazia. Dessa forma, todos os dados correspondem a informações do tipo "Bunker".

In [9]:
emissoes_gases = emissoes_gases[emissoes_gases['Emissão / Remoção / Bunker'] == 'Emissão']
emissoes_gases

Unnamed: 0,Nível 1 - Setor,Nível 2,Nível 3,Nível 4,Nível 5,Nível 6,Emissão / Remoção / Bunker,Gás,Estado,Atividade Econômica,...,2012,2013,2014,2015,2016,2017,2018,2019,2020,2021
0,Processos Industriais,Indústria Química,Produção de ABS,,,,Emissão,COVNM (t),SP,OUTRA_IND,...,897.600000,897.600000,897.600000,897.600000,897.600000,897.600000,897.600000,897.600,897.600,897.600
1,Processos Industriais,Indústria Química,Produção de Ácido Adípico,,,,Emissão,N2O (t),SP,OUTRA_IND,...,130.000000,130.000000,130.000000,130.000000,130.000000,130.000000,130.000000,130.000,130.000,130.000
2,Processos Industriais,Indústria Química,Produção de Ácido Adípico,,,,Emissão,CO (t),SP,OUTRA_IND,...,1380.576000,1380.576000,1380.576000,1380.576000,1380.576000,1380.576000,1380.576000,1380.576,1380.576,1380.576
3,Processos Industriais,Indústria Química,Produção de Ácido Adípico,,,,Emissão,NOx (t),SP,OUTRA_IND,...,431.430000,431.430000,431.430000,431.430000,431.430000,431.430000,431.430000,431.430,431.430,431.430
4,Processos Industriais,Indústria Química,Produção de Ácido Adípico,,,,Emissão,CO2e (t) GWP-AR2,SP,OUTRA_IND,...,40300.000000,40300.000000,40300.000000,40300.000000,40300.000000,40300.000000,40300.000000,40300.000,40300.000,40300.000
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
103241,Mudança de Uso da Terra e Floresta,Resíduos Florestais,Pantanal,,Desmatamento,,Emissão,CO2e (t) GWP-AR5,MS,AGROPEC,...,436935.000000,500067.000000,440030.000000,365272.000000,438422.000000,391113.000000,411738.000000,437039.000,871393.000,1004191.000
103242,Mudança de Uso da Terra e Floresta,Resíduos Florestais,Pantanal,,Desmatamento,,Emissão,CO2e (t) GWP-AR6,MT,AGROPEC,...,126806.000000,127558.000000,193758.000000,164585.000000,234509.000000,190412.000000,162919.000000,186091.000,368149.000,443120.000
103243,Mudança de Uso da Terra e Floresta,Resíduos Florestais,Pantanal,,Desmatamento,,Emissão,CO2e (t) GWP-AR6,MS,AGROPEC,...,439524.000000,502908.000000,442493.000000,367116.000000,440798.000000,393101.000000,413749.000000,439526.000,876637.000,1009968.000
103244,Mudança de Uso da Terra e Floresta,Resíduos Florestais,Pantanal,,Desmatamento,,Emissão,N2O (t),MT,AGROPEC,...,108.441090,109.811199,166.680103,141.442361,201.556097,162.932751,137.219684,158.000,314.000,479.000


`Drop`

Após filtrarmos os dados para manter apenas as emissões que estão no inventário nacional, essa coluna não tem mais utilidade. Todos os dados restantes são do tipo "Emissão", e a coluna não fornece mais informações adicionais ou necessárias para a análise.

In [10]:
#drop() remove a coluna da base de dados
emissoes_gases = emissoes_gases.drop(columns = 'Emissão / Remoção / Bunker')
emissoes_gases

Unnamed: 0,Nível 1 - Setor,Nível 2,Nível 3,Nível 4,Nível 5,Nível 6,Gás,Estado,Atividade Econômica,Produto,...,2012,2013,2014,2015,2016,2017,2018,2019,2020,2021
0,Processos Industriais,Indústria Química,Produção de ABS,,,,COVNM (t),SP,OUTRA_IND,,...,897.600000,897.600000,897.600000,897.600000,897.600000,897.600000,897.600000,897.600,897.600,897.600
1,Processos Industriais,Indústria Química,Produção de Ácido Adípico,,,,N2O (t),SP,OUTRA_IND,,...,130.000000,130.000000,130.000000,130.000000,130.000000,130.000000,130.000000,130.000,130.000,130.000
2,Processos Industriais,Indústria Química,Produção de Ácido Adípico,,,,CO (t),SP,OUTRA_IND,,...,1380.576000,1380.576000,1380.576000,1380.576000,1380.576000,1380.576000,1380.576000,1380.576,1380.576,1380.576
3,Processos Industriais,Indústria Química,Produção de Ácido Adípico,,,,NOx (t),SP,OUTRA_IND,,...,431.430000,431.430000,431.430000,431.430000,431.430000,431.430000,431.430000,431.430,431.430,431.430
4,Processos Industriais,Indústria Química,Produção de Ácido Adípico,,,,CO2e (t) GWP-AR2,SP,OUTRA_IND,,...,40300.000000,40300.000000,40300.000000,40300.000000,40300.000000,40300.000000,40300.000000,40300.000,40300.000,40300.000
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
103241,Mudança de Uso da Terra e Floresta,Resíduos Florestais,Pantanal,,Desmatamento,,CO2e (t) GWP-AR5,MS,AGROPEC,,...,436935.000000,500067.000000,440030.000000,365272.000000,438422.000000,391113.000000,411738.000000,437039.000,871393.000,1004191.000
103242,Mudança de Uso da Terra e Floresta,Resíduos Florestais,Pantanal,,Desmatamento,,CO2e (t) GWP-AR6,MT,AGROPEC,,...,126806.000000,127558.000000,193758.000000,164585.000000,234509.000000,190412.000000,162919.000000,186091.000,368149.000,443120.000
103243,Mudança de Uso da Terra e Floresta,Resíduos Florestais,Pantanal,,Desmatamento,,CO2e (t) GWP-AR6,MS,AGROPEC,,...,439524.000000,502908.000000,442493.000000,367116.000000,440798.000000,393101.000000,413749.000000,439526.000,876637.000,1009968.000
103244,Mudança de Uso da Terra e Floresta,Resíduos Florestais,Pantanal,,Desmatamento,,N2O (t),MT,AGROPEC,,...,108.441090,109.811199,166.680103,141.442361,201.556097,162.932751,137.219684,158.000,314.000,479.000


### Para saber mais: removendo uma coluna


No **pandas**, podemos remover dados de um **DataFrame** de duas formas principais:

**1. Usando `drop()`**

* Permite remover **linhas** ou **colunas** usando os parâmetros `index` (linhas) e `columns` (colunas), ou `axis=0` (linhas) / `axis=1` (colunas).
* Pode remover vários elementos de uma vez se passados em **lista**.
* Gera uma **cópia do DataFrame**, sem alterar o original. Para manter a alteração no DataFrame original, use `inplace=True` ou reassine à mesma variável.

**Exemplo:**

```python
df = df.drop(columns=['NomeColuna1', 'NomeColuna2'])
```

**2. Usando `pop()`**

* Remove apenas **uma coluna por vez**.
* Modifica o **DataFrame original** automaticamente, sem necessidade de reassinatura.
* Retorna a coluna removida, permitindo armazená-la para uso posterior.

---


| Método   | O que remove      | Afeta o DataFrame original?     | Pode remover múltiplos?        | Retorna coluna removida? |
| -------- | ----------------- | ------------------------------- | ------------------------------ | ------------------------ |
| `drop()` | Linhas ou colunas | Não, a menos que `inplace=True` | Sim, passando lista            | Não                      |
| `pop()`  | Apenas colunas    | Sim                             | Não, apenas uma coluna por vez | Sim                      |

**Exemplos práticos:**

```python
# Usando drop()
df = df.drop(columns=['Coluna1', 'Coluna2'])  # remove múltiplas colunas, cria nova cópia

# Usando pop()
coluna = df.pop('Coluna1')  # remove uma coluna do DataFrame original e armazena
```



##Exercício

Solucione os problemas propostos através de códigos utilizando a base de dados disponibilizada no curso.


1.  Encontre os valores únicos das colunas "Nível 1 - Setor" e "Estado" para identificar as atividades econômicas presentes na base de dados e se todos os Estados do Brasil estão presentes no DataFrame.

2.  Filtre o DataFrame somente com os dados dos Estados da região Sul do Brasil.

3.  Filtre o DataFrame para exibir apenas os registros em que o campo "Nível 1 - Setor" seja igual a "Mudança de Uso da Terra e Floresta" e o campo "Estado" seja igual a "AM" (sigla para o Estado do Amazonas).

3.  Encontre o valor máximo de emissão do ano de 2021 para os dados de "Agropecuária" no Estado do Pará.

In [12]:
#1

emissoes_gases['Nível 1 - Setor'].unique()

array(['Processos Industriais', 'Agropecuária', 'Energia', 'Resíduos ',
       'Mudança de Uso da Terra e Floresta'], dtype=object)

In [25]:
estados_unicos = emissoes_gases['Estado'].unique()
print("Valores únicos na coluna 'Estado':")
display(estados_unicos)

# Verificar se todos os estados estão presentes
if len(estados_unicos) == 27:
    print('True: O número de estados únicos está correto.')
else:
    print(f'\nFalse: O número de estados únicos é {len(estados_unicos)}, não 27.')

Valores únicos na coluna 'Estado':


array(['SP', 'BA', 'RJ', 'MG', 'SE', 'PR', nan, 'RO', 'AM', 'PA', 'TO',
       'MA', 'PI', 'CE', 'RN', 'PB', 'PE', 'AL', 'MT', 'MS', 'GO', 'DF',
       'ES', 'SC', 'RS', 'AC', 'AP', 'RR'], dtype=object)


False: O número de estados únicos é 28, não 27.


In [28]:
#2
emissoes_gases[emissoes_gases['Estado'].isin(['PR', 'RS', 'SC'])].head()

Unnamed: 0,Nível 1 - Setor,Nível 2,Nível 3,Nível 4,Nível 5,Nível 6,Gás,Estado,Atividade Econômica,Produto,...,2012,2013,2014,2015,2016,2017,2018,2019,2020,2021
35,Processos Industriais,Indústria Química,Produção de Amônia,,,,CO2 (t),PR,OUTRA_IND,,...,456204.2,468261.6,515168.9,515168.9,515168.9,515168.9,515168.9,515168.9,515168.9,515168.9
36,Processos Industriais,Indústria Química,Produção de Amônia,,,,CO2e (t) GWP-AR2,PR,OUTRA_IND,,...,456204.2,468261.6,515168.9,515168.9,515168.9,515168.9,515168.9,515168.9,515168.9,515168.9
37,Processos Industriais,Indústria Química,Produção de Amônia,,,,CO2e (t) GTP-AR2,PR,OUTRA_IND,,...,456204.2,468261.6,515168.9,515168.9,515168.9,515168.9,515168.9,515168.9,515168.9,515168.9
110,Processos Industriais,Produtos Minerais,Produção de Cimento,,,,CO2 (t),PR,CIM,,...,2012596.0,2212002.0,2241143.0,2176752.0,2279061.0,2115372.0,2173266.0,2230656.0,2488650.0,2845457.0
111,Processos Industriais,Produtos Minerais,Produção de Cimento,,,,CO2 (t),SC,CIM,,...,712636.8,642171.9,816338.3,676984.4,527268.6,514366.5,513045.1,545107.3,614443.1,717980.4


In [34]:
#3
emissoes_gases[
    (emissoes_gases['Nível 1 - Setor'] == 'Mudança de Uso da Terra e Floresta') &
    (emissoes_gases['Estado'] == 'AM')
].head()

Unnamed: 0,Nível 1 - Setor,Nível 2,Nível 3,Nível 4,Nível 5,Nível 6,Gás,Estado,Atividade Econômica,Produto,...,2012,2013,2014,2015,2016,2017,2018,2019,2020,2021
81262,Mudança de Uso da Terra e Floresta,Alterações de Uso da Terra,Amazônia,fora de Área Protegida,Desmatamento,Floresta primária -- Área sem vegetação,CO2 (t),AM,AGROPEC,,...,85118.0,97637.0,87619.0,121815.0,113759.0,52998.0,61170.0,48264.0,14381.0,31867.0
81271,Mudança de Uso da Terra e Floresta,Alterações de Uso da Terra,Amazônia,fora de Área Protegida,Desmatamento,Floresta primária -- Área sem vegetação,CO2e (t) GTP-AR2,AM,AGROPEC,,...,85118.0,97637.0,87619.0,121815.0,113759.0,52998.0,61170.0,48264.0,14381.0,31867.0
81280,Mudança de Uso da Terra e Floresta,Alterações de Uso da Terra,Amazônia,fora de Área Protegida,Desmatamento,Floresta primária -- Área sem vegetação,CO2e (t) GTP-AR4,AM,AGROPEC,,...,85118.0,97637.0,87619.0,121815.0,113759.0,52998.0,61170.0,48264.0,14381.0,31867.0
81289,Mudança de Uso da Terra e Floresta,Alterações de Uso da Terra,Amazônia,fora de Área Protegida,Desmatamento,Floresta primária -- Área sem vegetação,CO2e (t) GTP-AR5,AM,AGROPEC,,...,85118.0,97637.0,87619.0,121815.0,113759.0,52998.0,61170.0,48264.0,14381.0,31867.0
81298,Mudança de Uso da Terra e Floresta,Alterações de Uso da Terra,Amazônia,fora de Área Protegida,Desmatamento,Floresta primária -- Área sem vegetação,CO2e (t) GTP-AR6,AM,AGROPEC,,...,85118.0,97637.0,87619.0,121815.0,113759.0,52998.0,61170.0,48264.0,14381.0,31867.0


In [36]:
#4
emissoes_gases.loc[
    (emissoes_gases['Nível 1 - Setor'] == 'Agropecuária') &
     (emissoes_gases['Estado'] == 'PA'), 2021
].max()

36856969.7986