### O **efeito estufa** é o processo pelo qual a radiação da atmosfera de um planeta aquece a superfície do planeta a uma temperatura acima do que seria sem esta atmosfera.

<img src="images/CandidSelfreliantAvians.webp" width="750" align="center">

Atividades humanas como a queima de combustíveis fósseis, o emprego de certos fertilizantes, o desmatamento e o grande desperdício contemporâneo de alimentos, que têm entre seus resultados a elevação nos níveis atmosféricos de gases estufa, vêm intensificando de maneira importante o efeito estufa e desestabilizando o equilíbrio energético no planeta, produzindo um fenômeno conhecido como aquecimento global.

<img src="images/DependableCheeryBlacklemur.webp" width="750" align="center">

Aos longo dos últimos 20 anos, os satélites da Nasa monitoraram do espaço esse imenso “ser vivo”, observando não apenas suas propriedades físicas, mas o pulso da vida em diferentes estações — as ondas de calor que se movem ao redor do planeta, o gelo marinho que se expande e recua e a vegetação que floresce e padece nos continentes. 

Nas regiões árticas podem ser notadas os efeitos do aquecimento global, onde o clima está aquecendo mais rápido, os impactos já são visíveis do espaço. A vegetação de tundra do oeste do Alasca, Quebec e outros lugares ao norte está ficando mais verde, enquanto grandes incêndios entre 2004 e 2015 eliminaram milhões de hectares de florestas no Alasca. 

[Link da matéria](https://super.abril.com.br/ciencia/20-anos-de-mudancas-na-terra-em-um-gif-fascinante-da-nasa/)


<img src="images/mollweide_cycle.gif" width="750" align="center">

Atividades que geram uma determinada quantidade específica de cada gás

<img src='images/C0_1-Details-1-Emissions_By_Greenhouse_Gas.png' width="750" align="center">

### Mas afinal qual a relação das maiores economias do mundo junto a essa emissão de gases poluentes, e como fica o Brasil nessa história durante os últimos anos, pois bem, e o que vamos analisar no decorrer desta abordagem, venha comigo nesta jornada 🤗🤗🤗

<img src='images/emissao-gas-carbonico.jpg' width="750" align="center">

Vamos nessa? Let's Go Baby 😎

# Table of contents
[1. Loading and preparing data](#1.-Loading-and-preparing-data)

[2. Descriptive Statistics](#2.-Descriptive-Statistics)

[3. Analysis top ten economies](#3.-Analysis-top-ten-economies)

[4. Forecast analysis top economies](#4.-Forecast-analysis-top-economies)


### Primeiramente vamos comecar importando as bibliotecas que vamos utilizar para as analises e manipulacoes

In [None]:
import pandas as pd 
import numpy as np 
import matplotlib.pyplot as plt 
import seaborn as sns
import plotly.express as px
import os
%matplotlib inline

# 1. Loading and preparing data

In [None]:
for dirname, _, filenames in os.walk('/kaggle/input'):
    for filename in filenames:
        print(os.path.join(dirname, filename))

In [None]:
data = pd.read_csv('/kaggle/input/green-house-gases-analysis/archive/emission_data.csv')

In [None]:
data.head()

In [None]:
print('Quantidade de linhas', data.shape[0])
print('Quantidade de colunas', data.shape[1])

In [None]:
data.columns

Podemos observar que temos dados de 268 países, desde 1751, porem nessa análise vamos olhar para os últimos 20 anos, que e onde se concentra a maior quantidade de emissão

In [None]:
data.head()

In [None]:
columns = ['Country', '1997', '1998', '1999', '2000', '2001', '2002', '2003',
       '2004', '2005', '2006', '2007', '2008', '2009', '2010', '2011', '2012',
       '2013', '2014', '2015', '2016', '2017']

In [None]:
df = data[columns]

In [None]:
df.columns

# 2. Descriptive Statistics

In [None]:
desc = df.describe().T

f, ax = plt.subplots(figsize=(15, 8))
sns.heatmap(desc, annot=True, cmap='CMRmap_r', fmt='.00f',
            ax=ax, linewidths=1, cbar=False,
            annot_kws={'size': 14})

plt.xticks(size = 18)
plt.yticks(size = 12, rotation = 0)
plt.ylabel("Variables")
plt.title("Descriptive Statistics", size = 16)
plt.show()

Com a analise da media, pode-se notar que a cada ano vem tendo um aumento gradativo das emissões de poluentes.

Verificar se existe valores nulos nos dados

In [None]:
df.isna().sum()

In [None]:
df.info()

In [None]:
df['total_emission'] = df.sum(axis=1)

In [None]:
df[['Country','total_emission']].head()

# 3. Analysis top ten economies 

## Top ten economies in the world

<img src='images/tenor.gif'>

Analisando as top 10 economias do mundo, ou melhor, as top 10 que mais poluem haha

In [None]:
top = df.sort_values(by='total_emission', ascending=False)

In [None]:
top.head(11)

Nos últimos 20 anos (1997 a 2017) as maiores emissões vieram dos países que mais cresceram em proporção ao PIB, sendo liderado o ranking pelos Estados Unidos.

<img src='images/0106-pib-paises-1-.jpeg' width="1000" height="600">

OBS: imagem descrita acima e de 2021, onde o mundo todo se passa por uma pandemia, porém reflete o PIB desses principais países em relação com a emissão de poluentes.

In [None]:
top = top.drop(index=[227,64,72,13,4,138,1], axis=0)

In [None]:
df_economies = top.head(10)

Adicionando o Brasil na Analise

In [None]:
brazil = top[top['Country'] == 'Brazil']

In [None]:
df_economies = pd.concat([df_economies, brazil])

Analisando quais paises mais poluem

In [None]:
df_economies.columns

### Análise da feature _total emission_ em relação às maiores economias do mundo.

In [None]:
sns.catplot(x='Country', y='total_emission', data=df_economies, kind='bar', height=5, aspect=25/8, palette='inferno')

In [None]:
sns.catplot(x='Country', y='total_emission', data=df_economies, height=5, aspect=25/8, palette='inferno')

In [None]:
fig = plt.figure()
ax = fig.add_axes([0, 0, 2, 2])
ax.axis('equal')
ax.pie(df_economies['total_emission'], labels = df_economies["Country"], autopct='%1.2f%%')
plt.show()

### A partir das análises acima, podemos notar que os Estados Unidos **lidera disparadamente o total de emissões**, sendo aproximadamente 2,5x maior que a china, sendo a china aproximadamente 3x maior em população, convém analisarmos a relação de emissão por quantidade de habitantes.

- Population China 2017: 1.386 billion
- Population EUA 2017: 325.1 million



## A partir desta informação, convém analisarmos a relação das emissões por quantidade de habitantes, não é mesmo?

In [None]:
df_habit = pd.DataFrame()
df_habit = df_economies['total_emission'].iloc[0:2]

In [None]:
emission_eua = df_habit.iloc[0] / int(326e6)
emission_china = df_habit.iloc[1] / int(1.386e9)

In [None]:
fig = plt.figure()
ax = fig.add_axes([0, 0, 2, 2])
ax.axis('equal')
ax.pie([emission_eua, emission_china], labels=['EUA', 'CHINA'], autopct='%1.2f%%')
plt.show()

Podemos concluir com essa análise, que cada Americano emite 92,52% a mais que um Chines, isso reflete o grande crescimento dos EUA nos últimos anos...

### Nos ultimos 20 anos...

Posicao        |2019   | 2020
:---------: |:---------: | :------:
**1°**       |  EUA       |    EUA
2°         |    CHINA      |CHINA
3°         |JAPAO          |JAPAO   
4°          |ALEMANHA     |ALEMANHA
5°          |INDIA          |REINO UNIDO 
6°          |REINO UNIDO     |INDIA   
7°          |FRANCA          |FRANCA
8°          |   ITALIA   | ITALIA
9°          |BRAZIL   |CANADA
10°         |CANADA   |COREIA DO SUL
11°         |RUSSIA   | RUSSIA
12°         |  COREIA DO SUL  | BRAZIL     

[Link da Materia](https://www1.folha.uol.com.br/mercado/2021/03/brasil-sai-da-lista-das-dez-maiores-economias-do-mundo-estima-agencia.shtml
                        )

Podemos notar a partir da tabela acima, que existem economias que crescem muito, porém nem aparecem no top 11 de maiores emissores, como Canadá e a Coreia do Sul, que são exemplos de países em questões ambientais.

Em comparação **Estados Unido** e **China** correspondem por grande maioria das emissões do mundo, sendo os **EUA** liderando disparadamente.

Já o **Brasil** está equilibrado com a sua posição de relevância nas economias, 11° maior emissor e 12° maior economia em 2020.

## Analisando os países com maior população

In [None]:
df_economies

Slicing nos dados nos três mais populosos países do mundo, sendo eles EUA, China, e a Índia.

In [None]:
usa   = df_economies.loc[(df_economies['Country'] == 'United States'), 'total_emission'].iloc[0]
china = df_economies.loc[(df_economies['Country'] == 'China'), 'total_emission'].iloc[0]
india = df_economies.loc[(df_economies['Country'] == 'India'), 'total_emission'].iloc[0]

In [None]:
fig = plt.figure()
ax = fig.add_axes([0, 0, 2, 2])
ax.axis('equal')
plt.pie([usa, china, india], labels = ['United States', 'China', 'India'], autopct='%1.2f%%')
plt.show()

Podemos concluir que a **Índia** dos mais populosos, e o que menos emite **CO2**, porém isso está muito associado ao seu desenvolvimento econômico, onde o país realmente começou a crescer a produção e as emissões em meados dos anos 80, enquanto os **EUA** principalmente, **já se tornavam a maior economia do mundo em meados dos anos 20, após a primeira guerra mundial**.

# 4. Forecast analysis top economies

In [None]:
from prophet import Prophet


In [None]:
df_economies['Country']

In [None]:
df1 = df_economies.drop('total_emission', axis=1)

In [None]:
df = df1.T
df = df.reset_index()

In [None]:
df.columns = df.iloc[0]
df = df.rename(columns = {'Country':'year'})
df = df.drop(0)


In [None]:
df = df.astype('float')
df['year'] = df['year'].astype('int')

In [None]:
df.head()

### Analise temporal

In [None]:
plt.figure(figsize=(16, 8))
sns.lineplot(x='year', y='United States', data=df, label = 'US')
sns.lineplot(x='year', y='China', data=df, label = 'CH')
sns.lineplot(x='year', y='Russia', data=df, label = 'Russia')
sns.lineplot(x='year', y='Germany', data=df, label = 'GER')
sns.lineplot(x='year', y='United Kingdom', data=df, label = 'UK')
sns.lineplot(x='year', y='France', data=df, label = 'FRA')
sns.lineplot(x='year', y='India', data=df, label = 'IND')
sns.lineplot(x='year', y='Canada', data=df, label = 'CAN')
sns.lineplot(x='year', y='Poland', data=df, label = 'POL')
sns.lineplot(x='year', y='Brazil', data=df, label = 'BRA')
plt.show()

In [None]:
plt.figure(figsize=(16, 8))
sns.lineplot(x='year', y='United States', data=df, label = 'US')