## Bireysel Proje 18 / Zeynep Danış (17.07.2025)
### Dünya Bölgelerine Göre Yıllık CO₂ Emisyonları / Our World in Data
#### Veri Linki: https://ourworldindata.org/grapher/annual-co-emissions-by-region?time=earliest..2023

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px

### Veri Aktarımı ve Veri Analizi

In [None]:
df = pd.read_csv("annual-co-emissions-by-region.csv")
df

In [None]:
df = pd.read_csv("annual-co-emissions-by-region.csv")
df.columns = ['region', 'code', 'year', 'co2']
df = df.drop(columns=['code'])

In [None]:
df.columns

In [None]:
df

In [None]:
df.head()

In [None]:
df.tail()

In [None]:
df.info()

In [None]:
df.describe()

In [None]:
df.isnull().sum()

In [None]:
df["region"].unique()

In [None]:
df["year"].unique()

In [None]:
sorted(df["year"].unique())

In [None]:
df["region"].value_counts()

In [None]:
df["year"].value_counts()

In [None]:
df.sort_values(by = "co2", ascending = False).reset_index()

In [None]:
df.sort_values(by = "co2", ascending = True).reset_index()

In [None]:
df.groupby("region")[["co2"]].mean().reset_index()

In [None]:
df.groupby("year")[["co2"]].mean().reset_index()

### Grafikler

In [None]:
plt.figure(figsize=(40, 10))

sns.lineplot(data = df, x = "region", y = "co2")

plt.title("Bölgelere Göre CO₂ Emisyonları", fontsize = 30)
plt.xlabel("Bölge", fontsize = 20)
plt.ylabel("CO₂ Oranı (ton)", fontsize = 20)
plt.xticks(rotation=90)
plt.tight_layout()
plt.savefig("bolgeler_co2_cizgi.png", dpi=300)
plt.show()

In [None]:
plt.figure(figsize=(16, 6))

sns.lineplot(data = df, x = "year", y = "co2")

plt.title("Dünya Genelinde Yıllara Göre CO₂ Emisyonu")
plt.xlabel("Yıl")
plt.ylabel("CO₂ Oranı (ton)")
plt.xticks(rotation=90)
plt.tight_layout()
plt.savefig("dunya_co2_cizgi.png", dpi=300)
plt.show()

In [None]:
df[df["region"] == "Turkey"]

In [None]:
plt.figure(figsize=(16, 6))
sns.lineplot(x = "year", y = "co2", data = df[df["region"] == "Turkey"])
plt.xticks(rotation=90);
plt.title("Türkiye'de Yıllara Göre CO₂ Emisyonları")
plt.xlabel("Yıl")
plt.ylabel("CO₂ Oranı (ton)")
plt.savefig("turkiye_co2_cizgi.png", dpi=300)
plt.show()

In [None]:
plt.figure(figsize=(10, 5))
sns.lineplot(data=df[df["region"] == "Africa"], x="year", y="co2", color="darkgoldenrod")
plt.title("Afrika Bölgesinin CO₂ Emisyon Trendleri")
plt.xlabel("Yıl")
plt.ylabel("CO₂ Emisyonu (ton)")
plt.grid(True)
plt.savefig("afrika_co2_cizgi.png", dpi=300)
plt.show()

In [None]:
plt.figure(figsize=(10, 5))
sns.lineplot(data=df[df["region"] == "Asia"], x="year", y="co2", color="g")
plt.title("Asya Bölgesinin CO₂ Emisyon Trendleri")
plt.xlabel("Yıl")
plt.ylabel("CO₂ Emisyonu (ton)")
plt.grid(True)
plt.savefig("asya_co2_cizgi.png", dpi=300)
plt.show()

In [None]:
plt.figure(figsize=(10, 5))
sns.lineplot(data=df[df["region"] == "Europe"], x="year", y="co2", color="purple")
plt.title("Avrupa Bölgesinin CO₂ Emisyon Trendleri")
plt.xlabel("Yıl")
plt.ylabel("CO₂ Emisyonu (ton)")
plt.grid(True)
plt.savefig("avrupa_co2_cizgi.png", dpi=300)
plt.show()

In [None]:
plt.figure(figsize=(10, 5))
sns.lineplot(data=df[df["region"] == "North America"], x="year", y="co2", color="navy")
plt.title("Kuzey Amerika Bölgesinin CO₂ Emisyon Trendleri")
plt.xlabel("Yıl")
plt.ylabel("CO₂ Emisyonu (ton)")
plt.grid(True)
plt.savefig("k_amerika_co2_cizgi.png", dpi=300)
plt.show()

In [None]:
plt.figure(figsize=(10, 5))
sns.lineplot(data=df[df["region"] == "South America"], x="year", y="co2", color="sandybrown")
plt.title("Güney Amerika Bölgesinin CO₂ Emisyon Trendleri")
plt.xlabel("Yıl")
plt.ylabel("CO₂ Emisyonu (ton)")
plt.grid(True)
plt.savefig("g_amerika_co2_cizgi.png", dpi=300)
plt.show()

In [None]:
plt.figure(figsize=(10, 5))
sns.lineplot(data=df[df["region"] == "Oceania"], x="year", y="co2", color="turquoise")
plt.title("Okyanusya Bölgesinin CO₂ Emisyon Trendleri")
plt.xlabel("Yıl")
plt.ylabel("CO₂ Emisyonu (ton)")
plt.grid(True)
plt.savefig("okyanusya_co2_cizgi.png", dpi=300)
plt.show()

In [None]:
kitalar = ['Africa', 'Asia', 'Europe', 'North America', 'South America', 'Oceania']

kita_df = df[df["region"].isin(kitalar)]

plt.figure(figsize=(12, 6))
sns.lineplot(data=kita_df, x="year", y="co2", hue="region", palette="tab10")
plt.title("Kıtaların Yıllara Göre CO₂ Emisyonları")
plt.xlabel("Yıl")
plt.ylabel("CO₂ Emisyonu (ton)")
plt.legend(title="Kıta")
plt.grid(True)
plt.tight_layout()
plt.savefig("kitalar_co2_cizgi.png", dpi=300)
plt.show()

In [None]:
tavan_bolgeler = df[df["year"] == 2020].sort_values(by="co2", ascending=False)["region"].head(5).tolist()

plt.figure(figsize=(12, 6))
sns.lineplot(data=df[df["region"].isin(tavan_bolgeler)], x="year", y="co2", hue="region")
plt.title("En Yüksek Değere Sahip 5 Bölgenin Yıllık CO₂ Emisyonu")
plt.xlabel("Yıl")
plt.ylabel("CO₂ Emisyonu (ton)")
plt.grid(True)
plt.tight_layout()
plt.savefig("tavan_5_co2_cizgi.png", dpi=300)
plt.show()

In [None]:
son_yillar = df["year"].max()
son_yillar_df = df[df["year"] == son_yillar].sort_values(by="co2", ascending=False).head(10)

plt.figure(figsize=(12, 6))
sns.barplot(data=son_yillar_df, x="region", y="co2", hue="region", palette="viridis")
plt.title(f"{son_yillar} Yılında En Yüksek Değerlere Sahip 10 Bölgenin CO₂ Emisyonu")
plt.ylabel("CO₂ Emisyonu (ton)")
plt.xlabel("Bölge")
plt.xticks(rotation=45)
plt.tight_layout()
plt.savefig("2023_tavan_10_co2_cizgi.png", dpi=300)
plt.show()

### Makine Öğrenmesi
#### Yıllara Göre CO₂ Salınımı Tahmini

#### Kıta Bazlı CO₂ Emisyon Tahmin Modellemesi

In [None]:
from sklearn.linear_model import LinearRegression

afrika = df[df["region"] == "Africa"].copy()

afrika = afrika.dropna()

X = afrika[["year"]] 
y = afrika["co2"] 

model = LinearRegression()
model.fit(X, y)

gelecek_yillar = pd.DataFrame({"year": np.arange(2024, 2031)})
gelecek_tahmini = model.predict(gelecek_yillar)

gelecek_yillar["predicted_co2"] = gelecek_tahmini
print(gelecek_yillar)

In [None]:
plt.figure(figsize=(10, 5))
plt.plot(X, y, label="Gerçek", color="goldenrod")
plt.plot(gelecek_yillar["year"], gelecek_yillar["predicted_co2"], label="Tahmin", color="darkviolet", linestyle="--")
plt.title("Afrika için CO₂ Emisyon Tahmini (2024–2030)")
plt.xlabel("Yıl")
plt.ylabel("CO₂ Emisyonu (ton)")
plt.legend()
plt.grid(True)
plt.tight_layout()
plt.savefig("afrika_tahmin_co2_cizgi.png", dpi=300)
plt.show()

In [None]:
from sklearn.linear_model import LinearRegression

asya = df[df["region"] == "Asia"].copy()

asya = asya.dropna()

X = asya[["year"]] 
y = asya["co2"] 

model = LinearRegression()
model.fit(X, y)

gelecek_yillar = pd.DataFrame({"year": np.arange(2024, 2031)})
gelecek_tahmini = model.predict(gelecek_yillar)

gelecek_yillar["predicted_co2"] = gelecek_tahmini
print(gelecek_yillar)

In [None]:
plt.figure(figsize=(10, 5))
plt.plot(X, y, label="Gerçek", color="tomato")
plt.plot(gelecek_yillar["year"], gelecek_yillar["predicted_co2"], label="Tahmin", color="darkgreen", linestyle="--")
plt.title("Asya için CO₂ Emisyon Tahmini (2024–2030)")
plt.xlabel("Yıl")
plt.ylabel("CO₂ Emisyonu (ton)")
plt.legend()
plt.grid(True)
plt.tight_layout()
plt.savefig("asya_tahmin_co2_cizgi.png", dpi=300)
plt.show()

In [None]:
from sklearn.linear_model import LinearRegression

avrupa = df[df["region"] == "Europe"].copy()

avrupa = avrupa.dropna()

X = avrupa[["year"]] 
y = avrupa["co2"] 

model = LinearRegression()
model.fit(X, y)

gelecek_yillar = pd.DataFrame({"year": np.arange(2024, 2031)})
gelecek_tahmini = model.predict(gelecek_yillar)

gelecek_yillar["predicted_co2"] = gelecek_tahmini
print(gelecek_yillar)

In [None]:
plt.figure(figsize=(10, 5))
plt.plot(X, y, label="Gerçek", color="blueviolet")
plt.plot(gelecek_yillar["year"], gelecek_yillar["predicted_co2"], label="Tahmin", color="limegreen", linestyle="--")
plt.title("Avrupa için CO₂ Emisyon Tahmini (2024–2030)")
plt.xlabel("Yıl")
plt.ylabel("CO₂ Emisyonu (ton)")
plt.legend()
plt.grid(True)
plt.tight_layout()
plt.savefig("avrupa_tahmin_co2_cizgi.png", dpi=300)
plt.show()

In [None]:
from sklearn.linear_model import LinearRegression

kuzey_amerika = df[df["region"] == "North America"].copy()

kuzey_amerika = kuzey_amerika.dropna()

X = kuzey_amerika[["year"]] 
y = kuzey_amerika["co2"] 

model = LinearRegression()
model.fit(X, y)

gelecek_yillar = pd.DataFrame({"year": np.arange(2024, 2031)})
gelecek_tahmini = model.predict(gelecek_yillar)

gelecek_yillar["predicted_co2"] = gelecek_tahmini
print(gelecek_yillar)

In [None]:
plt.figure(figsize=(10, 5))
plt.plot(X, y, label="Gerçek", color="royalblue")
plt.plot(gelecek_yillar["year"], gelecek_yillar["predicted_co2"], label="Tahmin", color="orangered", linestyle="--")
plt.title("Kuzey Amerika için CO₂ Emisyon Tahmini (2024–2030)")
plt.xlabel("Yıl")
plt.ylabel("CO₂ Emisyonu (ton)")
plt.legend()
plt.grid(True)
plt.tight_layout()
plt.savefig("k_amerika_tahmin_co2_cizgi.png", dpi=300)
plt.show()

In [None]:
from sklearn.linear_model import LinearRegression

güney_amerika = df[df["region"] == "South America"].copy()

güney_amerika = güney_amerika.dropna()

X = güney_amerika[["year"]] 
y = güney_amerika["co2"] 

model = LinearRegression()
model.fit(X, y)

gelecek_yillar = pd.DataFrame({"year": np.arange(2024, 2031)})
gelecek_tahmini = model.predict(gelecek_yillar)

gelecek_yillar["predicted_co2"] = gelecek_tahmini
print(gelecek_yillar)

In [None]:
plt.figure(figsize=(10, 5))
plt.plot(X, y, label="Gerçek", color="y")
plt.plot(gelecek_yillar["year"], gelecek_yillar["predicted_co2"], label="Tahmin", color="red", linestyle="--")
plt.title("Güney Amerika için CO₂ Emisyon Tahmini (2024–2030)")
plt.xlabel("Yıl")
plt.ylabel("CO₂ Emisyonu (ton)")
plt.legend()
plt.grid(True)
plt.tight_layout()
plt.savefig("g_amerika_tahmin_co2_cizgi.png", dpi=300)
plt.show()

In [None]:
from sklearn.linear_model import LinearRegression

okyanusya = df[df["region"] == "Oceania"].copy()

okyanusya = okyanusya.dropna()

X = okyanusya[["year"]] 
y = okyanusya["co2"] 

model = LinearRegression()
model.fit(X, y)

gelecek_yillar = pd.DataFrame({"year": np.arange(2024, 2031)})
gelecek_tahmini = model.predict(gelecek_yillar)

gelecek_yillar["predicted_co2"] = gelecek_tahmini
print(gelecek_yillar)

In [None]:
plt.figure(figsize=(10, 5))
plt.plot(X, y, label="Gerçek", color="cyan")
plt.plot(gelecek_yillar["year"], gelecek_yillar["predicted_co2"], label="Tahmin", color="maroon", linestyle="--")
plt.title("Okyanusya için CO₂ Emisyon Tahmini (2024–2030)")
plt.xlabel("Yıl")
plt.ylabel("CO₂ Emisyonu (ton)")
plt.legend()
plt.grid(True)
plt.tight_layout()
plt.savefig("okyanusya_tahmin_co2_cizgi.png", dpi=300)
plt.show()

#### Dünya Genelinde CO₂ Emisyon Tahmin Modellemesi

In [None]:
# 'World' bölgesi yeterli veri sunmadığı için tahmin modellemesinde gerçeklikten uzak sonuçlar verdi.
# Bu yüzden dünya genelinde tahmin modellemesini 'World' bölgesini dışarda bırakıp bütün bölgeleri hesap ederek yaptım.

bolgeler = df[df["region"] != "World"]

dunya_df = bolgeler.groupby("year")["co2"].sum().reset_index()

In [None]:
from sklearn.linear_model import LinearRegression

X = dunya_df[["year"]]
y = dunya_df["co2"]

model = LinearRegression()
model.fit(X, y)

gelecek_yillar = pd.DataFrame({"year": np.arange(2024, 2031)})
gelecek_yillar["predicted_co2"] = model.predict(gelecek_yillar)

print(gelecek_yillar)

In [None]:
plt.figure(figsize=(10, 5))
plt.plot(X, y, label="Gerçek", color="green")
plt.plot(gelecek_yillar["year"], gelecek_yillar["predicted_co2"], label="Tahmin", color="magenta", linestyle="--")

plt.title("Dünya Genelinde CO₂ Emisyon Tahmini (2024-2030)")
plt.xlabel("Yıl")
plt.ylabel("Toplam CO₂ Emisyonu (ton)")
plt.legend()
plt.grid(True)
plt.tight_layout()
plt.savefig("dunya_tahmin_co2_cizgi.png", dpi=300)
plt.show()

#### Türkiye CO₂ Emisyon Tahmin Modellemesi

In [None]:
turkiye = df[df["region"] == "Turkey"].copy()
turkiye = turkiye.dropna(subset=["co2"]) 

X = turkiye[["year"]]
y = turkiye["co2"]

In [None]:
from sklearn.linear_model import LinearRegression

model = LinearRegression()
model.fit(X, y)

gelecek_yillar = pd.DataFrame({"year": np.arange(2024, 2031)})
gelecek_yillar["predicted_co2"] = model.predict(gelecek_yillar)

print(gelecek_yillar)

In [None]:
plt.figure(figsize=(10, 5))
plt.plot(turkiye["year"], turkiye["co2"], label="Gerçek", color="red")
plt.plot(gelecek_yillar["year"], gelecek_yillar["predicted_co2"], label="Tahmin", color="g", linestyle="--")

plt.title("Türkiye'nin CO₂ Emisyon Tahmini (2024–2030)")
plt.xlabel("Yıl")
plt.ylabel("CO₂ Emisyonu (ton)")
plt.legend()
plt.grid(True)
plt.tight_layout()
plt.savefig("turkiye_tahmin_co2_cizgi.png", dpi=300)
plt.show()

#### Tahminlerin Özeti ve Kıyaslaması

In [None]:
veriler = {
    "year": list(range(2024, 2031)),
    "Asia": [7.787070e+09, 7.827734e+09, 7.868398e+09, 7.909063e+09, 7.949727e+09, 7.990392e+09, 8.031056e+09],
    "Europe": [5.794722e+09, 5.822314e+09, 5.849907e+09, 5.877500e+09, 5.905092e+09, 5.932685e+09, 5.960278e+09],
    "North America": [5.979029e+09, 6.011544e+09, 6.044060e+09, 6.076576e+09, 6.109091e+09, 6.141607e+09, 6.174123e+09],
    "South America": [7.939248e+08, 7.998523e+08, 8.057797e+08, 8.117072e+08, 8.176347e+08, 8.235621e+08, 8.294896e+08],
    "Africa": [1.095833e+09, 1.106048e+09, 1.116263e+09, 1.126478e+09, 1.136693e+09, 1.146908e+09, 1.157122e+09],
    "Oceania": [2.673550e+08, 2.687114e+08, 2.700677e+08, 2.714240e+08, 2.727804e+08, 2.741367e+08, 2.754931e+08],
    "World": [1.191128e+11, 1.197057e+11, 1.202986e+11, 1.208915e+11, 1.214843e+11, 1.220772e+11, 1.226701e+11],
    "Turkey": [2.492596e+08, 2.514146e+08, 2.535697e+08, 2.557247e+08, 2.578797e+08, 2.600347e+08, 2.621897e+08]
}

df_tahminler = pd.DataFrame(veriler)
df_tahminler.head()

In [None]:
years = df_tahminler["year"]
regions = df_tahminler.columns[1:]
n_years = len(years)
n_regions = len(regions)

bar_width = 0.1
x = np.arange(n_years)

plt.figure(figsize=(16, 8))

for i, region in enumerate(regions):
    plt.bar(x + i*bar_width, df_tahminler[region], width=bar_width, label=region)

plt.xticks(x + bar_width*(n_regions-1)/2, years)
plt.xlabel("Yıl")
plt.ylabel("Tahmini CO₂ Emisyonu (ton)")
plt.title("2024-2030 CO₂ Emisyon Tahminleri - Kıtalar ve Türkiye Çubuk Grafiği")
plt.legend()
plt.tight_layout()
plt.savefig("kitalar_ve_turkiye_tahmin_co2_cubuk.png", dpi=300)
plt.show()

In [None]:
plt.figure(figsize=(14, 8))
plt.stackplot(df_tahminler["year"],
              df_tahminler["Asia"],
              df_tahminler["Europe"],
              df_tahminler["North America"],
              df_tahminler["South America"],
              df_tahminler["Africa"],
              df_tahminler["Oceania"],
              df_tahminler["Turkey"],
              labels=["Asia", "Europe", "North America", "South America", "Africa", "Oceania", "Turkey"],
              colors=plt.cm.tab20.colors)

plt.title("2024-2030 CO₂ Emisyon Tahminleri - Kıtalar ve Türkiye Alan Grafiği")
plt.xlabel("Yıl")
plt.ylabel("Tahmini CO₂ Emisyonu (ton)")
plt.legend(loc="upper left")
plt.tight_layout()
plt.savefig("kitalar_ve_turkiye_tahmin_co2_alan.png", dpi=300)
plt.show()