# Türkiye 2023 Yılı Erkek & Kadın ve Toplam Nüfus Verileri

Türkiye’de ilk nüfus sayımı 1927 yılında gerçekleştirilmiştir. Daha sonraki nüfus sayımları 1935 ile 1990 yılları arasında düzenli olarak sonu 0 ve 5 ile biten yıllarda uygulanmıştır. 1990 yılından sonra ise nüfus sayımının sonu sıfır ile biten yıllarda uygulanması kanunla belirlenmiş ve bu kapsamda ülkemizde son Genel Nüfus Sayımı 22 Ekim 2000 tarihinde yapılmıştır.

TÜİK'ten 1927'yılından 2023 yılına kadar olan nüfus sayımı verileri(Toplam Nüfus, Erkek Nüfusu, Kadın Nüfusu) üzerinde 2023 yılı özelinde görselleştirme işlemleri yapılmak üzere hazırlanmıştır.

In [1]:
# Veri yükleme işlemi için gerekli kütüphaneler import ediliyor
import numpy as np
import pandas as pd

# Görselleştirme işlemleri için gerekli kütüphaneler import ediliyor
import plotly.graph_objs as go
import plotly.express as px
import plotly.io as pio
import geopandas as gpd
import folium

In [2]:
# 'TR_population.csv' dosyası okunarak veri data değişkenine yüklenir.
data = pd.read_csv('TR-population.csv')

# 'TR-map.json' dosyası okunarak geometrik veri geo_data değişkenine yüklenir.
geo_data = gpd.read_file('TR-map.json')

In [3]:
# TÜİK'ten alınan nüfus verileri
data

Unnamed: 0,Yıl,İl,Toplam,Erkek,Kadın
0,2023,Adana,2270298,1135046,1135252
1,2023,Adıyaman,604978,306779,298199
2,2023,Afyonkarahisar,751344,374705,376639
3,2023,Ağrı,511238,265585,245653
4,2023,Aksaray,438504,219006,219498
...,...,...,...,...,...
2296,1927,Tokat,263063,124416,138647
2297,1927,Trabzon,290303,130926,159377
2298,1927,Van,75329,39525,35804
2299,1927,Yozgat,209497,98075,111422


In [4]:
# Türkiye'nin 81 ilinin koordinatlarını içeren veriler
geo_data

Unnamed: 0,id,name,geometry
0,01,Adana,"POLYGON ((36.0616 37.00968, 36.03897 37.01673,..."
1,02,Adıyaman,"POLYGON ((39.18896 38.04305, 39.14989 38.02073..."
2,03,Afyonkarahisar,"POLYGON ((30.44179 39.20629, 30.47724 39.1996,..."
3,04,Ağrı,"POLYGON ((43.31842 39.96932, 43.34095 39.9126,..."
4,05,Amasya,"POLYGON ((35.08926 41.08692, 35.40004 41.0207,..."
...,...,...,...
76,77,Yalova,"POLYGON ((29.42842 40.69088, 29.42935 40.60145..."
77,78,Karabük,"POLYGON ((32.81798 41.57635, 32.85219 41.54775..."
78,79,Kilis,"POLYGON ((37.52214 36.6736, 37.44612 36.6342, ..."
79,80,Osmaniye,"POLYGON ((36.7212 37.27119, 36.67614 37.22961,..."


In [5]:
# Veri setinin bilgilerini gösterir
data.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2301 entries, 0 to 2300
Data columns (total 5 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   Yıl     2301 non-null   int64 
 1   İl      2301 non-null   object
 2   Toplam  2301 non-null   int64 
 3   Erkek   2301 non-null   int64 
 4   Kadın   2301 non-null   int64 
dtypes: int64(4), object(1)
memory usage: 90.0+ KB


In [6]:
# Coğrafi veri setinin bilgilerini gösterir
geo_data.info()

<class 'geopandas.geodataframe.GeoDataFrame'>
RangeIndex: 81 entries, 0 to 80
Data columns (total 3 columns):
 #   Column    Non-Null Count  Dtype   
---  ------    --------------  -----   
 0   id        81 non-null     object  
 1   name      81 non-null     object  
 2   geometry  81 non-null     geometry
dtypes: geometry(1), object(2)
memory usage: 2.0+ KB


In [7]:
# Veri setindeki sütun isimlerini listeler
data.columns

Index(['Yıl', 'İl', 'Toplam', 'Erkek', 'Kadın'], dtype='object')

In [8]:
# Coğrafi veri setindeki sütun isimlerini listeler
geo_data.columns

Index(['id', 'name', 'geometry'], dtype='object')

___

## 2023 Verileri

In [9]:
# 2023 yılına ait verileri seçer
data2023 = data[data['Yıl'] == 2023]

# Seçilen verileri gösterir
data2023

Unnamed: 0,Yıl,İl,Toplam,Erkek,Kadın
0,2023,Adana,2270298,1135046,1135252
1,2023,Adıyaman,604978,306779,298199
2,2023,Afyonkarahisar,751344,374705,376639
3,2023,Ağrı,511238,265585,245653
4,2023,Aksaray,438504,219006,219498
...,...,...,...,...,...
76,2023,Uşak,377001,187253,189748
77,2023,Van,1127612,574993,552619
78,2023,Yalova,304780,152100,152680
79,2023,Yozgat,420699,210051,210648


___
**Alfabetik sırada olan 2023 verilerini plaka kodlarına göre eşleme ve sıralama**

geo_data verisetinde verilen il ve plaka kodu id'lerine göre data2023 veri setindeki illeri plaka kodlarına yani id'ye göre sıralamak için iki veri setini birleştirme işlemi ardından artan sıralmaya göre illeri sıralama işlemi yapılmaktadır.
___

In [10]:
# İlleri alfabetik sıraya göre sıralar ve plaka kodlarına göre eşleştirir
merged_data2023 = pd.merge(geo_data, data2023, left_on='name', right_on='İl', how='inner')

# Sıralanmış verileri plaka koduna göre sıralar
sorted_data2023 = merged_data2023.sort_values(by='id')

# Sıralanmış verileri gösterir
sorted_data2023

Unnamed: 0,id,name,geometry,Yıl,İl,Toplam,Erkek,Kadın
0,01,Adana,"POLYGON ((36.0616 37.00968, 36.03897 37.01673,...",2023,Adana,2270298,1135046,1135252
1,02,Adıyaman,"POLYGON ((39.18896 38.04305, 39.14989 38.02073...",2023,Adıyaman,604978,306779,298199
2,03,Afyonkarahisar,"POLYGON ((30.44179 39.20629, 30.47724 39.1996,...",2023,Afyonkarahisar,751344,374705,376639
3,04,Ağrı,"POLYGON ((43.31842 39.96932, 43.34095 39.9126,...",2023,Ağrı,511238,265585,245653
4,05,Amasya,"POLYGON ((35.08926 41.08692, 35.40004 41.0207,...",2023,Amasya,339529,168290,171239
...,...,...,...,...,...,...,...,...
76,77,Yalova,"POLYGON ((29.42842 40.69088, 29.42935 40.60145...",2023,Yalova,304780,152100,152680
77,78,Karabük,"POLYGON ((32.81798 41.57635, 32.85219 41.54775...",2023,Karabük,255242,128370,126872
78,79,Kilis,"POLYGON ((37.52214 36.6736, 37.44612 36.6342, ...",2023,Kilis,155179,78198,76981
79,80,Osmaniye,"POLYGON ((36.7212 37.27119, 36.67614 37.22961,...",2023,Osmaniye,557666,280450,277216


In [11]:
# Gereksiz sütunları kaldırır
new_data2023 = sorted_data2023.drop(columns=['id', 'name', 'geometry', 'Yıl'])

# new_data2023 veri setini CSV dosyasına kaydeder
new_data2023.to_csv('new_data2023.csv', index=False)

# new_data2023 veri setini tekrar okur
new_data2023 = pd.read_csv('new_data2023.csv')

# new_data2023 veri setini gösterir
new_data2023

Unnamed: 0,İl,Toplam,Erkek,Kadın
0,Adana,2270298,1135046,1135252
1,Adıyaman,604978,306779,298199
2,Afyonkarahisar,751344,374705,376639
3,Ağrı,511238,265585,245653
4,Amasya,339529,168290,171239
...,...,...,...,...
76,Yalova,304780,152100,152680
77,Karabük,255242,128370,126872
78,Kilis,155179,78198,76981
79,Osmaniye,557666,280450,277216


In [12]:
# new_data2023 veri setinin bilgilerini gösterir
new_data2023.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 81 entries, 0 to 80
Data columns (total 4 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   İl      81 non-null     object
 1   Toplam  81 non-null     int64 
 2   Erkek   81 non-null     int64 
 3   Kadın   81 non-null     int64 
dtypes: int64(3), object(1)
memory usage: 2.7+ KB


In [13]:
# new_data2023 veri setindeki sütun isimlerini listeler
new_data2023.columns

Index(['İl', 'Toplam', 'Erkek', 'Kadın'], dtype='object')

In [14]:
# new_data2023 veri setinin istatistiklerini gösterir
new_data2023.describe().T

Unnamed: 0,count,mean,std,min,25%,50%,75%,max
Toplam,81.0,1053980.0,1901677.0,86047.0,304780.0,557666.0,1116618.0,15655924.0
Erkek,81.0,527581.1,947182.7,43603.0,154235.0,280450.0,568064.0,7806787.0
Kadın,81.0,526398.8,954536.8,42207.0,152680.0,271568.0,548554.0,7849137.0


## Veri Görselleştirme

Plotly kütüphanesi ile bar grafiği kullanıldı çünkü matplotlib basit, kolay ve geniş kullanımıyla birlikte statiktir web siteleri üzerinde etkileşim gösteremez, plotly ise fare işaretleriyle (yakınlaştırma, uzaklaştırma vs.) detaylı bilgi ve kolay okunabilirliği ile bu veriseti üzerinde kullanımı tercih edilmiştir.

### 2023 yılı için veri görselleştirme işlemleri

#### Çubuk Grafiği

In [15]:
# Milyon notasyonu için lambda fonksiyonu kullanılıyor
millions = lambda x: f"{x / 10**6:.0f}M"

# Toplam nüfus için bar grafiği oluşturuluyor
total_pop = go.Bar(x=new_data2023['İl'], y=new_data2023['Toplam'], marker_color='black', name='Toplam Nüfus')

# Erkek nüfusu için bar grafiği oluşturuluyor
male_pop = go.Bar(x=new_data2023['İl'], y=new_data2023['Erkek'], marker_color='blue', name='Erkek Nüfusu')

# Kadın nüfusu için bar grafiği oluşturuluyor
female_pop = go.Bar(x=new_data2023['İl'], y=new_data2023['Kadın'], marker_color='red', name='Kadın Nüfusu')

# Tüm bar grafikleri içeren bir şekil (figür) oluşturuluyor
fig = go.Figure(data=[total_pop, male_pop, female_pop])

# Şeklin düzeni güncelleniyor
fig.update_layout(

    # Başlık tanımlanıyor.
    title='2023 Yılı Toplam, Erkek, Kadın Nüfusu',

    # X ekseni etiketi tanımlanıyor
    xaxis=dict(title='İl'),

    # Y ekseni etiketi tanımlanıyor ve özel bir format belirleniyor
    yaxis=dict(
        title='Nüfus',

        # Kesirli sayıların gösterilme biçimi belirleniyor
        tickformat='.0f',

        # İşaretlenen değerler belirleniyor
        tickvals=[0, 1000000, 2000000, 3000000, 4000000, 5000000, 6000000, 7000000, 8000000, 15000000],

        # İşaretlenen değerlere karşılık gelen metinler belirleniyor
        ticktext=[millions(0), millions(1000000), millions(2000000), millions(3000000), millions(4000000), millions(5000000), millions(6000000), millions(7000000), millions(8000000), millions(15000000)]
    ),

    # Bar grafiklerinin modu belirleniyor
    barmode='group',

    # X ekseni etiketlerinin açısı belirleniyor
    xaxis_tickangle=-90,

    # Şeklin yüksekliği belirleniyor
    height=600,

    # Şeklin genişliği belirleniyor
    width=1550,
)

# Grafik gösterimi
fig.show()

In [16]:
# Milyon notasyonu için lambda fonksiyonu kullanılıyor
millions = lambda x: f"{x / 10**6:.0f}M"

# Toplam nüfus için bar grafiği oluşturuluyor
total_pop = go.Bar(x=new_data2023['İl'], y=new_data2023['Toplam'], marker_color='black')

# Toplam nüfus grafiğinin düzeni tanımlanıyor
layout_total_pop = go.Layout(

    # Başlık tanımlanıyor
    title='2023 Yılı Toplam Nüfus',

    # X ekseni etiketi tanımlanıyor
    xaxis=dict(title='İl'),
    yaxis=dict(

        # Y ekseni etiketi tanımlanıyor
        title='Nüfus',

        # Kesirli sayıların gösterilme biçimi belirleniyor
        tickformat='.0f',

        # İşaretlenen değerler belirleniyor
        tickvals=[0, 1000000, 2000000, 3000000, 4000000, 5000000, 6000000, 15000000],

        # İşaretlenen değerlere karşılık gelen metinler belirleniyor
        ticktext=[millions(0), millions(1000000), millions(2000000), millions(3000000), millions(4000000), millions(5000000), millions(6000000), millions(15000000)]
    ),

    # X ekseni etiketlerinin açısı belirleniyor
    xaxis_tickangle=-90,

    # Grafiğin yüksekliği belirleniyor
    height=600,

    # Grafiğin genişliği belirleniyor
    width=1550
)

# Erkek nüfusu için bar grafiği oluşturuluyor
male_pop = go.Bar(x=new_data2023['İl'], y=new_data2023['Erkek'], marker_color='blue')

# Erkek nüfusu grafiğinin düzeni tanımlanıyor
layout_male_pop = go.Layout(

    # Başlık tanımlanıyor
    title='2023 Yılı Erkek Nüfusu',

    # X ekseni etiketi tanımlanıyor
    xaxis=dict(title='İl'),
    yaxis=dict(

        # Y ekseni etiketi tanımlanıyor
        title='Nüfus',

        # Kesirli sayıların gösterilme biçimi belirleniyor
        tickformat='.0f',

        # İşaretlenen değerler belirleniyor
        tickvals=[0, 1000000, 2000000, 3000000, 4000000, 5000000, 6000000, 7000000, 8000000, 10000000],

        # İşaretlenen değerlere karşılık gelen metinler belirleniyor
        ticktext=[millions(0), millions(1000000), millions(2000000), millions(3000000), millions(4000000), millions(5000000), millions(6000000), millions(7000000), millions(8000000), millions(10000000)]
    ),

    # X ekseni etiketlerinin açısı belirleniyor
    xaxis_tickangle=-90,

    # Grafiğin yüksekliği belirleniyor
    height=600,

    # Grafiğin genişliği belirleniyor
    width=1550
)

# Kadın nüfusu için bar grafiği oluşturuluyor
female_pop = go.Bar(x=new_data2023['İl'], y=new_data2023['Kadın'], marker_color='red')

# Kadın nüfusu grafiğinin düzeni tanımlanıyor
layout_female_pop = go.Layout(

    # Başlık tanımlanıyor.
    title='2023 Yılı Kadın Nüfusu',

    # X ekseni etiketi tanımlanıyor
    xaxis=dict(title='İl'),
    yaxis=dict(

        # Y ekseni etiketi tanımlanıyor
        title='Nüfus',

        # Kesirli sayıların gösterilme biçimi belirleniyor
        tickformat='.0f',

        # İşaretlenen değerler belirleniyor
        tickvals=[0, 1000000, 2000000, 3000000, 4000000, 5000000, 6000000, 7000000, 8000000, 10000000],

        # İşaretlenen değerlere karşılık gelen metinler belirleniyor
        ticktext=[millions(0), millions(1000000), millions(2000000), millions(3000000), millions(4000000), millions(5000000), millions(6000000), millions(7000000), millions(8000000), millions(10000000)]
    ),

    # X ekseni etiketlerinin açısı belirleniyor
    xaxis_tickangle=-90,

    # Grafiğin yüksekliği belirleniyor
    height=600,

    # Grafiğin genişliği belirleniyor
    width=1550
)

# Toplam nüfus grafiği gösteriliyor
pio.show(go.Figure(data=total_pop, layout=layout_total_pop))

# Erkek nüfusu grafiği gösteriliyor
pio.show(go.Figure(data=male_pop, layout=layout_male_pop))

# Kadın nüfusu grafiği gösteriliyor
pio.show(go.Figure(data=female_pop, layout=layout_female_pop))

In [17]:
# Yeni sütun oluşturularak erkek nüfusun toplam nüfusa oranı hesaplanıyor
new_data2023['Erkek_oran'] = new_data2023['Erkek'] / new_data2023['Toplam']

# Yeni sütun oluşturularak kadın nüfusun toplam nüfusa oranı hesaplanıyor
new_data2023['Kadın_oran'] = new_data2023['Kadın'] / new_data2023['Toplam']

# İl, erkek nüfus, kadın nüfus, erkek nüfus oranı ve kadın nüfus oranı sütunlarını içeren bir DataFrame oluşturuluyor
new_data2023[['İl', 'Erkek', 'Kadın', 'Erkek_oran', 'Kadın_oran']]

Unnamed: 0,İl,Erkek,Kadın,Erkek_oran,Kadın_oran
0,Adana,1135046,1135252,0.499955,0.500045
1,Adıyaman,306779,298199,0.507091,0.492909
2,Afyonkarahisar,374705,376639,0.498713,0.501287
3,Ağrı,265585,245653,0.519494,0.480506
4,Amasya,168290,171239,0.495657,0.504343
...,...,...,...,...,...
76,Yalova,152100,152680,0.499048,0.500952
77,Karabük,128370,126872,0.502934,0.497066
78,Kilis,78198,76981,0.503921,0.496079
79,Osmaniye,280450,277216,0.502900,0.497100


#### Yığın Çubuk Grafiği

In [18]:
# Erkek nüfusun toplam nüfusa oranı hesaplanıyor
new_data2023['Erkek_oran'] = new_data2023['Erkek'] / new_data2023['Toplam']

# Kadın nüfusun toplam nüfusa oranı hesaplanıyor.
new_data2023['Kadın_oran'] = new_data2023['Kadın'] / new_data2023['Toplam']

# İl isimleri sütunu oluşturuluyor
il_isimleri = new_data2023['İl']

# Erkek nüfus oranları sütunu oluşturuluyor
erkek_oranlar = new_data2023['Erkek_oran']

# Kadın nüfus oranları sütunu oluşturuluyor
kadın_oranlar = new_data2023['Kadın_oran']

# Erkek nüfus oranlarının string formatına dönüştürülmesi
erkek_oranlar_str = ['{:.2%}'.format(oran) for oran in erkek_oranlar]

# Kadın nüfus oranlarının string formatına dönüştürülmesi
kadın_oranlar_str = ['{:.2%}'.format(oran) for oran in kadın_oranlar]

# Boş bir figür oluşturuluyor
fig = go.Figure()

# Erkek nüfus oranlarını içeren bar grafiği oluşturuluyor
fig.add_trace(go.Bar(
    x=il_isimleri,
    y=erkek_oranlar,
    name='Erkek Oranı',
    marker_color='blue',

    # Grafiğe fare geldiğinde gösterilecek bilgi formatı belirleniyor
    hovertemplate='<b>%{x}</b><br><extra>Erkek Oranı: %{y:.2%}</extra>'
))

# Kadın nüfus oranlarını içeren bar grafiği oluşturuluyor
fig.add_trace(go.Bar(
    x=il_isimleri,
    y=kadın_oranlar,
    name='Kadın Oranı',
    marker_color='red',

    # Grafiğe fare geldiğinde gösterilecek bilgi formatı belirleniyor
    hovertemplate='<b>%{x}</b><br><extra>Kadın Oranı: %{y:.2%}</extra>'
))

# Grafiğin düzeni güncelleniyor
fig.update_layout(

    # Başlık tanımlanıyor
    title='Erkek ve Kadın Nüfus Yüzde (%) Oranları',

    # X ekseni etiketlerinin açısı belirleniyor
    xaxis_tickangle=-90,
    xaxis=dict(

        # X ekseni etiketi tanımlanıyor
        title='İller',

        # İşaretlenen değerlerin lineer olarak oluşturulmasını sağlar
        tickmode='linear'
    ),
    yaxis=dict(

        # Y ekseni etiketi tanımlanıyor.
        title='Nüfus Oranı'
    ),

    # Bar modu belirleniyor. 'stack' grafiği yığılmış hale getirir.
    barmode='stack'
)

# Grafik gösterimi
fig.show()

In [19]:
# 2023 Yılı toplam nüfusa göre azalan sıralama
total_population_sorted2023 = new_data2023.sort_values(by='Toplam', ascending=False)

# Sonuçları csv olarak kaydetme
total_population_sorted2023.to_csv('total_population_sorted2023.csv', index=False)

# Sonuçları gösterme
total_population_sorted2023

Unnamed: 0,İl,Toplam,Erkek,Kadın,Erkek_oran,Kadın_oran
33,İstanbul,15655924,7806787,7849137,0.498647,0.501353
5,Ankara,5803482,2860361,2943121,0.492870,0.507130
34,İzmir,4479525,2221180,2258345,0.495852,0.504148
15,Bursa,3214571,1605941,1608630,0.499582,0.500418
6,Antalya,2696249,1357198,1339051,0.503365,0.496635
...,...,...,...,...,...,...
78,Kilis,155179,78198,76981,0.503921,0.496079
28,Gümüşhane,148539,74581,73958,0.502097,0.497903
74,Ardahan,92819,48239,44580,0.519710,0.480290
61,Tunceli,89317,47110,42207,0.527447,0.472553


In [20]:
# Milyon notasyonu için lambda fonksiyonu kullanılıyor
millions = lambda x: f"{x / 10**6:.0f}M"

# Toplam nüfus için bar grafiği oluşturuluyor
total_pop = go.Bar(

    # X ekseni için il isimleri belirleniyor
    x=total_population_sorted2023['İl'],

    # Y ekseni için il nüfusları belirleniyor
    y=total_population_sorted2023['Toplam'],

    # Bar renkleri belirleniyor
    marker_color='black',

    # Grafiğin adı belirleniyor
    name='Toplam Nüfus'
)

# Boş bir figür oluşturuluyor ve sadece total_pop bar grafiği ekleniyor
fig = go.Figure(data=[total_pop])

# Şeklin düzeni güncelleniyor
fig.update_layout(

    # Başlık tanımlanıyor.
    title='2023 Yılı Toplam Nüfusunun En Kalabalık İlinden En Seyrek İline Sütun Grafiği',

    # X ekseni etiketi tanımlanıyor
    xaxis=dict(title='İl'),
    yaxis=dict(

        # Y ekseni etiketi tanımlanıyor
        title='Nüfus',

        # Y ekseni değerlerinin gösterim formatı belirleniyor
        tickformat='.0f',

        # İşaretlenen değerler belirleniyor
        tickvals=[0, 1000000, 2000000, 3000000, 4000000, 5000000, 6000000, 10000000, 15000000],

        # İşaretlenen değerlere karşılık gelen metinler belirleniyor
        ticktext=[millions(0), millions(1000000), millions(2000000), millions(3000000), millions(4000000), millions(5000000), millions(6000000), millions(10000000), millions(15000000)]
    ),

    # Bar modu belirleniyor
    barmode='group',

    # X ekseni etiketlerinin açısı belirleniyor
    xaxis_tickangle=-90,

    # Grafiğin yüksekliği belirleniyor
    height=600,

    # Grafiğin genişliği belirleniyor
    width=1550
)

# Grafik gösterimi
fig.show()

### Erkek ve Kadın Nüfus Oranının En Yüsek Olduğu İller

In [21]:
# 2023 yılı erkek nüfus oranına göre azalan sıralama
erkek_oran_sorted2023 = new_data2023.sort_values(by='Erkek_oran', ascending=False)

# Sonuçları gösterme
erkek_oran_sorted2023

Unnamed: 0,İl,Toplam,Erkek,Kadın,Erkek_oran,Kadın_oran
29,Hakkari,287625,154235,133390,0.536236,0.463764
61,Tunceli,89317,47110,42207,0.527447,0.472553
72,Şırnak,570745,299177,271568,0.524187,0.475813
75,Iğdır,209738,109710,100028,0.523081,0.476919
55,Siirt,347412,180736,166676,0.520235,0.479765
...,...,...,...,...,...,...
22,Elazığ,604411,298845,305566,0.494440,0.505560
42,Kütahya,575674,284542,291132,0.494276,0.505724
36,Kastamonu,388990,192048,196942,0.493709,0.506291
49,Nevşehir,315994,155897,160097,0.493354,0.506646


In [22]:
# 2023 yılı kadın nüfus oranına göre azalan sıralama
kadın_oran_sorted2023 = new_data2023.sort_values(by='Kadın_oran', ascending=False)

# Sonuçları gösterme
kadın_oran_sorted2023

Unnamed: 0,İl,Toplam,Erkek,Kadın,Erkek_oran,Kadın_oran
5,Ankara,5803482,2860361,2943121,0.492870,0.507130
49,Nevşehir,315994,155897,160097,0.493354,0.506646
36,Kastamonu,388990,192048,196942,0.493709,0.506291
42,Kütahya,575674,284542,291132,0.494276,0.505724
22,Elazığ,604411,298845,305566,0.494440,0.505560
...,...,...,...,...,...,...
55,Siirt,347412,180736,166676,0.520235,0.479765
75,Iğdır,209738,109710,100028,0.523081,0.476919
72,Şırnak,570745,299177,271568,0.524187,0.475813
61,Tunceli,89317,47110,42207,0.527447,0.472553


In [23]:
# Fonksiyon tanımlanıyor, bu fonksiyon verilerden bir sütunu kullanarak yığılmış sütun grafikleri oluşturur
def create_stacked_bar_chart(data, title, sorted_column, color1, color2, reverse=False):
    # Veriler sıralanıyor, varsayılan olarak artan sırada olacak şekilde
    sorted_data = data.sort_values(by=sorted_column, ascending=reverse)

    # Boş bir figür oluşturuluyor
    fig = go.Figure()

    # İlk bar grafiği (Erkek Oranı) oluşturuluyor ve figüre ekleniyor
    fig.add_trace(go.Bar(
        x=sorted_data['İl'],  # X ekseninde il isimleri kullanılıyor

        # Y ekseninde erkek oranları kullanılıyor (ters sıralama değilse), aksi takdirde kadın oranları kullanılıyor
        y=sorted_data['Erkek_oran'] if not reverse else sorted_data['Kadın_oran'],

        # Grafiğin adı belirleniyor
        name='Erkek Oranı' if not reverse else 'Kadın Oranı',

        # Bar rengi belirleniyor
        marker_color=color1,

        # Fare üzerine gelindiğinde gösterilecek bilgi formatı belirleniyor
        hovertemplate=f'<b>%{{x}}</b><br><extra>Erkek Oranı: %{{y:.2%}}</extra>'
    ))

    # İkinci bar grafiği (Kadın Oranı) oluşturuluyor ve figüre ekleniyor
    fig.add_trace(go.Bar(
        x=sorted_data['İl'],  # X ekseninde il isimleri kullanılıyor

        # Y ekseninde kadın oranları kullanılıyor (ters sıralama değilse), aksi takdirde erkek oranları kullanılıyor
        y=sorted_data['Kadın_oran'] if not reverse else sorted_data['Erkek_oran'],

        # Grafiğin adı belirleniyor
        name='Kadın Oranı' if not reverse else 'Erkek Oranı',

        # Bar rengi belirleniyor
        marker_color=color2,

        # Fare üzerine gelindiğinde gösterilecek bilgi formatı belirleniyor
        hovertemplate=f'<b>%{{x}}</b><br><extra>Kadın Oranı: %{{y:.2%}}</extra>'
    ))

    # Figürün düzeni güncelleniyor
    fig.update_layout(

        # Başlık tanımlanıyor
        title=title,

        # X eksenindeki etiketlerin açısı belirleniyor
        xaxis_tickangle=-90,
        xaxis=dict(

            # X ekseninin başlığı belirleniyor
            title='İller',

            # X eksenindeki etiketlerin düzeni lineer olarak belirleniyor
            tickmode='linear'
        ),
        yaxis=dict(

            # Y ekseninin başlığı belirleniyor
            title='Nüfus Oranı'
        ),

        # Bar modu yığılmış (stacked) olarak belirleniyor
        barmode='stack'
    )

    # Grafik gösterimi
    fig.show()

# Erkek nüfus oranının azalan sırayla grafiğini oluşturmak için fonksiyon çağrılıyor.
create_stacked_bar_chart(new_data2023, '2023 Yılı Erkek Nüfus Oranının Azalan Grafiği', 'Erkek_oran', 'blue', 'red')

# Kadın nüfus oranının azalan sırayla grafiğini oluşturmak için fonksiyon çağrılıyor.
create_stacked_bar_chart(new_data2023, '2023 Yılı Kadın Nüfus Oranının Azalan Grafiği', 'Kadın_oran', 'red', 'blue')

### 2023 Yılı Nüfusu en yüksek ve en düşük 10 ilde erkek ve kadın oranlarını görselleştirelim

#### Gruplanmış Çubuk Grafiği

In [24]:
# Fonksiyon tanımlanıyor, bu fonksiyon verilerden bir sütunu kullanarak sütun grafikleri oluşturur
def create_bar_chart(data, title):
    # Boş bir figür oluşturuluyor
    fig = go.Figure()

    # İlk bar grafiği (Erkek Oranı) oluşturuluyor ve figüre ekleniyor
    fig.add_trace(go.Bar(

        # X ekseninde il isimleri kullanılıyor
        x=data['İl'],

        # Y ekseninde erkek oranları kullanılıyor
        y=data['Erkek_oran'],

        # Grafiğin adı belirleniyor
        name='Erkek Oranı',

        # Bar rengi belirleniyor
        marker_color='blue',

        # Fare üzerine gelindiğinde gösterilecek bilgi formatı belirleniyor
        hovertemplate='<b>%{x}</b><br><extra>Erkek Oranı: %{y:.2%}</extra>'
    ))

    # İkinci bar grafiği (Kadın Oranı) oluşturuluyor ve figüre ekleniyor
    fig.add_trace(go.Bar(

        # X ekseninde il isimleri kullanılıyor
        x=data['İl'],

        # Y ekseninde kadın oranları kullanılıyor
        y=data['Kadın_oran'],

        # Grafiğin adı belirleniyor
        name='Kadın Oranı',

        # Bar rengi belirleniyor
        marker_color='red',

        # Fare üzerine gelindiğinde gösterilecek bilgi formatı belirleniyor
        hovertemplate='<b>%{x}</b><br><extra>Kadın Oranı: %{y:.2%}</extra>'
    ))

    # Figürün düzeni güncelleniyor
    fig.update_layout(

        # Başlık tanımlanıyor
        title=title,

        # X eksenindeki etiketlerin açısı belirleniyor
        xaxis_tickangle=-90,
        xaxis=dict(

            # X ekseninin başlığı belirleniyor
            title='İller',

            # X eksenindeki etiketlerin düzeni lineer olarak belirleniyor
            tickmode='linear'
        ),
        yaxis=dict(

            # Y ekseninin başlığı belirleniyor
            title='Oran'
        ),

        # Bar modu belirleniyor
        barmode='group'
    )

    # Grafik gösterimi
    fig.show()

# En yüksek 10 nüfusa sahip ilin erkek ve kadın oranlarını içeren bir DataFrame oluşturuluyor
top_10_cities = total_population_sorted2023.head(10).copy()
top_10_cities['Erkek_oran'] = top_10_cities['Erkek'] / top_10_cities['Toplam']
top_10_cities['Kadın_oran'] = top_10_cities['Kadın'] / top_10_cities['Toplam']

# En yüksek 10 nüfusa sahip ilin erkek ve kadın oranlarını gösteren bir grafik oluşturuluyor
create_bar_chart(top_10_cities, '2023 Yılı Nüfusu En Yüksek 10 İlin Erkek ve Kadın Oranları')

# En düşük 10 nüfusa sahip ilin erkek ve kadın oranlarını içeren bir DataFrame oluşturuluyor
bottom_10_cities = total_population_sorted2023.tail(10).copy()
bottom_10_cities['Erkek_oran'] = bottom_10_cities['Erkek'] / bottom_10_cities['Toplam']
bottom_10_cities['Kadın_oran'] = bottom_10_cities['Kadın'] / bottom_10_cities['Toplam']

# En düşük 10 nüfusa sahip ilin erkek ve kadın oranlarını gösteren bir grafik oluşturuluyor
create_bar_chart(bottom_10_cities, '2023 Yılı Nüfusu En Düşük 10 İlin Erkek ve Kadın Oranları')

In [25]:
# 2023 yılı verilerimizi hatırlayalım
new_data2023

Unnamed: 0,İl,Toplam,Erkek,Kadın,Erkek_oran,Kadın_oran
0,Adana,2270298,1135046,1135252,0.499955,0.500045
1,Adıyaman,604978,306779,298199,0.507091,0.492909
2,Afyonkarahisar,751344,374705,376639,0.498713,0.501287
3,Ağrı,511238,265585,245653,0.519494,0.480506
4,Amasya,339529,168290,171239,0.495657,0.504343
...,...,...,...,...,...,...
76,Yalova,304780,152100,152680,0.499048,0.500952
77,Karabük,255242,128370,126872,0.502934,0.497066
78,Kilis,155179,78198,76981,0.503921,0.496079
79,Osmaniye,557666,280450,277216,0.502900,0.497100


### 2023 Yılı Toplam Nüfusun oluşturduğu Dağılım

#### Koroplet Haritalama

In [26]:
# Türkiye haritası verisi TR-map.json dosyasından okunuyor
tr_map = gpd.read_file('TR-map.json')

# İl nüfus verisi total_population_sorted2023.csv dosyasından okunuyor
il_nufus = pd.read_csv('total_population_sorted2023.csv')

# Boş bir Folium haritası oluşturuluyor ve başlangıç konumu ve zoom seviyesi belirleniyor
turkey_map = folium.Map(location=[38.9683188, 35.3560241], zoom_start=6)

# Choropleth (alanlara göre renklendirme) katmanı oluşturuluyor ve Türkiye haritasına ekleniyor
folium.Choropleth(

    # Coğrafi veri dosyası belirtiliyo
    geo_data='TR-map.json',

    # Katman adı belirleniyor
    name='choropleth',

    # Veri seti belirtiliyor
    data=il_nufus,

    # Renklendirmede kullanılacak sütunlar belirleniyor
    columns=['İl', 'Toplam'],

    # Eşleşme anahtarı belirleniyor
    key_on='feature.properties.name',

    # Alan renkleri belirleniyor
    fill_color='Greys',

    # Doluluk opaklığı belirleniyor
    fill_opacity=0.6,

    # Çizgi opaklığı belirleniyor
    line_opacity=0.2,

    # Renk skalası için açıklama belirleniyor
    legend_name='2023 Yılı Toplam Nüfusu',

# Oluşturulan katman Türkiye haritasına ekleniyor
).add_to(turkey_map)

# Türkiye haritasındaki her il için döngü oluşturuluyor
for idx, row in tr_map.iterrows():

    # İl adı alınıyor
    il_ad = row['name']

    # İl adının, il nüfus verisindeki sırası belirleniyor
    nufus_sira = il_nufus[il_nufus['İl'] == il_ad].index[0] + 1

    # İl adının, il nüfus verisindeki toplam nüfusu alınıyor
    nufus_toplam = il_nufus[il_nufus['İl'] == il_ad]['Toplam'].iloc[0]

    # Her il için bir işaretçi (marker) oluşturuluyor ve Türkiye haritasına ekleniyor
    folium.Marker(

        # İşaretçinin konumu belirleniyor
        location=[row.geometry.centroid.y, row.geometry.centroid.x],

        # Fare üzerine gelindiğinde gösterilecek bilgi belirleniyor
        tooltip=f"{il_ad} <br> Nüfus: {nufus_toplam} <br>En kalabalık {nufus_sira}.şehir",

        # İşaretçi simgesi belirleniyor
        icon=folium.Icon(icon='map-pin', prefix='fa', color='black')

    # Oluşturulan işaretçi Türkiye haritasına ekleniyor
    ).add_to(turkey_map)

# Oluşturulan Türkiye haritası gösteriliyor
turkey_map

### 2023 Yılı Erkek Nüfusunun oluşturduğu Dağılım

In [27]:
# 'Toplam', 'Kadın', 'Erkek_oran' ve 'Kadın_oran' sütunlarını içermeyen bir kopya DataFrame oluşturuluyor
erkeknüfus = total_population_sorted2023.drop(columns=['Toplam','Kadın','Erkek_oran','Kadın_oran'])

# 'Erkek' sütununa göre azalan şekilde sıralama yapılıyor
erkeknüfus = erkeknüfus.sort_values(by='Erkek', ascending=False)

# Oluşturulan DataFrame 'erkeknüfus.csv' adlı bir CSV dosyasına kaydediliyor ve index sütunu dahil edilmiyor
erkeknüfus.to_csv('erkeknüfus.csv', index=False)

# Oluşturulan DataFrame ekrana yazdırılıyor
erkeknüfus

Unnamed: 0,İl,Erkek
33,İstanbul,7806787
5,Ankara,2860361
34,İzmir,2221180
15,Bursa,1605941
6,Antalya,1357198
...,...,...
78,Kilis,78198
28,Gümüşhane,74581
74,Ardahan,48239
61,Tunceli,47110


In [28]:
# 'TR-map.json' dosyasından Türkiye haritası verisi okunuyor
tr_map = gpd.read_file('TR-map.json')

# 'erkeknüfus.csv' dosyasından il nüfus verisi okunuyor
il_nufus = pd.read_csv('erkeknüfus.csv')

# Boş bir Folium haritası oluşturuluyor ve başlangıç konumu ve zoom seviyesi belirleniyor
turkey_map_man = folium.Map(location=[38.9683188, 35.3560241], zoom_start=6)

# Choropleth (alanlara göre renklendirme) katmanı oluşturuluyor ve Türkiye haritasına ekleniyor
folium.Choropleth(

    # Coğrafi veri dosyası belirtiliyor
    geo_data='TR-map.json',

    # Katman adı belirleniyor
    name='choropleth',

    # Veri seti belirtiliyor
    data=il_nufus,

    # Renklendirmede kullanılacak sütunlar belirleniyor
    columns=['İl', 'Erkek'],

    # Eşleşme anahtarı belirleniyor
    key_on='feature.properties.name',

    # Alan renkleri belirleniyor
    fill_color='Blues',

    # Doluluk opaklığı belirleniyor
    fill_opacity=0.6,

    # Çizgi opaklığı belirleniyor
    line_opacity=0.2,

    # Renk skalası için açıklama belirleniyor
    legend_name='2023 Yılı Erkek Nüfusu',

# Oluşturulan choropleth katmanı Türkiye haritasına ekleniyor
).add_to(turkey_map_man)

# Türkiye haritasındaki her il için döngü oluşturuluyor
for idx, row in tr_map.iterrows():
    # İl adı alınıyor
    il_ad = row['name']

    # İl adının, il nüfus verisindeki sırası belirleniyor
    nufus_sira = il_nufus[il_nufus['İl'] == il_ad].index[0] + 1

    # İl adının, il nüfus verisindeki toplam nüfusu alınıyor
    nufus_toplam = il_nufus[il_nufus['İl'] == il_ad]['Erkek'].iloc[0]

    # Her il için bir işaretçi (marker) oluşturuluyor ve Türkiye haritasına ekleniyor
    folium.Marker(

        # İşaretçinin konumu belirleniyor
        location=[row.geometry.centroid.y, row.geometry.centroid.x],

        # Fare üzerine gelindiğinde gösterilecek bilgi belirleniyor
        tooltip=f"{il_ad} <br> Nüfus: {nufus_toplam} <br>Erkek nüfusu en kalabalık {nufus_sira}.şehir",

        # İşaretçi simgesi belirleniyor
        icon=folium.Icon(icon='map-pin', prefix='fa', color='darkblue')

    # Oluşturulan işaretçi Türkiye haritasına ekleniyor
    ).add_to(turkey_map_man)

# Oluşturulan Türkiye haritası gösteriliyor
turkey_map_man

### 2023 Yılı Kadın Nüfusunun oluşturduğu Dağılım

In [29]:
# 'Toplam', 'Erkek', 'Erkek_oran' ve 'Kadın_oran' sütunlarını içermeyen bir kopya DataFrame oluşturuluyor
kadınnüfus = total_population_sorted2023.drop(columns=['Toplam','Erkek','Erkek_oran','Kadın_oran'])

# 'Kadın' sütununa göre azalan şekilde sıralama yapılıyor
kadınnüfus = kadınnüfus.sort_values(by='Kadın', ascending=False)

# Oluşturulan DataFrame 'kadınnüfus.csv' adlı bir CSV dosyasına kaydediliyor ve index sütunu dahil edilmiyor
kadınnüfus.to_csv('kadınnüfus.csv', index=False)

# Oluşturulan DataFrame ekrana yazdırılıyor
kadınnüfus

Unnamed: 0,İl,Kadın
33,İstanbul,7849137
5,Ankara,2943121
34,İzmir,2258345
15,Bursa,1608630
6,Antalya,1339051
...,...,...
78,Kilis,76981
28,Gümüşhane,73958
74,Ardahan,44580
68,Bayburt,42444


In [30]:
# 'TR_map.json' dosyasından Türkiye haritası verisi okunuyor
tr_map = gpd.read_file('TR-map.json')

# 'kadınnüfus.csv' dosyasından il nüfus verisi okunuyor
il_nufus = pd.read_csv('kadınnüfus.csv')

# Boş bir Folium haritası oluşturuluyor ve başlangıç konumu ve zoom seviyesi belirleniyor
turkey_map_woman = folium.Map(location=[38.9683188, 35.3560241], zoom_start=6)

# Choropleth (alanlara göre renklendirme) katmanı oluşturuluyor ve Türkiye haritasına ekleniyor
folium.Choropleth(

    # Coğrafi veri dosyası belirtiliyor
    geo_data='TR-map.json',

    # Katman adı belirleniyor
    name='choropleth',

    # Veri seti belirtiliyor
    data=il_nufus,

    # Renklendirmede kullanılacak sütunlar belirleniyor
    columns=['İl', 'Kadın'],

    # Eşleşme anahtarı belirleniyor
    key_on='feature.properties.name',

    # Alan renkleri belirleniyor
    fill_color='YlOrRd',

    # Doluluk opaklığı belirleniyor
    fill_opacity=0.6,

    # Çizgi opaklığı belirleniyor
    line_opacity=0.2,

    # Renk skalası için açıklama belirleniyor
    legend_name='2023 Yılı Kadın Nüfusu',

# Oluşturulan choropleth katmanı Türkiye haritasına ekleniyor
).add_to(turkey_map_woman)

# Türkiye haritasındaki her il için döngü oluşturuluyor
for idx, row in tr_map.iterrows():
    # İl adı alınıyor
    il_ad = row['name']

    # İl adının, il nüfus verisindeki sırası belirleniyor
    nufus_sira = il_nufus[il_nufus['İl'] == il_ad].index[0] + 1

    # İl adının, il nüfus verisindeki toplam nüfusu alınıyor
    nufus_toplam = il_nufus[il_nufus['İl'] == il_ad]['Kadın'].iloc[0]

    # Her il için bir işaretçi (marker) oluşturuluyor ve Türkiye haritasına ekleniyor
    folium.Marker(

        # İşaretçinin konumu belirleniyor
        location=[row.geometry.centroid.y, row.geometry.centroid.x],

        # Fare üzerine gelindiğinde gösterilecek bilgi belirleniyor
        tooltip=f"{il_ad} <br> Nüfus: {nufus_toplam} <br> Kadın nüfusu en kalabalık {nufus_sira}.şehir",

        # İşaretçi simgesi belirleniyor
        icon=folium.Icon(icon='map-pin', prefix='fa', color='red')

    # Oluşturulan işaretçi Türkiye haritasına ekleniyor
    ).add_to(turkey_map_woman)

# Oluşturulan Türkiye haritası gösteriliyor
turkey_map_woman