In [3]:
# Başlık: Veri Filtreleme ve Sıralama Projesi
# Veri Seti: country.csv
# Açıklama: Ülke verileri üzerinde temel veri temizliği, filtreleme ve sıralama görevlerini içerir.

In [43]:
import pandas as pd
import numpy as np

In [45]:
# Veri Seti Açıklaması:
#Country: Ülkenin adı
#Region: Ülkenin bulunduğu bölge (ör. ASIA, EASTERN EUROPE, NORTHERN AFRICA vb.)
#Population: Ülkenin toplam nüfusu
#Area (sq. mi.): Ülkenin yüzölçümü (mil kare olarak)
#Pop. Density (per sq. mi.): Nüfus yoğunluğu (mil kare başına düşen kişi sayısı)
#Coastline (coast/area ratio): Sahil uzunluğunun, ülkenin toplam alanına oranı
#Net migration: Net göç oranı (ülkeye giren veya çıkan kişi sayısına göre)
#Infant mortality (per 1000 births): Bebek ölüm oranı (1000 doğum başına)
#GDP ($ per capita): Kişi başına düşen Gayri Safi Yurtiçi Hasıla (GSYİH)
#Literacy (%): Okur-yazarlık oranı
#Phones (per 1000): Her 1000 kişi başına düşen telefon sayısı
#Arable (%): Tarıma elverişli arazi yüzdesi
#Crops (%): Ekilebilir ürünlerin yüzdesi
#Other (%): Diğer arazi kullanımı yüzdesi
#Climate: Ülkenin iklim kategorisi (numerik değer)
#Birthrate: Doğum oranı
#Deathrate: Ölüm oranı
#Agriculture: Tarım sektörünün ekonomideki payı
#Industry: Sanayi sektörünün ekonomideki payı
#Service: Hizmet sektörünün ekonomideki payı

In [47]:
data = pd.read_csv("country.csv")

data['Country'] = data['Country'].str.strip()

colums_clean = [
    'Population', 'Pop. Density (per sq. mi.)', 'Coastline (coast/area ratio)',
    'Net migration', 'Infant mortality (per 1000 births)', 'Literacy (%)',
    'Phones (per 1000)', 'Arable (%)', 'Crops (%)',
    'Other (%)', 'Birthrate', 'Deathrate',
    'Agriculture', 'Industry', 'Service'
]

for col in colums_clean:
    data[col] = pd.to_numeric(data[col].astype(str).str.replace(',','.', regex = False), errors='coerce')

cleaned_data = data.dropna(subset=[
    'Net migration','Infant mortality (per 1000 births)','GDP ($ per capita)',
    'Literacy (%)', 'Phones (per 1000)','Arable (%)',
    'Crops (%)','Other (%)', 'Climate',
    'Birthrate', 'Deathrate','Agriculture',
    'Industry', 'Service'
])


In [49]:
#Görev 1 - Nüfusa Göre Azalan Sıralama
azalan_nufus = cleaned_data.sort_values(by= 'Population', ascending=False)
print("\n 1. Görev: Nüfusa Göre Azalan Sırada Tüm Ülkeler")
print(azalan_nufus[['Country', 'Region', 'Population']].to_markdown(index=False))



 1. Görev: Nüfusa Göre Azalan Sırada Tüm Ülkeler
| Country                          | Region               |   Population |
|:---------------------------------|:---------------------|-------------:|
| China                            | ASIA (EX. NEAR EAST) |   1313973713 |
| India                            | ASIA (EX. NEAR EAST) |   1095351995 |
| United States                    | NORTHERN AMERICA     |    298444215 |
| Indonesia                        | ASIA (EX. NEAR EAST) |    245452739 |
| Brazil                           | LATIN AMER. & CARIB  |    188078227 |
| Pakistan                         | ASIA (EX. NEAR EAST) |    165803560 |
| Bangladesh                       | ASIA (EX. NEAR EAST) |    147365352 |
| Nigeria                          | SUB-SAHARAN AFRICA   |    131859731 |
| Japan                            | ASIA (EX. NEAR EAST) |    127463611 |
| Mexico                           | LATIN AMER. & CARIB  |    107449525 |
| Philippines                      | ASIA (EX. NEA

In [51]:
#Nüfus açısından en kalabalık ülkeler Çin, Hindistan ve ABD.
#Bu sıralama yalnızca nüfus büyüklüğüne odaklanıyor, diğer ekonomik veya sosyal göstergeleri hesaba katmıyor.

In [53]:
#Görev 2 - GSYİH'ye Göre Artan Sıralama
artan_gdp = cleaned_data.sort_values(by= 'GDP ($ per capita)', ascending=True)
print("\n 2. Görev: GDP ($ per capita) Sütununa Göre Artan Sırada Tüm Ülkeler")
print(artan_gdp[['Country', 'Region', 'GDP ($ per capita)']].to_markdown(index=False))



 2. Görev: GDP ($ per capita) Sütununa Göre Artan Sırada Tüm Ülkeler
| Country                          | Region               |   GDP ($ per capita) |
|:---------------------------------|:---------------------|---------------------:|
| Somalia                          | SUB-SAHARAN AFRICA   |                  500 |
| Sierra Leone                     | SUB-SAHARAN AFRICA   |                  500 |
| Burundi                          | SUB-SAHARAN AFRICA   |                  600 |
| Malawi                           | SUB-SAHARAN AFRICA   |                  600 |
| Congo, Dem. Rep.                 | SUB-SAHARAN AFRICA   |                  700 |
| Congo, Repub. of the             | SUB-SAHARAN AFRICA   |                  700 |
| Eritrea                          | SUB-SAHARAN AFRICA   |                  700 |
| Ethiopia                         | SUB-SAHARAN AFRICA   |                  700 |
| Comoros                          | SUB-SAHARAN AFRICA   |                  700 |
| Afghanistan    

In [55]:
#GDP ($ per capita) açısından en düşük değerler 500-700 USD civarında.

In [57]:
#Görev 3 - Nüfusu 10 Milyon Üzerinde Olan Ülkeler
populasyon_buyukluk = cleaned_data[cleaned_data['Population'] >= 10_000_000]
print(f"\n 3. Görev: Population >= 10 Milyon Olan Tüm Ülkeler (Toplam: {len(populasyon_buyukluk)})")
print(populasyon_buyukluk[['Country', 'Population']].to_markdown(index=False))



 3. Görev: Population >= 10 Milyon Olan Tüm Ülkeler (Toplam: 72)
| Country          |   Population |
|:-----------------|-------------:|
| Afghanistan      |     31056997 |
| Algeria          |     32930091 |
| Argentina        |     39921833 |
| Australia        |     20264082 |
| Bangladesh       |    147365352 |
| Belarus          |     10293011 |
| Belgium          |     10379067 |
| Brazil           |    188078227 |
| Burkina Faso     |     13902972 |
| Burma            |     47382633 |
| Cambodia         |     13881427 |
| Cameroon         |     17340702 |
| Chile            |     16134219 |
| China            |   1313973713 |
| Colombia         |     43593035 |
| Congo, Dem. Rep. |     62660551 |
| Cote d'Ivoire    |     17654843 |
| Cuba             |     11382820 |
| Czech Republic   |     10235455 |
| Ecuador          |     13547510 |
| Egypt            |     78887007 |
| Ethiopia         |     74777981 |
| France           |     60876136 |
| Germany          |     82422299 

In [59]:
#Filtreleme sonucunda, dünya genelinde 10 milyonun üzerinde nüfusa sahip ülkeler seçildi.
#Bu ülkeler Asya, Afrika, Latin Amerika ve Okyanusya gibi farklı bölgelerden geliyor.
#Nüfus bakımından en büyük ülkeler Çin, Hindistan, ABD ve Endonezya gibi ülkeler.

In [61]:
#Görev 4 - En Yüksek Okur-Yazarlığa Sahip İlk 5 Ülke
okur_yazar = cleaned_data.sort_values(by= 'Literacy (%)', ascending=False).head(5)
print("\n 4. Görev: En Yüksek Okur-Yazarlık Oranına Sahip İlk 5 Ülke")
print(okur_yazar[['Country', 'Region', 'Literacy (%)']].to_markdown(index=False))



 4. Görev: En Yüksek Okur-Yazarlık Oranına Sahip İlk 5 Ülke
| Country       | Region         |   Literacy (%) |
|:--------------|:---------------|---------------:|
| Denmark       | WESTERN EUROPE |            100 |
| Australia     | OCEANIA        |            100 |
| Finland       | WESTERN EUROPE |            100 |
| Liechtenstein | WESTERN EUROPE |            100 |
| Norway        | WESTERN EUROPE |            100 |


In [63]:
#Yüksek okur-yazarlık oranına sahip ülkeler, genellikle eğitim ve sosyal altyapıya güçlü yatırım yapan ülkeler.
#Bu ülkelerde ekonomik gelir ve yaşam kalites yüksek.
#Analiz, okur-yazarlık oranı yüksek ülkelerin küçük veya büyük nüfuslu olabilmesine rağmen, sosyal ve ekonomik göstergelerde avantajlı olduklarını ortaya koyuyor.

In [65]:
#5. Görev: GDP ($ per capita) > 10 Bin Olan Tüm Ülkeler
gdp_above_10k = data[data['GDP ($ per capita)'] > 10000]
print("\n 5. Görev: GDP ($ per capita) > 10 Bin Olan Tüm Ülkeler")
print(f"Toplam ülke sayısı: {len(gdp_above_10k)}\n")
print(gdp_above_10k[['Country', 'GDP ($ per capita)']].to_markdown(index=False))


 5. Görev: GDP ($ per capita) > 10 Bin Olan Tüm Ülkeler
Toplam ülke sayısı: 76

| Country              |   GDP ($ per capita) |
|:---------------------|---------------------:|
| Andorra              |                19000 |
| Antigua & Barbuda    |                11000 |
| Argentina            |                11200 |
| Aruba                |                28000 |
| Australia            |                29000 |
| Austria              |                30000 |
| Bahamas, The         |                16700 |
| Bahrain              |                16900 |
| Barbados             |                15700 |
| Belgium              |                29100 |
| Bermuda              |                36000 |
| British Virgin Is.   |                16000 |
| Brunei               |                18600 |
| Canada               |                29800 |
| Cayman Islands       |                35000 |
| Croatia              |                10600 |
| Cyprus               |                19200 |
| Czech

In [67]:
#Filtreleme sonucunda, dünya genelinde 10 bin üzerinde GDP ($ per capita) sahip ülkeler seçildi.

In [69]:
#Görev 6 - En Yüksek Nüfus Yoğunluğuna Sahip İlk 10 Ülke
nufus_yogun = cleaned_data.sort_values(by= 'Pop. Density (per sq. mi.)', ascending=False).head(10)
print("\n 6. Görev: En Yüksek Nüfus Yoğunluğuna Sahip İlk 10 Ülke")
print(nufus_yogun[['Country', 'Region', 'Pop. Density (per sq. mi.)']].to_markdown(index=False))


 6. Görev: En Yüksek Nüfus Yoğunluğuna Sahip İlk 10 Ülke
| Country    | Region               |   Pop. Density (per sq. mi.) |
|:-----------|:---------------------|-----------------------------:|
| Macau      | ASIA (EX. NEAR EAST) |                      16183   |
| Singapore  | ASIA (EX. NEAR EAST) |                       6482.2 |
| Hong Kong  | ASIA (EX. NEAR EAST) |                       6355.7 |
| Bermuda    | NORTHERN AMERICA     |                       1241   |
| Maldives   | ASIA (EX. NEAR EAST) |                       1196.7 |
| Bahrain    | NEAR EAST            |                       1050.5 |
| Bangladesh | ASIA (EX. NEAR EAST) |                       1023.4 |
| Barbados   | LATIN AMER. & CARIB  |                        649.5 |
| Taiwan     | ASIA (EX. NEAR EAST) |                        640.3 |
| Mauritius  | SUB-SAHARAN AFRICA   |                        608.3 |


In [71]:
#Filtreleme sonucunda, dünya genelinde en yüksek nüfus yoğunluğuna sahip 10 ülke seçildi.