## 📊 Veri Seti Hakkında:
Titanic veri seti, 1912'de batan Titanic gemisindeki yolcular hakkında bilgi içerir.

**Sütun Açıklamaları:**
- `survived`: Hayatta kalma durumu (0 = Hayır, 1 = Evet)
- `pclass`: Yolcu sınıfı (1 = 1. sınıf, 2 = 2. sınıf, 3 = 3. sınıf)
- `sex`: Cinsiyet
- `age`: Yaş
- `sibsp`: Gemide bulunan kardeş/eş sayısı
- `parch`: Gemide bulunan ebeveyn/çocuk sayısı
- `ticket`: Bilet numarası
- `fare`: Bilet ücreti
- `cabin`: Kabin numarası
- `embarked`: Bindiği liman (C = Cherbourg, Q = Queenstown, S = Southampton)

In [None]:
import pandas as pd

df = pd.read_csv("https://raw.githubusercontent.com/datasciencedojo/datasets/master/titanic.csv")

### Soru 1: Veri setinde kaç satır ve kaç sütun olduğunu bulun.

In [None]:
df.shape 

### Soru 2: Tüm sütun isimlerini yazdırın.

In [None]:
df.columns


### Soru 3: Yaş ortalamasını ve medyanını hesaplayın.

In [None]:
df["Age"].agg(["mean","median"])


### Soru 4: Cinsiyet değişkenindeki eşsiz değerleri yazdırın.

In [None]:
df['Sex'].unique() 


### Soru 5: `pclass` değişkenindeki değerlerin yüzdesel dağılımını yazdırın.

In [None]:
df["Pclass"].value_counts(normalize=True)


### Soru 6: Yaşı 30'dan büyük kadın yolcuları listeleyin.

In [None]:
df[(df["Age"] > 30) & (df["Sex"] == "female")].head()


### Soru 7: Yaşı 18'den küçük olup 1. sınıfta yolculuk eden yolcuları listeleyin.

In [None]:
df[(df["Age"] < 18) & (df["Pclass"] == 1 )].head()


### Soru 8: İlk 10 gözlemden son 3'ünü gösterin.

In [None]:
df.head(10).tail(3)

### Soru 9: Bilet fiyatı (fare) 100'den büyük olan kaç kişi vardır?

In [None]:
df_x = df[(df["Fare"] > 100)]
len(df_x)


### Soru 10: `sex`, `age` ve `fare` sütunlarından oluşan yeni bir DataFrame oluşturun.

In [None]:
df_new = df[["Sex","Age","Fare"]].copy()
df_new.head()



### Soru 1: Cinsiyete göre yaş ortalamasını bulun.

In [None]:
df.groupby("Sex")["Age"].mean()



### Soru 2: Sınıfa göre hayatta kalan kişi sayısını bulun.

In [None]:
df_y = df.groupby("Pclass")["Survived"]
len(df_y)

### Soru 3: Hem cinsiyet hem sınıfa göre hayatta kalma oranlarını hesaplayın.

In [None]:
df.groupby(["Sex", "Pclass"])["Survived"].mean()

### Soru 4: Embarked değişkenine göre ortalama yaş ve ortalama ücret nedir?

In [None]:
df.groupby("Embarked")[["Age", "Fare"]].mean()


### Soru 5: Pclass gruplarına göre yaşın standart sapmasını bulun.

In [None]:
df.groupby("Pclass")["Age"].std()


### Soru 6: Her `Embarked` limanından kaç yolcu olduğunu ve bunların yüzdelik dağılımını yazdırın.

In [None]:
df["Embarked"].value_counts()
df["Embarked"].value_counts(normalize=True)

### Soru 7: Yaşı 60'tan büyük olanların hayatta kalma oranını bulun.

In [None]:
df_z = df[df["Age"] > 60]
df_s = df_z["Survived"].mean()
print(df_s)


### Soru 8: `Sex`, `Pclass`, `Survived` için `groupby()` + `agg()` ile ortalama yaş ve ücret hesaplayın.

In [None]:
df.groupby(['Sex', 'Pclass', 'Survived']).agg({
    'Age': 'mean',
    'Fare': 'mean'
})


### Soru 9: Age değişkenini artan düzende sıralayın ve ilk 10 kişiyi yazdırın.

In [None]:
df.sort_values(by=["Age"]).head(10)


### Soru 1: En pahalı bileti alan kişinin yaşı, cinsiyeti ve sınıfı nedir?

In [None]:
df.loc[df['Fare'].idxmax(), ["Age", "Sex", "Pclass"]]

### Soru 2: Hayatta kalanlar ile ölenler arasında yaş ortalamaları farkı nedir?

In [None]:
df_survive = df[df["Survived"] == 1]["Age"].mean()
df_dead = df[df["Survived"] == 0]["Age"].mean()
df_survive - df_dead

### Soru 3: Hangi `Pclass` grubunda kadınların hayatta kalma oranı en yüksektir?

In [None]:
df[df['Sex'] == 'female'].groupby('Pclass')['Survived'].mean()


### Soru 4: Ortalama yaşın altında olan ve hayatta kalan erkeklerin sayısı kaçtır?

In [None]:
df_avgAge = df["Age"].mean()
df_Q = (df["Sex"] == 'male') & (df["Survived"] == 1) & (df["Age"] < df_avgAge)
len(df[df_Q])

### Soru 5: `Cabin` değeri eksik olmayanların yaş ortalaması ile eksik olanların yaş ortalaması arasında fark var mı?

In [None]:
df_1 = df[df["Cabin"].notnull()]["Age"].mean()
df_2 = df[df["Cabin"].isnull()]["Age"].mean()
df_1 - df_2


### Soru 6: `.describe()` çıktısına göre çarpıklık var mı? Hangi değişkenlerde?

In [None]:
df.describe()
df.skew(numeric_only=True)

### Soru 7: Veri setindeki en fazla tekrarlanan yaş değeri (mod) nedir?

In [None]:
df["Age"].mode()


### Soru 8: Ortalama bilet fiyatı kadınlar mı yoksa erkekler için mi daha yüksek?

In [None]:
df.groupby('Sex')['Fare'].mean()
