# 📘 NumPy ile Veri Analizi – HR Data Uygulaması
Bu dosyada NumPy kütüphanesini temel düzeyde tanıyacak ve HR Data.csv dosyası üzerinden örneklerle uygulayacağız.

In [2]:
# 🔹 NumPy ve Pandas kütüphanelerini içe aktar
import numpy as np
import pandas as pd

## 🔹 HR Data.csv dosyasını oku

In [4]:
# CSV dosyasını oku
df = pd.read_csv('HR Data.csv')
# Sadece sayısal sütunları al
numeric_df = df.select_dtypes(include='number')
# NumPy array'e çevir
veri = numeric_df.to_numpy()
numeric_df.head()

Unnamed: 0,Age,DailyRate,DistanceFromHome,Education,EmployeeCount,EmployeeNumber,JobSatisfaction,MonthlyIncome,MonthlyRate,PerformanceRating,TotalWorkingYears
0,41,1102,1,2,1,1,4,5993,19479,3,8
1,49,279,8,1,1,2,2,5130,24907,4,10
2,37,1373,2,2,1,4,3,2090,2396,3,7
3,33,1392,3,4,1,5,3,2909,23159,3,8
4,27,591,2,1,1,7,2,3468,16632,3,6


Özellik	                   np.array()	                                .to_numpy()

Veri kaynağı	    Python list, tuple, vs. (elle verirsin)	      DataFrame (otomatik çeviri)
Kullanım amacı	    Manuel NumPy array üretimi	                  Var olan DataFrame'den NumPy al
Kontrol	            Tamamen sende	                              Mevcut tabloya bağlı
Sütun isimleri?	    Yok	                                          Yok (çevrildiği anda isimler kaybolur)


## 🔹 NumPy ile Temel İşlemler

In [5]:
# Ortalama yaş ve maaş hesapla
ortalama_yas = np.mean(numeric_df['Age'])
ortalama_maas = np.mean(numeric_df['MonthlyIncome'])
print('Ortalama Yaş:', round(ortalama_yas, 2))
print('Ortalama Maaş:', round(ortalama_maas, 2))

Ortalama Yaş: 36.92
Ortalama Maaş: 6502.93


| Nereden?             | Kolaylık | Yorum                           |
|----------------------|----------|---------------------------------|
| `numeric_df['Age']`  | ✅       | Anlaşılır, sütun ismi var       |
| `veri[:, 0]`         | ✅✅     | Hızlı, ama dikkatli olmalı      |



In [None]:
# Ortalama maaştan yüksek maaş alan kişi sayısı
maas_dizisi = numeric_df['MonthlyIncome'].to_numpy()
ust_maas_sayisi = np.sum(maas_dizisi > ortalama_maas) # np.sum True False -leri topluyur 1+0+0+1+1
print('Ortalama maaş üstü alan kişi sayısı:', ust_maas_sayisi)

# numeric_df[numeric_df["MonthlyIncome"] > ortalama_maas].shape[0]
# Pandas ile sayi


In [7]:
# Yaş - Tecrübe farkı
yas = numeric_df['Age'].to_numpy()                        # örnek: [41, 49, 37, 33, 27, ...]
tecrube = numeric_df['TotalWorkingYears'].to_numpy()      # örnek: [8, 10, 7, 8, 6, ...]
tecrube_farki = yas - tecrube

#yas ve tecrube iki farklı NumPy dizisi (aynı uzunlukta),
# NumPy bu dizilerin aynı indexlerindeki elemanları çıkarır:
#[41 - 8, 49 - 10, 37 - 7, 33 - 8, 27 - 6] = [33, 39, 30, 25, 21]

print('İlk 5 kişinin Yaş - Tecrübe farkı:', tecrube_farki[:5]) 

İlk 5 kişinin Yaş - Tecrübe farkı: [33 39 30 25 21]


In [None]:
# Satır ve sütun ortalamaları
satir_ortalamalari = np.mean(veri, axis=1)
sutun_ortalamalari = np.mean(veri, axis=0)
print('İlk 5 satır ortalaması:', satir_ortalamalari[:5])
print('Tüm sütun ortalamaları:', np.round(sutun_ortalamalari, 2))

# axis = 0 → dikine hesap → sütun sütun
# axis = 1 → yatay hesap → satır satır
