In [None]:
pip install seaborn

**Seaborn**, Python programlama dili için veri görselleştirme kütüphanesidir ve özellikle veri analizi ve veri keşfi süreçlerinde kullanılır. Seaborn, Matplotlib'e dayalı bir yüksek seviyeli arayüz sağlar ve veri görselleştirmeyi daha kolay ve çekici hale getirir.

In [None]:
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

In [None]:
df = pd.read_csv("community_health_metric.csv")
df

In [None]:
df.describe()

**.describe()** bir Python pandas DataFrame veya Serisi üzerinde kullanılabilen bir metoddur. Bu metod, veri setinin temel istatistiksel özelliklerini hesaplar ve bu özellikleri bir özet istatistik tablosu olarak döndürür.

**Scatter Plot**

In [None]:
sns.scatterplot(data=df, x="yas", y="kilo")

In [None]:
plt.figure(figsize=(8, 6), dpi=100)

sns.scatterplot(data=df, x="yas", y="kilo", hue="cinsiyet", size="etnik", palette="viridis")

**hue** veri setinizdeki farklı kategorilere ait verileri renkler aracılığıyla vurgulamanızı sağlar . Bu, verilerinizi daha iyi anlamanıza ve farklı kategoriler arasındaki ilişkileri görselleştirmenize yardımcı olabilir .

**size** ile verileri değerşerine göre daha farklı boyutlar alabilirler .

**palette** ile tablo üzerinde renk değiştirme işlemlerini başırılı bir şekilde gerçekleştirebiliriz .

In [None]:
plt.figure(figsize=(8, 6), dpi=200)

sns.scatterplot(data=df, x="yas", y="kilo", alpha=0.4, style="cinsiyet")

**"alpha"** bir renk veya çizgi kalınlığına uygulanan bir şeffaflık (transparanlık) seviyesini ifade eder . Alpha, 0 ile 1 arasındaki bir değerdir ve renklerin veya çizgilerin ne kadar saydam veya opak olduğunu belirler .

**"style"** (stil) parametresi , veri görselleştirmeleri oluştururken kullanabileceğiniz grafiklerin genel görünümünü ve stilini ayarlamak için kullanılır . Seaborn'da farklı stiller mevcuttur ve bu stil parametresi , grafiklerinizin renklerini , çizgi stillerini, yazı tipini ve diğer görsel özelliklerini kolayca özelleştirmenize olanak tanır .

**Countplot**

**Countplot** , Seaborn kütüphanesinde kullanılan bir grafik türüdür ve kategorik verilerin sayılarını görselleştirmek için kullanılır . Bu tür bir grafik , her bir kategoriye ait veri noktalarının sayısını çubuk grafik (bar plot) şeklinde gösterir . Countplot genellikle kategorik verilerin dağılımını incelemek veya belirli bir veri kümesindeki kategorik sınıf sayılarını görmek için kullanılır .

In [None]:
sns.countplot(data=df, x="etnik")

Yukarıda mevcut olan grafiğin tam sayı degerlerini almak için aşagıda ki kodu kullanabiliriz .

In [None]:
df["etnik"].value_counts()

In [None]:
plt.figure(figsize=(11, 9), dpi=200)
sns.countplot(data=df, x="dr")

In [None]:
df["dr"].value_counts()

**Barplot**

**barplot** , Seaborn kütüphanesinde kullanılan bir grafik türüdür ve kategorik ve sayısal verilerin ilişkisini görselleştirmek için kullanılır . Bu grafik , bir kategorik değişkenin farklı sınıflarının sayısal bir özelliğinin merkezi eğilimini (genellikle ortalamasını) gösterir .

In [None]:
plt.figure(figsize=(16, 11), dpi=200)
sns.barplot(data=df, x="yas", y="boy")

**HİSTOGRAM**

Histogramlar , bir veri kümesindeki değerlerin dağılımını gösteren çok yaygın bir grafik türüdür . Bir histogram , bir sayısal değişkenin aralığını (binler) böler ve her bir aralıktaki veri noktalarının sayısını gösteren çubuklarla temsil eder . Bu , verinin yoğunluğunu ve dağılımını görsel olarak anlamak için kullanışlıdır .

In [None]:
sns.histplot(data=df, x="dr")

In [None]:
sns.histplot(data=df, x="dr", bins=10, kde=True)

**bins** parametresi , histogramdaki bu çubukların sayısını kontrol etmenize olanak tanır . Özellikle veri kümenizdeki değerler çok sayıda ise veya verinin dağılımını daha ayrıntılı bir şekilde incelemek istiyorsanız , bins parametresini ayarlayarak histogramın ayrıntısını özelleştirebilirsiniz .


**kde** (Kernel Density Estimation) parametresi , Seaborn'ün histplot fonksiyonunda kullanılan bir parametredir . Bu parametre , histograma ek olarak veri dağılımını bir yoğunluk tahmini çizgisi ile görselleştirmenize olanak tanır . Yoğunluk tahmini , veri dağılımının daha yumuşak bir tahminini sunar ve veri noktalarının yoğunluğunu daha iyi anlamanıza yardımcı olur .

kde parametresini kullanarak histplot fonksiyonunu çağırırken , True veya False değerlerini kabul eder . True olarak ayarlandığında, yoğunluk tahmini çizgisi histogramın üzerine eklenir . False olarak ayarlandığında , yoğunluk tahmin çizgisi oluşturulmaz .

**. . .**

Tema ayarlarken aşagıdaki kod ile ayarlayabiliriz . Ama bir kere ayarlayınca sürekli aynı tema gelir ta ki o temayı değiştirinceye kadar . 

In [None]:
sns.set(style="dark")
sns.histplot(data=df, x="dr", kde=True, edgecolor="purple", lw=1.5, color="orange")

**edgecolor=". . ."** kenar çizgi rengini ayarlamak için kullanılır .

**lw=. . .** kenar çizgilerini kalınkaştırmak ve ya inceltemek için kullanılan bir komuttur .

**color=". . ."** sütunların iç rengini belirlemek için kullanırız . 

**. . .**

**rugplot**


**rugplot** , Seaborn kütüphanesinde kullanılan bir veri görselleştirme grafiği türüdür . rugplot , veri noktalarının bir eksen üzerindeki konumlarını göstermek için kullanılır ve veri dağılımını daha iyi anlamak için diğer grafiklerle birlikte kullanılabilir .

rugplot grafiği , veri noktalarını bir çizgi veya eksen üzerinde küçük çizgiler (rug) olarak temsil eder . Her veri noktası , verinin nerede bulunduğunu gösteren bu küçük çizgilere sahiptir . rugplot grafiği, veri dağılımının yoğunluğunu ve veri noktalarının dağılımını daha iyi görselleştirmek için kullanışlıdır .

In [None]:
sns.rugplot(data=df, x="yas")

In [None]:
sns.rugplot(data=df, x="yas", height=0.5)

**kdeplot**


**kdeplot** (Kernel Density Estimation Plot), Seaborn kütüphanesinde kullanılan ve veri dağılımını görselleştirmek için yaygın olarak kullanılan bir grafik türüdür. kdeplot, veri noktalarının yoğunluk tahminini bir yoğunluk tahmini çizgisi (kernel density estimate) veya çizgisi ile gösterir. Bu çizgi, veri noktalarının yoğunluğunu daha pürüzsüz bir şekilde temsil eder ve verinin dağılımını daha iyi anlamanıza yardımcı olur.

kdeplot grafiği, veri dağılımının yoğunluğunu gösterirken, aynı zamanda verinin merkezi eğilimini ve dağılımını da incelemenize olanak tanır. kdeplot, bir sayısal değişkenin dağılımını daha iyi anlamak için sıklıkla kullanılır.

In [None]:
sns.kdeplot(data=df, x="yas")

In [None]:
sns.kdeplot(data=df, x="yas", bw_adjust=0.1)

In [None]:
sns.kdeplot(data=df, x="yas", bw_adjust=1, shade=True)

**shade=True** ile grafik içini doldurabiliriz .

In [None]:
sns.kdeplot(data=df, x="yas", y="kilo")

En  içerideki giren çizgilerde deger en büyük oluyor .

**Boxplot**

Box plot (kutu grafik) , veri setinin beş numaralı özeti olarak da bilinen istatistiksel bir grafik türüdür . Box plot , bir veri setinin dağılımını , merkezi eğilimini , çeyrekliklerini ve aykırı değerlerini görselleştirmek için kullanılır . Bu grafik , veri setinin temel istatistiksel özelliklerini hızlı ve etkili bir şekilde anlamanıza yardımcı olur .

In [None]:
sns.boxplot(data=df, x="etnik", y="kilo")

**violinplot**

Violin plot , kutu grafik (box plot) ve yoğunluk tahmini (kernel density estimate) çizgilerini bir araya getirerek veri dağılımını daha ayrıntılı bir şekilde ifade eder .

In [None]:
sns.violinplot(data=df, x="etnik", y="dr")

**Pairplot**

**seaborn.pairplot()** işlevi , veri setinizdeki sayısal değişkenlerin ikişerli kombinasyonlarının dağılımlarını ve ilişkilerini görselleştirmek için kullanılır . Bu işlev , özellikle çok değişkenli veri setlerini analiz etmek ve değişkenler arasındaki ilişkileri görsel olarak incelemek için kullanışlıdır . Bu tür bir görselleştirme , veri setinizdeki değişkenler arasındaki ilişkileri anlamaya ve veri analizi yapmaya yardımcı olabilir .

In [None]:
sns.pairplot(df)

**Jointplot**

**seaborn.jointplot()** Seaborn kütüphanesinin bir işlevidir ve iki sayısal değişken arasındaki ilişkiyi ve bu değişkenlerin dağılımlarını görselleştirmek için kullanılır. Bu işlev, iki değişken arasındaki ilişkiyi anlamaya yardımcı olmak için dağılım grafikleri, yoğunluk grafikleri veya saçılma (scatter) grafikleri gibi farklı grafik türlerini birleştirir.

seaborn.jointplot() işleminin temel amacı, aşağıdaki bilgileri sunmak için farklı grafikleri bir araya getirmektir:

**=> İki değişkenin dağılımları:** Her iki değişkenin ayrı ayrı dağılımını gösteren histogramlar veya çekirdek yoğunluk tahminleri.

**=> İki değişken arasındaki ilişki:** İki değişkenin birlikte nasıl dağıldığını gösteren saçılma (scatter) grafikleri veya yoğunluk grafikleri. Bu grafikler, değişkenler arasındaki korelasyonu ve ilişkiyi gösterir.

**=> Köşegen grafikler:** Her iki değişkenin ayrı ayrı dağılımını gösteren grafiklerdir ve aynı zamanda her iki değişkenin kendi aralarındaki ilişkiyi gösterir.

In [None]:
sns.jointplot(x='yas', y='kilo', data=df)

In [None]:
sns.jointplot(x='yas', y='kilo', kind='hex', data=df)

**NOT !!! . . .**

    Renklerin koyulaştığı yer verilerin orada yoğun oldugu anlamına gelir .

**Catplot**

**seaborn.catplot()** Seaborn kütüphanesinin bir işlevidir ve kategorik (categorical) veri türlerinin görselleştirilmesi için kullanılır. Bu işlev, kategorik değişkenlerin ve sayısal değişkenlerin ilişkilerini ve dağılımlarını görselleştirmek için tasarlanmıştır. catplot(), farklı türlerde grafikler (örneğin çubuk grafikleri, kutu grafikleri, violin grafikleri, vb.) kullanarak verileri sunma esnekliği sunar.

In [None]:
sns.catplot(data=df, x='yas', y='kilo', kind='bar')

**Facet Grid**

Seaborn'da facet grid, çoklu alt grafiklerin oluşturulmasını ve veri setinizin farklı alt küme veya kategorileri arasındaki ilişkileri incelemek için kullanılan bir görselleştirme aracıdır. Facet grid, seaborn.FacetGrid sınıfını kullanarak oluşturulur ve genellikle map işlemini kullanarak alt grafikleri doldurur. Bu, farklı alt küme veya kategorilerde verileri görselleştirmek için çok güçlü bir yöntemdir.

**Pairgrid**

seaborn.PairGrid, Seaborn kütüphanesinde kullanılan bir sınıftır ve çoklu alt grafiklerin oluşturulmasını ve çoklu sayısal değişkenler arasındaki ilişkileri görselleştirmek için kullanılır. PairGrid, veri setinizdeki farklı sayısal değişkenlerin kombinasyonlarını görselleştirmek için kullanılır ve genellikle veri keşfi ve analizi sırasında kullanılır.

**Heatmap**

Sadece ndarray ve sayısal verileri okur .

In [28]:
df

Unnamed: 0,yas,cinsiyet,etnik,kilo,boy,dr
0,47,kadin,D,112,165,10
1,26,erkek,C,128,168,9
2,26,erkek,B,91,173,6
3,39,erkek,C,108,185,9
4,55,erkek,A,90,155,10
...,...,...,...,...,...,...
995,43,kadin,E,124,173,16
996,34,kadin,D,112,193,8
997,54,kadin,B,141,191,12
998,38,erkek,E,29,191,7
