In [None]:
library(tidyverse) 
data <- read.csv("/kaggle/input/netflix-shows/netflix_titles.csv") 

# Boş yıl verilerini temizle
data_clean <- data %>%
  filter(!is.na(release_year))

# Yıllara göre içerik sayısı 
icerik_yil <- data_clean %>%
  group_by(release_year) %>%
  summarise(icerik_sayisi = n())

ggplot(icerik_yil, aes(x = release_year, y = icerik_sayisi)) +
  geom_col() +
  labs(
    title = "Yıllara Göre Netflix'e Eklenen İçerik Sayısı",
    x = "Yıl",
    y = "İçerik Sayısı"
  ) +
  theme_minimal()

data_ulkeler <- data_clean %>%
  separate_rows(country, sep = ", ") # Her ülkeyi ayrı satıra al

# En çok içerik üreten ülkeler
ulke_icerik <- data_ulkeler %>%
  group_by(country) %>%
  summarise(icerik_sayisi = n()) %>%
  arrange(desc(icerik_sayisi)) 

# İlk 10 ülkeyi görselleştir
ulke_icerik %>%
  slice_max(order_by = icerik_sayisi, n = 10) %>%  # 
  ggplot(aes(x = reorder(country, icerik_sayisi), y = icerik_sayisi)) +
  geom_col() +
  coord_flip() +
  labs(
    title = "En Çok İçerik Üreten 10 Ülke",
    x = "Ülke",
    y = "İçerik Sayısı"
  ) +
  theme_minimal()

# İçerik Türü (Film/Dizi) Dağılımı
data_clean %>% 
  count(type) %>%
  ggplot(aes(x = type, y = n, fill = type)) +
  geom_col(show.legend = TRUE) +
  labs(
      title = "Netflix'teki Film ve Dizi Sayısı",
      x = "İçerik Türü",
      y = "Sayı"
  ) +
  theme_minimal()

#En Yaygın Yayınlanma Süresi (duration)
data_clean %>%
  count(duration, sort = TRUE) %>%
  head(10) %>%
  ggplot(aes(x = reorder(duration, n), y = n)) +
  geom_col() +
  coord_flip() +
  labs(
      title = "En Yaygın Yayın Süreleri",
      x = "Süre",
      y = "Sayı"
  ) +
  theme_minimal()

# Hangi Aktör En Fazla İçerikte Yer Almış?
data_clean %>%
  filter(!is.na(cast)) %>%
  separate_rows(cast, sep = ",") %>%
  count(cast, sort = TRUE) %>%
  slice_max(n, n = 10) %>%
  ggplot(aes(x = reorder(cast, n), y = n)) +
  geom_col() +
  coord_flip() +
  labs(
      title = "En Çok Yer Alan Oyuncular",
      x = "Oyuncu",
      y = "İçerik Sayısı"
  ) +
  theme_minimal()

# Netflix'te Son Yıllarda Ne Değişti?
icerik_yil %>%
  filter(release_year >= 2015) %>%
  ggplot(aes(x = release_year, y = icerik_sayisi)) +
  geom_line() +
  geom_point() +
  labs(title = "2015 Sonrası Netflix İçerik Sayısı",
       x = "Yıl", y = "İçerik Sayısı") +
  theme_minimal()

  