# Gün 3 bölüm 1: Stokastik modeller 

<div style="background: #f8f9fa; padding: 0.5rem 1rem; border-radius: 8px; margin-bottom: 1rem; border-left: 4px solid #007bff;">
<a href="../../index.ipynb" style="text-decoration: none; color: #007bff; font-weight: bold;">← Kurs İndeksine Geri Dön</a> | 
<a href="../../index-tr.ipynb" style="text-decoration: none; color: #dc3545; font-weight: bold;">🇹🇷 Türkçe İndeks</a>
</div>

---

Bu uygulamada stokastisite, salgın kalıcılığı ve sönme olasılığı hakkındaki bazı kavramları uygulayacağız. Bu amacı göz önünde bulundurarak binomial dağılımı ve R'de bir dağılımdan nasıl örneklem alabileceğimizi keşfederek başlayacağız.

## Neden binomial dağılıma ihtiyacımız var?

İstatistik ve olasılık teorisinde, belirli olay özelliklerini bir istatistiksel dağılımla ilişkilendirme eğilimindeyiz. Örneğin, popülasyon vücut ağırlığının Normal dağılımı takip ettiğini güvenle söyleyebiliriz. Normal dağılım süreklidir (ağırlığınız 74Kg veya 74.37kg olabilir ve dağılımın parçası olabilir) ve merkezi ölçü ile verinin yayılımını yansıtan ortalama ve standart sapma ile tanımlanır. Örneğin:

$$
Ağırlık \sim Normal(72.5,5)  
$$

In [None]:
x <- seq(40, 110, by = .5)

y <- dnorm(x, mean = 72, sd = 5)

plot(x,y,type = "l", xlab = "Ağırlık (kg)", ylab = "Olasılık")
lines(c(72,72),c(0,max(y)),col="red")


Öte yandan Binomial dağılım, bir dizi deneydeki başarı sayısının ayrık olasılık dağılımıdır. Bir madeni parayı birkaç kez atıp sonuç olarak kaç kez yazı tura atacağınızı saymayı düşünün. Binomial dağılım *n* (deneme sayısı) ve *p* (başarı olasılığı) parametrelerini alır. Madeni para atma örneğimizle devam edersek, madeni para adaletli ise başarı (tura alma) olasılığının %50 olduğunu söyleyebiliriz. Bu, madeni parayı yeterince atarsak başarı sayısının %50'ye yaklaşması gerektiği anlamına gelir.

Önemli olarak, 1 denemeli binomial deneylerden (madeni parayı sadece bir kez atmak) bahsettiğimizde *Bernoulli* denemelerinden bahsederiz. 1'den büyük denemeler için binomial dağılımdan bahsederiz.

R kullanarak bunu deneyelim. R'de, temel fonksiyon *rbinom* bu tür deneyleri hesaplamak için kullanılır. *rbinom*, gözlem sayısı için *n*, deneme sayısı için *size* ve başarı olasılığı için *prob* parametrelerini alır. Aşağıdaki kodu çalıştırın:

In [None]:
# Madeni parayı bir kez atalım (Bernoulli)
rbinom(n=1,size=1,prob=0.5)

# Şimdi 100 deneme yapalım
rbinom(n=1,size=100,prob=0.5)

a)  Madeni parayı 100 kez attığınızda kaç başarı elde ettiniz?

b)  Deneme sayınızı artırırsanız ne olur?

Ancak bu kurs için daha alakalı bir vakayı inceleyelim. Artık binomial dağılımı bildiğinize göre, binomial olasılığın enfeksiyon bulaşması süreciyle nasıl alakalı olduğunu görebilirsiniz. Şimdiye kadar önceki derslerimizde bulaşmanın en az üç faktöre bağlı olduğunu öğrendik:

Bulaşma olasılığı $$\beta $$, enfeksiyon yaygınlığı $$\frac{I}{N} $$ ve bulaştırıcılık döneminin süresi $$D $$.

Daha önce incelediğimiz gibi, herhangi bir zamandaki yeni enfeksiyon sayısı (*Y*) şu şekilde tanımlanabilir: $$
Y = S\frac{\beta I}{N}
$$ Burada *S* duyarlı birey sayısıdır. Deterministik bir bakış açısından, değişkenlerimiz ve parametrelerimiz aynı olduğu sürece, bu her zaman aynı sayıyı üretecektir. Ancak daha önce öğrendiğimiz gibi, enfeksiyon süreci rastgelelik içerir.

*Binomial* denemelerini geri getirmek için, enfeksiyon sürecimizi bu çerçeveye nasıl sığdırabileceğimizi görebiliriz. Belirli bir noktada, enfeksiyon yaygınlığı diyelim ki %10 ise ve *beta* = 0.2 olduğunu biliyorsak, enfeksiyon olasılığının 0.1 x 0.2 olduğunu söyleyebiliriz. Bu dağılımdaki deneme sayısı duyarlı sayıdır. Stokastik olayları hesaba katarak enfeksiyon sayısını tahmin etmek için aşağıdaki kodu uyarlamaya çalışın:

In [None]:
# Parametrelerimizi tanımla
R0 <- 2     # Temel üreme sayısı
gamma<- 0.1 # iyileşme oranı
beta<-  ?? # <- R0 formülünden beta'yı çıkarabilir misin?
prevalence <- 0.1 # Enfeksiyon yaygınlığı (I/N)
S <- 1000 # t zamanında duyarlı bireyler  

n_trials <- ? 
probability_of_infection<- ?  

# Yeni enfeksiyon sayısı Y'yi tahmin etmek için binomial dağılımdan çek 
Y<-rbinom(n=1,size= n_trials ,prob=probability_of_infection)  


Artık enfeksiyon sürecindeki stokastisite nasıl basit R komutlarıyla ifade edilebileceği hakkında daha iyi bir fikrimiz olduğuna göre, stokastik bir model formüle etmeyi deneyelim.

### *Teknik Parantez:*

Stokastik model R'de farklı yaklaşımlarla kodlanabilir. *Odin* adında bir paket kullanacağız. Bu amaç için diğer paketler veya hatta temel R kullanılabilir, ancak *Odin*'in bize ayrık stokastik sürecin yapısının çok düzgün bir görünümünü verdiğine inanıyorum (Odin paketi hakkında daha fazla bilgi için [buraya](https://mrc-ide.github.io/odin/index.html) bakın). 

## Stokastik model formüle etmek

Toplumunuzda yeni bir viral hastalık ("X" hastalığı) tanımlandı. Şimdiye kadar toplanan sürveyans verilerinden birkaç parametre tahmin edildi. Başlangıç R0'ı ~ 2 olarak tahmin edildi ve semptomların başlangıcından iyileşmeye kadar geçen sürenin ortalaması 8 gündür. "X" hastalığının önceki salgınlarında enfeksiyonla kazanılan bağışıklığın medyan ömrünün 3 ay olduğu da kaydedilmiştir.

Aşağıdaki kod bir SIR stokastik model tanımlar. 1. Boşlukları (*??* sembolü ile işaretlenmiş) doldurmaya çalışın ve stokastik olayların enfeksiyon sürecine nasıl dahil edildiğine dikkat edin:

In [None]:

library(odin)
library(ggplot2)
library(reshape2)

sir_generator <- odin::odin({
  ## Bölmeler arası geçişler için temel denklemler:
  update(S) <- S - n_SI + n_RS # Duyarlı
  update(I) <- I + n_SI - n_IR # Bulaştırıcı
  update(R) <- R + n_IR - n_RS # İyileşmiş
  
  ## Bireysel geçiş olasılıkları:
  p_SI <- 1 - exp(-beta * I / N) # S'den I'ye
  p_IR <- 1 - exp(-gamma)        # I'den R'ye
  p_RS <- 1 - exp(-delta)        # R'den S'ye
  
  ## Bölmeler arası değişen sayıları tanımlamak için binomial dağılımlardan çek:
  n_SI <- rbinom(S, p_SI) # Yeni enfeksiyonlar
  n_IR <- rbinom(I, p_IR) # Yeni iyileşenler 
  n_RS <- rbinom(R, p_RS) # Yeni bağışıklığını kaybedenler 
  
  ## Toplam popülasyon büyüklüğü
  N <- S + I + R
  
  # Beta'yı R0 terimleriyle tanımla
  beta <- ?? #<------------------------- Beta'yı R0 terimleriyle tanımlayabilir misin? 
  
  ## Başlangıç durumları:
  initial(S) <- S_ini
  initial(I) <- I_ini
  initial(R) <- 0
  
  ## Kullanıcı tanımlı parametreler - parantez içinde varsayılan:
  S_ini <- user()
  I_ini <- user()
  R0    <- user()
  gamma <- user()
  delta <- user()
  
}, verbose = FALSE)


Soru işaretleriyle boşlukları doldurduysanız, şimdi,

2.  Model parametrelerini tanımlayın ve sonuçları görmek için modelinizi çalıştırın.

In [None]:

sir_generator <- odin::odin({
  ## Bölmeler arası geçişler için temel denklemler:
  update(S) <- S - n_SI + n_RS # Duyarlı
  update(I) <- I + n_SI - n_IR # Bulaştırıcı
  update(R) <- R + n_IR - n_RS # İyileşmiş
  
  ## Bireysel geçiş olasılıkları:
  p_SI <- 1 - exp(-beta * I / N) # S'den I'ye
  p_IR <- 1 - exp(-gamma)        # I'den R'ye
  p_RS <- 1 - exp(-delta)        # R'den S'ye
  
  ## Bölmeler arası değişen sayıları tanımlamak için binomial dağılımlardan çek:
  n_SI <- rbinom(S, p_SI) # Yeni enfeksiyonlar
  n_IR <- rbinom(I, p_IR) # Yeni iyileşenler 
  n_RS <- rbinom(R, p_RS) # Yeni bağışıklığını kaybedenler 
  
  ## Toplam popülasyon büyüklüğü
  N <- S + I + R
  
  # Beta'yı R0 terimleriyle tanımla
  beta <- R0*gamma # Beta'yı R0 terimleriyle tanımlayabilir misin? 
  
  ## Başlangıç durumları:
  initial(S) <- S_ini
  initial(I) <- I_ini
  initial(R) <- 0
  
  ## Kullanıcı tanımlı parametreler - parantez içinde varsayılan:
  S_ini <- user()
  I_ini <- user()
  R0    <- user()
  gamma <- user()
  delta <- user()
  
}, verbose = FALSE)


In [None]:
# Parametreleri tanımla 
R0   <- ?? # R0
gamma<- ?? # iyileşme oranı
delta<- ?? # Bağışıklık kaybı oranı 
S0   <- 1000 # 0 zamanında duyarlı popülasyon
I0   <- 1    # 0 zamanında bulaştırıcı popülasyon

    
# Tanımlanan parametrelerle "sir" model nesnesi oluştur   
sir <- sir_generator$new(
  S_ini = S0,
  I_ini = I0,
  R0    = R0,
  gamma = gamma,
  delta = delta)

# Rastgele sayı üretimi için seed ayarla (R standardı)
set.seed(1)

# SIR modelimizi iki yıllık bir dönem için çalıştır (gün adımlarında)
t_end<- 365 * 2
sir_res <- sir$run(0:t_end)

# Model çıktısına bir bakış at 

head(sir_res)


# Modelimizi çizdir

sir_col <- c("Navyblue", "orangered2", "darkgreen") # Çizim renkleri

days <- sir_res[, 1] # çizimimiz için zaman vektörünü tanımla 

matplot(days, sir_res[, -1], xlab = "Günler", ylab = "Birey sayısı",
        type = "l", col = sir_col, lty = 1)
legend("topright", lwd = 1, col = sir_col, legend = c("S", "I", "R"), bty = "n")


Modelinizi çalıştırdıktan sonra şimdi bir çizim görmelisiniz.

In [None]:
# Parametreleri tanımla 
R0   <- 2 # R0  
gamma<- 1/8 # iyileşme oranı
delta<- 1/90 # Bağışıklık kaybı oranı 
S0   <- 1000 # 0 zamanında duyarlı popülasyon
I0   <- 1    # 0 zamanında bulaştırıcı popülasyon

    
# Tanımlanan parametrelerle "sir" model nesnesi oluştur   
sir <- sir_generator$new(
  S_ini = S0,
  I_ini = I0,
  R0    = R0,
  gamma = gamma,
  delta = delta)

# Rastgele sayı üretimi için seed ayarla (R standardı)
set.seed(1)

# SIR modelimizi iki yıllık bir dönem için çalıştır (gün adımlarında)
t_end<- 365 * 2
sir_res <- sir$run(0:t_end)

# Modelimizi çizdir

sir_col <- c("Navyblue", "orangered2", "darkgreen") # Çizim renkleri

days <- sir_res[, 1] # çizimimiz için zaman vektörünü tanımla 

matplot(days, sir_res[, -1], xlab = "Günler", ylab = "Birey sayısı",
        type = "l", col = sir_col, lty = 1)
legend("topright", lwd = 1, col = sir_col, legend = c("S", "I", "R"), bty = "n")


Stokastik bir süreç sunduğumuz için her model çalıştırması farklı olacaktır. Sonuçların nasıl değiştiğini görmek için bu aynı kodu birkaç kez çalıştırmayı deneyin.

Salgın kalıcılığı hakkındaki dersimizden, sönme olasılığının daha olası hale geldiği bir eşiği kabaca tahmin edebileceğimizi hatırlayabilirsiniz.

3.  Aşağıdaki kodda bu eşiği tanımlamaya çalışın ve enfeksiyonlarınızı bu eşiğe karşı çizilmiş olarak görmek için modelinizi tekrar çizin

In [None]:
# Bir eşik tanımla

Y_limit <- ?? ### <------------- Boşluğu doldur 
  # İpucu: bunu popülasyon büyüklüğü açısından nasıl tanımlayacağınız için ders slaytlarına bakın

# Modelimizi çizdir

sir_col <- c("Navyblue", "orangered2", "darkgreen") # Çizim renkleri

days <- sir_res[, 1] # çizimimiz için zaman vektörünü tanımla 

matplot(days, sir_res[, 3], xlab = "Günler", ylab = "Birey sayısı",
        type = "l", col = "orangered2", lty = 1)
lines(c(0,365*2),c(Y_limit,Y_limit), col="black")
legend("topright", lwd = 1, col = "Orangered2", legend = c("I"), bty = "n")


In [None]:
# Bir eşik tanımla

Y_limit <- sqrt(1001) # İpucu ders slaytlarına bak 

# Modelimizi çizdir

sir_col <- c("Navyblue", "orangered2", "darkgreen") # Çizim renkleri

days <- sir_res[, 1] # çizimimiz için zaman vektörünü tanımla 

matplot(days, sir_res[, 3], xlab = "Günler", ylab = "Birey sayısı",
        type = "l", col = "orangered2", lty = 1)
lines(c(0,365*2),c(Y_limit,Y_limit), col="black")
legend("topright", lwd = 1, col = "Orangered2", legend = c("I"), bty = "n")


4.  Zaman içinde enfeksiyonların trendi hakkında ne söyleyebilirsiniz?
5.  Bu analizi R0 = 1.1 değeri ve R0 = 4 için yeniden üretmeyi deneyin. Ne gözlemliyorsunuz?
6.  R0=2 kullanarak, ortalama 1 yıllık bağışıklık kaybını varsaymak için delta değerini değiştirebilir misiniz? Ne gözlemliyorsunuz ve böyle bir davranışı açıklayabilir misiniz?

*odin* paketinin başka bir özelliğini kullanarak modelimizin birçok eşzamanlı gerçeklemesini aynı anda çalıştırabiliriz.

7.  Aşağıdaki kodda modelimizi 100 kez çalıştıracağız ve sonuçlarını çizeceğiz

In [None]:
# Model çalıştırmamızı 100 kez tekrarlamak için replicate kullan
sir_100 <- sir$run(0:t_end, replicate = 100)
# res_200 <- sir$transform_variables(res_200)
# res_200 <- cbind.data.frame(t = res_200[[1]], res_200[-1])

matplot(sir_100[, 1,],sir_100[, 3,], xlab = "Günler", ylab = "Enfeksiyon sayısı",
        type = "l", lty = 1, col="grey")
lines(c(0,t_end),c(Y_limit,Y_limit),type="l", col="red") 
legend("topright", lwd = 1, col = "grey", legend = c("I"), bty = "n")


Aynı model için bir dizi tekrarlama veya simülasyonumuz olduğu için mevcut model parametreleri için salgın sönmesi olasılığını tahmin edebiliriz. Bunu, simülasyon zamanının sonunda bu Enfeksiyon yörüngesinden kaçının sıfıra eşit olduğuna bakarak yapabiliriz.

8.  Sönme olasılığını tahmin etmek için aşağıdaki kodu kullanın.
9.  Model parametrelerinizi R0=4.5'e ve sonra R0 = 1'e değiştirin ve bu değeri yeniden tahmin edin

In [None]:
# Burada p. sönme bulmak için kullanıcı tanımlı bir fonksiyon oluşturuyoruz
prob_extinct<-function(results,t_end){
  
  n_extinct<-length(which(results[t_end,3,]==0)) # sıfırla biten simülasyonları bul
  n_runs   <-length(results[1,1,])
  
  return(prob_extinction=n_extinct/n_runs) 
}

# yeni tanımlanan fonksiyonu çağır, model sonuçları nesnemizi ve zaman uzunluğunu geç
prob_extinct(sir_100,t_end)