**Seçilen Proje**

Bu proje, insansız hava araçlarının (UAV'lerin) tespiti için bir sınıflandırma modeli geliştirmeyi amaçlamaktadır. Projede kullanılan veri seti, 33,100 adet UAV görüntü içeren kendi veri setimden seçilmiştir. UAV olmayan görüntüler, projenin gereksinimlerine uygun olarak özenle seçilmiş ve temsil edici bir veri seti elde etmek için kullanılmıştır.(UAV olmayan görüntü validasyon 151 ve train 377 ; UAV olan görüntü 177 validasyon  ve 1061 train)

Modelin eğitiminde evrişimli sinir ağı (CNN) mimarisi tercih edilmiştir. CNN, görüntülerden özelliklerin çıkarılması ve sınıflandırma işleminin gerçekleştirilmesinde etkili bir yapısıyla öne çıkmaktadır. Geliştirilen model, eğitim verileri üzerinde başarılı bir şekilde eğitilmiş ve ardından doğrulama verileri üzerinde test edilmiştir.

Veri seti oluşturma sürecinde, Savaşan İHA Yarışması için eğittiğimiz YOLO (You Only Look Once) modeline video verileri verilerek otomatik olarak veri seti oluşturulmuştur. Bu yöntem, geniş veri setleri gerektiren projelerde veri seti oluşturmayı kolaylaştırmış ve süreci hızlandırmıştır.

Sonuç olarak, bu projenin amacı, UAV tespiti için etkili bir sınıflandırma modeli geliştirmektir. Ancak, temsili veri setinin yeterli kalitede olmamasından dolayı model yeterli başarıyı gösterememiştir. Gelecekteki çalışmalarda, modelin daha geniş ve daha temsilci veri setleri üzerinde test edilmesi ve performansının daha da iyileştirilmesi hedeflenmektedir.

**Seçilen Yöntem**

Sınıflandırma projesi için UAV (Unmanned Aerial Vehicle - Insansız Hava Aracı) aracının resimde olup olmadığını tespit etmeyi amaçlayan bir projeyi seçtim.
Bunun için görsel verilerde en çok tercih edilen yöntem olan CNN kullanmaya karar verdim.


CNN'ler, özellikle görüntü işlemede başarılı olan bir yapay sinir ağı türüdür. Bu model, resimde uçak olup olmadığını belirlemek için eğitildi. Eğitim sırasında model, uçak içeren ve içermeyen resimler içeren bir veri kümesini kullanarak öğrendi. Model, resimlerdeki desenleri ve özellikleri tanımak için farklı evrişim katmanları ve havuzlama katmanlarından oluşur. Son olarak, model, resimdeki desenleri analiz ederek ve öğrendiği bilgileri kullanarak resmin uçak içerip içermediğini tahmin eder.

1. Yüksek Başarı Oranı: CNN'ler, özellikle görüntü sınıflandırma gibi karmaşık görevlerde yüksek başarı oranları sağlar. Bu nedenle, uçak sınıflandırması gibi görüntü temelli bir sorun için en uygun seçenek olarak tercih edilmiştir.
2. Özellik Çıkarma Yeteneği: CNN'ler, verilerdeki özellikleri otomatik olarak çıkarabilir. Bu özellik, el ile özellik mühendisliği yapmak zorunda kalmadan karmaşık görsel özellikleri tanımlamamıza olanak tanır.
3. Ölçeklenebilirlik: CNN'ler genellikle büyük veri setlerinde iyi performans gösterir ve eğitilmesi ve kullanılması kolaydır.
4. Uygunluk: Veri setinin yapısı ve problem alanının doğası, CNN'lerin kullanılmasını gerektirebilir. Örneğin, görüntü sınıflandırma problemleri, görüntüler arasındaki karmaşık ilişkileri tanımlamak için CNN'leri gerektirebilir.


**CNN Nedir ?**

CNN'ler, Evrişimli Sinir Ağları olarak da bilinir ve özellikle görüntü işleme alanında başarılıdır. Standart yapay sinir ağlarından farklı olarak, CNN'ler görüntü verilerini daha etkili bir şekilde işleyebilen özel bir mimariye sahiptir.

CNN'lerin temel yapı taşı "evrişim" (convolution) katmanıdır. Bu katman, girdi görüntü üzerinde belirli bir filtre matrisini kaydırarak (convolution işlemi) girdi verisinden özellik haritaları çıkarır. Bu sayede, görüntünün çeşitli özellikleri (kenarlar, köşeler, desenler vb.) fark edilir.

Ardından, "havuzlama" (pooling) katmanı gelir. Bu katman, özellik haritalarını küçültür ve önemli özellikleri vurgular. Bu işlem, ağın daha hızlı öğrenmesini ve daha az hesaplama yapmasını sağlar.

CNN'ler genellikle bu evrişim ve havuzlama katmanlarının tekrarı ile oluşturulur. Daha sonra, tam bağlantılı (fully connected) katmanlar gelir. Bu katmanlar, özellikleri sınıflara (uçak, araba, vb.) karşılık gelen çıktılarla ilişkilendirir. Eğitim sırasında, ağ, doğru sınıflandırmayı yapabilmek için girdi verileriyle ağırlıklarını ayarlar.

Sonuç olarak, CNN'ler, görüntü verilerinden özellikleri çıkararak ve bu özellikleri kullanarak sınıflandırma yapabilen güçlü ve etkili sinir ağı modelleridir.

**Projede Kullanacağım Derin Öğrenme Kütüphanesi PYTORCH'un Eklenmesi**

In [26]:
import torch.optim as opt
import torch.nn.functional as F
import torch.nn as nn
import torch

# **MODELİN OLUŞTURULMASI VE EĞİTİME HAZIRLIK**

**MODEL GÖRSELİ**

<img src="model.png">

**Model Katman Çıktıları :**
* conv1: 1 kanal girişi (grayscale), 30 filtre, çekirdek boyutu 7x7, adım (stride) 2, dolgu (padding) 3 kullanılarak hesaplanır. Bu durumda çıktı boyutu şöyle olur: 64 (batch size) x 30 (filtre sayısı) x 112 x 112.
* pool1: Max pooling işlemi uygulandığında, çıktı boyutu 64 x 30 x 55 x 55 olur.
* conv2: 30 kanal girişi, 60 filtre, çekirdek boyutu 1x1, adım 2 kullanılarak hesaplanır. Bu durumda çıktı boyutu şöyle olur: 64 x 60 x 28 x 28.
* pool2: Max pooling işlemi uygulandığında, çıktı boyutu 64 x 60 x 14 x 14 olur.
* conv3: 60 kanal girişi, 120 filtre, çekirdek boyutu 1x1 kullanılarak hesaplanır. Bu durumda çıktı boyutu şöyle olur: 64 x 120 x 14 x 14.
* pool3: Max pooling işlemi uygulandığında, çıktı boyutu 64 x 120 x 7 x 7 olur.
* conv4: 120 kanal girişi, 240 filtre, çekirdek boyutu 1x1 kullanılarak hesaplanır. Bu durumda çıktı boyutu şöyle olur: 64 x 240 x 7 x 7.
* fc1: Tam bağlı (fully connected) katman, 11760 boyutunda bir girişi alır ve 5000 boyutunda bir çıktı üretir.
* fc2: 5000 boyutundaki girişi alır ve 1000 boyutunda bir çıktı üretir.
* fc3: 1000 boyutundaki girişi alır ve 500 boyutunda bir çıktı üretir.
* fc4: 500 boyutundaki girişi alır ve 250 boyutunda bir çıktı üretir.
* fc5: 250 boyutundaki girişi alır ve 5 boyutunda bir çıktı üretir.

In [27]:
class Network(nn.Module):
    def __init__(self):
        super().__init__()

        self.conv1 = nn.Conv2d(1,30,kernel_size=7,stride=2,padding=3) 
        self.pool1 = nn.MaxPool2d(kernel_size=3,stride=2)

        # transition layer 1 ->
        self.conv2 = nn.Conv2d(30,60,kernel_size=1,stride=2) 
        self.bn2 = nn.BatchNorm2d(60)
        self.conv2_drop = nn.Dropout2d()
        self.pool2 = nn.MaxPool2d(kernel_size=2,stride=2)


        # transition layer 2 ->
        self.conv3 = nn.Conv2d(60,120,kernel_size=1)
        self.bn3 = nn.BatchNorm2d(120)
        self.conv3_drop = nn.Dropout2d()
        self.pool3 = nn.MaxPool2d(kernel_size=2,stride=2)

        # transition layer 3 ->
        self.conv4 = nn.Conv2d(120,240,kernel_size=1)
        self.bn4 = nn.BatchNorm2d(240)
        self.conv4_drop = nn.Dropout2d()
        

        # classification layer->
        self.fc1 = nn.Linear(11760, 5000)
        self.fcDout = nn.Dropout()
        self.fc2 = nn.Linear(5000, 1000)

        self.fc3 = nn.Linear(1000, 500)

        self.fc4 = nn.Linear(500, 250)
        self.fc5 = nn.Linear(250, 2)

    def forward(self, x):

        # starting layer ->
        x = self.conv1(x)
        x = self.pool1(x)
        x = torch.relu(x)

        # transition layer 1 ->
        x = self.conv2(x)
        x = self.bn2(x)
        x = self.conv2_drop(x)
        x = self.pool2(x)
        x = torch.relu(x)  

        # transition layer 2 ->
        x = self.conv3(x)
        x = self.bn3(x)
        x = self.conv3_drop(x)
        x = self.pool3(x)
        x = torch.relu(x)

        # transition layer 3 ->
        x = self.conv4(x)
        x = self.bn4(x)
        x = self.conv4_drop(x)
        x = torch.relu(x)

        x = x.view(-1, 11760) 

        # Lineer katmanların çıkışını hesapla
        x = self.fc1(x)
        x = torch.relu(x)
        x = self.fcDout(x)
        x = self.fc2(x)
        x = torch.relu(x)
        x = self.fcDout(x)
        x = self.fc3(x)
        x = torch.relu(x)
        x = self.fcDout(x)
        x = self.fc4(x)
        x = torch.relu(x)
        x = self.fcDout(x)
        x = self.fc5(x)


        return torch.log_softmax(x, dim=1)

**VERİ SETİMİZİN PYTHORCH İÇİN TENSÖR HALİNE GETİRİLMESİ**

In [28]:
import torch
from torch.utils.data import Dataset, DataLoader
import numpy as np

class data(Dataset):
    def __init__(self,dataset):

        data = np.loadtxt(f'{dataset}.csv', delimiter=',')
        self.veriler = data[:, 2:]
        self.hedefler = data[:, 0:2]

    def __len__(self):
        return len(self.veriler)

    def __getitem__(self, idx):
    
        veri = torch.tensor(self.veriler[idx].reshape(-1, 240, 240)).float()
        hedef = torch.tensor(self.hedefler[idx]).float()


        return veri, hedef

**EĞİTİM PARAMETRELERİ**



* **MOMENTUM** : SGD optimizasyon algoritmasının güncelleme adımlarında ne kadar
geçmiş gradyan bilgisini kullanacağını kontrol eden bir parametredir. Yüksek momentum değerleri, daha fazla geçmiş gradyan bilgisini kullanır ve bu da optimizasyon sürecinde daha az salınım ve daha düzgün bir güncelleme yolu sağlayabilir
* **EPOCHS** : Modelin tüm veri kümesi üzerinde kaç kez eğitileceğini belirten epoch sayısı
* **Batch Size** : Test verilerinin kaçarlık gruplar halinde kullanılacağını belirten batch boyutu
* **Learning Rate** : Öğrenme oranı









In [29]:
n_epochs = 40  
batchSizeTrain = 128  
batchSizeTest = 128
learning_rate = 0.001 
momentum = 0.99

**MODELİN EĞİTİM SIRASINDA GÖSTERDİĞİ HATA VE BAŞARI MİKTARLARININ GRAFİKLEŞTİRİLMESİ İÇİN LİSTELER OLUŞTURULDU**

In [30]:
lossL = []
train_Accuracy = []

**MODELİN EĞİTİLECEĞİ BİRİM**

EĞİTİMİ CPU YADA GPU (CUDA) İLE EĞİTEBİLİRİZ
EĞİTİM SIRASINDA CUDA KULLANILMASI İŞLEMLERİN EKRAN KARTININ İŞLEM GÜÇÜNDEN FAYDALANARAK İŞLEMLERİN HIZLANMASINI SAĞLAR

In [31]:
device = "cpu"

In [32]:
trainLoader = DataLoader(data("__dataset__"), batch_size=batchSizeTrain, shuffle=True)

testLoader = DataLoader(data("__dataset_valid__"), batch_size=batchSizeTrain, shuffle=True)

In [33]:
myModel=Network().to(device)
print(myModel)

Network(
  (conv1): Conv2d(1, 30, kernel_size=(7, 7), stride=(2, 2), padding=(3, 3))
  (pool1): MaxPool2d(kernel_size=3, stride=2, padding=0, dilation=1, ceil_mode=False)
  (conv2): Conv2d(30, 60, kernel_size=(1, 1), stride=(2, 2))
  (bn2): BatchNorm2d(60, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
  (conv2_drop): Dropout2d(p=0.5, inplace=False)
  (pool2): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
  (conv3): Conv2d(60, 120, kernel_size=(1, 1), stride=(1, 1))
  (bn3): BatchNorm2d(120, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
  (conv3_drop): Dropout2d(p=0.5, inplace=False)
  (pool3): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
  (conv4): Conv2d(120, 240, kernel_size=(1, 1), stride=(1, 1))
  (bn4): BatchNorm2d(240, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
  (conv4_drop): Dropout2d(p=0.5, inplace=False)
  (fc1): Linear(in_features=11760, out_features=5000, bias

**OPTİMİZER NEDİR ?**

Optimizer, bir makine öğrenimi modelinin eğitim sürecinde kullanılan bir algoritmadır. Bu algoritma, modelin ağırlıklarını güncellemek için kullanılır ve kayıp fonksiyonunu minimize ederek modelin doğru sonuçları üretmesini sağlar. Optimizasyon algoritmaları, öğrenme oranı, momentum ve düzenleme gibi teknikleri kullanarak modelin daha hızlı öğrenmesini, aşırı uyumu azaltmasını ve daha iyi genelleme yapmasını sağlar. Doğru optimizer seçimi, modelin daha iyi performans göstermesini ve daha iyi sonuçlar elde etmesini sağlayabilir.

**Stokastik gradyan iniş (SGD) Seçilme Sebebi**

* Hızlı Öğrenme: Momentum, gradyan inişindeki dalgalanmaları azaltarak daha hızlı bir öğrenme sağlayabilir. Bu, konverjansı hızlandırabilir ve eğitim süresini kısaltabilir.
*Daha İyi Genelleme: Momentum, ağırlık güncellemelerini daha düzenli hale getirerek aşırı uyumu (overfitting) azaltabilir. Bu, modelin genel olarak daha iyi performans göstermesini sağlayabilir.
*Daha İyi Minimumlar: Momentum, yerel minimumlere sıkışmadan önce daha geniş alanları keşfetmeye yardımcı olabilir. Bu, modelin daha iyi, daha geniş minimumlara ulaşmasını sağlayabilir.
*Daha İyi Gradient Descent Performansı: Momentum, gradient desent sırasında yakalanabilecek yerel optimumlere karşı daha dirençli bir yapı oluşturabilir.
*Parametrelerin Daha İyi Ayarlanması: Momentum, öğrenme oranını daha etkili bir şekilde ayarlamanıza olanak tanır. Bu, öğrenme sürecini daha verimli hale getirebilir.

In [34]:
optimizer = opt.SGD(myModel.parameters(), lr=learning_rate, momentum=momentum) # ağırlık güncellemesi

# **EĞİTİM AŞAMASI**

In [35]:
myModel.train()

Network(
  (conv1): Conv2d(1, 30, kernel_size=(7, 7), stride=(2, 2), padding=(3, 3))
  (pool1): MaxPool2d(kernel_size=3, stride=2, padding=0, dilation=1, ceil_mode=False)
  (conv2): Conv2d(30, 60, kernel_size=(1, 1), stride=(2, 2))
  (bn2): BatchNorm2d(60, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
  (conv2_drop): Dropout2d(p=0.5, inplace=False)
  (pool2): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
  (conv3): Conv2d(60, 120, kernel_size=(1, 1), stride=(1, 1))
  (bn3): BatchNorm2d(120, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
  (conv3_drop): Dropout2d(p=0.5, inplace=False)
  (pool3): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
  (conv4): Conv2d(120, 240, kernel_size=(1, 1), stride=(1, 1))
  (bn4): BatchNorm2d(240, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
  (conv4_drop): Dropout2d(p=0.5, inplace=False)
  (fc1): Linear(in_features=11760, out_features=5000, bias

In [36]:
for e in range(n_epochs):
    print(e+1)
    for batch,target in trainLoader:
    
        optimizer.zero_grad() #Gradientleri sıfırla
        o=myModel.forward(batch.to(device))
        
        loss = F.cross_entropy(o, torch.argmax(target, dim=1).to(device))# cross entropy çok boyutlu targetlarda kullanılır
        loss.backward()
        optimizer.step() # ağırlık güncellemesi
        lossL.append(loss)
    correct = 0
    for batch,target in testLoader:

            o=myModel.forward(batch.to(device))

            pred = o.data.max(1, keepdim=True)[1]

            correct += pred.eq(torch.argmax(target, dim=1).to(device).data.view_as(pred)).sum()

    train_Accuracy.append(correct)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40


**VALİDASYON VERİ SETİ EĞİTİLMİŞ VERİ SETİNE VERİLİR VE BAŞARI YÜZDESİ GÖSTERİLİR**

In [37]:
#Test
myModel.eval()
testLoss = 0
correct = 0
for batch,target in testLoader:
        o=myModel.forward(batch.to(device))
        pred = o.data.max(1, keepdim=True)[1]
        correct += pred.eq(torch.argmax(target, dim=1).to(device).data.view_as(pred)).sum()
testLoss /= len(testLoader.dataset)
print('\nTest set: Accuracy: {}/{} ({:.0f}%) - lr : {}\n'.format(
    correct, len(testLoader.dataset),
    100. * correct / len(testLoader.dataset),learning_rate))


Test set: Accuracy: 165/328 (50%) - lr : 0.001



**EĞİTİM AŞAMASINDAKİ HATA VE BAŞARI GRAFİKLERİ**

In [38]:
from torch.utils.tensorboard import SummaryWriter
writer = SummaryWriter()
for n_iter in range(len(train_Accuracy)):

    writer.add_scalar('Accuracy/train', train_Accuracy[n_iter], n_iter)

for n_iter in range(len(lossL)):

    writer.add_scalar('Loss/train', lossL[n_iter], n_iter)

<img src="Ekran Alıntısı.png">

<img src="Ekran Alıntısı2.png">