Skip to content

mervebagislar/Cyber-Attack-Detection

Repository files navigation

🛡️ Makine Öğrenmesi ile Siber Saldırı Tespiti

Bu repository, ağ trafiği verileri kullanılarak makine öğrenmesi algoritmaları ile siber saldırı tespiti yapılmasını amaçlayan akademik bir çalışmayı içermektedir. Çalışmada, geçmiş saldırı davranışlarından öğrenilerek olası siber tehditlerin doğru şekilde tahmin edilmesi hedeflenmiştir.


📌 Proje Özeti

  • Ağ trafiği verileri üzerinden siber saldırı tespiti
  • Denetimli makine öğrenmesi algoritmalarının kullanımı
  • Farklı modellerin performans karşılaştırması
  • İstatistiksel ve görsel değerlendirme yöntemleri
  • Özellik seçimi ve model optimizasyonu

📊 Veri Seti

  • Toplam 45 ağ trafiği özelliği
  • Eğitim ve test verileri birleştirilerek kullanılmıştır
  • İkili sınıflandırma (Saldırı / Normal)
  • İçerilen saldırı türleri:
    • Fuzzers
    • Analysis
    • Backdoors
    • DoS
    • Exploits
    • Generic
    • Reconnaissance
    • Shellcode
    • Worms

🧹 Veri Ön İşleme

  • Eğitim ve test veri setlerinin birleştirilmesi
  • Gereksiz sütunların kaldırılması
  • Kategorik değişkenlerin label encoding ile dönüştürülmesi
  • Saldırı türlerinin görselleştirilmesi
  • Verinin %70 eğitim – %30 test olacak şekilde bölünmesi

🤖 Kullanılan Modeller

Aşağıdaki makine öğrenmesi algoritmaları uygulanmış ve karşılaştırılmıştır:

  • Decision Tree
  • Random Forest
  • K-Nearest Neighbors (KNN)
  • XGBoost
  • LightGBM

Her model için uygun hiperparametre ayarlamaları yapılmıştır.


📈 Performans Değerlendirme Ölçütleri

Modeller aşağıdaki metrikler kullanılarak değerlendirilmiştir:

  • Accuracy (Doğruluk)
  • Precision (Kesinlik)
  • Recall (Hassasiyet)
  • Specificity (Özgüllük)
  • Confusion Matrix
  • ROC Eğrisi ve AUC

Ayrıca modeller arasında anlamlı fark olup olmadığını incelemek için Wilcoxon testi uygulanmıştır.


🏆 Deneysel Sonuçlar

  • Random Forest, en yüksek performansı göstermiştir:
    • Doğruluk ≈ %95
    • Hassasiyet ≈ %96
  • Özellik önem analizi ile en kritik ağ parametreleri belirlenmiştir
  • Daha az özellik kullanılarak da yüksek doğruluk elde edilmiştir

🔍 Özellik Analizi

  • Sayısal özellikler için korelasyon analizi yapılmıştır
  • En önemli 20 ve 10 özellik görselleştirilmiştir
  • Seçilen özelliklerle modeller yeniden eğitilmiştir

📌 Sonuç ve Değerlendirme

  • Makine öğrenmesi algoritmaları siber saldırı tespitinde yüksek başarı sağlamaktadır
  • Veri ön işleme ve özellik seçimi model performansını doğrudan etkilemektedir
  • Random Forest, doğruluk ve kararlılık açısından en başarılı model olmuştur
  • Çalışma, akıllı siber güvenlik sistemleri için uygulanabilir bir temel sunmaktadır

About

This study focuses on detecting cyber attacks by analyzing 45 network traffic and user behavior features. KNN, Decision Tree, and Random Forest models were trained and evaluated using real attack data to ensure robustness and reliable detection performance.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors