BİLDİRİ DETAY

Tuğba TUĞ KAROĞLU, Hayrettin OKUT
BAGGING ALGORİTMASI İLE BOOSTING ALGORİTMASININ PERFORMANSLARININ DEĞERLENDİRİLMESİ ÜZERİNE BİR ÇALIŞMA
 
Bagging ve boosting sınıflandırma için yaygın olarak kullanılan iki ensemble yöntemidir. Ortak amaçları, rastgele tahminden bir nebze daha iyi olan tekli sınıflandırıcıları birleştiren bir sınıflandırıcının doğruluğunu iyileştirmektir (Alafaro ve ark., 2013). Bu çalışmada kullanılan veri seti 2010- 2013 yılları arasında TÜİK(Türkiye İstatistik Kurumu) ve ÖSYM(Öğrenci Seçme ve Yerleştirme Merkezi) arşivinden alınarak; 2010-2013 yılları arasında 81 ilden alınan veri seti üzerinde yapılan Bagging ve Boosting yötemleriyle yapılan sınıflandırma işleminde her iki yöntemi karşılaştırarak performans değerlendirmesini yapılmıştır. Çalışmada önerilen yöntemlerin performansını göstermek için doğruluk, kesinlik, duyarlılık ve f-ölçütleri kullanılmıştır. Bu başarı ölçütleri aşağıdaki gibi hesaplanmaktadır. Doğruluk(Accuracy)=(TP+TN)/(TP+TN+FP+FN) Kesinlik(Precision)=TP/(TP+FP) Duyarlılık(Recall)=TP/(TP+FN) F-Ölçütü(F-Measure)=2(Duyarlılık*Kesinlik)/(Duyarlılık+Kesinlik) Bu denklemlerde T, F, P ve N; sırasıyla doğruyu, yanlışı, pozitifi ve negatifi ifade etmektedir. Doğruluk: Başarının tespiti için kullanılan en popüler ve basit yöntemdir ve bu oran doğru sınıflandırılmış (TP+TN) örnek sayısının, toplam örnek sayısına (TP+TN+FP+FN) oranı olarak tanımlanmaktadır. Kesinlik: Sınıflandırıcı sonucunun kesinlik derecesini verir. Pozitif olarak etkilenen örneklerin sayısının (TP) pozitif olarak sınıflandırılmış toplam örneklere (TP+FP) oranıdır. Duyarlılık: Pozitif olarak etiketlenmiş örneklerin (TP) gerçekten pozitif olan örneklerin (TP+FN) toplam sayısına oranıdır. F-Ölçütü: Kesinlik ve duyarlılık metrikleri kullanılarak hesaplanmaktadır. Sistemin, kesinlik veya duyarlılık yönüne doğru optimize edilmesinde kullanılmaktadır. Verilen sonuçlar göstermiştir ki, bütün performans ölçütlerinde marjinal olarak Boosting yöntemi Bagging yönteminden daha iyi sonuçlar üretmiştir. Örneğin ortalama olarak Bagging sınıflandırma metodu ile % 83.6 başarı oranı gözlenmiştir. Bagging ve Boosting karşılaştırmaları yapılırken Bagging için 1000 Bootstrap alarak yapılmıştır. Ancak, veri setinin büyük olmadığı bu tür uygulamalarda Bootstrap sayısı arttırılarak daha doğru bir karşılaştırma yapmak gerekmektedir.

Anahtar Kelimeler: AdaBoost, Bagging, Boosting, Ensemble Model



 


Keywords: