BİLDİRİ DETAY

Tuğba TUĞ KAROĞLU, Hayrettin OKUT
BOOSTING YÖNTEMİYLE YAPILAN SINIFLANDIRMADA ADABOOST ALGORİTMASININ DİĞER BOOSTING ALGORİTMALARINA ÜSTÜNLÜĞÜ ÜZERİNE BİR ÇALIŞMA
 
Boosting algoritması sınıflandırıcının bulmuş olduğu doğruluk değerini artırmaya çalışan bir yöntemdir. Veriye ait olan bir önceki sınıflandırıcının doğru olarak belirleyemediği veriler kullanılır ve hatalı veriler sonradan kullanılacak eğitim setine ilave edilerek daha doğru tahmin yapmaya çalışır (Schapire ve Freund, 2012). Boosting algoritmalarının pek çok versiyonu olmasına rağmen en iyi bilineni AdaBoost algoritmasıdır. Bu çalışmada amaç; 2010-2013 yılları arasında 81 ilden alınan veri seti üzerinde yapılan Boosting yötemiyle yapılan sınıflandırmada test kısmındaki çapraz geçerlik hatalatı ile ensemble miktarı arasındaki değişimi inceleyerek AdaBoost yönteminin LPBoost ve TotalBoost algoritmalarına göre üstünlüğünü incelemektir. Boosting algoritmasının tahminleme yeteneğini değerlendirmek amacıyla, veri seti eğitim ve test şeklinde ikiye bölünmüştür. Bu amaçla, 2010-2012 yılları arasındaki veriler eğitim (training) verileri olarak kullanılırken 2013 verileri ise test (testing) verileri olarak kullanılmıştır. Test kısmındaki (testing) çapraz geçerlilik hataları (cross validation error) ile ensemble miktarının değişimi görülür. Çapraz geçerlilik hata değeri en küçük olan algoritma boosting algoritmaları arasında en iyi olanıdır. Çapraz geçerlilik hata değerinin belirlenmesinde değişik kayıp fonksiyonları kullanılır ve kayıp fonksiyonuna bağlı olarak aynı verilerde farklı sonuçlara ulaşılabilir. Regresyon ve sınıflandırma esaslı boosting algoritmalarında test için kullanılan veri setindeki çapraz geçerlilik hataların küçük olması arzu edilir. Eğitim verileri ile ensemble büyüklüğü arasındaki hatalar üç ayrı boosting yöntemiyle incelendiğinde, hem test kısmındaki verilerde, hem de eğitim verilerinde, AdaBoost'un daha iyi sonuç verdiği görülmüştür. Total Boost ve LP Boost yöntemlerinde aşırı uyum başlamıştır, fakat AdaBoost yönteminde aşırı uyumu kontrol altına alan parametrenin varlığından dolayı aşırı uyum tehlikesine rastlanmamıştır.

Anahtar Kelimeler: AdaBoost, Boosting, Ensemble Model



 


Keywords: