BİLDİRİ DETAY

Tuğba TUĞ KAROĞLU, Hayrettin OKUT
BAGGING YÖNTEMİNDE YAPRAK SAYISI İLE HATA KARELER ORTALAMASI ARASINDAKİ İLİŞKİ
 
Ensemble modelleri arasında ilk uygulamaya alınan bagging yöntemidir. Bu yöntem; tekrarlı olarak iadeli şekilde öğrenim verilerinden örnek çekerek tahmin konusunda uygun ağacı önerir. Bagging yönteminde “n” adet örnekten oluşan eğitim setinden yine “n” örnekli bir eğitim seti; iadeli, rastgele seçimle üretilir. Bu durumda bazı eğitim örnekleri yeni eğitim kümesinde yer almazken (yaklaşık %33) bazıları birden fazla kez yer alırlar. Bundan dolayı bagging yöntemi, eğitim setinin rastgele olarak yeniden oluşturarak ayrı ayrı her bir sınıflandırıcının eğitimini gerçekleştirmesini sağlar. Veri setinin MATLAB istatistik yazılım programında Bagging algoritmasıyla sınıflandırma işlemleri gerçekleştirilmiştir. Veri setine göre başarı oranları yeniden hesaplanmış ve yeni hesaplanan değer, bağımlı değişken olarak göz önünde tutulmuştur. Buna göre ortalamanın üstü 1'e ve ortalamanın altı 0'a eşit olacak şekilde bağımlı değişken değerleri atanmıştır. Bagging algoritmasının tahminleme yeteneğini değerlendirmek amacıyla, veri seti eğitim ve test şeklinde ikiye bölünmüştür. Bu amaçla, 2010-2012 yılları arasındaki veriler eğitim (training) verileri olarak kullanılırken 2013 verileri ise test (testing) verileri olarak kullanılmıştır. Hata Kareler Ortalaması'nın yaprak sayısına göre nasıl değiştiği incelenmiştir. Regresyon için genel olarak yaprak sayısı 5 seçilir ve giriş bilgilerinin üçte biri rastgele seçilir. Bir sonraki adımda çeşitli yaprak sayısının gerilemesiyle elde edilen hatalar, optimal yaprak sayılarını karşılaştırarak doğrular. Grafik incelendiğinde hata kareler ortalamasının en düşük 5 yaprakta elde edildiği görülür. Genel olarak toplamda var olan 324 gözlem değerine ait, hata değerlerinin sıfıra yakın olduğu görülür. Fakat bazı verilerde çok büyük hataların olduğu açıktır ki bunlar aykırı değerlerdir.

Anahtar Kelimeler: Bagging, Botstrap, Ensemble Model, Hata Kareler Ortalaması



 


Keywords: