BİLDİRİ DETAY

Tuğba TUĞ KAROĞLU, Hayrettin OKUT
BAGGING YÖNTEMİ İLE SINIFLANDIRMADA DEĞİŞKENLERİN TAHMİNLEME ÜZERİNE ETKİSİ
 
Bootstrap ve Aggregation'ın kısaltılmış hali olan Bagging, orijinal veri setlerinden yeniden örneklendirilerek ortaya çıkarılan ve bootstrap tarafından farklı eğitim veri setleri tarafından eğitilen sınıflandırıcıları, en son elde edilen sonuçlar olarak bir araya getirir ve optimizasyon işlemi kullanılarak bagging algoritmasının sadeleştirilmesiyle elde edilen en uygun bir ensemble modeli elde edilir (Zeng ve ark. 2010). Bu çalışmada; 2010-2013 yılları arasında 81 ilden alınan değişkenlerin Bagging yöntemi ile sınıflandırmasını yaparken değişkenlerin tahminleme üzerine etkisi incelenmiştir. Bagging algoritmasının tahminleme yeteneğini değerlendirmek amacıyla, veri seti eğitim ve test şeklinde ikiye bölünmüştür. Bu amaçla, 2010-2012 yılları arasındaki veriler eğitim (training) verileri olarak kullanılırken 2013 verileri ise test (testing) verileri olarak kullanılmıştır. Çalışmada 1'den 11'e kadar kodlanmış olan özellikler; okul sayısı "1", öğretmen sayısı "2", öğrenci sayısı "3", YGS'ye giren öğrenci sayısı "4", okullaşma oranı "5", işsizlik oranı "6", istihdam oranı "7", okuma yazma bilmeyen sayısı "8", üniversite mezunu sayısı "9", YGS'de 180 ve üstü puan alarak yerleşen öğrenci sayısı "10" ve 180 ve üstü puan alan öğrenci sayısı "11" olarak ifade edilmiştir. En güçlü özellikleri kullanmak, tahmin gücünü arttırmak bagging algoritması için önemli bir strateji olmaktadır. Tahminlemede 11. özellik olarak nitelendirilen 180 ve üstü puan alan öğrenci sayısı diğer özelliklerden daha etkili olmuştur. Bu özellikten sonra sırasıyla 3. özellik olan öğrenci sayısı ve 2. özellik olan öğretmen sayısı sınıflandırmada etkili olan özelliklerdir. En az etkili olan özellik ise 7. özellik olarak ifade edilen istihdam oranı ve sonrasında da 1. özellik olarak ifade edilen okul sayısı değişkeni olmuştur.

Anahtar Kelimeler: Bagging, Botstrap, Ensemble Model



 


Keywords: