BİLDİRİ DETAY

Ekin YENER, Vedide Rezan USLU
MALLOW’UN CP KRİTERİNE DAYALI DEĞİŞKEN SEÇİMİNİN GENETİK ALGORİTMA İLE BELİRLENMESİ
 
Giriş: Çoklu regresyon analizinin uygulama aşamasında araştırmacının aday bağımsız değişkenler için geniş bir havuzu vardır ve bunlardan yalnızca birkaçı gerçekten önemlidir. Model için uygun bağımsız değişken alt kümesinin bulunması değişken seçim problemi olarak adlandırılmaktadır. Çoklu regresyonda amaç, bağımlı değişkendeki toplam değişimi açıklayan en iyi açıklayıcı değişkenleri seçmek ve bu seçim esnasındada modelin boyutunu olabildiğince küçük tutmaktır. Değişken seçimi amacıyla kullanılan değişik yöntemler geliştirilmiştir. Bu yöntemlerden birisi olan Cp istatistiği, çoklu regresyonda farklı parametre sayılarına sahip aday modelleri karşılaştırırken en uygun modelin seçimi için geliştirilmiştir. Amaç: Veri çok sayıda açıklayıcı değişken içerdiği durumlarda tüm olası regresyonları yapmak çok zaman alıcı olduğundan Genetik algoritma ile Cp kriteri kullanarak en iyi modeli seçmek istedik. Yöntem: Cp istatistiği modelin hata kareler ortalamasına dayalı, Mallow tarafından önerilen bir kriterdir. Arama uzayının çok geniş olduğu durumlarda en iyi sonuca ulaşmak için geliştirilen algoritmalardan biri olan genetik algoritma, doğadaki canlıların geçirdiği süreci örnek alır. Genetik algoritma doğada en güçlü gene sahip bireyin hayatta kalıp kötü gene sahip bireyin yaşayamayacağı ilkesine dayanarak sürekli yenilenen çözümler üretir. Bu sayede istenilen en iyi çözüme ulaşılmış olur. Bulgular: Genetik algoritma yazılıp Cp kriteri amaç fonksiyonu olarak tanımlanmıştır. Çözüme çeşitlilik katmak için algoritmaya ait parametre oranları değiştirilerek program tekrarlanmıştır. Her modele ait düzeltilmiş R^2 değeri hesaplanmıştır. Seçilen modelin anlamlılığı test edilmiştir. Sonuç:Cp istatistiğinin beklenen değeri modeldeki parametre sayısına eşittir. Bu durum dikkate alınarak bulunan bütün olası çözümlerden Cp ile parametre sayısı arasında farkı en az, düzeltilmiş R^2 değeri en yüksek ve bütün katsayıları anlamlı olan model en iyi model olarak seçilmiştir.

Anahtar Kelimeler: Mallow’s Cp istatistiği, Genetik Algoritma, Değişken Seçimi



 


Keywords: