BİLDİRİ DETAY

Barış ERGÜL, Arzu ALTIN YAVUZ
ÇARPIK HATA DAĞILIMLI REGRESYONDA TAHMİN YÖNTEMLERİNİN KARŞILAŞTIRILMASI
 
Giriş: Çarpık dağılım ailesi, matematiksel işlem kolaylığı, normal dağılımı içermesi ve veri modellemesi için daha esnek yapıya sahip olması gibi sebeplerden dolayı son yıllarda sıklıkla kullanılmaktadır. Çarpık dağılım ailesi, genel yapıları itibari ile birikimli dağılım fonksiyonları ile dağılıma ait olasılık fonksiyonlarının çarpımı olarak ifade edilmektedir. Bu çalışmada çarpık dağılım ailesi kullanılmasının sebebi, normal dağılıma iyi bir alternatif olmasıdır. Çarpık dağılım ailesi, çarpıklıkları yanı sıra kalın kuyruklu olması sebebiyle dağılımda bulunan aykırı değerleri de modellemektedir. Yöntem: Regresyon analizi, değişkenler arasındaki fonksiyonel ilişkiyi belirlemede en çok kullanılan tekniklerden biridir. Bu analiz, değişkenler arasındaki ilişkiyi belirleyerek parametre kestirimini sağlayan istatistiksel bir tekniktir (David, 1981). Regresyon analizinde yaygın kullanıma sahip En Küçük Kareler (EKK) tekniği ile parametre tahminlerinin yapılabilmesi için temel bazı varsayımlar vardır. Bu varsayımlar genel olarak hata terimleri ile ilgilidir. Hata terimi bağımsız ve özdeş, ortalaması sıfır, varyansı olan normal dağılıma sahiptir. Bu varsayımların bozulması durumunda tutarlı olmayan ve yanlı tahminlere yol açılabilir (Mosteller ve Tukey, 1977). Ancak günümüzde elde edilen verilerin normal dağılıma sahip olmaması durumu ile sıklıkla karşılaşılmaktadır. Hata teriminin dağılımı normal olmadığında, kalsik yöntemlere alternatif olarak robust regresyon teknikleri kullanılmaktadır. Robust regresyon teknikleri, verinin büyük kısmından önemli derecede farklılık gösteren ve aykırı değer adı verilen değere karşı dirençli regresyon yöntemleridir. Özellikle normallik varsayımına karşı duyarsız yaklaşımlar “robust (sağlam)” olarak adlandırılmaktadır (Öztürk, 2003). Gözlem değerlerinin normallik varsayımını bozan en önemli etken büyük hata terimi olarak nitelendirilen aykırı değerlerdir. Aykırı değerler, istatistiksel tekniğe ve kurulan regresyon modeline zarar verirler. Robust regresyon teknikleri, aykırı değerlere diğer gözlem değerlerinden farklı ağırlıklar vererek, iteratif olarak çözüm vermektedir. Hata terimlerinin normal dağılıma sahip olmaması durumunda EKK tekniği ile elde edilen sonuçlar genelleme amacıyla kullanılamaz. Bu durumda literatürde yaygın olarak kullanılan regresyon analizinde farklı tahmin yöntemlerinin ele alınmasını gerekli kılmaktadır. Amaç: Bu çalışmanın amacı, hata terimi dağılımı Çarpık dağılım ailesinden olduğu durumda En Küçük Kareler (EKK) tekniği ile farklı robust regresyon tekniklerinin parametre kestirimlerinin performanslarını karşılaştırmaktır. Hata terimi dağılımı Çarpık dağılım ailesinden olduğu zaman EKK tekniği ile kestirimi yapılan parametreler etkinliğini ve optimal olma özelliklerini kaybeder. Mean Square Error (Hata Kareler Ortalaması-MSE), iki tahmin edicinin yanlılık ve varyans özelliklerine dayalı bir karşılaştırma kriteridir. Bu nedenle yanlı ve yansız tahmin edicilerin performanslarını karşılaştırmada sıklıkla kullanılmaktadır. Hata terimi dağılımı, Çarpık dağılım ailesinden olduğu zaman parametre tahmin edicileri yansızlık özelliklerini kaybedecektir. Klasik olarak kullanılan EKK tahmin edicilerinin etkinliği, robust tahmin edicilerin performansı ile MSE kriteri bakımından karşılaştırılmıştır. Bulgular: Bu çalışmasında, iterasyon sayısı N=100000/n, örneklem hacmi n=10,20,30,50, hata terimi için Çarpık dağılım ailesinin iki üyesi ve bu dağılımların çeşitli parametre değerleri için basit doğrusal regresyon modeli için parametre tahmin edicileri karşılaştırılması yapılmıştır. Basit doğrusal regresyon modelinde sabit terim 0 ve eğim parametresi 1 olarak alınmıştır. Parametre tahmini için EKK, robust regresyon teknikleri kullanılmıştır. Tahmin ediciler için MSE değerleri hesaplanmıştır. Dağılımların çarpıklık derecelerine göre farklı robust tahmin ediciler EKK tahmin edicisinden çok daha etkin olarak bulunmuştur. Sonuç: Hata terimi dağılımı Çarpık dağılım ailesinden geldiği durumlarda, Robust Regresyon tekniklerinin MSE değerlerinin EKK tekniği için MSE değerlerinden daha küçük olduğu görülmüştür. Bu neden ile hata terimi dağılımı, Çarpık dağılım ailesinden ise Robust Regresyon teknikleri tercih edilmelidir.

Anahtar Kelimeler: Regresyon Modeli, En Küçük Kareler, Robust Regresyon Teknikleri, Çarpık Dağılım



 


Keywords: