BİLDİRİ DETAY

Yıldız BORA, Abdullah YEŞİLOVA
KARIŞIMLI MODEL YAKLAŞIMINDA UYGUN MODELİN BELİRLENMESİNDE KULLANILAN ÖLÇÜTLER
 
Giriş Son yıllarda istatistik alanındaki en büyük gelişmelerden biri; var olan durumu kullanıp, ileride olması beklenen tahminlerin yapılması yönündedir. Bu açıdan, toplumsal alandaki çalışmalara yönelik verilerin analiz edilmesinde, veri setinin kendi içerisindeki heterojenliğinin belirlenmesinde gözlenemeyen sınıf analizi kullanılmaktadır. Gözlenemeyen sınıf analizi dahilinde yapılan tanımlayıcı ve analitik istatistiklerin tümü genel olarak “karışımlı modelleme (mixture models)” olarak adlandırılır. Karışımlı modellerde amaç, gözlenen değişkenlerin kaç alt gruba ait olduğunun belirlenmesi ve hangi gözlem değerlerinin hangi alt grup bulunması gerektiğine karar verilmesidir. Böylece bütün gözlenen değişkenler için tek bir parametre tahmini yapmak yerine her alt grup için ayrı parametre tahmini yapılmaktadır. Dolayısıyla, her alt grup için parametre tahmin değeri farklı olabilmektedir. Sınıflandırma amaçlı faktör ve kümeleme istatistiksel analiz yöntemleri yaygın olarak kullanılmaktadır. Son yıllarda özellikle yapay sinir ağları esaslı modeller ile karışımlı model yaklaşımları karmaşık veri setlerini sınıflandırmada kullanılmaya başlamıştır. Karışımlı model yaklaşımı; ilk olarak veri setini heterojen olarak kabul ederek homojen kaç alt gruptan (latent class) oluşacağını tespit etmektedir. Böylece her bir alt grup için ayrı parametre tahminlerinin elde edilir. Karışımlı model yaklaşımı bu yönü ile diğer yöntemlere nazaran istatistiksel yorumlamada önemli avantajlar sağlamaktadır. Bunlar; gözlemlerin doğru sınıflandırma olasılığını sağlamak, elde edilen her alt grup için ayrı parametre tahminini yapmak, sınıflandırmadaki hata payını en aza indirmektir. Karışımlı normal modellemede, heterojen yapı gösteren veri setinin homojen kaç alt gruba ayrılacağını belirlemek için Akaike Bilgi Kriteri (AIC), Bayesian Bilgi Kriteri (BIC) yaygın olarak kullanılmaktadır. Genel olarak en küçük AIC ve BIC değerlerine sahip model en iyi model olarak seçilmektedir. Bunun yanı sıra, karışımlı modellemede, veri setinin dağılacağı uygun modeli saptamak için entropy doğru sınıflandırma ölçütü kullanılmaktadır. Yöntem: Gerekli analizler MPLUS istatistiksel yazılım programı kullanılarak yapılmıştır. Analiz sonucunda, 2013 yılında Türkiye’deki bireylerin mutluluk düzeyleri bakımından homojen 6 grup gösterdikleri saptanmıştır. Alt grupları belirlemede Akaiki ve Bayesian bilgi ölçütleri kullanılmıştır. Oluşturulan her bir alt grup için en çok olabilirlik yöntemi ve Beklenti Maksimizasyonu algoritması kullanılarak parametre tahminleri elde edilmiştir. Amaç: Çok değişkenli istatistiksel yöntemlerde en önemli amaç, karmaşık bir veri setini kavramsal olarak yorumlanması kolay bir formatta sunmaktır. Bu nedenle son yıllarda buna yönelik sınıflandırma amaçlı istatistiksel yöntemler üzerinde durulmaktadır. Karışımlı model yaklaşımı bu yönü ile diğer yöntemlere nazaran istatistiksel yorumlamada önemli avantajlar sağlamaktadır. Ayrıca gözlemlerin doğru sınıflandırma olasılığını sağlamak, elde edilen her alt grup için ayrı parametre tahminini yapmak, sınıflandırmadaki hata payını en aza indirmektir. Kapsam: Bu çalışmada, Türkiye İstatistik Kurumu (TÜİK) tarafından 2013 yılında ilk defa il düzeyinde yapılan, “Yaşam Memnuniyeti Araştırması” sonuçlarına göre mutluluk kaynağı göstergelerinde 10 değişkenin 81 il bazında incelenmesi amaçlanmıştır. Araştırma kapsamında Türkiye genelinde 125.720 haneye gidilerek, 18 ve daha yukarı yaştaki 196.203 birey ile yüz yüze görüşmeler yapılmıştır. Araştırma, mutluluk kaynağı olan kişiler ve mutluluk kaynağı olan değerlerden oluşmaktadır. Sınırlıklar: Araştırma Türkiye Cumhuriyeti sınırları içinde bulunan hanelerde yaşayan 18 ve daha yukarı yaştaki Türkiye Cumhuriyeti vatandaşları ile yabancı uyruklu kişileri kapsamakta olup araştırmada, kurumsal nüfus (üniversite öğrenci yurdu, huzurevi, bakımevi, ceza ve tutukevi, ıslahevi, yetiştirme yurdu, askeri birlik ve kışla vb.) kapsam dışında tutulmaktadır. Bulgular: Bu çalışmada, en küçük AIC ve BIC istatistikleri altı alt gruplu modelden elde edilmiştir. Bu nedenle tüm parametre tahminleri bu modele göre yorumlanmıştır. Böylece, Türkiye’de İllere Göre mutluluk kaynağı olarak; çocuklar, eş, anne/baba, kendisi, torunları, sağlık, sevgi, başarı, para ve iş gibi değişkenler kendi içlerinde homojen ve kendi aralarında heterojen olmak üzere altı alt gruba ayrılmıştır. Bunun yanı sıra, bu çalışmada, en yüksek entropy ölçütü en iyi model olarak seçilen altı alt gruplu modelde %96.8 olarak elde edilmiştir. Sonuç: Çocukları mutluluk kaynağı olarak görmeyen illerin başında Mardin gelmiştir. Bu ili diğer Doğu Anadolu ve Güneydoğu Anadolu Bölgelerindeki iller izlemiştir. Eşi mutluluk kaynağı olarak gören iller diğer illere nazaran oldukça yüksek bir ortalama değer ile Ağrı, Bitlis ve Muş olmuştur. Anne ve babayı mutluluk kaynağı gören iller sıralamasında Mardin başta yer almıştır. Mutluluk kaynağı olarak torunları görenlerin, en yüksek ortalama ile Antalya, Edirne, Kayseri, Kocaeli, Ordu, Sivas, Yalova ve Yozgat illeri olmuştur. Genellikle Doğu Anadolu ve Güneydoğu Anadolu Bölgeleri sağlık durumunu mutluluk kaynağı olarak pek görmedikleri sevgiyi ise diğer bölgelere nazaran mutluluk kaynağı olarak gördükleri sonucuna ulaşılmıştır. Ayrıca para, iş ve başarı gibi durumların belirli bölgelerde yoğunlaşmadığı görülmüştür. Anahtar Kelimeler: Alt grup, Karışımlı Model, Akaiki, Bayesian, Entropy Yazar Notu: Bu çalışma Doç. Dr. Abdullah YEŞİLOVA tarafından danışmanlığı yapılan Yüzüncü Yıl Üniversitesi, Ziraat Fakültesi, Zootekni Anabilim Dalı “Fen Bilimleri Enstitüsü”nde yapılmış Yıldız BORA’nın “Karışımlı Model Yaklaşımının Sınıflandırma Amaçlı Kullanılması ” Konu Başlıklı, Doktora Tez çalışmasından türetilmiştir.

Anahtar Kelimeler: Alt grup, Karışımlı Model, Akaiki, Bayesian, Entropy



 


Keywords: