BİLDİRİ DETAY

Handan ANKARALI
MODİFİYE SİMETRİZE YÜZDE DEĞİŞİM İÇİN YENİ BİR TEST İSTATİSTİĞİ: SİMÜLASYON ÇALIŞMASI
 
Giriş: Modifiye edilmiş simetrize yüzde değişim (MSPC) ölçüsü, biyolojik değişimi doğru tanımlamak açısından, fark değişimine göre daha olumlu sonuçlar vermektedir. Ancak farklara ait test istatistiğinin özelliklerinin iyi tanımlanmış ve sağlam teorik temellere oturtulmuş olması nedeniyle pratikte farklar test edilmektedir. Bu çalışmanın ilk basamağında, MSPC’ ye ait hipotezlerin testinde, 4 farklı istatistiğin örnekleme dağılımı incelendi ve sonuçta 4 istatistiğin de t-dağılımı göstermediği görüldü. Amaç: Bu çalışmada, bir önceki aşamada simetrik ve normal dağılım gösterdiği belirlenen iki test istatistiğinin, çeşitli koşullarda, örnekleme dağılımlarına ait %95 ihtimalli güven aralığındaki kuyruk değerlerini belirlemek ve bu değerlere göre söz konusu testlerin gerçekleşen birinci tip hataları ve güçlerini incelemek, uygun test için önerilerde bulunmak amaçlandı. Özgün Değeri: a) MSPC’ ye dayalı hipotezlerin testinde uygun tablo değerleri sunulmuş olacak, b) yeni testin kullanım koşulları tanımlanacak, c) farklara ilişkin hipotez testinde kullanılan bağımlı gruplarda t-testi ile karşılaştırması yapılacaktır. Kapsam: Çalışma, tekrarlı ölçümler içeren deneme düzenlerini kapsamaktadır. Yöntem: Bu çalışmanın birinci basamağında, MSPC ölçüsü dikkate alınarak kurulan sıfır hipotezinin testi için 40000 denemenin her birisinde ve 6 farklı örneklem genişliği ile 3 farklı korelasyon yapısında, Median değerleri interquartile range değerine (IQR) ve TrMean değerleri IQR’ye bölünerek hesaplanan istatistiklerin örnekleme dağılımları simetrik ve normal dağılım bulunmuş idi. Bu dağılımların %95 ihtimalli güven aralığındaki alt ve üst sınır değerleri, tablo halinde sunuldu ve bu sonuçlar uygun test arayışı aşamasında, 40000 simulasyon sonucunda eğitim verisinden elde edildi. Bu çalışmada ise belirlenen tablo değerleri kullanılarak yine aynı koşullar için 40000 ayrı deneme yapıldı ve üretilen verilere göre gerçekleştirilen test sonuçları, daha önce bulunan tablo değerleri ile test edildi. Öncelikle birinci tip hatalar hesaplandı, daha sonra popülasyonlar arasında 0.5SD, 1SD, 2SD ve 2.5SD (SD: standart sapma) farklılık olacak şekilde veri üretildi ve söz konusu iki testin gücü belirlendi. Simulasyonlarda ve grafiklerin elde edilmesinde Microsoft Power Station Developer Studio ve IMSL Library desteği ile FORTRAN programlama dili ve Minitab (ver. 16.0) programı kullanıldı. Bulgular: Eğitim verisinden elde edilen örnekleme dağılımları ve bu dağılımların %95 ihtimalli alt ve üst sınır değerleri, tablo halinde sunuldu. Bu değerlere göre sıfır hipotezi geçerli iken üretilen 40000 örneklemde, her iki test istatistiğinin bu hipotezi ret etme olasılıkları birinci tip hata olarak hesaplandı. Ayrıca sıfır hipotezinin yanlış olduğu 4 farklı etki büyüklüğü için testlerin güç değerleri hesaplandı. Belirlenen tablo değerleri yardımıyla, Median/IQR istatistiğinin 18 farklı koşul için hesaplanan birinci tip hata yapma olasılıklarının çoğunluğu %5’ e çok yakın değer aldı, en küçük %4.82 ve en büyük %5.65 olarak belirlendi. TrMean/IQR istatistiğinin sonuçları da benzer bulundu, değerlerin çoğu %5’ e çok yakın bulundu, en küçük %4.63 ve en büyük %5.63 olarak hesaplandı. Bu koşullarda simülasyonla üretilen bilgilerin geçerliliğini test etmek için aynı koşullarda farklar alınarak t-testi yapıldı ve bu teste ait birinci tip hata yapma olasılıkları ve güç değerleri hesaplandı. Bu sonuçlar değerlendirildiğinde ise t testinin birinci tip hata olasılığı %5 civarında çıktı ve en küçük değer %4.81, en büyük değer %5.34 bulundu. Bu sonuçlar, 3 test istatistiğinin de birinci tip hatalarının birbirine çok yakın olduğunu ve başlangıçta belirlenen %5 seviyesini koruduğunu gösterdi. Testlerin güç değerleri incelendiğinde örneklem genişliği 10 civarında ve etki büyüklüğü küçük ise 3 testinde gücü düşük bulundu ve etki büyüklüğü arttıkça bu değerin yükseldiği gözlendi. Bunun dışında kalan örneklem genişliklerinde ve etki büyüklüğü 0.5 standart sapma iken t-testinin yeterince güçlü sonuçlar verdiği, etki büyüklüğünün 1 standart sapma ve üzerine çıktığı durumlarda da gücünün %100 veya çok yakın değerler aldığı belirlendi. Ancak bu çalışmada önerilen Median/IQR ve TrMean/IQR istatistiklerinin 0.5 SD etki büyüklüğünde çok büyük örneklemlerde gücünün yüksek olduğu, 1SD etki büyüklüğünde yeterli güce n>60 iken ulaştığı, 1.5SD etki büyüklüğünde n>30 iken gücünün istenen seviyelere çıktığı ve son olarak 2SD etki büyüklüğünde tüm testlerin %100 gücü yakaladığı belirlendi. Bu sonuçlar doğrultusunda, MSPC kullanılarak önerilen iki yeni testin, bilinen t-testi gibi dayanıklı (robust) testler olduğu ancak özellikle 1SD veya daha fazla sapma gösteren farklılıkların değerlendirilmesinde de güçlü (poweful) sonuçlar vereceği söylenebilir. Sonuç: MSPC, uygulama öncesi ve sonrası değişimi ifade etmekte farklara göre daha kolay anlaşılan ve yorumlanabilen, ayrıca bireylerin başlangıç değerlerindeki farklılığa göre düzeltme yaptığı için değişimi daha doğru ifade eden bir ölçüdür. Bu çalışmada, örnekleme dağılımı normal dağılım gösteren 2 test istatistiğinin kullanım koşulları ve test için uygun tablo değerleri verildi. Söz konusu koşullar sağlandığında, farklara eşleştirilmiş gruplarda t-testi yapmak yerine, MSPC için Median / IQR istatistiğini kullanmak daha çok avantaj sağlayacaktır. Çünkü bu iki test istatistiğinin dağılım özellikleri çok benzer bulunmuştur. Bunun dışındaki koşullarda ise Median / IQR istatistiği dayanıklı bir test olmasına karşın farklılığı ortaya koymakta başarısı t-testine göre düşüktür. Ancak bu koşullarda ise sadece tanımlayıcı bir değer olarak çalışmalarda yer alabilir.

Anahtar Kelimeler: Pre-Post Denemeleri, Yüzde Değişim, Simetrize Yüzde Değişim, Trimmed Ortalama, Birinci Tip Hata Yapma Olasılığı, Testin Gücü 


Keywords: