BİLDİRİ DETAY

Ahmet KOCATÜRK, Bülent ALTUNKAYNAK
GEN AÇIKLAMA VERİLERİ İÇİN İKİLİ KÜMELEME ALGORİTMALARI
 
Giriş: Son yıllarda gen açıklama (gene expression) verilerinin ikili kümeleme (biclustering) yaklaşımıyla analiz edilmesi yaygınlaşmıştır. Bunun nedeni farklı koşulların (conditions) alt kümeleriyle ilişkili gen kümelerini tespit etme çabasıdır. Bu sayede ortak açıklama genleri (co-expressed/co-regulated) tanımlanabilmektedir. Ancak farklı gen açıklama verilerinin varlığı ve bu verilerin büyük hacimli veriler olması analiz işlemini oldukça zorlaştırmaktadır. Bu nedenle literatürde ikili kümeleme için birçok farklı sezgisel algoritma önerilmiştir. Bunlardan bazıları CC, Bimax, Plaid, Spectral, Quest ve Xmotif algoritmaları olarak verilebilir. Bu algoritmaların adımları birçok çalışmada açıkça verilmemiştir ve ayrıca algoritmaların karşılaştırılmasına ilişkin çalışmalar da sınırlı sayıdadır. Amaç: Uygulama açısından karmaşık bir yapıya sahip olan CC, Bimax, Plaid, Spectral, Quest ve Xmotif ikili kümeleme algoritmalarının adımlarını açık bir şekilde göstermek ve bu algoritmaların gerçek veri kümeleri üzerinde uygulamalarını göstererek performanslarını karşılaştırmaktır. Kapsam: Bu araştırmada üç farklı gerçek veri seti kullanılmıştır. Bu veri setleri; gen ve koşullardan oluşan 2884x17 boyutlu maya verisi, insandaki lenf hücrelerinin gen açıklamasını içeren 4096x96 boyutlu lenf verisi ve farelerin protein etkisini içeren 1080x77 boyutlu fare verisidir. Gerçek veri setlerinden ikili küme elde etmek için uygulanan CC, Bimax, Plaid, Spectral, Quest ve Xmotif ikili kümeleme algoritmaları Chia ve Karuturi ikili küme skoruna (CKSB) göre karşılaştırılmıştır. Sınırlıklar: Bu araştırmada elde edilen sonuçlar maya, lenf ve fare verilerine dayalı olarak elde edilmiştir. Başka veri yapılarını içermemektedir. Ayrıca elde edilen sonuçların gen verileri açısından kuramsal (biyolojik) olarak uygunluğunun da uzman görüşleri doğrultusunda karşılaştırılması ve tartışılması gerekir. Yöntem: Çalışmada gen açıklama veri matrisinde hem satır hem de sütun kümelerinin eş zamanlı kümelenmesi için yaygın olarak kullanılan CC, Bimax, Plaid, Spectral, Quest ve Xmotif ikili kümeleme algoritmaları karşılaştırılmıştır. Algoritmaların adımları verilerek R Project v3.4.4 programıyla uygulamaları yapılmıştır. İkili kümeleme algoritmalarının karşılaştırılması için CKSB skorları hesaplanmış ve ısı grafikleri elde edilmiştir. Bulgular: Maya ve lenf verisi için yapılan analizler sonucunda CC, Bimax, Plaid ve Xmotif algoritmaları ikili kümeleri tespit etmede başarılı olmuştur. Ancak Quest ve Spectral algoritmalarından herhangi bir ikili küme elde edilememiştir. Fare verisinde ise CC, Bimax, Spectral, Quest ve Xmotif algoritmalarından ikili kümeler elde edilmiş ancak Plaid algoritmasından ikili küme elde edilememiştir. Maya verisi için CC, Bimax, Plaid ve Xmotif algoritmalarının elde ettikleri ikili kümeler CKSB skorlarına göre anlamlı çıkmıştır. Lenf verisi için sadece Bimax algoritmasıyla elde edilen ikili küme CKSB skoruna göre anlamlı çıkmıştır. Fare verisinde ise Bimax ve Xmotif algoritmalarıyla elde edilen ikili kümeler CKSB skorlarına göre anlamlı çıkmıştır. Sonuç: Gerçek veri setlerinden maya, lenf ve fare verileri kullanılarak ikili kümeleme algoritmalarının performanslarının karşılaştırılmasında CKSB skoru kullanılmıştır. Gerçek veri setinden maya verisi için CC, Bimax, Plaid ve Xmotif algoritmalarından elde edilen ikili kümelerden CKSB skoruna göre en iyi performansı gösteren Bimax algoritmasıdır. Lenf verisi için ikili kümeleme algoritmalarından sadece Bimax algoritmasıyla elde edilen ikili küme anlamlı olduğu için en iyi performansı göstermiştir. Maya ve lenf verisi için en kötü performansı ikili küme elde edemeyen Quest ve Spectral algoritmasıdır. Fare verisinde Bimax ve Xmotif algoritmalarıyla elde edilen ikili kümelerden CKSB skoruna göre daha iyi performansı gösteren Bimax algoritmasıdır. Genel olarak üç farklı veri setinde altı farklı ikili kümeleme algoritmalarından Bimax algoritması ile elde edilen ikili kümelerin diğer algoritmalarla elde edilen ikili kümelerden CKSB skoruna göre daha iyi performans göstermiştir.

Anahtar Kelimeler: İkili küme, Gen açıklama verisi, Chia ve Karuturi ikili küme skoru



 


Keywords: