6 Mart 2015 Cuma

D3 ile Veri Görselleştirme

Veri görselleştirme üzerine daha önce biyoinformatiktr'de bir yazı yazmıştım ve diğer yazılarımda da yine bahsettiğim yerler olmuştu. Veri görselleştirme üzerine olan yazıma buradan ulaşabilirsiniz. Çünkü bugün veri görselleştirmenin öneminden değil veri görselleştirme için kullanılan mükemmel bir JavaScript kütüphanesinden bahsedeceğim.

Şimdiye kadar hepimiz bir şeylerin grafiğini elimizle yada bilgisayarda oluşturmak zorunda kalmışızdır. Bu işlemi bilgisayarda yapmak düşünüldüğünde ilk akla gelecek araç da Excel'dir. Benim düşünceme göre Excel gerçekten de mükemmel bir araç ve inanılmaz kolaylıklar sağlıyor. Özellikle istatistiksel ve matematiksel alanda oldukça kullanışlı ve bir çok analizi yapabiliyoruz. Fakat görselleştirme ve veri analizi konusunda Excel'in de yetersiz olduğu durumlar olabiliyor. Özellikle veri miktarı arttıkça karmakarışık bir grafik elde ediyoruz. Yada bir grafik üzerinde gösterebildiğimiz bilgiler sınırlı kalıyor. Bunu yazının tamamını okuduğunuzda daha iyi anlayacaksınız.

Şimdi elimizde 10 adet gen olduğunu düşünelim ve bu genlere ait içerdikleri baz sayısı, hangi bazdan ne kadar içerdikleri bilgisi olsun. Bununla ilgili bir görüntüleme yapmak istiyoruz. Burada grafik oluştururken temel amacımız elimizdeki verileri kolayca karşılaştırabilmektir. Bunun için sadece gen uzunluklarını gösteren yada her genin içerdiği baz sayısını gösteren bir grafik yapabiliriz. Her grafik bize farklı konular hakkında bilgi verecektir. Bir grafikte görebileceğimiz ilişkiyi başka bir grafikte göremeyebiliriz. Yada öyle durumlar vardır ki iki grafik sizi bir sonuca götürebilir. İşte bu gibi durumlarda D3.js mükemmel bir kütüphane. Excel'de ayrı ayrı bir çok grafikte elde edeceğiniz bilgiyi D3.js ile tek bir sayfada elde edebiliriz. Bu tamamen sizin hayal gücünüze kalmış.

Biraz önce bahsettiğim 10 gen ile ilgili görüntüleme işleminin D3.js ile yapılmış halini aşağıda görebilirsiniz. Bu grafik bize aynı anda bütün gen uzunluklarını karşılaştırmayı, herhangi bir gen üzerine geldiğinizde o gende hangi bazdan kaçar tane olduğunu ve yüzdesini görmeyi, eğer yandaki pasta grafiği üzerine gelirseniz sadece genlerdeki o bazların miktarını karşılaştırma imkanını sağlıyor. Bu da bize veriyi bir çok yönden kolayca karşılaştırma imkanı sağlıyor. 

D3.js ile gerçekten büyüleyici ürünler ortaya çıkarılabiliyor. Şimdiye kadar hep Excel'e karşı avantajlarını söyledim ama tabi ki böyle bir şey ortaya çıkarmak Excel'de grafik yapmak kadar kolay değil. Bunu yapabilmek için JavaScript dilini ve D3.js kütüphanesini bilmek gerekiyor. Eğer öğrenmek isterseniz Codecademy'de bulunan JavaScript dersleri ile başlayabilirsiniz ve buradan D3.js ile ilgili kaynaklara ulaşabilirsiniz. D3.js ile nelerin yapıldığını görmek isterseniz buradan örneklere bakabilirsiniz. Ben çoğuna bakmanızı tavsiye ederim içlerinde Genetik verilerin görselleştirmesi ile ilgili bir kaç başlık da bulunmakta.

Bu konudan bahsetmişken Blosum'dan bahsetmemek olmaz. Blosum Ahmet Raşit Hoca'nın Blosum Matrix'inden oluşturduğu bir proje. Blosum matrix'i hakkında bilgiye buradan ulaşabilirsiniz. Blosum aminoasitler hakkında bir çok bilgi içeriyor ve benzerlik (yerine geçme) ihtimalleri üzerine gruplanmış aminoasitleri görebiliyorsunuz. İncelemek için buradan ulaşabilirsiniz. Tuna projesi bittiğinde o da hemen hemen her yerinde D3.js içeren bir araç olacak ve bir çok analizi yapmak için kullanılabilecek. Bittiği zaman yine sizi buradan bilgilendireceğim. =)



Bilgi paylaştıkça güzelleşir. Paylaşarak öğrenmek dileğiyle.

Osman

Hiç yorum yok:

Yorum Gönder