30 Ocak 2015 Cuma

Veri Analizi

Bu günlerde verilere olan ilgim artmaya başladı. Etrafımdaki şeyleri farklı görmeye başladım diyebilirim. Nerede bir kaç sayı görsem aralarında bir ilişki var mı ona bakıyorum. Eğer bu sayı grubunun içinde farklı olan yada olanlar varsa ve bunu yakalayabilirsem bunun farklı olmasının sebebini düşünüyorum. Bu şekilde bir şeyleri çözmeye çalışmak şimdilik hoşuma gidiyor ama ilerisi için ne olur bilemem. :)

Neden böyle düşündüğüme gelirsek sebebini ben de tam olarak bilmiyorum. Aslında bunu ilk başlarda yeni okumayı öğrenen çocukların her şeyi okumasına benzetmiştim. Ama bunun artık biraz daha farklı olduğunu düşünmeye başladım. Çocuklarda bir süre sonra bu kaybolsa da sanırım bu alanlarda çalışanlarda bu sürekli olan bir davranış haline geliyor. Bunu ilerleyen zamanlarda bizzat kendi üzerimde yaptığım deneylerle göreceğiz. :)

Şimdilik sadece küçük verilerle uğraşıyorum ve bunu beynim analiz edebiliyor. Belki de bu işi güzel yapan şuan için budur. :) Peki büyük veri setleri ile neler yapacağız. Binlerce yada milyonlarca sayının olduğu veri beyin tarafından analiz edilemeyecek kadar büyük. Hadi analiz etmeyi başardık diyelim ama bunu yapmak ne kadar zaman alır bilinmez. Burada bizim için devreye bilgisayar giriyor. John Vincent Atanasoff'a bilgisayar devrini başlattığı için ne kadar teşekkür etsek azdır. Artık onun sayesinde bu dev verileri analiz edebiliriz.

Veri analizi görebildiğimiz şeylerin arkasında bulunan göremediğimiz ilişki sistemini ortaya çıkarmamıza yardımcı olur. Böylece bazı şeylerin sebeplerini daha iyi anlayıp var olan bilgilere yenilerini ekleyebiliriz. Araştırmalar hiç bir zaman bir takım deneysel verileri elde etmek olarak düşünülmemelidir. Önemli olan elde edilen verinin analiz edilmesi ve anlamlı ilişkilerin ortaya çıkarılabilmesidir. Bir şeylerin sebeplerinin ne olabileceği hakkındaki fikirlere bu şekilde ulaşabiliriz. Uğraştığınız iş biyoinformatik olmasa bile eğer bir laboratuvarda bir deney yapıyorsanız sonuç olarak verileri elde edeceksiniz ve bunların analiz edilmesi gerekecek. 

Bir veri analizinin en basit yolu onu görselleştirmektir. Hatta bu zaten veri analizinin bir parçasıdır ama böylece konu hakkında hemen bir bilgi sahibi olabilir ve farklılıkları görebiliriz. Küçük veriler için kafamda analiz yaparken de aslında bunu yapıyorum. Kafamda yaptığım bir görselleştirme ile dikkat çeken noktaları belirleyebiliyorum.

Aşağıda "makyajsız selfie" ve "kanser araştırmaları" konularının Şubat 2014- Nisan 2014 tarihleri arasında Google'da ne kadar araştırıldığını karşılaştıran bir grafik var. Grafiğe bakılacak olursa aralarında bir ilişki var gibi duruyor. Ve bu grafikte de görüldüğü gibi gerçekten bir ilişki var. Mart ayında Kanser Araştırması, bayanların doğal selfie yayınlamalarına ilham kaynağı olan "makyajlı selfie'ye hayır" lansmanını yaptı. Ay boyunca "kanser farkındalığı" aramaları ikiye katlandı ve kampanyadan 12,5 milyon ABD doları elde edildi.



Veri analizi üzerine uğraşmak istiyorum derseniz aklınıza gelen şeylerle ilgili verileri bulup bunu Excel'de görüntüleyebilirsiniz. Eğer veri bulmakta zorlanırsanız Tuik'in sitesine göz atmanızda fayda var.


Bilgi paylaştıkça güzelleşir. Paylaşarak öğrenmek dileğiyle.

Osman

Hiç yorum yok:

Yorum Gönder