22 Ekim 2016 Cumartesi

Fasta nedir?

Fasta formatı nükleotit yada protein sekansı(dizisi) içeren bir metin dosyasıdır. Bu format aynı zamanda sekans isimlerini ve sekansa ait bilgileri de içerebilir. Bu format temel olarak FASTA yazılım paketlerinde kullanılmaktayken şuan biyoinformatik alanında bir standart haline gelmiştir.
Bir fasta formatı aşağıdakileri içermektedir.
  • ">" işareti ile başlayan ve bir dizi tanımlamaları içeren bir satır. Bu satıra istenilen bütün bilgiler yazılabilir. Satırın içeriği tamamen isteğe bağlıdır. Satırda hiç bir bilgi yer almasa bile ">" işareti kesinlikle olmalıdır.
  • Sekansın kendisini içeren bir yada birden fazla satır. Genellikle uzun diziler 60 yada 100 bazdan sonra bir alt satırdan devam eder şekilde yazılmaktadır.
Fasta formatı tek bir sekans içerebildiği gibi birden fazla sekansı da içerebilir. Yukarıda bahsedilen bilgiler her sakans için bulunur. Multi-Fasta formatı olarak da geçmektedir.

Fasta formatı biyoinformatiğin her alanında yaygın bir şekilde kullanılmaktadır. Veritabanları genelde sekans bilgilerini fasta olarak sunmaktadır. Yine veritabanlarında sekans üzerinde bir işlem yapmak isterseniz fasta formatında veri girmenizi istemektedir. Blast fasta formatında veri kabul etmektedir ve multi-fasta formatında verileri kabul etmektedir. Bunun gibi bir yerde fasta dosyası kullanılmaktadır. Aşağıda fasta formatı örneklerini bulabilirsiniz.
>BTBSCRYR
tgcaccaaacatgtctaaagctggaaccaaaattactttctttgaagacaaaaactttca
aggccgccactatgacagcgattgcgactgtgcagatttccacatgtacctgagccgctg
caactccatcagagtggaaggaggcacctgggctgtgtatgaaaggcccaattttgctgg
gtacatgtacatcctaccccggggcgagtatcctgagtaccagcactggatgggcctcaa
cgaccgcctcagctcctgcagggctgttcacctgtctagtggaggccagtataagcttca
gatctttgagaaaggggattttaatggtcagatgcatgagaccacggaagactgcccttc
catcatggagcagttccacatgcgggaggtccactcctgtaaggtgctggagggcgcctg
gatcttctatgagctgcccaactaccgaggcaggcagtacctgctggacaagaaggagta
ccggaagcccgtcgactggggtgcagcttccccagctgtccagtctttccgccgcattgt
ggagtgatgatacagatgcggccaaacgctggctggccttgtcatccaaataagcattat
aaataaaacaattggcatgc

>crab_anapl ALPHA CRYSTALLIN B CHAIN (ALPHA(B)-CRYSTALLIN).             
MDITIHNPLIRRPLFSWLAPSRIFDQIFGEHLQESELLPASPSLSPFLMR
SPIFRMPSWLETGLSEMRLEKDKFSVNLDVKHFSPEELKVKVLGDMVEIH
GKHEERQDEHGFIAREFNRKYRIPADVDPLTITSSLSLDGVLTVSAPRKQ
SDVPERSIPITREEKPAIAGAQRK

>crab_anapl ALPHA CRYSTALLIN B CHAIN (ALPHA(B)-CRYSTALLIN).             
MDITIHNPLIRRPLFSWLAPSRIFDQIFGEHLQESELLPASPSLSPFLMR
SPIFRMPSWLETGLSEMRLEKDKFSVNLDVKHFSPEELKVKVLGDMVEIH
GKHEERQDEHGFIAREFNRKYRIPADVDPLTITSSLSLDGVLTVSAPRKQ
SDVPERSIPITREEKPAIAGAQRK
>crab_bovin ALPHA CRYSTALLIN B CHAIN (ALPHA(B)-CRYSTALLIN).             
MDIAIHHPWIRRPFFPFHSPSRLFDQFFGEHLLESDLFPASTSLSPFYLR
PPSFLRAPSWIDTGLSEMRLEKDRFSVNLDVKHFSPEELKVKVLGDVIEV
HGKHEERQDEHGFISREFHRKYRIPADVDPLAITSSLSSDGVLTVNGPRK
QASGPERTIPITREEKPAVTAAPKK
>crab_chick ALPHA CRYSTALLIN B CHAIN (ALPHA(B)-CRYSTALLIN).             
MDITIHNPLVRRPLFSWLTPSRIFDQIFGEHLQESELLPTSPSLSPFLMR
SPFFRMPSWLETGLSEMRLEKDKFSVNLDVKHFSPEELKVKVLGDMIEIH
GKHEERQDEHGFIAREFSRKYRIPADVDPLTITSSLSLDGVLTVSAPRKQ
SDVPERSIPITREEKPAIAGSQRK
>crab_human ALPHA CRYSTALLIN B CHAIN (ALPHA(B)-CRYSTALLIN).
MDIAIHHPWIRRPFFPFHSPSRLFDQFFGEHLLESDLFPTSTSLSPFYLR
PPSFLRAPSWFDTGLSEMRLEKDRFSVNLDVKHFSPEELKVKVLGDVIEV
HGKHEERQDEHGFISREFHRKYRIPADVDPLTITSSLSSDGVLTVNGPRK
QVSGPERTIPITREEKPAVTAAPKK

Hiç yorum yok:

Yorum Gönder