İnsan DNA'sını Araştırmaya Adanmış Devasa Proje: Human Genome Project
türkçesiyle insan genom projesi, 13 yıl sürmüş ve haploid bir insan genomundaki 3 milyar baz çiftinin diziliminin (sekans) %99.9 kesinlikte (yani 10.000 bazda 1 baz hata payıyla) ortaya çıkarılmasını sağlamış ve yaklaşık 3 milyar dolar bütçeli bir projedir.
projenin hedefi
insanın tüm kromozomları üzerinde taşınan genetik materyalinin (genom) dna dizilimini (yani adenin (a), timin (t), guanin (g) ve sitozin (c) bazlarının sırasını) ortaya çıkarıp kalıtımın temel birimi olan genlerin sıralamasını ve hangi kromozomlar üzerinde yer aldığını belirlemekti. bunun için birçok gönüllüden dna örnekleri alındı. ortaya çıkabilecek etik sorunlar göz önüne alınarak anonimleme yöntemi kullanılmıştır. bu sayede bugün gönüllüler ve projeyi yürüten kişiler dahil olmak üzere hiç kimse sekanslanan genomun kime ait olduğunu bilmemektedir.
projenin ortaya çıkışı
projenin temelleri 1985 yılında moleküler biyolog robert sinsheimer'in düzenlediği bir konferansta insan genomunun dizilenebilirliğinin ilk kez tartışılmasından sonra 1988 yılında abd'nin ulusal sağlık enstitüleri (national institutes of health) ve enerji bakanlığı'nın insan genomuyla ilgili araştırma ve teknik aktiviteleri düzenlemesi amacıyla imzaladığı bir anlaşmada atıldı. buna binaen ertesi yıl projeyi yürütmesi, koordine etmesi ve desteklemesi amacıyla insan genom araştırması ulusal merkezi (igaum) kuruldu.
igaum'un ilk başkanı james d watson'dı. watson, projeyi 4 yıl yönettikten sonra başa francis collins geldi.
sanılanın aksine bu, sadece abd'nin yürüttüğü bir proje değildi. abd ile birlikte çin, fransa, almanya, ingiltere ve japonya'nın da dahil olduğu 6 ülkeden 20 farklı merkezin katkıda bulunduğu uluslararası bir projeydi.
projenin bitişi ve sonuçları
proje, 1990 yılında başladı ve dna sarmalinin keşfinin 50. yıl dönümünde, ilk etapta hesaplanandan 2 yıl önce, 2003 yılında bitti. projenin erken bitmesinin en önemli sebeplerinden biri, sekanslamayla ilgili ortaya attığı parlak fikirlerin projenin başındaki francis collins tarafından sert bir şekilde eleştirilmesi üzerine igp'den ayrılarak celera adlı bir biyoteknoloji şirketi kuran craig venter'ın insan genomunu farklı bir yöntemle dizilemeye başlamasıyla ortaya çıkan çekişmedir. sonunda her iki grup çalışmalarının sonuçlarını eş zamanlı olarak nature ve science dergilerinde yayımlamıştır.
projenin sonucunda dizisi ortaya çıkarılan insan genomu belli bir kişi ya da kuruluş tarafından patentlenmesi engellenerek (bkz: bermuda anlaşması) genbank adı verilen bir siteden halka açılmıştır. bugün isteyen herkes bu diziye buradan erişebilir.
insan genomunda başta 100,000 kadar olduğu düşünülen genlerin sayısı projenin devam ettiği 13 yıl içinde önce 40,000'lere inmiş, projenin sonunda da 20,000-25,000 arasında olduğu tespit edilmiştir.
igp'nin abartılmış bir proje olduğu doğru değildir. bulguları hala kullanılan ve tahminim bugün işlevi bilinmeyen tüm genlerin ne işe yaradığı bulunsa bile hala faydalı olmaya devam edecek olan bir çalışmadır bu. zira insan genomunun sadece %2'si genlerden oluşmaktadır ve geri kalan kısmının işlevi hala büyük ölçüde muammadır. dizinin bu muammayı çözmede çok büyük bir katkısı olacaktır şüphesiz. üstelik sırf kodlanan kısmı (yani genleri) bile düşündüğümüzde genom dizisinden önce bir hastalıkla ilişkili tek bir geni bulup sekanslamanın yıllar aldığı düşünüldüğünde tüm genomun 13 yılda dizilenmesi büyük bir başarıdır adeta. zaten birçok hastalığın genetik temellerinin tek bir genle sınırlı olmadığı, tersine çok daha karmaşık olduğu düşünüldüğünde genom dizisi olmaksızın bu hastalıklarının genetik temellerine inmek pratikte imkansızdır.
bu projeden sonra ya da onun vesilesiyle sekanslanan başka model organizma genomları (bir sonraki madde) ve gelişen dna sekanslama teknolojileri (next generation sequencing) ve insan tek nükleotid polimorfizmi haritasının çıkarılmış olması yine bu projenin önemli uzantılarıdır hep. bugün elimizdeki insan genom sekansının kullanım alanı oldukça geniştir. (bkz: moleküler biyoloji) (bkz: tıp) (bkz: gen terapisi) (bkz: farmakogenombilim) (bkz: popülasyon genetiği) (bkz: adli tıp) (bkz: evrim)
proje kapsamında insan genomunun yanısıra escherichia coli, saccharomyces cerevisiae, caenorhabditis elegans, mus musculus genomları da sekanslanmıştır. aynı zaman diliminde craig venter'in başkanlığındaki grup haemophilus influenza ve drosophila melanogaster genomlarını sekanslamış, onun karısının başında bulunduğu grup da mycoplasma genitalium genomunu sekanslamıştır.
insanlığa projeyi tanıtmak amaçlı eğitimler hazırlaması, konuyla ilgili olarak ortaya çıkabilecek etik ve politik konuları (bkz: genetik ayrımcılık) ele alması, tıbbi ve kamusal politikaları geliştirmesi amacıyla amacıyla elsi (ethical, legal, and social issues) kurulmuştur.
buraya kadar saydıklarımı konuyla ilgili aşağı yukarı her kaynaktan bulmak mümkün aslında. hal böyleyken sen bize yeni ne söyleyeceksin, ne diye oturdun da bu entry'yi yazdın diye soracaklar için başlıyorum efenim.
yorum: şimdi nedir cidden bu igp denen olay?
altı üstü bir genom sekanslaması, madem gen dizileme teknolojisi bundan yıllar evvel geliştirilmiş niye böyle 13 yıl kadar uzun sürmüş bu dizileme işi diye sormazlar mı? sorarlar, şahsen ben sormuş idim çömez bir lisans öğrencisiyken. ve fakat cevabımı almak pek kolay olmadı zira biyologlar çoğu zaman işin detayına dalmaktan büyük resmi açıklamayı unutuyorlar, böylece yolun başındaki çömez moleküler biyoloji öğrencileri de kalakalıyor.
igp'nin bu kadar uzun sürmesinin en temel sebebi insan genomunun çok ciddi bir biçimde uzun olması. yukarıda da belirttiğim gibi 3 milyar baz çifti uzunluğunda haploid bir insan genomu. ama sekanslamada kullanılan enzimin saniyede 10 baz ekleme yapabildiği düşünülürse ufak bir hesapla tüm genomun 83.3 saat gibi bir sürede dizilenmesini bekleriz. oysa biz 13 yıldan bahsediyoruz. çünkü neden? çünkü dna fermuar gibi açılarak baştan sonra bir hamlede sekanslanamıyor. çünkü bu büyüklükte bir molekül in vitro koşullarda stabil değil. [zaten 3 milyar bazlık insan genomu tek bir büyük molekül değil ayrı ayrı 23 (haploid) kromozomdan oluşuyor. (gerçi bu işimizi kolaylaştırırdı, o zaman sekanslama maksimum en uzun kromozomun sekanslanması kadar sürerdi.)] ancak yukarıda saydığım teknik kısıtlamadan dolayı igp kapsamında bir seferde sekanslanabilen en uzun dna segmenti 2000 baz uzunluğunda olabildi.
o zaman yapılacak şey belli; genomu minik parçalara ayıracağız, teker teker dizilerini çıkarıp sonra birleştireceğiz. ama dna'yı keserken her şey gözle hiçbir şeyin görülmediği deney tüpünde gerçekleştiği için, teker teker dizilediğimiz sekansların hangisi bir diğerinden önce geliyor bilmek namümkün. bunu aşmak için igaum ve celera farklı iki yöntem kullandılar. düz yazıyla anlatmak da anlamak da zor olduğu için pek faideli iki animasyon yoluyla özetlemeye çalışacağım bu iki yöntemi mümkün mertebe.
igaum yöntemi
kısaca burda genomun önce çözünürlüğü 1 milyon bazlık bir fiziksel haritalaması (bilinen birtakım genlerin kromozom üstündeki yerlerini göstermek oluyor bu) yapılmış, sonra genom birbiriyle örtüşen parçalara bölünmüş, bu parçalar fiziksel haritaya göre dizilmiş, aralarından bazıları seçilerek daha küçük parçalara ayrılmış ve her bir parça teker teker sekanslanmıştır. fiziksel haritalama sayesinde genomun belli frekansta mimlendiğini, yani geçilen yerlere işaret konulduğunu düşünürsek, bu işaretler daha sonra sekanslama sırasında yönlendirici olmuş ve çevresindeki diziler belirlenmiştir. oldukça temkinli ama yavaş bir yöntemdir. (bu noktada bir parantez açıp sırf fiziksel haritalama evresinde menkes sendromu, huntington hastalığı, myotonik distrofi gibi birçok hastalıkla ilişkili genlerin bulunduğunu not düşmek isterim. yani projenin sonuçları salt genomun dizilenmesinin de ötesinde.)
celera yöntemi
burda ise birden fazla genom önceden bir haritalama olmaksızın parçalara ayrılarak sekanslanmış ve çok gelişmiş bilgisayar yazılımları kullanılarak (biyoinformatik) bu parçalar örtüşen diziler yardımıyla birleştirilmiştir. ( shotgun method) craig venter grubu bu projeyle halihazırda halka açılmış olan kısmi insan genom dizisinden de yararlanmıştır. en büyük avantajı çok hızlı olmasıdır. diğer yöntem gibi bu metodda da hata payını düşürmek için aynı sekans birden fazla kere sekanslanmıştır. (coverage) sonuçta her bir baz yaklaşık 9 kez sekanslanmıştır.