ChIP-Seq: DNA İlişkili Proteinlerin Görev Yerlerini Bulmak

Bilim öncelikle doğayı anlamaya çalışır. Işığı, sesi, maddeyi; bir şeylerin diğerleri ile etkileşimini, süreçleri, olayları kısacası olan biten her şeyi. Anladığı şeyleri taklit etmeye, sürdürmeye, engellemeye, kontrol etmeye, geliştirmeye çalışır.

Bilimin karmaşık görünen yöntemlerinin altında yatan mantık çoğu zaman çok doğrudan ya da basittir fakat zekicedir. Biyolojik ortamlar söz konusu olduğunda ise yaşayan, dinamik bir dünyayı gözlemlemek oldukça zordur. Her şeyin hem de her şeyin moleküllerin birbiri ile etkileşiminden ibaret olduğu bir alana burnunuzu sokmak için zekice kurgulanmış bir yönteme ihtiyaç duyarsınız. Tıpkı DNA’nın üzerinde görev yapan proteinleri gözlemlemek için onları bulundukları yere sabitlemek gibi.

DNA üzerinde görev yapan pek çok protein vardır; transkripsiyon faktörleri, polimerazlar, nükleazlar, histonlar gibi. Her birinin ayrı hikayeleri vardır ancak hepsi DNA ile ilişkidedir. Bu proteinlerin DNA’da görev yaptıkları yerler bellidir. Her biri kendisine özgü kısa bir DNA dizisini gördüğü yerde görevini icra eder. Örneğin BATF proteini kabaca TGAGTCA dizisini tanıyarak DNA’nın bu diziyi içeren bölgelerinde görev yapar. Bu dizilere motif ya da bağlanma bölgesi denir. Dolayısıyla eğer DNA üzerinde görev yapan bir proteinin bağlanma bölgesini keşfedebilirsek en basitinden kendi sentezlediğimiz bir DNA’da bu proteinin görev yapıp yapmayacağına karar verebiliriz. Bugün DNA zincirini kendine özgü bağlanma bölgelerinden kesen enzimlerin bu bağlanma dizilerini kullanarak DNA moleküllerini istediğimiz noktalardan kesip, birleştirebiliyoruz. (ayr. bkz. Rekombinant DNA)

 

PBR322, klonlama vektörü olarak kullanılan ilk ve yaygın plazmitlerden biridir. Enzimlerin kesme noktaları gösterilmiş.
PBR322, klonlama vektörü olarak kullanılan ilk ve yaygın plazmitlerden biridir. Şekilde enzimlerin bu halkasal DNA’yı kesme noktaları gösterilmiştir.

 

90’ların başından 2000’li yılların başlarına kadar olan dönemde pek çok yeni DNA dizileme metodu geliştirildi. Bilgisayar teknolojileri ve moleküler biyoloji her seferinde daha güçlü bir araya gelerek genetik mühendisliği, biyoinformatik gibi alanlarda bir ivme oluşturdu. Tüm bu süreçte DNA çevresinde gelişen olaylara dair gözlem kabiliyetlerimiz ve kontrol gücümüz önemli ölçüde arttı. DNA’nın hücre içi organizasyonu, eşlenmesi, transkripsiyonuna yönelik anlayışının artması, DNA ile ilişkili proteinlerin tanımlanmasına, görevlerinin ve görev yaptıkları bölgelerin anlaşılması ile doğrudan ilişkilidir. Dolayısıyla buna yönelik yöntemler de zamanla gelişmiştir.

ChIP-Seq: Chromatin Immunoprecipitation Sequencing

DNA’nın hücre içerisinden çıkarılması ve saf olarak elde edilmesi sürecinde DNA üzerinde görev yapan proteinler görev yerlerinde kalamazlar, başka bir deyişle tutundukları bölgelerle etkileşimleri görece zayıf olduğundan düşerler. Haliyle DNA’yı hücre dışına çıkartmadan önce proteinleri bulundukları bölgeye sabitlemek gerekmektedir. Öncelikle henüz hücreler bütün halindeyken bu işlem ilgili kimyasal maddeler ile gerçekleştirilir ve proteinler görev yaptıkları yerlere teknik dille çapraz bağlanır, yani sıkıca tutunur. Sonrasında DNA hücre dışına çıkarılır ve geri kalan her şey atılır. DNA fiziksel bir işlem ile (ses dalgaları kullarak) rastgele yerlerden parçalara ayrılır.

Bazılarının üzerinde sabtitlediğimiz proteinlerin bağlı olduğu milyonlarca DNA parçası içerisinden ilgilendiğimiz proteini seçmek gerekmektedir. ChIP kısaltması tam da burada oluşmaktadır. Türkçesiyle kromatin immünoçöktürme. Kromatin, yöntemin ilk keşfedildiği zamanlardan kalan bir isimdir ve DNA’nin hücre içinde bulunduğu özel bir yapıyı ifade eder (ayr bkz. Histon). İlgilendiğimiz DNA-Protein ikilisinin diğerlerinden ayrılması ise özetle immünoçöktürmedir. Yani yalnızca istediğimiz proteine bağlanan başka bir molekülden yardım alarak proteinleri çöktürmek. Bu molekül, bağ yaptığı proteinleri de ardına katarak çözelti içerisinde bir çökelti oluşturur. Geri kalan her şey ortamdan uzaklaştırıldıktan sonra öncelikle bu moleküllerin proteinlerden ayrılması sağlanır, sonrasında ise proteinler ile sıkıca tutundukları DNA parçaları birbirinden ayrılır. Böylece geriye yalnızca istediğimiz proteinin ona özgü bağlanma bölgesini içeren DNA parçaları kalır.

Elimizde gene de milyonlarca DNA parçası vardır. Tek tek, el ile bunları incelemek elbette mümkün değildir. ChIP adına elbette bir tarihsel gelişimin ardından -Seq burada eklenir. İngilizce sequencing kelimesinin kısaltmasıdır ve dizilemeyi ifade eder. Son 20 yılda büyük gelişmeler kaydeden Yeni Nesil Dizileme teknolojileri elimizdeki bu milyonlarca DNA parçasını bir kahve molası sırasında dizileyebilir, yani DNA’ları A,T,G ve C’den oluşan dijital verilere dönüştürür.

 

couger_input_fa
DNA dizilerinin ifade edildiği özel bir metin formatı olan FASTA.

 

İlgilendiğimiz proteinin nihayetinde bağlanma bölgesi hakkında hiçbir fikrimiz yoktur ve elimizde her biri 30-40 harften oluşan milyonlarca dizi vardır. Neyseki gelişmiş bilgisayar teknolojileri mevcuttur ve bütün o DNA parçalarından gelen bilgiler (diziler ya da sekanslar) daha önce tamamı dizilenmiş tek parça referans bir DNA’ya hizalanır (alignment), buna haritalama (mapping) da denir. Biraz daha açıklamak gerekirse elimizde AAABBBCCCDDD referans dizisi ve AAA ve CCC olarak elde ettiğimiz ChIP-Seq dizileri olsun. Haritalama (mapping) sonrasında bu AAA ve CCC’nin nerelere denk geldiğini görebiliriz. Bu eğer görüntülemek isterseniz aşağıdaki gibi görünür.

 

hizalama
DNA üzerinde tekrarlı bir bölgeye hizalanmış diziler.

 

Bununla beraber elimizdeki DNA parçaları rastgele yerlerden kırıldıkları için proteinlerin bağlandıkları yerler konum olarak farklıdır. Bunu şöyle açıklamak gerekirse elimizde CGTCGCTAG, TCGCTAGCTA ve TACGTCGCTA dizileri olsun bunlar hizalandıkları zaman şu şekilde görünür.

 

hizalama2

 

Diziler şekildeki gibi hizalandığında göze çarpan her birinin belli bir diziyi içeriyor ve bu nedenle o bölgeye haritalanıyor olmasıdır. Bu şekilde onlarca hatta yüzlerce dizinin özel bir yere haritalanması bize ilgilendiğimiz proteinin o bölgede görev yapıyor olduğunu gösterir. Diziler hizalanma biçimlerine göre incelendiğinde yukarıdaki gibi ortak bir motife sahip oldukları görünür. Söz konusu motif, yola çıktığımız proteinin görev yaptığı DNA bağlanma bölgesidir.

Hizalanma ve haritalama kavramları biraz kafa karışıklığı oluşturmuş olabilir. Her bir DNA parçasının -bunlara dijital ortamda artık okuma (read) denmektedir- referans genomda bir yerlere denk getirilmesi işlemi haritalamadır (mapping). Bu okumalar çok sayıda olduğundan ve ortaklıklar içerdiklerinden haritalandıkları bölgelerde ortak parçalarına göre hizalanırlar (alignment).

 

ChIP_Seq_Illustration2
Olan bitenin özetinin özeti: ChIP-Seq nedir? Tıklayarak büyütebilirsiniz.

 

DNA canlılık altında yatan koddur ancak tek başına hiçbir işe yaramaz. Bir şekilde okunması gereklidir çünkü işlerin nasıl yürüyeceğini anlatır. DNA’yı okuyan, kesen, kopyalayan, birleştiren moleküllerin bunu nasıl ve nerede yaptığını bilmek insanoğluna canlılığın işleyişini kontrol etme gücü verir ki bunu tamir etmek, iyileştirmek, sürdürmek, geliştirmek ve hatta yeniden tasarlamak için kullanabilir.

Ekstra

ChIP-Seq verilerinin hizalanmasında bazı sorunlar vardır. Örneğin birden fazla yere dağılan aynı diziler gibi, nerenin doğru yer olduğunu bulmak bir sorun olabilmektedir. İnsan genomu 3 milyar harf içermekte ve ChIP-Seq bu kadar harflik bir referansa milyonlarca diziyi haritalamaya çalışmaktadır. Tüm eşleşmeleri göz ile kontrol etmek mümkün değildir. Elbette bunun için pek çok yazılım (Bowtie) ve algortima (Burrows-Wheeler) mevcuttur ancak bunlar da sürekli geliştirilmektedir. ChIP-Seq çıktıları burada anlatıldığı kadar kesin ve basit olmamakla beraber, DNA’nın tekrarlı baz dizilimine sahip bölgeleri, kopya genler vs. ChIP-Seq sonuçlarını bulandırmaktadır. ChIP-Seq, biyoinformatiği yakından ilgilendirerek üzerinde yoğun çalışmaların yapıldığı güncel bir alandır.

 

Kaynaklar ve Okumalar

  1. “ChIP–seq: advantages and challenges of a maturing technology”, Peter J. Park; Nature Reviews: Genetics 10 (2009) 669-680 [PDF]
  2. “Whole-Genome Chromatin IP Sequencing (ChIP-Seq)”, Illumina Inc.; 2010, Data Sheet: Sequencing [PDF]
  3. “Practical Guidelines for the Comprehensive Analysis of ChIP-seq Data”, T. Bailey, P. Krajewski; PLOS Computational Biology 9 (2013) 11; e1003326 [PDF]
  4. ChIP-Seq Data Analysis”, V. Orgogozo, Institut Jacques Monod,  Bioinformatics Course Material [PDF]
  5. “ChIP-seq: Using high-throughput sequencing to discover protein–DNA interactions” D. Schmidt, M. D. Wilson; Methods 48 (2009) 240–248 [PDF]
  6. “ChIP–seq and beyond: new and improved methodologies to detect and characterize protein–DNA interactions”, Terrence S. Furey; Nature Reviews: Genetics 13 (2012) 640-652 [PDF]
  7. “Kromatin İmmunopresipitasyon-Dizileme Metodu ile Transkripsiyon Faktörü Bağlanma Bölgelerinin Saptanması.” S.S. Ekmekci, N. Abacı, Deneysel Tıp A. E., 3(6) (2012) 1-6 [PDF]
  8. “Computational Analysis of ChIP-Seq Data”, J. Duan; Aarhus University, 2010 [PDF]
  9. “Getting started with ChIP-Seq”, EMD Millipore [PDF]

 
 


Reklamlar

One thought on “ChIP-Seq: DNA İlişkili Proteinlerin Görev Yerlerini Bulmak”

  1. Merhaba Seyit,
    Seni uzun zamandan beri takip ediyorum. Tebrik ediyorum ve başarılarının devamını diliyorum. İleriki yıllarda adını bilim tarihine yazdıracağını umut ediyorum

Yorum Yap

Aşağıya bilgilerinizi girin veya oturum açmak için bir simgeye tıklayın:

WordPress.com Logosu

WordPress.com hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap / Değiştir )

Twitter resmi

Twitter hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap / Değiştir )

Facebook fotoğrafı

Facebook hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap / Değiştir )

Google+ fotoğrafı

Google+ hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap / Değiştir )

Connecting to %s