ENCODE


ENCODE (zusammengesetzt aus engl. ENCyclopedia Of DNA Elements, Enzyklopädie der DNA-Elemente) ist ein Forschungsprojekt, das im September 2003 vom US-amerikanischen National Human Genome Research Institute (NHGRI) initiiert wurde. Ziel des Projekts ist, alle funktionellen Elemente des menschlichen Genoms sowie das Transkriptom zu identifizieren und zu charakterisieren [1]. ENCODE ist damit das Folgeprojekt des Humangenomprojekts, das die Sequenzierung des menschlichen Genoms zum Ziel hatte und das seit 2003 abgeschlossen ist. Ein weiteres Ziel von ENCODE ist die Entwicklung und Implementierung von Hochdurchsatzmethoden zur Identifikation der funktionellen Elemente. [2]

Durchgeführt wird ENCODE von einem Forschungskonsortium, zu dem insgesamt etwa 30 Arbeitsgruppen an verschiedenen Instituten gehören. Das Projekt wird in drei Phasen ausgeführt: einer Pilotphase, die das Ziel hat, 1 % (30 Megabasen) des Genoms zu analysieren und die Untersuchungsmethoden zu evaluieren, einer technologischen Phase, in denen der Datendurchsatz erhöht und die Kosten zur Akquirierung der Daten verringert werden sollen und einer Produktionsphase, in der die restlichen 99 % des Genom analysiert werden sollen. Alle Daten, die im Zuge des ENCODE-Projekts generiert werden, werden in einer öffentlich zugänglichen Datenbank der Allgemeinheit zur Verfügung gestellt [3][4]. Als ein erstes Ergebnis konnte ENCODE 2007 bestätigen, dass etwa die Hälfte aller produzierten RNAs einer Zelle weder mRNA noch ribosomale RNA oder andere RNA-Endprodukte, sondern andere RNAs mit bisher unbekannten Funktionen sind.

Pilotphase

In der Pilotphase wurden zunächst 30 Megabasen DNA-Sequenz des humanen Genoms ausgewählt, was etwa 1 % umfasst, und mit bereits etablierten Methoden analysiert. 50 % dieser Stichprobe wurden gezielt ausgewählt und 50 % zufällig.[5] Dabei wurde das Transkriptom, also sämtliche transkribierten Sequenzen, kartiert, sowie Transkriptionsstartpunkte, Promotoren, Enhancer, Repressoren bzw. Silencer, Exons, Origins of replication, Replikationsterminationssites, Bindestellen von Transkriptionsfaktoren, Methylierungssites, DNase I-hypersensitive Regionen, Chromatinmodifikationen und Regionen, die hochkonserviert sind, aber bisher keine bekannte Funktion haben, identifiziert. Auch genetische Variationen innerhalb dieser hochkonservierten Bereiche werden dokumentiert. Zu den angewandten Methoden zählen neben Sequenzierung, Microarrays, Chromatin-Immunopräzipitation (ChIP) und quantitative PCR.

Technologische Entwicklungsphase

Die technische Weiterentwicklung der Methoden findet zeitgleich mit der Pilotphase statt. Es sollen neue Labortechniken und Computerprogramme ausgearbeitet werden.

Produktionsphase

In der letzten produktiven Phase sollen die verbleibenden 99 % der Sequenz des menschlichen Genom analog zum ersten Prozent kartiert und funktionelle Elemente identifiziert werden, und dies so kostengünstig und verlässlich wie möglich. Weitere funktionelle Elemente, die in der Pilotphase noch nicht berücksichtigt wurden wie zum Beispiel Telomere und Centromere, sollen dann charakterisiert werden.

Kosten

Zunächst wurden in der Pilotphase acht Arbeitsgruppen mit insgesamt 12 Millionen US-Dollar gefördert. Seitdem kamen weitere Gruppen hinzu, die sich beispielsweise mit der Koordination der Datenbanken befassen. Insgesamt kostete das Pilotprojekt 55 Millionen US-Dollar, und die 2012 beendete Produktionsphase weitere 130 Millionen.[6]

Einzelnachweise

  1. The ENCODE Project Consortium: The ENCODE (ENCyclopedia Of DNA Elements) Project Science 22 October 2004: Vol. 306. no. 5696, pp. 636 - 640 DOI: 10.1126/science.1105136
  2. Science22 October 2004:Vol. 306. no. 5696, pp. 636 - 640 DOI: 10.1126/science.1105136 The ENCODE (ENCyclopedia Of DNA Elements) Project
  3. http://genome.ucsc.edu/ENCODE/
  4. [1] "ENCODE Project Data Release Policy"
  5. http://www.genome.gov/10506161
  6. Brendan Maher: ENCODE: The human encyclopaedia. In: Nature. 489, 2012, S. 46–48, doi:10.1038/489046a.

Weblinks

Die News der letzten Tage