DNA-Sequenzanalyse

Eine DNA-Sequenzanalyse ist in der Molekularbiologie und Bioinformatik die automatisierte, computergestützte Bestimmung von charakteristischen Abschnitten, insbesondere Genen, auf einer DNA-Sequenz. Untersucht werden die bei der DNA-Sequenzierung gewonnenen Informationen über die Abfolge und Position der Basenpaare. Die Resultate dieser Tätigkeit werden auch Annotationen genannt, wobei sich die Sequenzanalyse nicht nur auf Annotationsmethoden beschränkt.

Die Analyse von DNA-Sequenzen wurde durch die Verfügbarkeit großer genomischer Datenmengen und der Notwendigkeit ihrer Interpretation bedingt. Viele der für Nukleotid-Sequenzen entwickelten Methoden lassen sich auch genauso oder mit geringfügigen Modifikationen auf Aminosäure-Sequenzen, also die Primärstruktur von Proteinen anwenden. Die Methoden, die zum überwiegenden Teil den so genannten Stringalgorithmen zuzurechnen sind, lassen sich – bei Vernachlässigung der Biologie-spezifischen Einschränkungen – sogar auf beliebige Symbolsequenzen übertragen.

Sequenzanalysen können durch folgende Probleme motiviert werden:

  • Bei der Sequenzierung eines Genoms fallen Daten in Form von tausenden relativ kurzer Sequenzen an: Wie setzt man diese zusammen?
  • Analoge Gene, Gene also, deren Proteinprodukte ähnliche Funktionen haben, können in verschiedenen Arten ähnliche Muster aufweisen; homologe Gene können sich im Laufe der Evolution auseinanderentwickeln: Kann man unbekannte Gene im Menschen durch Kenntnis der homologen Gene in der Maus auffinden? Wie weit sind die Organismen genetisch voneinander getrennt? Wie viel Zeit ist seit ihrer Trennung im Stammbaum vergangen?
  • Introns und Exons weisen unterschiedliche Muster und Statistiken auf, Gen-Kontrollregionen sind oft stark konserviert: Lassen sich diese Bereiche allein durch Mustervergleiche und statistische Analyse der n-Tupel-Häufigkeiten automatisch unterscheiden?
  • Ein großer Teil der genomischen DNA besteht aus nichtkodierender DNA die durch relativ kurze sehr häufig wiederholte Einheiten (repeats) gekennzeichnet sind: Wie filtert man diese heraus, damit Suchalgorithmen nicht durch falsch positive Ergebnisse falsche oder irreführende Resultate produzieren?

Algorithmen

Stringalgorithmen

Eine der häufigsten Problemstellungen ist die Suche nach bestimmten Teilsequenzen in einer Datenbank. Man kann entweder nach exakten Übereinstimmungen (String-Matching-Algorithmen) suchen oder nach allen ungefähren Entsprechungen innerhalb einer bestimmten Levenshtein-Distanz vom Suchstring. Im englischen Sprachraum werden diese Anpassungen zweier Strings sequence alignments genannt, was wiederum der ganzen Familie von Alignment-Algorithmen ihren Namen gab. Der Begriff setzt sich auch im Deutschen mehr und mehr in unübersetzter Form durch. Die weitaus bekanntesten Realisierungen von Alignments sind der Needleman-Wunsch-Algorithmus (globales Alignment), der Smith-Waterman-Algorithmus (lokales Alignment) und BLAST-Algorithmus (heuristisches paarweises Alignment).

Weblinks

Die News der letzten Tage

02.12.2022
Ethologie | Säugetierkunde
Markierungsbäume von Geparden sind Hotspots der Kommunikation – auch für andere Tierarten
Markierungsbäume sind für Geparde wichtige Hotspots der Kommunikation: Dort tauschen sie über Duftmarken, Urin und Kot Informationen mit anderen und über andere Geparde aus.
02.12.2022
Land-, Forst-, Fisch- und Viehwirtschaft | Ökologie
DBU: Weltbodentag am 5. Dezember
Mittlerweile leben acht Milliarden Menschen auf der Welt und Ernährungssicherung wird zu einer dringendsten Herausforderungen unserer Zeit.
01.12.2022
Physiologie
Altern Frauen anders als Männer?
Studien an Fruchtfliegen zeigen, wie das biologische Geschlecht die Wirkung des derzeit vielversprechendsten Anti-Aging-Medikaments Rapamycin beeinflusst.
29.11.2022
Ethologie | Zoologie
Geschlechterrollen im Tierreich hängen vom Verhältnis von Weibchen und Männchen ab
Wie wählerisch sollten Weibchen und Männchen sein, wenn sie einen Partner auswählen?
28.11.2022
Ökologie | Paläontologie | Säugetierkunde
Fossil aus dem Allgäu: Biber leben seit mehr als 11 Millionen Jahren im Familen-Clan
Die Hammerschmiede im Allgäu, Fundstelle des Menschenaffen Danuvius, ist eine einmalige Fundgrube für Paläontologen: Bereits über 140 fossile Wirbeltierarten konnten hier geborgen werden.
28.11.2022
Anthropologie | Neurobiologie
Arbeitsgedächtnis: Vorbereitung auf das Unbekannte
Beim Arbeitsgedächtnis, oder auch Kurzeitgedächtnis genannt, galt lange die Theorie, dass seine Kernaufgabe die aktive Speicherung von Informationen über einen kurzen Zeitraum ist.
28.11.2022
Meeresbiologie | Ökologie
Offshore-Windparks verändern marine Ökosysteme
Der Ausbau von Offshore-Windparks in der Nordsee geht voran, doch die Konsequenzen für die marine Umwelt, in der sie errichtet werden, sind noch nicht vollständig erforscht.
25.11.2022
Evolution | Genetik | Neurobiologie
Was haben Oktopus und Mensch gemeinsam?
Kopffüßler sind hochintelligente Tiere mit komplexem Nervensystem, dessen Evolution mit der Entwicklung von auffällig viel neuer microRNA verbunden ist.
25.11.2022
Klimawandel | Ökologie
Der Klimawandel in den Wäldern Norddeutschlands
Immer mehr Bäume leiden an den Folgen des menschgemachten Klimawandels der vergangenen Jahrzehnte.
24.11.2022
Biochemie | Entwicklungsbiologie | Genetik
Das Erwecken des Genoms
Die Befruchtung einer Eizelle durch ein Spermium ist der Beginn neuen Lebens, die mütterliche und väterliche Erbinformation, die DNA, wird neu kombiniert und speichert den Aufbau des Lebewesens.
24.11.2022
Genetik | Mykologie | Taxonomie
Die Welt der Pilze revolutioniert
Ein internationales Forschungsteam hat unter den bisher bekannten Pilzen und Flechten eine neue Großgruppe identifiziert: Mithilfe von Genom-Sequenzierung konnte nachgewiesen werden, dass über 600 Arten einen gemeinsamen Ursprung haben.
24.11.2022
Insektenkunde | Ökologie
Vegetationsfreie Flächen fördern bodennistende Wildbienen
Über die Nistansprüche bodennistender Wildbienen ist bisher relativ wenig bekannt, obwohl Nistplätze für die Förderung der meisten Wildbienenarten von zentraler Bedeutung sind.