DNA barcoding


DNA Barcoding ist eine taxonomische Methode zur Artenbestimmung anhand der DNA-Sequenz eines Markergens[1]. Die Abfolge der Basenpaare wird dabei analog wie der Strichcode auf Lebensmittel-Verpackungen als Kennzeichen für eine bestimmte Art verwendet. Der Name Barcoding (bar: engl.: Balken) entstammt dieser Analogie. Da sich die DNA-Sequenz mit einer im großen und ganzen gleichmäßigen Rate durch Punktmutationen verändert (vg.: Molekulare Uhr), besitzen näher verwandte Individuen (und Arten) ähnlichere Sequenzen. Solange eine Art ungeteilt bleibt, d.h. einen gemeinsamen Genpool besitzt, werden Unterschiede zwischen verschiedenen Populationen durch Genfluss immer wieder ausgeglichen. Mit der Separation bei der Artbildung entwickeln sich die Sequenzen mit annähernd konstanter Rate auseinander. Besitzen also Proben aus zwei Individuen deutlich unterschiedliche Sequenzen, ist dies ein Zeichen, dass sie aus verschiedenen Arten stammen.

Beim DNA-Barcoding geht es nicht um die proteincodierende Eigenschaft der DNA. Da kodierende Sequenzen der Selektion unterliegen, steht ihre Verwendung sogar unter Vorbehalten. Sie ist dennoch möglich, weil der genetische Code in der dritten Position des Basentripletts zu großen Teilen redundant ist ("degenerierter Code"). Dadurch unterliegt die Sequenz hier kaum der Wirkung der Selektion und kann als neutraler Marker verwendet werden. Für die Detektierung von Unterschieden zwischen nah verwandten Arten ist eine schnell verändernde Basensequenz, z.B. aus einem funktionslosen DNA-Abschnitt, am besten geeignet. Für größere Unterschiede eignen sich langsam verändernde Abschnitte besser. Für die Methode wurden demgemäß verschiedene DNA-Abschnitte vorgeschlagen. Am weitesten verbreitet ist dabei ein Abschnitt aus der mitochondrialen DNA (mtDNA). Diese hat den Vorteil, dass sie keine Introns enthält (außer bei Pilzen), nur sehr wenig der Rekombination unterliegt und im haploiden Modus vererbt wird; dies erspart eine sonst notwendige Klonierung. Von den 13 proteincodierenden Genen der mtDNA wird als Standard eine 648 Basenpaare (abgekürzt: bp) lange Region des Gens der Untereinheit I der Cytochrom c Oxidase (COI oder cox1) verwendet.[2], weil dieses Gen zwischen verschiedenen Arten stärkere Unterschiede aufweist als die anderen mitochondrialen Gene.

Durchführung

Das Verfahren beruht auf der Anwendung der Polymerase-Kettenreaktion (abgekürzt PCR nach dem engl.). Folgende Arbeitsschritte sind erforderlich:

  • Extraktion der DNA aus dem untersuchten Organismus oder der Probe. Hierzu kann frisches Material oder Museumsmaterial dienen, wobei aber die in Museen häufig praktizierte Konservierung mit Formalin Probleme bereitet.
  • Durchführung der PCR. Damit die Reaktion starten kann, ist neben dem Enzym ein kurzer DNA-Abschnitt, der Primer erforderlich. Für beide DNA-Stränge (nach der Ringstruktur am jeweiligen Ende 3' und 5' genannt) ist ein eigener Primer notwendig, wobei in der Praxis meist nur der 5'-Primer verwendet wird. Eigentlich scheint es so, dass die Auswahl des Primers eine unmögliche Aufgabe sein müsste; schließlich hängt er von der Basensequenz der DNA ab, die ja unbekannt ist und mit der Methode gerade herausgefunden werden soll. Glücklicherweise sind im Genom zahlreiche Abschnitte eingestreut, die zwischen verschiedenen Organismen nur sehr wenig variabel sind. Diese konservierten Sequenzen kodieren meist für eine biologisch grundlegende Aufgabe, so dass sich Mutationen an dieser Stelle meist letal auswirken. Die Standardsequenz des cox1-Gens wurde nicht zuletzt deshalb ausgewählt, weil für sie gute Primer zur Verfügung standen. Dennoch ist die Auswahl des Primers ein schwieriger Schritt, und unterschiedliche Primer können unterschiedliche Sequenzen ergeben. Es ist möglich, mit dem Enzym Reverse Transkriptase neue Primer zu erzeugen, dies ist aber für Routineuntersuchungen viel zu aufwendig.
  • Sequenzierung der vervielfältigen (oder "amplifizierten") DNA. Dies war früher eine diffizile Laboraufgabe. Heute stehen leistungsfähige Sequenzierautomaten mit hoher Durchsatzrate zur Verfügung, die die Sequenzierung automatisch durchführen. Die Sequenzierung trägt daher heute weder zu den Schwierigkeiten noch zu den Kosten der Methode noch Nennenswertes bei.
  • Analyse der Sequenz. Liegt bereits eine Datenbank für die untersuchte Gruppe vor, wird die Sequenz mit den dort gespeicherten Sequenzen verglichen. Ist sie identisch oder weist nur geringe Variationen auf, gehört die untersuchte Probe wahrscheinlich zu dieser Art. Schwieriger ist es, wenn gar keine Datenbank vorliegt bzw. diese mit den Proben gerade erstellt werden soll, oder wenn die Probe keine Übereinstimmung mit den gespeicherten Sequenzen aufweist. Unbekannte Proben werden vom Computer nach Sortieralgorithmen abgestuft nach Ähnlichkeit gruppiert, so dass sich Bäume ergeben, die einem Stammbaum ähneln. Proben aus derselben Art oder aus sehr nahe verwandten Arten sollten ähnliche Sequenzen aufweisen und daher bei der Sortierung nahe beieinander liegen. Weisen die Proben von einer "Art" zwei oder mehr deutlich getrennte Gruppen (oder "Cluster") auf, ist dies ein starker Hinweis darauf, dass hier in Wirklichkeit mehrere Arten vorliegen, die bisher nicht erkannt und unterschieden worden waren. Unglücklicherweise ist der Unterschied zwischen verschiedenen Arten in unterschiedlichen systematischen Gruppen sehr unterschiedlich groß, und gleichzeitig kann der Polymorphismus innerhalb einer Art manchmal recht groß sein. Es ist deshalb nicht möglich, eine universelle Schwelle anzugeben, ab der divergierende Sequenzen mit Sicherheit verschiedene Arten repräsentieren. In der Größenordnung hat sich vielfach ein Unterschied von 3 % bewährt, aber sowohl niedrigere als auch höhere Werte sind vielfach in Gebrauch. Was die Cluster der Datenanalyse, manchmal "operational taxonomic units" oder OTUs genannt, wirklich repräsentieren und ob man sie ohne weiteres mit Arten gleichsetzen darf, gehört zu den größten Streitpunkten des Verfahrens.

Anwendungen

Es gibt weltweit eine Reihe von Initiativen, die versuchen, für bestimmte Artengruppen Datenbanken mit DNA barcode-Sequenzen als Referenzen aufzubauen. Ziel der Initiativen ist es vor allem, Sequenzen von zweifelsfrei bestimmten Individuen beschriebener Arten zu sammeln und einzulesen, um Daten für Anwender bereitzustellen. Die Initiative IBOL (International barcode of life project) koordiniert die Bemühungen in zahlreichen Artengruppen und leistet technische Hilfe. Einige teilnehmende Initiativen sind: Die Fish Barcode of Life Initiative (FISH-BOL) versucht, eine Datenbank mit DNA barcodes für weltweit alle Fischarten aufzubauen [3]. ABBI ist die entsprechende Initiative für die die Vögel[4]. Andere IBOl-Initiativen versuchen dasselbe für die Schmetterlinge[5] und die Säugetiere[6].

Der Ehrgeiz mancher Forschungsgruppen geht allerdings schon weit über diese Ziele hinaus. Viele erträumen sich, irgendwann einmal einfach unsortierte aus der Umwelt gewonnene Proben zu sequenzieren und anschließend mehr oder weniger eine Artenliste des entsprechenden Lebensraums zu erhalten, ohne hochtrainierte, teure und seltene Spezialisten noch bemühen zu müssen[7]. Andere erwarten in naher Zukunft durch Miniaturisierung der Komponenten sogar transportable Barcoder, die, handhabbar im Gelände oder am Arbeitsplatz, aus kleinsten Proben verlässlich und in Echtzeit einen Artnamen ermitteln können.

Fallbeispiele

  • Die Untersuchung des neotropischen Schmetterlings Astraptes fulgerator mittels DNA barcoding hat ergeben, dass das, was bisher für eine (polymorphe) Art gehalten worden ist, in Wirklichkeit einen Komplex aus zehn sehr ähnlichen Zwillingsarten darstellt, die morphologisch kaum unterscheidbar sind[8].
  • In einer Studie an tropischen parasitoiden Brackwespen konnten mit morphologischen Methoden 171 provisorische (zu ca. 95 % unbeschriebene) Arten unterschieden werden. DNA barcoding ergab das Vorhandensein von weiteren 142 Arten, die bei der morphologischen Sortierung nicht erkannt werden konnten, die meisten davon wirtsspezifisch. Die Studie lässt Hochrechnungen auf die extreme Artenfülle dieser Gruppe in den Tropen zu, auf die weltweit nur extrem wenige Taxonomen spezialisiert sind.[9].
  • Die Eignung der Methode konnte für die Artidentifikation mariner Rotalgen nachgewiesen werden. Diese sind nach morphologischen Kriterien nur extrem schwierig unterscheidbar[10].
  • Bei Landpflanzen ist das cox1-Gen für DNA barcoding ungeeignet und erbringt keine verwertbaren Resultate. Für die Methode wurde eine Reihe anderer Gene getestet. Bisher am besten geeignet war ein Abschnitt des Plastid-Gens matK[11] (Plastiden besitzen ebenso wie Mitochondrien eigenes Erbmaterial). In einer Pilotstudie an Orchideenarten konnte die Eignung dieses Gens für DNA barcoding von Landpflanzen nachgewiesen werden. Marker für tropische Orchideenarten könnten in der Anwendung ein wichtiger Baustein zum Verhindern von Schmuggel sein.[12]. Eine weitere Arbeitsgruppe fand allerdings bei Bäumen der auch ökonomisch bedeutsamen Familie Meliaceae (Mahagonigewächse), dass alle Marker auf Mitochondrien und Plastiden gleichermaßen unzuverlässig waren. Sie schlagen eine mituntersuchte Region des nuklearen Genoms als Marker vor[13]
  • Die Anwendung der Methode auf Primatenarten erwies sich wegen einiger methodischer Probleme schwierig, sie war aber nach entsprechender Anpassung der Standardmethodik möglich und für die Zukunft vielversprechend. Die Methode könnte auch hier helfen, Schmuggel (auch von Fleisch und anderen Produkten) einzudämmen und wäre in der biomedizinischen Forschung hilfreich.[14].
  • In einer Studie konnte nachgewiesen werden, dass es möglich ist, aus Kotproben, die im Lebensraum gesammelt worden sind, Art- und Geschlechtszugehörigkeit von Sibirischen Tigern und Amurleoparden zu bestimmen. Damit kann die verbleibende Verbreitung, die Ökologie und Lebensweise dieser extrem heimlichen Arten viel einfacher als mit den sehr seltenen Sichtbeobachtungen aufgeklärt werden[15]
  • Forschern in Südfrankreich ist es gelungen, anhand von DNA aus Wasserproben heruauszufinden, ob in dem Gewässer Individuen des Amerikanischen Ochsenfroschs vorkommen. Die Art, die nach Europa eingeschleppt wurde, ist hier wegen ihrer Auswirkungen auf die heimische Amphibienfauna gefürchtet. Ein direkter Nachweis ist bei niedriger Populationsdichte schwierig und nur zu bestimmten Jahreszeiten möglich.[16].

Wesentliche Vorteile der Methode

Die Befürworter der Methode führen folgende wesentliche Vorteile des DNA barcoding gegenüber mehr traditionellen taxonomischen Arbeitsmethoden an, die sie teilweise auch belegen können (vgl. die Fallbeispiele):

  • Die Methode ermöglicht Nicht-Spezialisten die Bestimmung von Arten aus schwierigen und artenreichen Gruppen. Dies ist wichtig, weil jeder Spezialist mit einiger Sicherheit nur wenige Tausend Arten wirklich überschauen kann, es aber Millionen von Arten gibt (vgl.: Artenvielfalt). Die Anzahl der Taxonomen ist weltweit gering. Sie nimmt zur Zeit weiter deutlich ab, weil das Fach als altmodisch gilt und bei den internen Rangkämpfen um knappe Mittel der biologischen Fachrichtungen untereinander meist zu den Verlierern zählt. Gleichzeitig soll die Biodiversität des Lebens auf der Erde beschrieben und erfasst werden, was mit konventionellen Methoden bei der bisherigen Geschwindigkeit Jahrhunderte benötigen würde.
  • Durch DNA barcoding ist es möglich, Teile und Produkte von Organismen einer Art zuzuordnen. Dies ist wesentlich, um Schmuggel geschützter Arten, Einhaltung von Fangquoten und ähnliche Probleme zu lösen, mit denen die Behörden heute überfordert sind. Außerdem können Larven und andere Entwicklungsstadien den (meist nach Adulti beschriebenen) Arten zugeordnet werden.
  • Durch Analyse scheinbar bekannter Arten erweist es sich häufig, dass es morphologisch nicht unterscheidbare Zwillingsarten (Kryptospezies) gibt, die sich in Lebensweise und Spezialisierung deutlich unterscheiden können. In anderen, merkmalsarmen Gruppen wie den Nematoden ist eine Artbestimmung nach der Morphologie ohnehin fast unmöglich. Hier kann DNA barcoding die Zusammenhänge deutlich besser enträtseln oder zumindest wesentliche Hinweise geben.

Kritik und Grenzen der Methode

Die beeindruckenden Chancen, die die Methode des DNA barcoding bei der schnellen und einfachen Artbestimmung ermöglicht, sollten nicht den Blick verstellen auf Unzulänglichkeiten, die sich in verschiedenen Bereichen erwiesen haben. Eine unkritische Übernahme der Ergebnisse kann schwere Fehlurteile zur Folge haben. Diese betreffen verschiedene Aspekte des Verfahrens und sind teilweise durch technische Anpassungen und Verfeinerungen behebbar, teilweise aber auch grundsätzliche Unzulänglichkeiten, die den Einsatz des DNA barcoding für einige Einsatzbereiche erschweren oder unmöglich machen.

Zunächst ergibt es sich aus der Verwendung eines mitochondrialen Markergens, dass Verwandtschaft ausschließlich im mütterlichen Erbgang ermittelt wird, da das Spermium keine Mitochondrien zum neuen Organismus beisteuert. Dadurch ist es nicht möglich, einige Effekte von Hybridisierungen oder Introgressionen zu erforschen. Dieser Effekt ist aber nur bei noch unvollkommenen Artaufspaltungen oder sehr nahe verwandten Arten bedeutsam.

Eine weitere prinzipielle Schwierigkeit liegt darin, dass es selten einen scharfen Bruch zwischen der intraspezifischen und der interspezifischen Variabilität (d.h. derjenigen innerhalb einer Art und zwischen verschiedenen Arten) gibt. Sehr polymorphe Arten und nahe verwandte Artengruppen gehen unscharf abgegrenzt ineinander über. Im Grunde ist dies nicht ein Problem der Methode, sondern einfach ein Effekt der Natur selbst, die sich nicht immer perfekt in unsere mehr oder weniger künstlichen Sortierkriterien einfügt. Probleme ergeben sich aber daraus in der Anwendung, z.B. wenn Artenzahlen verglichen werden sollen. Noch problematischer wird es, wenn ausschließlich mit DNA barcoding abgegrenzte "operational taxonomic units" als Arten behandelt werden, weil dann die Artenvielfalt z.B. eines Lebensraums kritisch von den bei der Analyse verwendeten Schwellenwerten abhängt. Dadurch werden subtile Manipulationen möglich. Da die Schwellenwerte zwischen verschiedenen Organismengruppen sehr verschieden sein können, ist es auch sehr riskant, schlecht erforschte oder unbekannte Sequenzen ohne sehr ähnliche Referenzeinträge in der Datenbank als reale biologische Einheiten zu behandeln. Die genannten Schwierigkeiten sollten kleiner werden und letztlich verschwinden, wenn die untersuchten Gruppen besser bekannt und die Datenbanken vollständiger geworden sind. Allerdings hatten die Verfechter der neuen Methode immer damit geworben, dass man mit ihr die Biodiversität unaufwendig direkt bestimmen könnte, d.h. gerade ohne vertiefte Kenntnisse der Arten auf unabhängigen Wegen.

Einige Forscher weisen darauf hin, dass das Markergen cox1 zumindest bei einigen Organismengruppen einer stärkeren gerichteten Selektion unterliegt. Durch den Effekt der Selektion sind Änderungen nicht mehr zwingend neutral, sie können langsamer oder schneller ablaufen als erwartet und dadurch die Resultate verzerren. Die Selektion kann direkt auf das kodierte Enzym gerichtet sein oder sich indirekt durch die Koppelung mit anderen Genen ergeben (linkage disequilibrium, in etwa: "Genkoppelungs-Ungleichgewicht"). Bei Insekten und anderen Arthropoden kann z.B. die fast universell verbreitete Infektion mit symbiotischen oder schädigenden Bakterienstämmen, z.B. der Gattung Wolbachia, starke Ungleichgewichte der mtDNA innerhalb einer Art erzeugen (wobei dann fälschlich angenommen wird, es lägen mehrere, kryptische Arten vor) als auch einzelne Populationen verschiedener Arten zueinander ähnlicher machen als zu anderen Populationen innerhalb der Art (hier würde entweder der Artunterschied ganz verkannt oder es würden zu viele Arten unterschieden)[17]. Diese Effekte sind für die Schätzungen der Artenvielfalt nicht ohne Belang, weil etwa die Hälfte der beschriebenen Arten (und vermutlich ein deutlich höherer Anteil der unbekannten) Insekten sind. In einer Pilotstudie bei einer Fliegengattung konnte gezeigt werden, dass der Effekt nicht nur theoretisch plausibel ist, sondern die Ergebnisse auch tatsächlich verfälscht[18].

Ein weiteres Problem der Methode sind Pseudogene der mitochondrialen Gene im Zellkern[19]. Durch Kopierfehler werden gelegentlich Abschnitte der mtDNA irrtümlich in das nukleare Genom integriert, dadurch nimmt man an, dass in der Vergangenheit die meisten der ursprünglich viel zahlreicheren unabhängigen Organellengene in den Zellkern integriert worden sind. Obwohl diese Integration funktional abgeschlossen ist, werden immer noch gelegentlich solche Gene in den Zellkern eingebaut, wo sie funktionslos bleiben und in der Regel mehr oder weniger rasch durch selektiv neutrale Mutationen zu Pseudogenen degenerieren[20]. Bei vielen Arten liegen zahlreiche solche Pseudogene im Zellkern vor, beim Menschen sind es zum Beispiel mehr als 500 allein für COI[21]. Durch die üblichen Primer beim DNA barcoding werden die Pseudogene ebenso bei der PCR vervielfältigt wie das "echte" Gen. Da es sich um Sequenzen handelt, die mehr oder weniger lange Zeit unabhängig vom Ursprungsgen mutiert sind, sind sie von diesem verschieden und ergeben fehlerhafte Messwerte. Im schlimmsten Fall wird die Sequenz des Pseudogens mit dem Markergen verwechselt, wodurch die betreffende Art völlig falsch einsortiert wird. Wie nicht erkannte Pseudogene eine Analyse ruinieren können, zeigt z.B.[22]

Quellen

  1. Paul D. N. Hebert, Alina Cywinska, Shelley L. Ball, Jeremy R. de Waard (2003): Biological identifications through DNA barcodes. Proceedings of the Royal Society London Series B 270, 313–321.
  2. Dirk Steinke & Nora Brede (2006): DNA-Barcoding. In: Biologie in unserer Zeit. Bd. 36, Nr. 1, S. 40-46. doi:10.1002/biuz.200410302 PDF
  3. http://www.fishbol.org/
  4. http://www.barcodingbirds.org/
  5. http://www.lepbarcoding.org/
  6. http://www.mammaliabol.org/
  7. Gentile Francesco Ficetola, Claude Miaud, François Pompanon, Pierre Taberlet (2009): DNA barcoding for ecologists. Trends in Ecology & Evolution 24(2): 110-117.
  8. Paul D. N. Hebert, Erin H. Penton, John M . Burns, Daniel H. Janzen, Winnie Hallwachs (2004): Ten species in one: DNA barcoding reveals cryptic species in the neotropical skipper butterfly Astraptes fulgerator. Proceedings of the National Academy of Sciences USA 101(41): 14812-14817.
  9. M. Alex Smith, Josephine J. Rodriguez, James B. Whitfield, Andrew R. Deans, Daniel H. Janzen, Winnie Hallwachs, Paul D. N. Hebert (2008): Extreme diversity of tropical parasitoid wasps exposed by iterative integration of natural history, DNA barcoding, morphology, and collections . Proceedings of the National Academy of Science USA 105(34): 12359–12364.
  10. Lavinia Robba, Stephen J. Russell, Gary, L. Barker, Juliet Brodie (2006): Assessing the use of the mitochondrial cox1-marker for use in DNA barcoding of red algae (Rhodophyta). American Journal of Botany 93(8): 1101–1108.
  11. Khidir W. Hilu & Hongping Liang (1997): The matK-Ggene: sequence variation and application in plant systematics. American Journal of Botany 84(6): 830–839.
  12. Renaud Lahaye, Michelle van der Bank, Diego Bogarin, Jorge Warner, Franco Pupulin, Guillaume Gigot, Olivier Maurin, Sylvie Duthoit, Timothy G. Barraclough, Vincent Savolainen (2008): DNA barcoding the floras of biodiversity hotspots. Proceedings of the National Academy of Science USA 105(8): 2923-2928.
  13. A. N. Muellner, H. Schaefer, R. Lahaye(2011): Evaluation of candidate DNA barcoding loci for economically important timber species of the mahogany family (Meliaceae). Molecular Ecology Resources 11(3): 450–460. doi:10.1111/j.1755-0998.2011.02984.x
  14. Joseph G. Lorenz, Whitney E. Jackson, Jeanne C. Beck, Robert Hanner (2005): The problems and promise of DNA barcodes for species diagnosis of primate biomaterials. Philosophical Transactions of the Royal Society Series B 360: 1869-1877.
  15. Taro Sugimoto, Junco Nagata, Vladimir V. Aramilev, Alexander Belozor, Seigo Higashi, Dale R. McCullough (2006) Species and sex identification from faecal samples of sympatric carnivores, Amur leopard and Siberian tiger, in the Russian Far East. Conservation Genetics 7: 799–802.
  16. Gentile Francesco Ficetola, Claude Miaud, François Pompanon, Pierre Taberlet (2008): Species detection using environmental DNA from water samples. Biology Letters 23(4): 423–425.
  17. Hurst, G.D. & Jiggins, F.M. (2005): Problems with mitochondrial DNA as a marker in population, phylogeographic and phylogenetic studies: the effects of inherited symbionts. In: Proceedings of the Royal Society London Series B 272: 1525-1534. PDF
  18. T.L. Whitworth, R.D. Dawson, H. Magalon, E. Baudry (2007): DNA barcoding cannot reliably identify species of the blowfly genus Protocalliphora (Diptera: Calliphoridae). In: Proceedings of the Royal Society London Series B 274: 1731-1739. doi: 10.1098/rspb.2007.0062
  19. Hojun Song, Jennifer E. Buhay, Michael F. Whiting, Keith A. Crandall (2008):Many species in one: DNA barcoding overestimates the number of species when nuclear mitochondrial pseudogenes are coamplified. Proceedings of the National Academy of Science USA 105 (36): 13486-13491. doi 10.1073/pnas.0803076105
  20. D. Bensasson, D. X. Zhang, D. L. Hartl, G. M. Hewitt (2001): Mitochondrial pseudogenes: Evolution's misplaced witnesses. Trends in Ecology and Evolution 16: 314–321.
  21. Erik Richly & Dario Leister (2004): NUMTs in Sequenced Eukaryotic Genomes. Molecular Biology and Evolution 21 (6): 1081-1084. doi: 10.1093/molbev/msh110
  22. Jennifer E. Buhay (2009): “COI-Like” sequences are becoming problematic in molecular systematic and DNA barcoding studies. Journal of Crustacean Biology 29(1): 96-110. doi:10.1651/08-3020.1

Siehe auch

Weblinks