Pfam


Pfam (Protein Families) ist eine frei zugängliche Datenbank für bioinformatische Zwecke. Es handelt sich zum Einen um eine maschinelle Kategorisierung von Proteindomänen, die alle bekannten Proteine einschließt. Grundlage ist die Mustererkennung mittels Machine Learning der Aminosäuresequenz. Die so ermittelten Muster können zum Anderen in neuen Proteinen wiedergefunden werden, was einen Hinweis auf die Zusammensetzung dieser Proteine aus Domänen, und damit auch auf ihre Funktion, bzw. bei Enzymen auf die enzymatische Aktivität gibt. Für diese Vorhersage stellt Pfam einen Webservice bereit.

Pfam besteht aus zwei Teilen, Pfam-A und Pfam-B. In Pfam-A sind gut charakterisierte Domänen zusammengefasst, während sich Domänen mit unbekannter Funktion in Pfam-B befinden. Bei der Methode des maschinellen Clustering und der Mustererkennung handelt es sich um Hidden Markov Modelle.[1]

Pfam wurde 1997 von den Bioinformatikern Erik Sonnhammer (Karolinska Institutet bei Stockholm), Sean Eddy (Washington University in St. Louis), und Richard Durbin (Sanger Center, Cambridge) aufgebaut.[2] Um etliche Funktionalitäten erweitert, kam Anfang 2006 die Aktualisierung 18 heraus.[3] Die aktuelle Version ist Pfam 26.0.[4]

Literatur

  1. Durbin, R., Eddy S., Krogh, A., Mitchison G. Biological Seqeuence Analysis. Cambridge University Press, Cambridge, 1998 ISBN 0-521-62041-4
  2. Sonnhammer EL, Eddy SR, Durbin R. Pfam: a comprehensive database of protein domain families based on seed alignments. Proteins 28:405-420. 1997 PMID 9223186
  3. Finn RD, Mistry J, Schuster-Bockler B, Griffiths-Jones S, Hollich V, Lassmann T, Moxon S, Marshall M, Khanna A, Durbin R, Eddy SR, Sonnhammer EL, Bateman A.Pfam: clans, web tools and services. Nucleic Acids Res. 34:D247-251. 2006 PMID 16381856
  4. http://pfam.sanger.ac.uk/help#tabview=tab3

Weblinks

Zugriff auf Pfam: GB:pfam.sanger.ac.uk Schweden:pfam.sbc.su.su USA:pfam.janelia.org