Phylogenetische Untersuchungen haben ein einfaches praktisches Problem:
Zeitaufwändig und mühevoll beschafft man die interessierenden Organismen aus aller Herren Länder, extrahiert DNA und ringt ihr die Sequenzen von einigen Markergenen ab. Man findet etwas wirklich interessantes und unerwartetes, doch nun gilt es zu beweisen dass das richtige Ausgangsmaterial ins Epi gewandert ist. Wenn es sich um einen kleinen Organismus (oder weniger anthropozentrisch: einen von normaler Größe) handelt, hat man diesen aber meist bei der DNA-Extraktion komplett in Proteinasen aufgelöst.
Da Taxonomen rar sind und sich der alles entscheidende, letzte überlebende[1] Experte (lüE) natürlich nichtmehr erinnern kann wie sicher er sich bei genau der in Frage stehenden Probe mit seiner morphologischen Bestimmung war, wäre es schön noch eine Dokumentation des entsprechenden Organismus zu haben. Strich-Zeichnungen, welche der lüE (nur dieser ist dazu fähig) angefertigt hat wären schön. Einzelne Bilder sind weniger befriedigend, da die interessierenden Strukturen nie alle auf einmal im Focus sind.
Wahrscheinlich hat besonders der chronische Mangel an morphologischen Merkmalen [2] bei Nematoden dazu geführt, dass sich Paul de Ley eine clevere Technik hat einfallen lassen, die dieses Problem löst.
Die possierlichen Rundwürmer werden dabei unter dem Mikroskop mit einer günstigen, handelsüblichen Digital-Videokamera gefilmt, wobei während der Aufnahme "durch den Wurm fokusiert" wird. Für den Betrachter des entstandenen Videoclips, entsteht so beim Bewegen des Abspielposition-Schiebers der Eindruck selbst am Mikroskop zu sitzen. Dieser Clip kann nun per Mail an den lüE geschickt werden und dieser kann die Artzugehörigkeit (aus morphologischer Perspektive) des sequenzierten Individuums bestimmen. Weiter kann der digital verewigte Wurm in einer Datenbank gespeichert und so der kritischen Fachwelt zugänglich gemacht werden.
[1] Wer helfen möchte die Taxonomen vor dem Aussterben zu bewahren, kann sich in diese Unterschriftenliste eintragen.
[2] Es gibt einige Nematoden, die eine ganze Reihe von ausgefallen morphologischen Merkmalen aufweisen, ich sollte einige dieser Viecher hier genauer vorstellen. Vielleicht gelingt es mir sogar regelmäßig, einen Nematoden der Woche (oder weniger optimistisch; des Monats) auszuwählen...
De Ley, P., De Ley, I.T., Morris, K., Abebe, E., Mundo-Ocampo, M., Yoder, M., Heras, J., Waumann, D., Rocha-Olivares, A., Burr, A.J., Baldwin, J.G., Thomas, W.K. 2005. An integrated approach to fast and informative morphological vouchering of nematodes for applications in molecular barcoding. Philosophical Transactions of the Royal Society of London B. Vol. 360: p.1945-1958
Change of language, change of content
From now on this blog is about my adventures in bioinformatics and in the use of open source software:
The code is bash, perl, R -especially sweave/noweb-, LaTeX and my lovely, beastlyOS editor`s (Gnu-Emacs) elisp.
I will publish code snippets and short comments in English language. You con read about the same and my other more biology focussed interests in German on Alles was lebt.
The code is bash, perl, R -especially sweave/noweb-, LaTeX and my lovely, beastly
I will publish code snippets and short comments in English language. You con read about the same and my other more biology focussed interests in German on Alles was lebt.
Freitag, 27. Juni 2008
Montag, 23. Juni 2008
Vergleichbarkeit von Orthologen bei Primaten und Nagern
Soooooo, es ist also endlich Zeit für meinen ersten Post. Meine recht willkürliche Wahl viel auf ein Paper aus dem Bereich der Genomik. Dem Titel meines Blog werde ich wahrscheinlich erst in einigen Monaten gerecht werden und mehr über Populationsgenetik schreiben...
Ich habe versucht sämtliche Fachausdrücke (außer "Knockout", das war mir dann doch zu blöd) ins Deutsche zu übersetzen, obwohl ich befürchte, dass dies die Verständlichkeit nicht unbedingt verbessert. Aber urteilt selbst!
In den nächsten Jahren wird die verfügbare Sequenzinformation von Nicht-Modellorganismen dank der neuen Generation von Sequenzier-Geräten sprunghaft zunehmen. Um die Flut an Daten, die diese Maschinen produzieren, zu ordnen ist allerdings das Wissen, das über Modelorganismen gewonnen wurde, von entscheidender Bedeutung. Ein sehr wichtiger Schritt der Analyse von Sequenzdaten (über die vorausgehenden Schritte werde ich sicher noch in einigen Posts berichten, wenn ich endlich mal selbst an solchen Daten sitze) ist die Annotation von Genen. Dabei werden sehr unterschiedliche Methoden (über diese auch sicher in anderen Posts mehr) eingesetzt um vorauszusagen, wie die vorliegende Sequenz in ein Protein übersetzt wird: Man muss z.B. bestimmen in welchem Leserahmen übersetzt wird, was trotz teilweise vorhandener Sequenzierfehler möglichst robust geschehen sollte. Findet man orthologe Gene, z. B. aus einem schon komplett sequenzierten Modellorganismus, hat das aber über die simple Annotation hinaus (die sehr erleichtert wird) noch andere Vorteile: Man kann Schlüsse über die Funktion und Wichtigkeit (Wesentlichkeit) des entdeckten Gens aus dem Wissen über das Orthologe im Modellorganismus ziehen.
Für die Wichtigkeit eines Gens ist dessen "Wesentlichkeit" (= direkte Übersetzung des englischen "essentiality") ein eindeutiges Maß. Wesentliche (=essentielle) Gene sind dabei solche, die bei einer Nullmutation die Reproduktion des Trägers ausschließen (= seine Fitness auf 0 reduziert).
Doch wie gut sind Voraussagen anhand von Orthologen über den Effekt von Genen auf die Fitness? Wie schnell und häufig ändern Gene ihre Wesentlichkeit und ihre Funktion?
Um Veränderungen der Wesentlichkeit zu beleuchten analysierten Ben-Yang Liao und Jianzhi Zhang, in einer im März in PNAS veröffentlichten Studie, die Überlebenswichtigkeit von Gene zweier sehr gut erforschter Säugetiere; des Menschen und der Maus. Deren letzter gemeinsamer Vorfahre lebte vor etwa 87 Millionen Jahren (Mya) und beide unterscheiden sich, obwohl wir einige menschliche Merkmale als stark abgeleitet wahrnehmen, in evolutionärem Maßstab nur marginal.
Die Studie nutz die Vorteile des riesigen Wissens über beide Organismen um 120 Gene zu identifizieren, die beim Menschen durch eine Nullmutation Krankheiten verursachen, die vor Erreichen der Fortpflanzungsfähigkeit zu Tod führen, oder unfruchtbar machen, und für die ein Phänotyp beim Knock-out in der Maus beobachtet wurde.
Für 27 der 120 identifizierten Gene ist überraschenderweise der Phänotyp beim Maus-Knockout nicht mit einem Totalverlust der Fitness verbunden.
Übernehmen Paraloge in der Maus die Funktion des entsprechenden Gens? Bei den identifizierten Genen handelt es sich um eins-zu-eins Orthologe, Genduplikation in einer der beiden zur Maus oder zum Menschen führenden Linien ist also ausgeschlossen. Die Funktion des entsprechenden Gens könnte aber von einem Paralogen übernommen werden, das schon im gemeinsamen Vorfahren vorhanden war. Um dies zu testen verglichen die beiden Forscher (1.) die Gruppe der Gene die für Mensch und Maus wesentlich sind mit (2.) der Gruppe von Genen, die nur für den Menschen, nicht für die Maus essentiell sind: Der Anteil der Gene mit Paralogen und die durchschnittliche Ähnlichkeit mit dem nächsten Paralogen unterscheiden sich in beiden Gruppen nicht. Zusammen mit früheren Studien der selben Autoren, die generell das Vorkommen einer Kompensation der Genfunktion durch Paraloge in Säugetieren selten und unwahrscheinlich erscheinen lassen, kann man Kompensation durch Paraloge also im vorliegenden Fall nahezu ausschließen.
Weiter fanden Liao und Zhang eine verstärkte Selektion auf eine Veränderung der Proteinsequenz (zwischen Maus und Mensch) in der zweiten Gruppe verglichen mit der ersten: Sie verglichen die Anzahl der synonymen und nichtsynonymen ausgetauschten Basen (= synonyme und nichtsynonyme Distanz; dS und dN) in diesen Gruppen und einer weiteren (3.) Gruppe von Genen, die für die Maus nicht wesentlich sind, ungeachtet dessen, ob sie für den Menschen essentiell sind.
Die nichtsynonyme Distanz ist für die 2. Gruppe größer als für die erste, während die synonyme Distanz gleich ist. Die Proteinsequenz ist also bei den Genen mit veränderter Wesentlichkeit unterschiedlicher als bei Genen die gleich essentiell sind.
Dies könnte zwei Ursachen haben: Positive Selektion auf eine veränderte Funktion, oder eine schwächere negative Selektion durch die veränderte Wesentlichkeit. Um zwischen diesen beiden Möglichkeiten (bei denen jeweils Ursache und Wirkung vertauscht sind) zu unterscheiden verglichen die Forscher die nichtsynonyme Distanz der 2. mit der 3. Gruppe (die die zweite Gruppe, plus für Maus und Menschen nicht essentielle Gene enthält): Dass die Distanz zwischen der zweiten Gruppen nicht kleiner sondern größer ist als zwischen der dritten Gruppe interpretierten sie als Indiz dafür, dass man nicht von einer abgeschwächten negativen Selektion auf die 2. Gruppe ausgehen kann (diese musste in der dritten Gruppe noch schwächer sein).
Verringerte negative Selektion auf nicht essentielle Gene als Grund für den Unterschied zwischen dN(1.) und dN(2.) ist also unwahrscheinlich.
Weiter konnten die Autoren Orthologe der Gene der zweiten Gruppe aus zwei vollständig sequenzierten Primatenarten (Schimpanse und Makake) und einer weiteren Nagerart, der Ratte zur Analyse heranziehen. Sie nutzen dazu eine Methode um positive Selektion aufzuspüren: Sie verglichen das Verhältnis von nichtsynonymen zu synonymen Distanzen (dN/dS) für die 27 Gene entlang des phylogenetischen Baums. Die meisten (17) Gene hatten dabei das höchste dN/dS-Verhältnis zwischen den Primatenarten. Die meisten nichtsynonymen Polymorphismen sind also erst in den Hominidae (Menschenaffen) entstanden.Zu dN/dS-Verhältnissen wird es hier sicher noch einige Posts geben, doch was macht außerdem die Ergebnisse diese Papers nun so interessant?
Zum einen gibt es für medizinisch motivierte Studien an Mausmodellen Zweifel an der Übertragbarkeit der Ergebnisse. Ein großer Teil der Proteine der Gene der 2. Gruppe ist in der Vakuole lokalisiert und wurden möglicherweise durch die Evolution einer längeren Lebenszeit der Menschenaffen speziell in Neuronen essentiell. Besonders für neurologische Krankheiten könnten Nager also suboptimale Modelle sein.
In anderen Organismen könnten möglicherweise Voraussagen über die Wichtigkeit eines Gens nur sehr eingeschränkt möglich sein. Dies ist natürlich besonders bedauerlich, wenn man mit einem Organismus arbeitet, dessen letzter gemeinsamer Vorfahre mit einem Modellorganismus (= Verfügbarkeit von Knockout-Phänotypen) vor etwa 400 Mya gelebt hat. Mich würde natürlich in diesem Zusammenhang interessieren, wie oft z.B. bei C. elegans und C. briggsae (100 Mya) unterschiedliche Knockout-Phänotypen beobachtet werden.
Ich hab eben bemerkt, dass auf Nimravid’s Weblog das Paper schon dikutiert wurde.
________________________________________________________________________________________________________________
B.-Y. Liao, J. Zhang (2008). Null mutations in human and mouse orthologs frequently result in different phenotypes Proceedings of the National Academy of Sciences, 105 (19), 6987-6992 DOI: 10.1073/pnas.0800387105
Ich habe versucht sämtliche Fachausdrücke (außer "Knockout", das war mir dann doch zu blöd) ins Deutsche zu übersetzen, obwohl ich befürchte, dass dies die Verständlichkeit nicht unbedingt verbessert. Aber urteilt selbst!
In den nächsten Jahren wird die verfügbare Sequenzinformation von Nicht-Modellorganismen dank der neuen Generation von Sequenzier-Geräten sprunghaft zunehmen. Um die Flut an Daten, die diese Maschinen produzieren, zu ordnen ist allerdings das Wissen, das über Modelorganismen gewonnen wurde, von entscheidender Bedeutung. Ein sehr wichtiger Schritt der Analyse von Sequenzdaten (über die vorausgehenden Schritte werde ich sicher noch in einigen Posts berichten, wenn ich endlich mal selbst an solchen Daten sitze) ist die Annotation von Genen. Dabei werden sehr unterschiedliche Methoden (über diese auch sicher in anderen Posts mehr) eingesetzt um vorauszusagen, wie die vorliegende Sequenz in ein Protein übersetzt wird: Man muss z.B. bestimmen in welchem Leserahmen übersetzt wird, was trotz teilweise vorhandener Sequenzierfehler möglichst robust geschehen sollte. Findet man orthologe Gene, z. B. aus einem schon komplett sequenzierten Modellorganismus, hat das aber über die simple Annotation hinaus (die sehr erleichtert wird) noch andere Vorteile: Man kann Schlüsse über die Funktion und Wichtigkeit (Wesentlichkeit) des entdeckten Gens aus dem Wissen über das Orthologe im Modellorganismus ziehen.
Für die Wichtigkeit eines Gens ist dessen "Wesentlichkeit" (= direkte Übersetzung des englischen "essentiality") ein eindeutiges Maß. Wesentliche (=essentielle) Gene sind dabei solche, die bei einer Nullmutation die Reproduktion des Trägers ausschließen (= seine Fitness auf 0 reduziert).
Doch wie gut sind Voraussagen anhand von Orthologen über den Effekt von Genen auf die Fitness? Wie schnell und häufig ändern Gene ihre Wesentlichkeit und ihre Funktion?
Um Veränderungen der Wesentlichkeit zu beleuchten analysierten Ben-Yang Liao und Jianzhi Zhang, in einer im März in PNAS veröffentlichten Studie, die Überlebenswichtigkeit von Gene zweier sehr gut erforschter Säugetiere; des Menschen und der Maus. Deren letzter gemeinsamer Vorfahre lebte vor etwa 87 Millionen Jahren (Mya) und beide unterscheiden sich, obwohl wir einige menschliche Merkmale als stark abgeleitet wahrnehmen, in evolutionärem Maßstab nur marginal.
Die Studie nutz die Vorteile des riesigen Wissens über beide Organismen um 120 Gene zu identifizieren, die beim Menschen durch eine Nullmutation Krankheiten verursachen, die vor Erreichen der Fortpflanzungsfähigkeit zu Tod führen, oder unfruchtbar machen, und für die ein Phänotyp beim Knock-out in der Maus beobachtet wurde.
Für 27 der 120 identifizierten Gene ist überraschenderweise der Phänotyp beim Maus-Knockout nicht mit einem Totalverlust der Fitness verbunden.
Übernehmen Paraloge in der Maus die Funktion des entsprechenden Gens? Bei den identifizierten Genen handelt es sich um eins-zu-eins Orthologe, Genduplikation in einer der beiden zur Maus oder zum Menschen führenden Linien ist also ausgeschlossen. Die Funktion des entsprechenden Gens könnte aber von einem Paralogen übernommen werden, das schon im gemeinsamen Vorfahren vorhanden war. Um dies zu testen verglichen die beiden Forscher (1.) die Gruppe der Gene die für Mensch und Maus wesentlich sind mit (2.) der Gruppe von Genen, die nur für den Menschen, nicht für die Maus essentiell sind: Der Anteil der Gene mit Paralogen und die durchschnittliche Ähnlichkeit mit dem nächsten Paralogen unterscheiden sich in beiden Gruppen nicht. Zusammen mit früheren Studien der selben Autoren, die generell das Vorkommen einer Kompensation der Genfunktion durch Paraloge in Säugetieren selten und unwahrscheinlich erscheinen lassen, kann man Kompensation durch Paraloge also im vorliegenden Fall nahezu ausschließen.
Weiter fanden Liao und Zhang eine verstärkte Selektion auf eine Veränderung der Proteinsequenz (zwischen Maus und Mensch) in der zweiten Gruppe verglichen mit der ersten: Sie verglichen die Anzahl der synonymen und nichtsynonymen ausgetauschten Basen (= synonyme und nichtsynonyme Distanz; dS und dN) in diesen Gruppen und einer weiteren (3.) Gruppe von Genen, die für die Maus nicht wesentlich sind, ungeachtet dessen, ob sie für den Menschen essentiell sind.
Die nichtsynonyme Distanz ist für die 2. Gruppe größer als für die erste, während die synonyme Distanz gleich ist. Die Proteinsequenz ist also bei den Genen mit veränderter Wesentlichkeit unterschiedlicher als bei Genen die gleich essentiell sind.
Dies könnte zwei Ursachen haben: Positive Selektion auf eine veränderte Funktion, oder eine schwächere negative Selektion durch die veränderte Wesentlichkeit. Um zwischen diesen beiden Möglichkeiten (bei denen jeweils Ursache und Wirkung vertauscht sind) zu unterscheiden verglichen die Forscher die nichtsynonyme Distanz der 2. mit der 3. Gruppe (die die zweite Gruppe, plus für Maus und Menschen nicht essentielle Gene enthält): Dass die Distanz zwischen der zweiten Gruppen nicht kleiner sondern größer ist als zwischen der dritten Gruppe interpretierten sie als Indiz dafür, dass man nicht von einer abgeschwächten negativen Selektion auf die 2. Gruppe ausgehen kann (diese musste in der dritten Gruppe noch schwächer sein).
Verringerte negative Selektion auf nicht essentielle Gene als Grund für den Unterschied zwischen dN(1.) und dN(2.) ist also unwahrscheinlich.
Weiter konnten die Autoren Orthologe der Gene der zweiten Gruppe aus zwei vollständig sequenzierten Primatenarten (Schimpanse und Makake) und einer weiteren Nagerart, der Ratte zur Analyse heranziehen. Sie nutzen dazu eine Methode um positive Selektion aufzuspüren: Sie verglichen das Verhältnis von nichtsynonymen zu synonymen Distanzen (dN/dS) für die 27 Gene entlang des phylogenetischen Baums. Die meisten (17) Gene hatten dabei das höchste dN/dS-Verhältnis zwischen den Primatenarten. Die meisten nichtsynonymen Polymorphismen sind also erst in den Hominidae (Menschenaffen) entstanden.Zu dN/dS-Verhältnissen wird es hier sicher noch einige Posts geben, doch was macht außerdem die Ergebnisse diese Papers nun so interessant?
Zum einen gibt es für medizinisch motivierte Studien an Mausmodellen Zweifel an der Übertragbarkeit der Ergebnisse. Ein großer Teil der Proteine der Gene der 2. Gruppe ist in der Vakuole lokalisiert und wurden möglicherweise durch die Evolution einer längeren Lebenszeit der Menschenaffen speziell in Neuronen essentiell. Besonders für neurologische Krankheiten könnten Nager also suboptimale Modelle sein.
In anderen Organismen könnten möglicherweise Voraussagen über die Wichtigkeit eines Gens nur sehr eingeschränkt möglich sein. Dies ist natürlich besonders bedauerlich, wenn man mit einem Organismus arbeitet, dessen letzter gemeinsamer Vorfahre mit einem Modellorganismus (= Verfügbarkeit von Knockout-Phänotypen) vor etwa 400 Mya gelebt hat. Mich würde natürlich in diesem Zusammenhang interessieren, wie oft z.B. bei C. elegans und C. briggsae (100 Mya) unterschiedliche Knockout-Phänotypen beobachtet werden.
Ich hab eben bemerkt, dass auf Nimravid’s Weblog das Paper schon dikutiert wurde.
________________________________________________________________________________________________________________
B.-Y. Liao, J. Zhang (2008). Null mutations in human and mouse orthologs frequently result in different phenotypes Proceedings of the National Academy of Sciences, 105 (19), 6987-6992 DOI: 10.1073/pnas.0800387105
Labels:
BENEFICIAL,
Genomics,
German,
mammals,
Research Blogging
Samstag, 7. Juni 2008
Hallo...
...erstmal! Für den (mindestens einen) Leser dieses neugeborenen Blogs erstmal ein paar allgemeine Infos:
Ich will diese Plattform in erster Linie nutzen um über Paper (peer-reviewed) zu schreibe. Dies soll mich dann dazu zwingen einige Veröffentlichungen, die ich für interessant halte, wirklich richtig genau zu lesen. Solchen Posts werde ich, um im Schema des Blogtitels zu bleiben, das Label BENEFICIAL verpassen.
Das Label NEUTRAL wird alles erhalten, was nur bedingt interessant für den naturwissenschaftlich interessierten Leser ist, wie z.B. Organisatorisches (dieser Post).
Mit DELETERIOUS werde ich alles labeln, was absolut überhaupt nichts mit Wisssenschaft zu tun hat und mich und den Leser von der Arbeit abhält.
In den nächsten Monaten werde ich hier auch verstärkt über meine Arbeit an der Uni Karlsruhe und an der University of Edinburgh schreiben, da ich gerade am Anfang meiner Doktorarbeit stehe und immernoch (vielleicht lässt das auch nie nach) Spass daran habe über mein Projekt zu reden. Ich muss zugeben, dass ich auch immernoch unglaublich stolz bin von der VW-Stiftung für ein Projekt gefördert zu werden, das ich mir zum Großteil selbst ausgedacht habe, hoffe aber, dass die entsprechenden Posts nicht zu sehr in Angeberei ausarten.
Außeredem möchte ich kleine praktische Tips im Umgang mit meinem Versuchsorganismus Anguillicola crassus hier veröffentlichen, die zu unbedeutend für eine Publikation sind, aber für eine winzige Gruppe von anderen Wissenschaftlern möglicherweise interessant sein könnten. Ein erster solcher Post könnte möglicherweise die Kultur des Zwischenwirtes (Süßwasser-Copepoden) betreffen... wenn sich die Tierchen denn mal endlich vermehren...
For a start most of the posts will be published in german language. If I will attract readers in my new scottish habitat, this will change!
Viel Spass beim Lesen! Cheers!
Ich will diese Plattform in erster Linie nutzen um über Paper (peer-reviewed) zu schreibe. Dies soll mich dann dazu zwingen einige Veröffentlichungen, die ich für interessant halte, wirklich richtig genau zu lesen. Solchen Posts werde ich, um im Schema des Blogtitels zu bleiben, das Label BENEFICIAL verpassen.
Das Label NEUTRAL wird alles erhalten, was nur bedingt interessant für den naturwissenschaftlich interessierten Leser ist, wie z.B. Organisatorisches (dieser Post).
Mit DELETERIOUS werde ich alles labeln, was absolut überhaupt nichts mit Wisssenschaft zu tun hat und mich und den Leser von der Arbeit abhält.
In den nächsten Monaten werde ich hier auch verstärkt über meine Arbeit an der Uni Karlsruhe und an der University of Edinburgh schreiben, da ich gerade am Anfang meiner Doktorarbeit stehe und immernoch (vielleicht lässt das auch nie nach) Spass daran habe über mein Projekt zu reden. Ich muss zugeben, dass ich auch immernoch unglaublich stolz bin von der VW-Stiftung für ein Projekt gefördert zu werden, das ich mir zum Großteil selbst ausgedacht habe, hoffe aber, dass die entsprechenden Posts nicht zu sehr in Angeberei ausarten.
Außeredem möchte ich kleine praktische Tips im Umgang mit meinem Versuchsorganismus Anguillicola crassus hier veröffentlichen, die zu unbedeutend für eine Publikation sind, aber für eine winzige Gruppe von anderen Wissenschaftlern möglicherweise interessant sein könnten. Ein erster solcher Post könnte möglicherweise die Kultur des Zwischenwirtes (Süßwasser-Copepoden) betreffen... wenn sich die Tierchen denn mal endlich vermehren...
For a start most of the posts will be published in german language. If I will attract readers in my new scottish habitat, this will change!
Viel Spass beim Lesen! Cheers!
Abonnieren
Posts (Atom)