Change of language, change of content

From now on this blog is about my adventures in bioinformatics and in the use of open source software:
The code is bash, perl, R -especially sweave/noweb-, LaTeX and my lovely, beastly OS editor`s (Gnu-Emacs) elisp.

I will publish code snippets and short comments in English language. You con read about the same and my other more biology focussed interests in German on Alles was lebt.

Montag, 23. Juni 2008

Vergleichbarkeit von Orthologen bei Primaten und Nagern

ResearchBlogging.orgSoooooo, es ist also endlich Zeit für meinen ersten Post. Meine recht willkürliche Wahl viel auf ein Paper aus dem Bereich der Genomik. Dem Titel meines Blog werde ich wahrscheinlich erst in einigen Monaten gerecht werden und mehr über Populationsgenetik schreiben...
Ich habe versucht sämtliche Fachausdrücke (außer "Knockout", das war mir dann doch zu blöd) ins Deutsche zu übersetzen, obwohl ich befürchte, dass dies die Verständlichkeit nicht unbedingt verbessert. Aber urteilt selbst!

In den nächsten Jahren wird die verfügbare Sequenzinformation von Nicht-Modellorganismen dank der neuen Generation von Sequenzier-Geräten sprunghaft zunehmen. Um die Flut an Daten, die diese Maschinen produzieren, zu ordnen ist allerdings das Wissen, das über Modelorganismen gewonnen wurde, von entscheidender Bedeutung. Ein sehr wichtiger Schritt der Analyse von Sequenzdaten (über die vorausgehenden Schritte werde ich sicher noch in einigen Posts berichten, wenn ich endlich mal selbst an solchen Daten sitze) ist die Annotation von Genen. Dabei werden sehr unterschiedliche Methoden (über diese auch sicher in anderen Posts mehr) eingesetzt um vorauszusagen, wie die vorliegende Sequenz in ein Protein übersetzt wird: Man muss z.B. bestimmen in welchem Leserahmen übersetzt wird, was trotz teilweise vorhandener Sequenzierfehler möglichst robust geschehen sollte. Findet man orthologe Gene, z. B. aus einem schon komplett sequenzierten Modellorganismus, hat das aber über die simple Annotation hinaus (die sehr erleichtert wird) noch andere Vorteile: Man kann Schlüsse über die Funktion und Wichtigkeit (Wesentlichkeit) des entdeckten Gens aus dem Wissen über das Orthologe im Modellorganismus ziehen.
Für die Wichtigkeit eines Gens ist dessen "Wesentlichkeit" (= direkte Übersetzung des englischen "essentiality") ein eindeutiges Maß. Wesentliche (=essentielle) Gene sind dabei solche, die bei einer Nullmutation die Reproduktion des Trägers ausschließen (= seine Fitness auf 0 reduziert).

Doch wie gut sind Voraussagen anhand von Orthologen über den Effekt von Genen auf die Fitness? Wie schnell und häufig ändern Gene ihre Wesentlichkeit und ihre Funktion?

Um Veränderungen der Wesentlichkeit zu beleuchten analysierten Ben-Yang Liao und Jianzhi Zhang, in einer im März in PNAS veröffentlichten Studie, die Überlebenswichtigkeit von Gene zweier sehr gut erforschter Säugetiere; des Menschen und der Maus. Deren letzter gemeinsamer Vorfahre lebte vor etwa 87 Millionen Jahren (Mya) und beide unterscheiden sich, obwohl wir einige menschliche Merkmale als stark abgeleitet wahrnehmen, in evolutionärem Maßstab nur marginal.
Die Studie nutz die Vorteile des riesigen Wissens über beide Organismen um 120 Gene zu identifizieren, die beim Menschen durch eine Nullmutation Krankheiten verursachen, die vor Erreichen der Fortpflanzungsfähigkeit zu Tod führen, oder unfruchtbar machen, und für die ein Phänotyp beim Knock-out in der Maus beobachtet wurde.

Für 27 der 120 identifizierten Gene ist überraschenderweise der Phänotyp beim Maus-Knockout nicht mit einem Totalverlust der Fitness verbunden.
Übernehmen Paraloge in der Maus die Funktion des entsprechenden Gens? Bei den identifizierten Genen handelt es sich um eins-zu-eins Orthologe, Genduplikation in einer der beiden zur Maus oder zum Menschen führenden Linien ist also ausgeschlossen. Die Funktion des entsprechenden Gens könnte aber von einem Paralogen übernommen werden, das schon im gemeinsamen Vorfahren vorhanden war. Um dies zu testen verglichen die beiden Forscher (1.) die Gruppe der Gene die für Mensch und Maus wesentlich sind mit (2.) der Gruppe von Genen, die nur für den Menschen, nicht für die Maus essentiell sind: Der Anteil der Gene mit Paralogen und die durchschnittliche Ähnlichkeit mit dem nächsten Paralogen unterscheiden sich in beiden Gruppen nicht. Zusammen mit früheren Studien der selben Autoren, die generell das Vorkommen einer Kompensation der Genfunktion durch Paraloge in Säugetieren selten und unwahrscheinlich erscheinen lassen, kann man Kompensation durch Paraloge also im vorliegenden Fall nahezu ausschließen.

Weiter fanden Liao und Zhang eine verstärkte Selektion auf eine Veränderung der Proteinsequenz (zwischen Maus und Mensch) in der zweiten Gruppe verglichen mit der ersten: Sie verglichen die Anzahl der synonymen und nichtsynonymen ausgetauschten Basen (= synonyme und nichtsynonyme Distanz; dS und dN) in diesen Gruppen und einer weiteren (3.) Gruppe von Genen, die für die Maus nicht wesentlich sind, ungeachtet dessen, ob sie für den Menschen essentiell sind.
Die nichtsynonyme Distanz ist für die 2. Gruppe größer als für die erste, während die synonyme Distanz gleich ist. Die Proteinsequenz ist also bei den Genen mit veränderter Wesentlichkeit unterschiedlicher als bei Genen die gleich essentiell sind.
Dies könnte zwei Ursachen haben: Positive Selektion auf eine veränderte Funktion, oder eine schwächere negative Selektion durch die veränderte Wesentlichkeit. Um zwischen diesen beiden Möglichkeiten (bei denen jeweils Ursache und Wirkung vertauscht sind) zu unterscheiden verglichen die Forscher die nichtsynonyme Distanz der 2. mit der 3. Gruppe (die die zweite Gruppe, plus für Maus und Menschen nicht essentielle Gene enthält): Dass die Distanz zwischen der zweiten Gruppen nicht kleiner sondern größer ist als zwischen der dritten Gruppe interpretierten sie als Indiz dafür, dass man nicht von einer abgeschwächten negativen Selektion auf die 2. Gruppe ausgehen kann (diese musste in der dritten Gruppe noch schwächer sein).
Verringerte negative Selektion auf nicht essentielle Gene als Grund für den Unterschied zwischen dN(1.) und dN(2.) ist also unwahrscheinlich.

Weiter konnten die Autoren Orthologe der Gene der zweiten Gruppe aus zwei vollständig sequenzierten Primatenarten (Schimpanse und Makake) und einer weiteren Nagerart, der Ratte zur Analyse heranziehen. Sie nutzen dazu eine Methode um positive Selektion aufzuspüren: Sie verglichen das Verhältnis von nichtsynonymen zu synonymen Distanzen (dN/dS) für die 27 Gene entlang des phylogenetischen Baums. Die meisten (17) Gene hatten dabei das höchste dN/dS-Verhältnis zwischen den Primatenarten. Die meisten nichtsynonymen Polymorphismen sind also erst in den Hominidae (Menschenaffen) entstanden.Zu dN/dS-Verhältnissen wird es hier sicher noch einige Posts geben, doch was macht außerdem die Ergebnisse diese Papers nun so interessant?

Zum einen gibt es für medizinisch motivierte Studien an Mausmodellen Zweifel an der Übertragbarkeit der Ergebnisse. Ein großer Teil der Proteine der Gene der 2. Gruppe ist in der Vakuole lokalisiert und wurden möglicherweise durch die Evolution einer längeren Lebenszeit der Menschenaffen speziell in Neuronen essentiell. Besonders für neurologische Krankheiten könnten Nager also suboptimale Modelle sein.

In anderen Organismen könnten möglicherweise Voraussagen über die Wichtigkeit eines Gens nur sehr eingeschränkt möglich sein. Dies ist natürlich besonders bedauerlich, wenn man mit einem Organismus arbeitet, dessen letzter gemeinsamer Vorfahre mit einem Modellorganismus (= Verfügbarkeit von Knockout-Phänotypen) vor etwa 400 Mya gelebt hat. Mich würde natürlich in diesem Zusammenhang interessieren, wie oft z.B. bei C. elegans und C. briggsae (100 Mya) unterschiedliche Knockout-Phänotypen beobachtet werden.

Ich hab eben bemerkt, dass auf Nimravid’s Weblog das Paper schon dikutiert wurde.

________________________________________________________________________________________________________________

B.-Y. Liao, J. Zhang (2008). Null mutations in human and mouse orthologs frequently result in different phenotypes Proceedings of the National Academy of Sciences, 105 (19), 6987-6992 DOI: 10.1073/pnas.0800387105

Keine Kommentare: