Change of language, change of content

From now on this blog is about my adventures in bioinformatics and in the use of open source software:
The code is bash, perl, R -especially sweave/noweb-, LaTeX and my lovely, beastly OS editor`s (Gnu-Emacs) elisp.

I will publish code snippets and short comments in English language. You con read about the same and my other more biology focussed interests in German on Alles was lebt.

Mittwoch, 26. November 2008

Die neutrale Theorie der molekularen Evolution

Meine erstes Thema wird die Ausbreitung von Mutationen innerhalb einer finiten Population sein.

Motoo Kimura entwickelte seine Theorie dazu in den 1960er bis 1980er Jahren ausgehend von Anwendungen von Diffusions Approximationen auf genetische Fragestellungen, an denen zuvor R.A.Fisher und S. Wright gearbeitet hatten. Die Herleitung der Formeln übersteigt dabei mein mathematisches Verständnis. Die Theorie (und ihre nahezu neutrale Erweiterung) ist aber eine der elegantesten in der Biologie und daher auch intuitiv verständlich.
Ich versuche deshalb nur ihre Grundzüge ohne Anspruch auf Vollständigkeit darzustellen, zu zeigen welche Annahmen benötigt werden und welche Vorhersagen dies erlaubt. Bewusst wähle ich diesen Ansatz mit einer der mathematisch komplexesten Theorien zu starten (in den folgenden Posts kann es also nur einfacher werden) und werde später bei mathematisch einfacheren Theorien mehr auf Herleitung und Entwicklung der Formeln eingehen.

Hauptsächlich interessiert mich im aktuellen Post die Fixierungswahrschheinichkeit eines Allels (Ausprägungszustand eines Gens), oder spezieller einer neuen Mutation. Fixierung bedeutet hierbei, dass in der Population ausschließlich das betreffende Allel vorkommt. Der Verlust des Alles oder dessen Fixierung stellen Extremzustände da, die sich in einer vereinfachten Darstellung untersuchen lassen.
Hartl und Clark benutzen das Beispiel einer Bouling-Bahn in der die seitlichen Rinnen Analoga dieser Extremzustände sind. Nimmt man nun an, dass die -analog zur Zeit- unendlich lange Bahn -analog zu möglichen Zufallsereignissen- nicht perfekt eben ist- wird offensichtlich, dass jedes Allel über kurz oder lang einen dieser Extremzustände erreicht.
Wichtig ist lediglich die Breite der Bahn oder ihr biologisches Analogon, die Populationsgröße.

Wir nehmen eine diploide Population mit N Individuen an, in dieser sind 2N Kopie des interessierenden Gens vorhanden und es werden 2N Gameten für die nächste Generation gewählt , die dann wieder N Zygoten bilden (=gleichbleibende Populationsgröße und zufällige Paarung). Die Fixierunswahrscheinlickeit eines Alles ist nun gegeben durch seine aktuelle Frequenz p0/Anzahl der Kopien. Im Falle einer neuen Mutation, die per Definition nur einmal vorhanden ist

[1]

Das macht Intuitiv Sinn, da jedes Gen einen Fixierungszustand ansteuert und zum Startzeitpunkt eben 2N Alternativen gegeben sind.


{1}

Betrachtet man die aus dieser Formel resultierende Fixierungswahrscheinlichkeit für eine Mutation als Funktion der Populationsgröße wird deutlich, dass diese Wahrscheinlichkeit selbst für eine moderate Populationsgröße nicht besonders groß ist. Sie ist allerdings auch nicht 0 für große Populationen (z.B. N=1,000,000-> p= 0,0000005)

u ist die Mutationsrate mit der irgendwo im interessierenden Abschnitt des Genoms eine Mutation entsteht. Neutralität kann man nun für einen ganzen Abschnitt des Genoms, wie z.B. ein Pseudogen, annehmen oder für spezielle Mutationen, wie z.B. jene von degernerierte Basen an der dritten Stelle eines Kodons (= synonyme Mutationen).
Die Rate u, mit der die Mutationen entstehen ist nun erstaunlicherweise gleich der Rate mit der neutrale Mutationen fixiert werden K. Sie ist unabhängig von der Populationsgröße, da in großen Populationen auch mehr Mutationen entstehen.

[2]

d.h. die kleinere Fixierungswahrscheinlichkeit und die Populationsgröße heben sich gegenseitig auf. Ein Zusammenhang von mathematisch schlichter Schönheit.
Die durchschnittliche Zeit zwischen zwei Fixierungen ist dann logischerweise 1/u.

Dieses Modell passt logischerweise nicht immer zu den beobachteten Daten und ist daher sehr hilfreich als Nullhypothese um Neutralität zu testen. Es ist allerdings falsch aus abweichenden Beobachtungen auf Nicht-Neutralität zu schließen, da auch andere Voraussetzungen wie beispielsweise die gleichbleibende Populationsgröße verletzt sein können.

Folgerungen aus der neutralen Theorie der molekularen Evolution tauchen in zukünftigen Post wieder auf. In diesen werde ich näher auf den Einfluss von Selektion und damit auf die nahezu neutrale Version der Theorie eingehen, finite Populationsgrößen näher beleuchten und Zusammenhänge von Polymorphismus und Divergenz aufzeigen.

4 Kommentare:

Ingo Bading hat gesagt…

... Ähm, ... vielleicht mal eine kleine kritische Einwendung: Du benutzt den Begriff "Neutralität". Erläuterst Du den irgendwo, in welchem Sinne Du diesen eigentlich benutzt? Oder hab ich das irgendwo überlesen? (... Grübel ...)

derele hat gesagt…

Sehr guter Punkt!

Ich schreib in den naechsten tagen:

1. einen Post mit Begriffsdefinitionen

2. Nochmal einen zusammenfassenden Neutrale-Theorie-post

dann erst:

3. Probleme der NT (molekular clock)

4. ein "neues" anderes Modell (das paper ist der Hammer...)

derele hat gesagt…
Dieser Kommentar wurde vom Autor entfernt.
derele hat gesagt…

Um mal vorerst ne schnelle, kurze und trotzdem genaue Antwort auf deine Frage zu geben:

Bisher folge ich Kimura:

Neutral ist eine Mutation wenn
s<2/N

Negative (purifying) Selektion ist in der NT erlaubt, vielleicht verwirrt dich das im Moment...

Erklärung folgt wie gesagt!