Change of language, change of content

From now on this blog is about my adventures in bioinformatics and in the use of open source software:
The code is bash, perl, R -especially sweave/noweb-, LaTeX and my lovely, beastly OS editor`s (Gnu-Emacs) elisp.

I will publish code snippets and short comments in English language. You con read about the same and my other more biology focussed interests in German on Alles was lebt.

Samstag, 14. Februar 2009

A mere heart of silicon

An Darwins 200. Geburtstag vor zwei Tagen fand ich keine Zeit zu bloggen. Hier eine Erklärung dafür.
Der Titel dieses etwas verspäteten Posts, ist eine Anspielung auf das Darwins Zitat "A scientific man ought to have no wishes, no affections, -- a mere heart of stone."Das "silicon" steht für meine kürzlich entdeckte Liebe zur Bioinformatik und statistischen Datenverarbeitung.

Ich fühle mich im Moment etwas wie der Primat in 2001: A Space Odyssey, nur weniger aggressiv.



Es hat schon etwas wenn man die Herstellung von Werkzeug entdeckt, im Gegensatz zu Kubricks Primaten werde ich meine Werkzeuge Perl und R aber eher einsetzen um zu versehen, weniger um Einfluss auf meine Umwelt zu nehmen.
Besonders Perl ist dabei unglaublich nützlich. Ich empfehle jedem, der viele (schwierig das näher zu definieren) Sequenzen in seiner Arbeit anschaut sich damit zu beschäftigen. In der zweiten Wochen kann man bereits scripte schreiben, die einem die Arbeit erleichtern. Perl schreibt zum Beispiel für mich mein Laborbuch. Einfach ELKE.pl (Emanuel's Labwork Kalculating Environment) starten und die Rektionen berechnen, es entsteht Laborbuch-gerechter Output auf der Festplatt und auf Papier (zugegeben das funktioniert nur, da ich sehr repetitive Laborarbeit mache) .

Im Moment fasziniert mich auch die Hochdurchsatz-Transkriptom-Sequenzierung an sich. Aus mehreren Gründen:
Beim Annotieren der Transkripte benutzt man sogenannten Blast-Suchen, die man automatisiert mit selbst geschriebenen Perl-Programmen durchführt und auswertet. Dabei vergleicht man seine unbekannten Sequenzen mit einer Datenbank bekannter Sequenzen. Solange keine Sequenzen des eigenen Untersuchungsobjekts bekannt sind stammen diese hauptsächlich von verwandten Organismen.
Auf diese Art passiert folgendes: In der oft tausende Zeilen umfassenden Ausgabe seiner Programme findet man unzählige Namen von interessanten Tieren und Genen, die man vorher noch nicht kannte.

Dazu kommt dann auch noch das Gefühl, dass man Neuland betritt, dass man etwas sieht, was noch nie zuvor jemand gesehen hat. Das ist faszinierend: Auch wenn es nur Gene aus einem Wurm der in der Schwimmblase des Aals lebt sind.

Eigentlich wollte ich etwas mehr über Statistik und quantitative Methoden schreiben, stattdessen hab ich den bislang wahrscheinlich "wildesten" Post des Blogs verzapft: Von Darwin über Kubrick, Statistik, Programmieren und Blast bis zum Aal, das muss mir erst mal jemand nachmachen.

Keine Kommentare: