Positionspapier Bioinformatik



Positionspapier zum Ausbau der Bioinformatik
an der Ludwig-Maximilians-Universität München



Rolf Backofen 5, August Böck 1, François Bry 4,
Andreas Buckenmaier 2, Peter Clote 4, Wilfried Gabriel 1,
Rudolf Grosschedl 3, Heinz-Gerd Hegering 4, Reinhold G. Hermann 1,
Hans-Peter Kriegel 4, Regine Kahmann 1, Fred Kröger 4,
Claudia Linnhoff-Popien 4, Hans-Werner Mewes 1, Elisabeth Weiß 1
und Martin Wirsing 4




1 Professor an der Fakultät für Biologie, Mitglied der Bioinformatik-Kommission

2 Student an der Fakultät für Biologie, Vertreter der Studierenden in der Bioinformatik-Kommission

3 Leiter des Gen-Zentrums,
Professor an der Fakultät für Chemie und Pharmazie

4 Professor am Institut für Informatik

5 Wissenschaftlicher Assistent am Institut für Informatik




7. Juli 1999




"The biological sciences are poised to become to the 21st Century what physics has been to the 20th Century. Just as the discovery of DNA in the 1950's led to a profound revolution in biological understanding, today we are poised to make a similar leap, in which advanced computational tools will be used to understand biological systems in all their complexity while preserving and exploiting those systems in a sustainable fashion."

"Computational biology is part of a larger revolution that will affect how all of science is conducted. This larger revolution is being driven by the generation and use of information in all forms and in enormous quantities and requires the development of intelligent systems for gathering, storing and accessing information. "

Dr. Mary Clutter (National Science Foundation),
[1] Mitteilung an die US-Senatskommission für Handel, Wissenschaft und Verkehr, 17.9.1996




Vorwort

Ziel dieses Positionspapiers ist es, den Ausbau der Bioinformatik an der Ludwig-Maximilians-Universität München zu fördern, die vorhandenen Initiativen in diesem Bereich zu bündeln und so den Fortbestand und das Gedeihen dieser Schlüsseldisziplin an der Ludwig-Maximilians-Universität München zu sichern.

Dieses Positionspapier vertieft Themen und Handlungsvorschläge, die mit dem [3] Weißbuch über Perspektiven in der Ludwig-Maximilians-Universität zum Anbruch des Informationszeitalters vom 23.7.1998 eingeführt wurden. Es entstand aus Gesprächen zur Stärkung der Bioinformatik in Forschung und Lehre zwischen der Fakultät für Biologie, der Fakultät für Chemie und Pharmazie, dem Gen-Zentrum und dem Institut für Informatik. Vertreter aller dieser Einrichtungen haben dieses Positionspapier erhalten und an seinem Inhalt mitgewirkt.

Nachdrucke dieses Positionspapiers sind unter folgender Adresse erhältlich:

Institut für Informatik
Sekretariat von Prof. Dr. François Bry
Oettingenstraße 67
80538 München
Tel.: 089 - 2178 2210
Fax: 089 - 2178 2211




Inhaltsverzeichnis

  1. Die Bioinformatik: Eine zukunftsweisende, multidisziplinäre Forschungsrichtung
  2. Bedeutung der Bioinformatik für den Forschungs- und Wirtschaftsstandort Bayern
  3. Die Bioinformatik an bayerischen Universitäten
  4. Handlungsvorschläge für die Ludwig-Maximilians-Universität München
  5. Schlussbemerkung
  6. Literatur




  1. Die Bioinformatik: Eine zukunftsweisende, multidisziplinäre Forschungsrichtung

    Die Bioinformatik ist ein neuer, multidisziplinärer Forschungsbereich innerhalb der Praktischen Informatik, der einen starken Bezug einerseits zur Theoretischen Informatik, andererseits zur computergestützten Biologie ("computational biology") hat. Die Analyse und Interpretation großer Datenmengen der strukturellen und funktionellen Genomanalyse, die Darstellung und Modellierung komplexer funktioneller Netzwerke der Zelle, sowie die Entwicklung von Methoden zur Vorhersage von Eigenschaften biologisch relevanter Makromoleküle und ihrer Interaktionen sind Gegenstand der Bioinformatik. In der Bioinformatik werden Fragestellungen der molekularen Biologie mit den Methoden der Informatik beantwortet. Dabei sind die Praktische Informatik ebenso wie die Theoretische Informatik gefordert. Die Aufgabe der Bioinformatik selbst ist es, die Anwendung der von der Informatik entwickelten Methoden auf die biologischen Fragestellung zu realisieren und kritisch zu verifizieren.

    Aus der Sicht der Biologie sind die Ziele der Bioinformatik unter anderem:

    • Die Analyse und Interpretation genomischer Information mit Hilfe von komplexen algorithmischen Verfahren sowie die Organisation des biologischen Wissens in geeigneten Datenbanken. Dabei spielen Methoden zu verlässlichen Vorhersagen von Eigenschaften von DNA- und Proteinsequenzen eine herausragende Rolle.
    • Die Interpretation komplexer, dynamischer Prozesse der Regulation und Zelldifferenzierung.
    • Die Vorhersage struktureller Eigenschaften durch Faltungsmodelle oder der vergleichenden Analyse bekannter Strukturen ("Threading").
    • Die Vorhersage von Molekül/Molekül-Interaktionen zur Analyse funktioneller Netzwerke.
    • Die Identifizierung und Charakterisierung von Mutationen als Ursachen zellulärer oder genetischer Dysfunktionen (Carcinogenese, genetische bedingte Disposition).
    • Die Identifizierung von sogenannten Targets durch differentielle Genomanalyse zur Entwicklung von Pharmaka z.B. zur Bekämpfung pathogener Keime.
    • Die Simulation metabolischer und regulatorischer Netzwerke.
    • Die Simulation molekularer Interaktionen.

    Die Anwendungen der Bioinformatik umfassen praktisch alle Bereiche der modernen, molekularen Biologie, ebenso wie die der molekularen Medizin (Humangenomprojekt, Populationsgenetik, Neurobiologie).

    Aus der Sicht der Informatik sind die Aufgaben der Bioinformatik:

    • einerseits komplexe algorithmische Verfahren zu entwickeln, um unter dem Einsatz von Computern systematisch nach Informationen zu suchen, die auf Grund der überwältigenden Datenmenge aus Genomprojekten nur in dieser Weise gewonnen werden können (so geschah z.B. die entscheidende Entdeckung von Genmutationen bei den Cystic-Fibrosis- und Parkinson-Krankheiten),
    • andererseits Lebensvorgänge mit Computern zu simulieren, um sie so schneller und zielsicherer untersuchen zu können als ausschließlich im Reagenzglas (dieser Ansatz wird eingesetzt u.a. zur Lösung des noch nicht erreichten, für die Biowissenschaften zentralen Ziels der Strukturvorhersage von biologischen Molekülen sowie zu Simulationen mit neuronalen Netzen in der Neurobiologie).

    Die Entwicklung der komplexen algorithmischen Verfahren erfordert die Anwendung von Methoden der Theoretischen Informatik. Nicht nur in den Biowissenschaften, sondern auch in Bereichen wie unter anderem der Physik, den Geo-Wissenschaften und sogar in Mathematik und Sozialwissenschaften nimmt in letzter Zeit die Bedeutung der computergestützten Simulation deutlich zu.

    Die Methoden der Bioinformatik sind nicht auf einzelne Bereiche, wie etwa die "rote" oder "grüne" Biologie beschränkt. Im Vordergrund steht sowohl für die Analyse der kleinen Genome (Bakterien, Pilze) als auch der zelldifferenzierenden Eukaryonten (Modellgenome wie C. elegans, A. thaliana, D. melanogaster) die Identifizierung und Charakterisierung der genetischen Elemente durch die Sequenzanalyse. Die Anwendungen und Weiterentwicklung von Standardalgorithmen und die Bewertung der Ergebnisse spielt eine wesentliche Rolle in der Bioinformatik der Genomanalyse (z.B. BLAST, FASTA, Hidden-Markov-Modelle zum Sequenzvergleich, Genmodellierung, Sekundärstrukturvorhersagen, Erkennung von Mustern und Domänen usw.). Von fundamentaler Bedeutung sind die primären und sekundären biologischen Datenbanken mit zahlreichen ungelösten Problemen bei der Repräsentation biologischen Wissens und ihrer Integration: Derzeit gibt es mehr als einhundert verschiedene Datenbanken in der Molekularbiologie, denen kein einheiltiches Datenmodell zu Grunde liegt.

    Die Anwendungen von Bioinformatikmethoden sind vielfältig, hervorzuheben sind:

    • Genomanalyse ganzer Genome (zur Zeit sind mehr als 20 Genome vollständig sequenziert und öffentlich zugänglich, einschließlich der detaillierten Sequenzanalyse und Funktionsvorhersagen).
    • Analyse genetischer und physikalischer Karten (Microsatelliten, "Fingerprinting" zur sogenannten biometrischen Unterschrift, usw.).

    • Sequence-by-Hybidization (kurz SBH) und Resequencing mit Biochip (ein Ansatz, der vom Unternehmen Affymetrix untersucht und eingesetzt wird).
    • Systematische Genomvergleiche.
    • Strukturvorhersagen und Klassifikationen der Proteinfaltung. (Dieser Bereich schließt die Strukturelle Genomanalyse ein, in der versucht wird, alle Proteinstrukturen eines Genoms entweder vorherzusagen oder experimentell aufzuklären. In dieses Gebiet fällt auch die molekulare Modellierung.)
    • Molekulare Evolution (z.B. die Neandertaler-Analyse in der evolutionären Paläontologie und generell die Entstehung von Arten).
    • Expressionsanalyse zur Untersuchung der Biosyntheseraten aller Gene in Abhängigkeit einer Vielzahl von Parametern (e.g. Genzerstörung, Stress, Zellteilung, Wachstumsbedingungen, Organspezifität, Entwicklungsstadium).
    • Proteomanalyse zur Untersuchung der zellulären Konzentrationen von Proteinen und ihrer Modifikationen.
    • Arzneimittelentwicklung basierend auf Sequenzvergleichen und Molekülinteraktionen (Identifikation von Targets, Entwicklung von Wirkstoffen ("Drug Design", "Drug Screening").
    • Hybridisierungsmethoden (z.B. Oligonukleotid-Fingerprinting, Chip-Hybridisierung zur genetischen Analyse).
    • "Computing with Biomolecules" (d.h., der Einsatz von molekularbiologischen Methoden wie Gelelektrophorese und Polymerase-Kettenreaktion (kurz PCR) zur Berechnung komplexer mathematischer Probleme, wie etwa kryptographischer Entschlüsselung).
    • "Expression Profiling" zur Aufklärung regulatorischer Netzwerke auf RNA-Ebene.
    • Modellierung und Simulation von neurobiologischen Prozessen mittels neuronaler Netzwerken
    • Zeitbedingte Simulationen in der Ökologie.
    Aktuelle Arbeitsgebiete der Bioinformatiker sind die Verbesserung der Qualität von Funktions- und Strukturvorhersagen, der systematischen komparativen Genomanalyse, der Genmodellierung und der Proteininteraktionen (Docking, sowohl für die Protein/Wirkstoff- als auch die Protein/Proteininteraktionen). Die Masse der generierten Daten schließt eine manuelle Bearbeitung aus, daher wurden Bioinformatikpakete zur Analyse und Interpretation entwickelt und ständig verbessert.

    Ein bisher noch wenig hervorgetretener Bereich ist die computergestützte Simulation biologischer Prozesse z.B. zur Untersuchung komplexer Netzwerke, besonders bei der Auswahl und dem Entwurf experimenteller Ansätze. Dabei kann auf Erfahrungen bei der Simulation chemischer Prozesse aufgebaut werden, die wegen ihrer geringeren Komplexität schon weiter fortgeschritten sind und sich leichter weiterentwickeln lassen. In gleicher Weise wie Biologie auf den molekularen Grundlagen der Chemie beruht, kann Bioinformatik in wichtigen Teilbereichen Strukturen der Chemieinformatik nutzen [5].

    Zuletzt sei erwähnt, dass die Bioinformatik an die Kognitionswissenschaften angrenzt. Die Kognitionswissenschaften sind der interdisziplinären Untersuchung von Wissens- und Denkvorgängen sowie der sogenannten Bioinformation, d.h. den physiologischen Trägern dieser Vorgänge, gewidmet. Die Kognitionswissenschaften setzen u.a. medizinische Methoden der Hirnforschung und Informatikmethoden der Künstlichen Intelligenz ein. Auch im Bereich der Kognitionswissenschaften wird an der Ludwig-Maximilians-Universität München geforscht.

    Zusammenfassend lässt sich feststellen, dass die Bioinformatik als fester Bestandteil der biologischen Forschung etabliert ist. Die ungezählten Herausforderungen und Probleme der modernen Biologie lassen sich nur mit Hilfe der Informatik bewältigen, die Methoden, Algorithmen und Anwendungen entwickelt und bereitstellt. Der Bioinformatik selbst kommt dabei die Rolle des Vermittlers zwischen dem experimentierenden Biologen und dem mathematisch denkenden Informatiker zu.

    Keines der großen von der DFG und dem BMBF geförderten Programme zur Genomforschung (z.B. Deutsches Humangenomprojekt DHGP, Genomanalyse im Biologischen Modell Pflanze, GABI) kann ohne Bioinformatik realisiert werden. Bei der Vergabe von Drittmitteln spielt die Bioinformatik oft die entscheidende Rolle.

    Auch in der Lehre wird die Wichtigkeit des Bioinformatik erkannt. In mehreren Universitäten -- unter anderem an der Ludwig-Maximilians-Universität München -- wird die Einrichtung von Studiengängen im Fach Bioinformatik vorbereitet [4].



  2. Bedeutung der Bioinformatik für den Forschungs- und Wirtschaftsstandort Bayern

    Die Region München ist eine der Hochburgen der Softwareindustrie Europas. In Erlangen befindet sich eines der weltweit wenigen Industriezentren der medizinischen Informatik, zu der die Bioinformatik wesentlich beiträgt. Zur Agrarwissenschaft, die in Bayern weiterhin eine wichtige Rolle spielt, leisten die Biowissenschaften in immer stärkerem Umfang wesentliche Beiträge. Gerade im Bereich der Züchtung werden immer mehr bioinformatische Methoden eingesetzt, die mit einem massgeblichen Beitrag der Grundlagenforschung auf dem Gebiet der Genomanalyse an der Ludwig-Maximilians-Universität München entwickelt wurden. Im Bereich der Arzneimittelentwicklung bietet die Bioinformatik Möglichkeiten, ältere Ansätze aus der klassischen Chemie zu erneuern bzw. zu ersetzen. Hierüber ebnet die Bioinformatik den Weg zu neuen Industriezweigen.

    Es sei bemerkt, dass die Bioinformatik bei den Diskussionen um die Fusion der europäischen Chemiekonzerne Hoechst und Rhône-Poulenc ein wichtiger Punkt war. Auch führende Pharmakonzerne in den USA wie SmithKline Beecham oder Millenium Pharmaceutical betreiben in erheblichem Umfang Forschungs- und Entwicklungsarbeiten im Bereich der Bioinformatik.

    Die in der Region München gegründeten jungen Biotechnologieunternehmen sind auf eine starke Bioinformatik angewiesen. Einige von ihnen sind in der Genomanalytik vertreten und nutzen Bioinformatikdienstleistungen intensiv (z.B. Medigenomix, GPC, Epidaurus, Switch Biotech). Die Bioinformatik unterstützt die Unternehmen beim Aufbau ihrer Informationstechnologien. Es haben sich bereits zwei Bioinformatikanbieter als Ausgründungen des Forschungszentrums für Umwelt und Gesundheit (GSF) etabliert: die Biomax Informatics GmbH und Genomatix. Diese Tatsache unterstreicht nicht nur die wirtschaftliche Bedeutung der Bioinformatik, sondern auch die Notwendigkeit zur Ausbildung qualifizierter Bioinformatiker.

    An den Münchner Universitäten sind mit dem Gen-Zentrum, der Fakultät für Biologie und den Instituten in Weihenstephan international renommierte Einrichtungen vorhanden, die die Biowissenschaften hervorragend repräsentieren. Mit dem "Münchner Informationszentrum für Proteinsequenzen" des Forschungszentrums für Umwelt und Gesundheit (GSF) am Max-Planck-Institut für Biochemie besteht bereits seit mehreren Jahren eine international anerkannte Einrichtung, die Methoden der Bioinformatik zum Zweck der Genomanalyse einsetzt.

    Es ist höchste Zeit, die vorhandenen Ressourcen zu verknüpfen und mit dem Ausbau der Bioinformatik einen weiteren, in das nächste Jahrtausend weisenden Forschungsschwerpunkt in Bayern anzusiedeln.



  3. Die Bioinformatik an bayerischen Universitäten

    Bayerische Julius-Maximilians-Universität Würzburg. 1993 wurde an dieser Universitat ein Biozentrum gegründet, das zunächst sechs Lehrstühle aus der Biologie, einen aus der Chemie und drei aus der Medizin zusammenbrachte, 1997 kamen drei pflanzenwissenschaftlich ausgerichtete Lehrstühle hinzu. Derzeit plant das Biozentrum die Gründung eines Lehrstuhls für Bioinformatik. Dieser Lehrstuhl soll in der Fakultät für Mathematik und Informatik angesiedelt sein. Eine Zweitmitgliedschaft in der Fakultät für Biologie soll eine enge Verbindung zum Anwendungsfach sichern.

    Im RIDOM-Projekt (Ribosomal Differentiation of Medical Micro-Organisms), einer Kooperation zwischen der Fakultät für Mathematik und Informatik und dem Institut für Hygiene und Mikrobiologie der Bayerischen Julius-Maximilians-Universität Würzburg, wurde ein WWW-Informationssystem zur Erkennung von Mikroorganismen aufgebaut, das im Juni 1999 bei Fachtagungen der wissenschaftlichen Öffentlichkeit dargestellt wurde.

    Ludwig-Maximilians-Universität München. An der Ludwig-Maximilians-Universität München wurde der beschriebenen Entwicklung sehr früh Rechnung getragen, so dass sie im Vergleich zur anderen Universitäten, die erst vor kurzem Interesse an die Bioinformatik angekündigt haben, über einen beachtlichen Vorsprung verfügt.

    Zusammenfassend lässt sich feststellen, dass die Bioinformatik im Bereich der Forschung an der Ludwig-Maximilians-Universität München bereits jetzt eine breite Basis hat. Wenn viele Wissenschaftler der Ludwig-Maximilians-Universität München unter anderem Methoden der Bioinformatik untersuchen oder anwenden, fehlen an dieser Universität noch Arbeitsgruppen, die sich in Forschung und Lehre primär der Bioinformatik widmen. Die Ludwig-Maximilians-Universität München bietet eine hervorragende Grundlage für die Bildung solcher Arbeitsgruppen und eines interdisziplinären Lehr- und Forschungsschwerpunkts Bioinformatik.

    Damit befindet sich die Ludwig-Maximilians-Universität München in einer für Deutschland seltenen Situation: Lediglich die Universitäten Bielefeld, Bonn in Zusammenarbeit mit der GMD (GMD Forschungszentrum Informationstechnik GmbH, Sankt-Augustin bei Bonn), Saarbrücken und das DKFZ (Deutsches Krebsforschungszentrum) in Heidelberg haben bereits Forschungsgruppen im Bereich der Bioinformatik.

    Der herausragenden Rolle der Bioinformatik für die Biowissenschaften wird derzeit im Bereich der Lehre noch nicht Rechnung getragen. Dies führt dazu, dass Hochschulabsolventen, die sowohl eine fundierte Informatik- als auch eine Biologieausbildung vorweisen können, derzeit auf dem Arbeitsmarkt "Mangelware" sind. Hier sehen das Institut für Informatik, die Fakultät für Biologie, das Gen-Zentrum und die Fakultät für Chemie und Pharmazie der Universität München eine gemeinsame Aufgabe in der Ausbildung. Ziel soll sein, junge Studenten in einem interdisziplinären Studiengang Bioinformatik für attraktive Positionen in Forschung und Industrie auszubilden.

    Technische Universität München. An der Technischen Universität München wurde die Bedeutung der Bioinformatik erkannt. Kürzlich erfolgte der Senatsbeschluss, die Bioinformatik in Zusammenarbeit mit dem Forschungszentrum für Umwelt und Gesundheit (GSF) an der Technischen Universität München neu einzurichten. Geplant sind zunächst 3 der Bioinformatik gewidmete Lehrstühle. Zu einem späteren Zeitpunkt sollen 3 C3-Professuren mit Schwerpunkt Bioinformatik folgen.

    Friedrich-Alexander-Universität Erlangen-Nürnberg. Auch das Institut für Mathematische Maschinen und Datenverarbeitung (Informatik) der Friedrich-Alexander-Universität Erlangen-Nürnberg hat vor kurzem Interesse am Aufbau eines Studiengangs Bioinformatik gezeigt.



  4. Handlungsvorschläge für die Ludwig-Maximilians-Universität München

    Aus den bereits geführten Gesprächen zwischen dem Institut für Informatik und Mitgliedern der Fakultäten für Biologie, für Chemie und Pharmazie und des Gen-Zentrums erscheinen die folgenden Möglichkeiten zur Stärkung der Bioinformatik an der Ludwig-Maximilians-Universität München als besonders sinnvoll und erfolgversprechend:



  5. Schlussbemerkung

    Die Bioinformatik ist eine Schlüsseltechnologie für die Weiterentwicklung von Biologie, Chemie, Pharmazie und Medizin, die für den Forschungs- und Wirtschaftstandort Bayern entscheidend ist.

    Die Ludwig-Maximilians-Universität München darf ihre vorhandenen Ressourcen in diesem Bereich nicht aufs Spiel setzen, wenn sie ihre führende Rolle in den erwähnten Disziplinen auch in Zukunft behalten will.

    Darüber hinaus muss eine fundierte und fächerübergreifende Ausbildung im Studienfach Bioinformatik an der Ludwig-Maximilians-Universität München angeboten werden. Diese Universität bietet die besten Voraussetzungen für eine Ausbildung, die Universitätsabsolventen besonders gute Chancen auf dem Arbeitsmarkt verspricht.



  6. Literatur

    [1]
    Mitteilung an die US-Senatskommission für Handel, Wissenschaft und Verkehr,
    Dr. Mary Clutter, National Science Foundation, 17.9.1996

    [2]
    Strukturplan zum Ausbau der Informatik an der Universität München,
    Institut für Informatik, Ludwig-Maximilians-Universität München, 15.5.1998.
    (Fortschreibung der Pläne vom 29.6.1989, 30.7.1994 und 24.7.1995)

    [3]
    Weißbuch über Perspektiven in der Ludwig-Maximilians-Universität zum Anbruch des Informationszeitalters,
    François Bry, Peter Clote, Heinz-Gerd Hegering, Hans-Peter Kriegel, Fred Kröger, Thomas Ludwig und Martin Wirsing, 23.7.1998.
    (Das Weißbuch ist erhältlich unter der URL-Adresse http://www.pms.informatik.uni-muenchen.de/publikationen/PMS-FB/perspektiven.html sowie unter folgender Postanschrift: Institut für Informatik, Sekretariat von Prof. Dr. François Bry, Oettingenstraße 67, 80538 München, Tel.: 089 - 2178 2210, Fax: 089 - 2178 2211.)

    [4]
    Empfehlung zur Einrichtung von Studiengängen im Fach Bioinformatik (PostScript-Datei),
    Fachgruppe 4.0.2 der Gesellschaft für Informatik (GI), R. Giegerich, R. Hofestaedt, H.-G. Lipinski, D. Schomburg und T. Werner, 6.11.1997.

    [5]
    Mitteilungen von Prof. Dr. Herbert Mayr,
    Fakultät für Chemie und Pharmazie, Ludwig-Maximilians-Universität München, 2.7.1999.

    [6]
    Reengineering the University,
    Dennis Tsichritzis, Communications of the ACM (Association for Computing Machinery), Volume 42, Number 6, Juni 1999.