19.07.2011

Genforschung: Mit Riesenrechnern die Datenwelle surfen

Von gleich mehreren großen IT-Projekten aus dem Umfeld der medizinischen Genforschung ist in diesen Tagen zu berichten. Was dort gerade an unterschiedlichen Stellen pilotiert wird, könnte durchaus der erste Vorbote der nächsten großen Digitalisierungswelle im Gesundheitswesen sein. Die beiden wichtigsten Faktoren, die die neuen Projekte kennzeichnen, sind eine bisher komplett unvorstellbare Rechenleistung und die Einführung von digitaler klinischer beziehungsweise biomedizinischer Intelligenz, mit deren Hilfe Nutzern die Datenberge bei ganz konkreten Fragestellungen erschlossen werden sollen.

Am eindrucksvollsten dürfte das internationale Krebsgenomprojekt (ICGC) sein, dessen deutscher Arm am Deutschen Krebsforschungszentrum in Heidelberg koordiniert wird. Beim ICGC soll das Genom von 25000 Krebspatienten sequenziert werden. Weil Tumorzellen und gesunde Zellen gleichzeitig betrachtet werden sollen, sind insgesamt 50000 Sequenzierungen des kompletten menschlichen Genoms nötig. Und weil jedes Genom - um Fehler auszuschließen - dreißig Mal sequenziert wird, entstehen pro Genom 2,7 Terabyte (!) Daten. Allein die rund 2000 Genome, die in Deutschland sequenziert werden, produzieren demnach mehrere Petabyte an Daten. Nur um eine Vorstellung davon zu geben, wie leistungsfähig eine Infrastruktur sein muss, um damit auch nur ansatzweise fertig zu werden: In Heidelberg wird gerade überlegt, zehn 10 Gigabit-Leitungen parallel zu schalten, um diese Datenmengen überhaupt in den Arbeitsspeicher zu bringen.

Gesucht: Eine neue Art der klinischen Medizin

Mit solchen Zahlen lässt sich schön Eindruck schinden. Aber was medizinisch dahinter steckt, ist auch nicht ohne. Die entstehende Infrastruktur bildet die Voraussetzung für eine neue Art der Medizin, bei der individuelle (Gen-)Daten und Krankheitsverläufe gemeinsam gespeichert und im Idealfall für den jeweils behandelnden Arzt nutzbar gemacht werden. Der könnte, um ein Beispiel zu nehmen, bei einem Krebspatienten eine Datenbankabfrage starten, um zu sehen, welche Art der Behandlung bei Patienten mit ähnlichen individuellen (Gen-)-Merkmalen vielversprechend ist. Klinische Studiendaten sind nicht die ganze Wahrheit.

Nun ist „eine Datenbankabfrage starten" einfach gesagt. Wie soll das aussehen? Das ist letztlich noch nicht klar. In Heidelberg will man hier mit Unterstützung von IBM weiterkommen. Genutzt werden soll dabei die Watson-Technologie. Die nach dem IBM-Gründer (nicht dem Genforscher) benannten Watson-Algorithmen haben bekanntlich Anfang 2011 bei einer US-Quiz-Show gewonnen, bei der Wissensfragen in Alltagssprache gestellt wurden. Das geht einen deutlichen Schritt über die von Schachcomputern bekannte, letztlich rein quantitative „Intelligenz" hinaus.

Zwar ohne Watson, aber in ähnliche Richtung denken die Initiatoren des von der EU im 7. Forschungsrahmenprogramm geförderten p-medicine-Projekts, für das kürzlich der Startschuss fiel. Auch p-medicine, das von der Universitätsklinik des Saarlandes koordiniert wird, ist in der Onkologie angesiedelt. Es geht darum, eine Infrastruktur aufzubauen, die patienteneigene klinische, radiologische und labormedizinische Daten zusammenführt und für Abfragen öffnet. Die Hauptintention von p-medicine besteht darin, einen Großteil der europäischen klinischen Krebsforschung zu vernetzen, um auf diese Weise hoch individualisierte Studien durchführen zu können, die sich nicht so sehr an Krankheitsentitäten, sondern an klinischen Konstellationen orientieren.

dgd