Forschende entwickeln KI-Lösungen für medizinische Spitzenforschung

Neuherberg (02.02.2022) –

Daten sind Gold – das gilt nicht nur für die Wirtschaft, sondern auch für die biomedizinische Forschung. Um neue Therapien oder Präventionsstrategien für Krankheiten zu entwickeln, brauchen Wissenschaftler:innen immer schneller immer mehr und immer bessere Daten. Doch die Qualität ist häufig sehr unterschiedlich und die Integration verschiedener Datensätze oft fast unmöglich. Mit dem Computational Health Center des Forschungszentrums Helmholtz Munich entsteht jetzt unter der Leitung von Fabian Theis eines der europaweit größten Forschungszentren für künstliche Intelligenz in der medizinischen Wissenschaft. In enger Vernetzung mit der Technischen Universität München (TUM) entdecken hier mehr als hundert Wissenschaftler:innen mithilfe von künstlicher Intelligenz und maschinellem Lernen Lösungen für genau diese Probleme und ermöglichen damit medizinische Innovationen für eine gesündere Gesellschaft. In der jüngsten Ausgabe des Fachjournals Nature Methods präsentieren sie gleich drei Artikel mit bahnbrechenden neuen Lösungen.

Fabian Theis, Leiter des Computational Health Center bei Helmholtz Munich und Professor für Mathematische Modellierung biologischer Systeme an der TUM: „Wir haben vier intensive Wochen hinter uns, in denen unsere wissenschaftlichen Projekte und Methoden gleichzeitig erfolgreich publiziert wurden. In meiner Gruppe konzentrieren wir uns auf die Einzelzellgenomik. Mit dieser Methode wollen wir den Ursprung von Krankheiten auf mechanistische Weise verstehen. Dafür nutzen und entwickeln wir Ansätze des maschinellen Lernens, um komplexe Daten besser darzustellen. Mit unseren drei neuesten Studien haben wir uns mit der Integration von Einzelzelldaten, dem Lernen von Trajektorien und der räumlichen Auflösung beschäftigt. Mit diesen Beiträgen aber auch darüber wollen wir die Einzelzellforschung und damit unser Verständnis von Krankheiten auf die nächste Stufe bringen.“

Die neuesten Lösungen von Helmholtz Munich und der TUM im Überblick:

Das Dilemma mit der Datenintegration lösen

In wissenschaftlichen Studien arbeiten Forschende oft an einzelnen Datensätzen. Um zu prüfen, ob sie ihre Ergebnisse aus einer Studie verallgemeinern können, müssen sie ihre Daten mit anderen Datensätzen aus demselben System vergleichen. In der medizinischen Forschung handelt es sich dabei oft um Daten einzelner Zellen. Da Einzelzelldaten nicht immer zur gleichen Zeit, am gleichen Ort oder von der gleichen Person erzeugt wurden, unterscheiden sich auch die gleichen Zelltypen in ihrem molekularen Profil. Dieses Problem bezeichnet man als Batch-Effekt und es erschwert die Kombination von Datensätzen immens. Bisher brachte die Forschung mehr als fünfzig unterschiedliche Lösungsvorschläge hervor, doch welcher ist der beste? Malte Lücken und seine Kolleg:innen haben 86 Datensätze sorgfältig aufbereitet und 16 der gängigsten Lösungen für die Datenintegration anhand von 13 Aufgaben miteinander verglichen. Nach mehr als 55.000 Stunden Rechenzeit und einer detaillierten Auswertung von 590 Ergebnissen haben sie einen Leitfaden erstellt, wie sich das Dilemma mit der Datenintegration am besten lösen lässt. Dies ermöglicht eine bessere Beobachtung von Krankheitsprozessen über unterschiedliche Datensätze hinweg.

Schicksal von Zellen mit Open-Source-Software vorhersagen

In der medizinischen Forschung dreht sich vieles um die Fragen: Wie entwickeln sich Zellen? Wie funktioniert Zellregeneration? Um diese zu beantworten interessieren sich Forschende für die Genexpression von Zellen, die über eine Methode namens Einzelzell-RNA-Sequenzierung ermittelt wird. Das Verfahren zerstört jedoch die Zelle und liefert nur eine kurze Momentaufnahme der Genexpression. Deshalb haben Wissenschaftler:innen bereits viele Algorithmen entwickeln, um von der Momentaufnahme künstlich auf einen kontinuierlichen Entwicklungsprozess rückschließen zu können. Die Algorithmen stehen jedoch alle vor derselben Herausforderung: Sie können keine verlässlichen Vorhersagen für das Schicksal der Zelle treffen. Marius Lange und seine Kolleg:innen arbeiten dafür an einem neuen Algorithmus. CellRank beschreibt die Entwicklung einer Zelle, indem es die Momentaufnahme der Genexpression mit “RNA Velocity” kombiniert, einem Konzept zur Abschätzung der Genregulation. Sowohl in vitro als auch in vivo konnte CellRank das Schicksal von Zellen korrekt vorhersagen und bekannte Gene wiedererkennen. In einem Beispiel zur Lungenregeneration sagte CellRank neuartige Zellzwischenzustände voraus, deren Existenz experimentell bestätigt wurde. CellRank ist eine Open-Source-Software, die in Laboren weltweit bereits zum Einsatz kommt um komplexe Zelldynamiken im Kontext von Reprogrammierung, Regeneration oder Krebs zu untersuchen.

Räumliche Omics-Analysen visualisieren

In den letzten Jahren wurden immer mehr Technologien entwickelt, um Veränderungen in der Genexpression von Geweben zu messen. Der Vorteil solcher Technologien besteht darin, dass Forschende die Zellen in ihrem Kontext beobachten können. So können sie besser verstehen, wie das Gewebe aufgebaut ist und wie die Zellen miteinander kommunizieren. Um die wachsende Vielfalt solcher Daten speichern, integrieren und visualisieren zu können, braucht es flexible computergestützte Systeme. Zu diesem Zweck haben Giovanni Palla, Hannah Spitzer und Kolleg:innen eine neue Software, Squidpy genannt, entwickelt. Squidpy ermöglicht die Verarbeitung räumlicher Genexpressionsdaten. Es vereint Werkzeuge für die Genexpressions- und die Bildanalyse, um räumliche Omics-Daten effizient zu bearbeiten und interaktiv zu visualisieren. Squidpy ist erweiterbar und kann mit einer Vielzahl von Tools für maschinelles Lernen aus dem Python-Ökosystem verbunden werden. Wissenschaftler:innen auf der ganzen Welt nutzen die Lösung bereits, um räumliche molekulare Daten zu analysieren.

Neben den drei Veröffentlichungen in Nature Methods, erschienen neueste Ergebnisse des Computational Health-Teams auch als Cover-Story der aktuellen Ausgabe von Nature Biotechnology: https://www.nature.com/nbt/volumes/40/issues/1. Lesen Sie dazu auch die entsprechende Pressemitteilung „Künstliche Intelligenz hilft bei der Erkennung einzelner kranker Zellen“.

Zu den Personen

Fabian Theis leitet das Computational Health Center bei Helmholtz Munich und ist Koordinator der Helmholtz Artificial Intelligence Cooperation Unit (Helmholtz AI). Darüber hinaus ist Inhaber des Lehrstuhls für Mathematische Modellierung biologischer Systeme an der TUM. Giovanni Palla und Marius Lange arbeiten als Doktoranden bei Helmholtz Munich und an der TUM. Malte Lücken und Hannah Spitzer sind beide als Postdocs bei Helmholtz Munich.

Über Helmholtz Munich

Helmholtz Munich ist ein biomedizinisches Spitzenforschungszentrum. Seine Mission ist, bahnbrechende Lösungen für eine gesündere Gesellschaft in einer sich schnell verändernden Welt zu entwickeln. Interdisziplinäre Forschungsteams fokussieren umweltbedingte Krankheiten, insbesondere die Therapie und die Prävention von Diabetes, Adipositas, Allergien und chronischen Lungenerkrankungen. Mittels künstlicher Intelligenz und Bioengineering transferieren die Forschenden ihre Erkenntnisse schneller zu den Patient:innen. Helmholtz Munich zählt mehr als 2.500 Mitarbeitende und hat seinen Sitz in München/Neuherberg. Es ist Mitglied der Helmholtz-Gemeinschaft, mit mehr als 43.000 Mitarbeitenden und 18 Forschungszentren die größte Wissenschaftsorganisation in Deutschland. Mehr über Helmholtz Munich (Helmholtz Zentrum München Deutsches Forschungszentrum für Gesundheit und Umwelt GmbH): www.helmholtz-muenchen.de

Helmholtz Zentrum München Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH),
Prof. Dr. med. Dr. h.c. Matthias H. Tschöp, Kerstin Günther, Daniela Sommer (kom.)

Be the first to comment

Leave a Reply Cancel reply