Benchmarking computergestützter Methoden zur Vorhersage von Domänen-Domänen-Interaktionen
Allgemeine Informationen
Credits (SWS) | 12 (10 SWS) |
Modulniveau | Master |
Sprache | Deutsch/English |
Gesamtstunden | 360 h |
Wöchentlicher Zeitslot | 2-3 days/week |
Blockteil in vorlesungsfreier Zeit | noch nicht festgelegt |
Zeitablauf des Praktikums
Feb - Mar 2025 | Kickoff Meeting und Zuordnung der Projekte und Teams |
Apr - Jul 2025 | Aufteilung der Projektarbeit, Zwischenpräsentationen |
Jul - Aug 2025 | Blockteil für den Abschluss der Projektarbeit, das Verfassen des Berichts und die Vorbereitung der Abschlusspräsentation |
Vorraussetzungen und Vorkenntnisse
Bachelor Bioinformatik. Gute Programmierkenntnisse. Interesse an Datenvisualisierung und Netzwerk Medizin. Vorkenntnisse in der Entwicklung von Softwares sind von Vorteil, aber kein Muss.
Beschreibung
Hintergrund
Proteine sind in der Biochemie von entscheidender Bedeutung und führen biologische Prozesse durch komplexe und vorübergehende Wechselwirkungen aus. Diese Interaktionen hängen von dem Kontext ab, in dem sie auftreten, und bilden die Grundlage für Protein-Protein-Interaktionsnetzwerke (PPI). Diese Netzwerke werden für die Entwicklung von Arzneimitteln, zur Erforschung von Zelldifferenzierung und -kommunikation, der Erkennung von Krankheitsmodulen und viele andere Themen genutzt.
Motivation
Die experimentelle Messung dieser Interaktionen ist zeitaufwändig, kostspielig und ungenau (es gibt Studien, die Falsch-Positiv-Raten von bis zu 40-60 %[1,2] beschreiben). Darüber hinaus leiden PPI-Netzwerke unter Studienverzerrungen, bei denen übermäßig untersuchte Proteine wichtiger erscheinen, als sie sind, und außerdem wurde schon gezeigt, dass Methoden zur Identifizierung aktiver Module bei zufälligen Netzwerken genauso gut funktionieren[3]. Außerdem berücksichtigen sie nicht das alternative Spleißen, einen entscheidenden Prozess, der zu verschiedenen Protein-Isoformen führt, die unterschiedliche oder entgegengesetzte Bindungspräferenzen aufweisen können. Um die Probleme von PPI-Netzwerken anzugehen, haben wir CoBiNet gestartet, ein gemeinsames Projekt mit der FAU in Erlangen und dem IEO in Mailand. Bei DaiSyBio konzentrieren wir uns darauf, den PPI-Netzwerken Informationen auf Isoformebene hinzuzufügen. Da das Testen aller paarweisen Interaktionen von Protein-Isoformen unerschwinglich ist, können computergestützte Werkzeuge dabei helfen, isoformspezifische Interaktionen zu ermitteln. Zu diesem Zweck haben wir zuvor DIGGER [4] aufgebaut, eine Datenbank, die nicht nur experimentell validierte PPIs, sondern auch bekannte Domänen-Domänen-Interaktionen (DDI) berücksichtigt, um zu ermitteln, ob Protein-Isoformen wahrscheinlich interagieren werden. Nur wenige DDIs wurden experimentell validiert, so dass eine computergestützte Vorhersage erforderlich ist, um DIGGER so zu erweitern, dass ein bedeutender Teil des Interaktoms abgedeckt wird. Die Qualität dieser DDIs begrenzt somit auch die Qualität der DIGGER-Datenbank. Für die Vorhersage von DDIs wurden zwar verschiedene Vorhersagemethoden entwickelt, diese wurden jedoch nicht systematisch validiert.
Ziele
Ein wichtiger Aspekt bei der Verbesserung und Erweiterung der DDI-Vorhersage ist die Bewertung der bestehenden Methoden. Das Projekt zielt darauf ab, eine Nextflow-Pipeline zu erstellen, um die vorhandenen Methoden zu bewerten und die Ergebnisse zu vergleichen. Es könnte sein, dass einige Methoden nicht funktionieren und daher neu implementiert werden müssen, während andere vielleicht nicht so gut abschneiden wie beschrieben. Dieses Projekt lässt auch Raum für die Implementierung zusätzlicher Strategien.
Aufgaben
- Recherche zu bestehenden Methoden und dem Status ihres Codes
- Auswahl der zu implementierenden Methoden - Erstellung einer Nextflow-Benchmarking-Pipeline
- Einsatz der Pipeline mit den bereitgestellten Datensätzen (unter Verwendung von Datensplitting, um Informationen für das Benchmarking zu beizubehalten)
- Analyse und Visualisierung der Benchmarking-Ergebnisse
Referenzen
- Armean IM, Lilley KS, Trotter MW (2012). Popular computational methods to assess multiprotein complexes derived from label-free affinity purification and mass spectrometry (AP-MS) experiments
- Berggård T, Linse S, James P (2007). Methods for the detection and analysis of protein-protein interactions
- Lazareva O, Baumbach J, List M, Blumenthal DB (2021). On the limits of active module identification.
- Louadi Z, Yuan K, Gress A, Tsoy O, Kalinina O, Baumbach J, Kacprowski T, List M (2020). DIGGER: exploring the functional role of alternative splicing in protein interactions