Durch das Erlernen versteckter physiologischer Muster aus Studien zum Nachtschlaf zeigt ein neues KI-Modell, wie Schlaf als Frühwarnsystem für Krankheitsrisiken Jahre vor der klinischen Diagnose dienen kann.

Studie: Bildnachweis: AnnaStills/Shutterstock.com

In einer aktuellen Studie, die in Nature Medicine veröffentlicht wurde, entwickelten Forscher ein multimodales Schlafmodell, SleepFM, zur Krankheitsvorhersage.

Von Schlafstörungen zu systematischem Krankheitsrisiko

Schlafstörungen betreffen Millionen von Menschen und werden zunehmend als Mitverursacher und Indikatoren für verschiedene Erkrankungen erkannt. Die Polysomnographie (PSG) ist der Goldstandard für die Schlafanalyse und erfasst reichhaltige physiologische Signale. Frühere Studien mit maschinellem Lernen zielten in der Regel auf einzelne Krankheiten oder begrenzte Schlafkennzahlen ab, wodurch viel der komplexen Informationen, die die PSG liefert, ungenutzt blieben.

SleepFM verknüpft nächtliche Physiologie mit langfristigem Krankheitsrisiko

In der vorliegenden Studie entwickelten die Forscher SleepFM, ein multimodales Schlafmodell zur Krankheitsvorhersage. Daten der Polysomnographie wurden aus vier Kohorten verwendet: BioSerenity, den Outcomes of Sleep Disorders in Older Men (MrOS), der Multi-Ethnic Study of Atherosclerosis (MESA) und der Stanford Sleep Clinic (SSC). Zusammen umfassten diese Kohorten etwa 65.000 Teilnehmer und 585.000 Stunden Schlafaufzeichnungen.

Zusätzlich wurde der Datensatz der Sleep Heart Health Study (SHHS) verwendet, um externe Übertragungs- und Verallgemeinerungsfähigkeiten zu evaluieren und wurde von der Vortrainierung ausgeschlossen. Das Team verwendete ein selbstüberwachtes kontrastives Lernziel zur Vortraining. Nach dem Vortraining wurde die Leistung der gelernten Darstellungen von SleepFM durch Feinabstimmung an vier Benchmark-Aufgaben bewertet: Geschlechterklassifikation, Schlafphasenklassifikation, Altersäußerung und Klassifikation von Schlafapnoe.

Die Fähigkeit von SleepFM, das chronologische Alter vorherzusagen, wurde zur Altersäußerung bewertet. Das Modell erzielte einen mittleren absoluten Fehler von 7,33 Jahren. Die Leistung variierte je nach Altersgruppe, mit höherer Genauigkeit in den Gruppen der Mittelalten und der Pädiatrie sowie größerem Fehler bei älteren Erwachsenen. Die Geschlechterklassifikation hatte eine Fläche unter der ROC-Kurve (AUROC) von 0,86 und eine Fläche unter der Präzisions-Recall-Kurve von 0,9.

SleepFM schnitt gut ab bei der Unterscheidung zwischen Wachzustand, Phase 2 und REM-Schlaf, zeigte jedoch Verwirrung bei Übergangsschlafphasen, wie z.B. Phase 1, was mit der bekannten Variabilität in der Bewertung übereinstimmt. Bemerkenswerterweise erzielte das Modell eine wettbewerbsfähige Leistung im Vergleich zu modernsten Modellen, einschließlich U-Sleep, Greifswald Schlafphasenklassifizierer (GSSC), Yet Another Spindle Algorithmus (YASA) und STAGES, obwohl spezialisierte Modelle in bestimmten externen Datensätzen gelegentlich besser abschnitten als SleepFM.

Für die Klassifikation von Schlafapnoe zeigte SleepFM eine wettbewerbsfähige Leistung, mit Genauigkeiten von 0,87 und 0,69 für die Klassifikation von Vorhandensein und Schwere. Anschließend verknüpften die Forscher SSC-Daten mit elektronischen Gesundheitsakten, indem sie Diagnoseschlüssel und deren Zeitstempel für die Krankheitsvorhersage extrahierten. Diese Codes wurden einem hierarchischen System von mehr als 1.800 Krankheitskategorien zugeordnet, die für phänotypweite Assoziationsstudien (Phecodes) entworfen wurden. Nach der Filterung nach Prävalenz und zeitlichen Beschränkungen blieben 1.041 Phecodes für die Bewertung übrig, wobei Fälle als Diagnosen definiert wurden, die mehr als sieben Tage nach der Schlafstudie auftraten, um triviale Assoziationen zu vermeiden.

SleepFM erzielte robuste Ergebnisse in verschiedenen Bereichen, darunter schwangerschaftsbedingte Komplikationen, psychische Störungen, Neoplasien und Kreislauferkrankungen. Das Modell erreichte eine AUROC von 0,93 für Parkinson, 0,84 für sowohl Entwicklungsverzögerungen und -störungen als auch leichte kognitive Beeinträchtigungen, gemessen über einen Vorhersagezeitraum von sechs Jahren. Unter den Kreislauferkrankungen sagte SleepFM effektiv intrakranielle Blutungen und hypertensive Herzkrankheit mit AUROC-Werten von sechs Jahren von 0,82 bzw. 0,88 voraus. Die Autoren betonen, dass diese Vorhersagen eine statistische Risikoabschichtung widerspiegeln und nicht kausale Beziehungen oder den bevorstehenden Ausbruch von Krankheiten.

Unter den Neoplasien zeigte SleepFM starke Vorhersageleistung für Prostatakrebs, Melanome der Haut und Brustkrebs. Das Team untersuchte dann die Generalisierungsfähigkeiten des Modells über zeitliche Verteilung und externe Standortvalidierung. Für die zeitliche Generalisierung wurde das Modell an einer separaten Kohorte von Stanford-Patienten ab 2020 getestet; SleepFM hielt eine starke Vorhersageleistung aufrecht, trotz des begrenzten Nachbeobachtungszeitraums.

Um die Übertragungslernenfähigkeiten von SleepFM zu bewerten, wurde die Leistung auf dem SHHS-Datensatz untersucht. Einbettungen aus dem vortrainierten Modell wurden extrahiert und auf einem Teil dieses Datensatzes feinabgestimmt. Da die Ergebnisdefinitionen an verschiedenen Standorten unterschiedlich waren, beschränkte sich die Bewertung auf sechs überlappende kardiovaskuläre Ergebnisse. SleepFM zeigte robuste Übertragungslernen-Leistungen in diesen Schlüsselbereichen und erreichte signifikante Vorhersagegenauigkeit für Herzinsuffizienz, Schlaganfall und kardiovaskulär bedingte Sterblichkeit.

Schließlich verglichen die Forscher SleepFM mit zwei überwachten Baseline-Modellen, End-to-End PSG und Demografie. Das Demografie-Baseline-Modell wurde auf strukturierten klinischen Merkmalen trainiert, z.B. Körpermasseindex, Alter, Geschlecht und Rasse oder Ethnie. Das End-to-End PSG-Modell wurde auf Roh-PSG-Daten trainiert, einschließlich Alter und Geschlecht, jedoch ohne Vortraining.

Der prozentuale Unterschied in der AUROC zwischen den beiden Baseline-Modellen und SleepFM lag zwischen 5 % und 17 %. SleepFM übertraf konsequent beide Baseline-Modelle in den meisten Krankheitskategorien. Darüber hinaus war SleepFM bei der Vorhersage der Gesamtsterblichkeit überlegen und erzielte eine AUROC von 0,85 im Vergleich zu beiden Baseline-Modellen, die eine AUROC von 0,78 hatten. Über die Krankheitskategorien hinweg zeigte das Modell eine starke Risikoabschichtung, wobei mehr als 130 Bedingungen einen Harrell’s C-Index von mindestens 0,75 erreichten. Laut den Autoren heben diese Ergebnisse das Potenzial des Schlafs als reichhaltige, ungenutzte Quelle für langfristige Gesundheitsdaten hervor.

Schlafbasierte KI-Modelle könnten die frühe Krankheitsdetektion revolutionieren

Zusammenfassend entwickelte die Studie ein großangelegtes Schlafmodell mit mehr als 585.000 Stunden PSG-Daten. SleepFM war robust in der Vorhersage von Demenz, Herzinsuffizienz, chronischer Nierenerkrankung und Tod. Das Modell erzielte wettbewerbsfähige Leistungen bei Standardaufgaben wie der Apnoe-Erkennung und der Schlafphasenklassifizierung, die mit modernsten Modellen vergleichbar sind. SleepFM zeigte auch starke Übertragungslernenfähigkeiten und behielt eine robuste Vorhersagekraft für mehrere kardiovaskuläre Ergebnisse über unabhängige Datensätze hinweg bei.

Darüber hinaus übertraf das Modell überwachte Baseline-Modelle in verschiedenen Krankheitskategorien und sagte die Gesamtsterblichkeit genauer voraus als beide Baseline-Modelle. Die Autoren weisen jedoch darauf hin, dass die meisten Daten von Personen stammen, die für klinische Schlafstudien überwiesen wurden, was die Verallgemeinerbarkeit auf die breitere Bevölkerung einschränken kann. Sie erkennen auch an, dass, wie viele Grundmodelle, die gelernten Darstellungen von SleepFM noch nicht auf der Ebene spezifischer physiologischer Mechanismen vollständig interpretierbar sind.

Insgesamt deuten diese Ergebnisse darauf hin, dass SleepFM bestehende Risikobewertungstools ergänzen und helfen könnte, frühe Krankheitszeichen zu identifizieren. Zukünftige Studien könnten untersuchen, wie die Integration von Schlafmodellen mit Daten aus Gesundheitsakten, Bildgebung und Omik-Analysen deren Nutzen verbessern kann.

Laden Sie jetzt Ihre PDF-Kopie herunter!


Quellen:

Journal reference:
  • Thapa R, Kjaer MR, He B, et al. (2026). A multimodal sleep foundation model for disease prediction. Nature Medicine. DOI: 10.1038/s41591-025-04133-4. DOI: https://doi.org/10.1038/s41591-025-04133-4. https://www.nature.com/articles/s41591-025-04133-4