Der Fokus-Score (FS) bei Biopsien der kleinen labialen Speicheldrüsen ist eines der beiden wichtigsten Kriterien (mit Anti-SSA-Positivität) für die Diagnose des primären Sjögren-Syndroms (pSS). Um Fehlerquoten bei der Diagnostik zu reduzieren, könnten zur Unterstützung von Pathologen künftig Deep-Learning-Algorithmen unter Verwendung künstlicher neuronaler Netze eingesetzt werden.

Nach den ACR/EULAR-Kriterien für das pSS ist die Einstufung des Fokus-Scores (FS) eines von drei der Klassifikationskriterien, aber sie erfordert Fachwissen, das in der Praxis nicht immer vorhanden ist. 53% der Fälle führen zu einer Revision der Diagnose, wenn sie von Experten bewertet werden. 

Beim maschinellen Lernen (Machine Learning) handelt es sich um Familien von Algorithmen, die eine Vielzahl von Daten aufnehmen und diese zum Beispiel verwenden können, um etwas vorherzusagen. Das Deep Learning ist eine Untergruppe dieses Bereichs, der sich auf nur eine Familie von Algorithmen konzentriert und «Deep Neural Networks» genannt wird, erklärte Louis Basseto, Scienta Lab, Research Department, Paris, einleitend [1]. 

Deep Learning wird bereits in der medizinischen Pathologie eingesetzt, zum Beispiel bei Brustkrebs, wo es schon heute mittels Algorithmen sehr genau Metastasen in Gewebeproben von Lymphknoten mit besserer Leistung als Pathologen erkennt. «Unsere Gruppe hat zudem gezeigt, dass maschinelles Lernen auch bei rheumatoider Arthritis eingesetzt werden kann, um das Ansprechen auf Methotrexat und TNF-Hemmer vorherzusagen.» Nun stellten sich die Forscher der Aufgabe, Deep Learning beim Sjögren-Syndrom anzuwenden und herauszufinden, ob es bei der Einstufung des Fokus-Scores und der pSS-Diagnose unterstützen kann?

Deep Learning auf Basis von Speicheldrüsenbiopsien 

Hierzu entwickelten sie zwei Deep-Learning-Netzwerke unter Verwendung von digitalisierten labialen Speicheldrüsenbiopsien von Pa­tien­ten zur Vorhersage des Fokus-Scores (FS ≥1 oder FS <1) und der Diagnose des primären Sjögren-Syndroms anhand nur der Histologie (pSS+ oder pSS-). Eingeschlossen in die Untersuchung wurden 325 Patientinnen und Patienten (145 von der Universität Paris-Saclay, Krankenhaus Bicêtre, 71 von der Queen Mary University London und 109 von der University of Birmingham), unter Verwendung der in der klinischen Routine entnommenen Biopsien. Die Teilnehmer wurden in drei Gruppen unterteilt:

  1. pSS- und FS <1 (32%, Sicca-Symptome)
  2. pSS+ und FS ≥1 (47%)
  3. pSS+ und FS <1 (21%)

Alle FS wurden zuvor von Pathologen sowie die pSS-Diagnosen von Experten bestätigt.

Um eine Vorhersage zu tätigen, werden ein oder mehrere Bilder der Biopsie herangezogen. Jedes Bild wird in Kacheln unterteilt und der Algorithmus ordnet jeder dieser Kacheln eigenständig einen Risikoscore zu. All diese Informationen werden anschliessend zusammengeführt, um eine Vorhersage entweder bzgl. des Fokus-Scores oder der Diagnose zu treffen, abhängig davon, um welchen Algorithmus es sich handelt. 

«Wir verwenden zwei verschiedene Datensätze», erläuterte Basseto: Ein Trainings-Set (70% der Patienten) sowie ein Validierungs-Set (30% der Patienten). Die beiden Sätze beinhalten den gleichen Anteil an positiven wie negativen Klassen (pSS+/pSS– oder FS ≥1/FS <1) und die verschiedenen Zentren, aus denen sich die Teilnehmer zusammensetzen, sind im Training und in der Validierung gemischt. Diese beiden Aufgaben nennt man «semi-supervised learning», also halbüberwachtes Lernen. «Das ist der Schlüssel zum Verständnis der Arbeit: Halbüberwachtes Lernen bedeutet, dass wir dem Modell im Training zwar Informationen geben – z.B. sagen wir ihm, wenn ein Patient einen FS >1 hat. Wir sagen aber nicht, welche Teile der Bildgebung einen Pathologen dazu veranlassen würden, dies zu glauben. Das Modell eruiert dies anhand der Daten selbst.» 

Potenzielle neue Biomarker

Die Leistung des Algorithmus wurde anhand der Fläche unter der ROC-Kurve (AUROC) gemessen. Bezüglich des Fokus-Scores (FS ≥1/FS <1) erreichte der Algorithmus einen AUROC von 0,88. 77% der positiven Vorhersagen waren tatsächlich Patienten mit einem Fokus-Score von ≥1. Beim negativen Vorhersagewert wurde sogar zu 83% korrekt angegeben, dass es sich um einen FS<1 handelt. Im Fall der Diagnosevorhersage betrug der AUROC 0,84. 83% der Patienten mit einer positiven Vorhersage des Algorithmus waren tatsächlich mit Sjögren positiv (pSS+) und 67% der Patienten mit einer negativen Vorhersage waren tatsächlich Sjögren-negativ (pSS-) (Tab. 1).

«Diese Vorhersagen wurden einzig anhand der Bilder gemacht. Wir haben dem Algorithmus zwar nicht gesagt, wo er nachschauen soll, um seine Entscheidung zu treffen, – aber nach dem Training können wir die Algorithmen überprüfen, um zu sehen, auf welcher Basis sie ihre Vorhersagen getätigt haben.» Die Erkenntnis der Forscher war, dass der Algorithmus für den Fokus-Score Lymphozytenfoci identifizierte, um eine Vorhersage zu treffen (Abb. 1). Dies sorge für Erklärbarkeit und ermögliche es dem Pathologen, die Ergebnisse der Vorhersage visuell zu bestätigen. Für den FS sei dies somit beruhigend, so Basseto, «doch was für den FS beruhigend ist, ist für die Diagnose sehr aufregend, da es diesbezüglich zur potenziellen Identifizierung neuer histologischer Biomarker führen könnte, die nur für die Population pSS+ und FS<1) interessant sind». Für die zukünftige Arbeit der Forschergruppe sei dieser Aspekt von besonderem Interesse.

Take-Home-Messages

  • Deep Learning sagt den Fokus-Score und die Diagnose des primären Sjögren-Syndroms anhand von Labial-Speicheldrüsen-Biopsien genau voraus.
  • Deep Learning könnte die Fehlerquote bei der Diagnose potenziell um das ~2,5-Fache reduzieren. Die Fehlerrate durch Deep Learning beträgt 19,7% vs. 53% bei Nicht-Expertenzentren.

Perspektiven:

  • Weitere klinische Assessments sind erforderlich, um die Algorithmen in der realen klinischen Praxis zu validieren.
  • Zusätzliche Validierung an einer grösseren Kohorte.
  • Laufende Arbeit zielt darauf ab, neue histologische Biomarker zu identifizieren, die mit der Diagnose von pSS assoziiert sind.

Kongress: EULAR 2023

Quelle:

  1. Basseto L: Vortrag «Deep Learning Accurately Predicts Focus Score and Diagnosis of Primary Sjögren Syndrome using Labial Salivary Gland Biopsies»; EULAR 2023, Mailand, 2.6.2023 (online).
  2. Basseto L: Scientific Abstract OP0232, EULAR 2023; doi: 10.1136/annrheumdis-2023-eular.418.

InFo RHEUMATOLOGIE 2023: 5(2): 20–21

Jens Dehn

Write A Comment