^
A
A
A

Stimme als Analyse: Frühe Signale von Krebs und gutartigen Läsionen

 
Alexey Kryvenko, Medizinischer Gutachter
Zuletzt überprüft: 18.08.2025
 
Fact-checked
х

Alle iLive-Inhalte werden medizinisch überprüft oder auf ihre Richtigkeit überprüft.

Wir haben strenge Beschaffungsrichtlinien und verlinken nur zu seriösen Medienseiten, akademischen Forschungseinrichtungen und, wenn möglich, medizinisch begutachteten Studien. Beachten Sie, dass die Zahlen in Klammern ([1], [2] usw.) anklickbare Links zu diesen Studien sind.

Wenn Sie der Meinung sind, dass einer unserer Inhalte ungenau, veraltet oder auf andere Weise bedenklich ist, wählen Sie ihn aus und drücken Sie Strg + Eingabe.

12 August 2025, 08:13

Forscher der Oregon Health & Science University analysierten Sprachaufnahmen aus dem neuen öffentlich zugänglichen Bridge2AI-Voice-Datensatz und entdeckten ein einfaches akustisches Merkmal, das Stimmbandpathologien aufdecken kann. Es handelt sich um das Harmonic-to-Noise-Ratio (HNR) – das Verhältnis von „musikalischen Obertönen“ zu Rauschen. Sein Pegel und seine Variabilität unterschieden die Stimmen von Menschen mit Kehlkopfkrebs und gutartigen Läsionen von gesunden Menschen sowie einigen anderen Stimmstörungen. Der Effekt war besonders deutlich bei Cisgender-Männern; bei Frauen reichte die statistische Signifikanz nicht aus – die Autoren begründen dies mit der geringen Stichprobengröße und fordern eine Erweiterung der Daten. Die Arbeit wurde als Kurzbericht in Frontiers in Digital Health veröffentlicht.

Hintergrund der Studie

  • Warum überhaupt nach „Stimmmerkmalen“ suchen? Heiserkeit ist eine häufige Beschwerde. Die Ursachen sind vielfältig: von Erkältungen und Reflux bis hin zu Knötchen/Polypen und Kehlkopfkrebs. Derzeit führt ein Besuch beim HNO-Arzt und eine Endoskopie (mit einer Kamera in Nase/Rachen) zur Diagnose. Diese ist zwar präzise, aber nicht immer schnell verfügbar und eignet sich nicht für die Selbstkontrolle zu Hause. Ein Vorscreening ist notwendig: eine einfache Methode, um zu verstehen, wer zuerst einen Arzt aufsuchen sollte.
  • Was ist ein Stimmbiomarker? Sprache ist ein Signal, das sich leicht mit einem Telefon aufzeichnen lässt. Anhand ihres „Musters“ lässt sich beurteilen, wie die Stimmbänder vibrieren. Läsionen führen zu ungleichmäßigen Vibrationen: mehr „Lärm“ und weniger „Musik“.
  • Warum neue Datensätze wichtig sind. Bisher stützten sich solche Arbeiten auf kleine, „selbstgemachte“ Stichproben – die Modelle waren fragil. Bridge2AI-Voice ist ein großer, multizentrischer und ethisch korrekt gesammelter Satz von Audioaufnahmen, die mit Diagnosen verknüpft sind. Er wurde als „gemeinsames Testfeld“ geschaffen, um Algorithmen endlich anhand großer und heterogener Daten zu trainieren und zu testen.
  • Wo liegen die größten Schwierigkeiten?
    • Die Stimme verändert sich durch Mikrofon, Raumgeräusche, Kälte, Rauchen, Sprache, Geschlecht und Alter.
    • Es gibt traditionell weniger Daten von Frauen und die weibliche Stimme ist häufiger – die Metriken verhalten sich anders.
    • Kein „Heim“-Test kann eine Untersuchung ersetzen oder eine Diagnose stellen – er hilft höchstens bei der Entscheidung: „Ist ein dringender Besuch beim HNO-Arzt notwendig?“
  • Warum brauchen Klinik und Patienten dies? Wenn Personen mit hohem Risiko für Knoten/Tumoren durch einen kurzen Termin für einen vorrangigen Termin ausgewählt werden können, beschleunigt dies die Diagnostik, reduziert unnötige Überweisungen und bietet ein Instrument zur Selbstüberwachung zwischen den Besuchen (nach der Operation, während der Therapie).
  • Wohin dies führen sollte: Zu validierten Telemedizinanwendungen/-modulen, die:
    1. eine Rede nach dem Standard schreiben (Phrase + langgezogenes „aaa“),
    2. Berechnung grundlegender Merkmale (HNR, Jitter, Shimmer, F0),
    3. bei einem besorgniserregenden Profil die Empfehlung aussprechen, einen Spezialisten zu kontaktieren,
    4. Aufrechterhaltung der Dynamik nach der Behandlung.

Die Idee ist einfach: „Halten Sie das Telefon an das Ohr eines HNO-Arztes“ – nicht zur Diagnose, sondern um diejenigen nicht zu verpassen, die schnelle persönliche Hilfe benötigen.

Was genau haben sie getan?

  • Wir haben die erste Veröffentlichung des multizentrischen, ethisch erhobenen Bridge2AI-Voice-Datensatzes durchgeführt, einem Vorzeigeprojekt des NIH, bei dem Sprachaufzeichnungen mit klinischen Informationen (Diagnosen, Fragebögen usw.) verknüpft werden.
  • Es wurden zwei analytische Proben gebildet:
    1. „Kehlkopfkrebs / gutartige Knoten / gesund“;
    2. „Krebs oder gutartige Knoten“ versus spasmodische Dysphonie und Stimmlippenlähmung (andere häufige Ursachen für Heiserkeit).
  • Anhand standardisierter Phrasen wurden grundlegende Stimmmerkmale identifiziert: Grundton (F0), Jitter, Schimmer und HNR. Die Gruppen wurden mithilfe nichtparametrischer Statistik verglichen. Ergebnis: Die stabilsten Unterschiede lagen bei HNR und F0 vor, wobei HNR und seine Variabilität gutartige Läsionen am besten von der Norm und Kehlkopfkrebs unterscheiden konnten. Diese Signale waren bei Männern deutlicher ausgeprägt.

Warum ist das wichtig?

  • Frühes Screening ohne Sonde. Derzeit führt der Weg zur Diagnose oft über eine Nasenspiegelung und, bei Verdacht, über eine Biopsie. Wenn einfache akustische Merkmale in Kombination mit KI die Priorität derjenigen bestimmen, die eine Endoskopie benötigen, gelangen Patienten schneller zum HNO-Arzt und unnötige Überweisungen werden reduziert. Dies ist eine Ergänzung, kein Ersatz für den Arzt.
  • Big Data für die Stimme. Bridge2AI-Voice ist ein seltenes Projekt, bei dem Stimmen mithilfe einheitlicher Protokolle erfasst und mit Diagnosen verknüpft werden. Die Daten stehen Forschern über PhysioNet / Health Data Nexus zur Verfügung. Dies beschleunigt die Entwicklung zuverlässiger Stimm-Biomarker anstelle von „Wunder-Apps“ mit kleinen Stichproben.

Was ist HNR?

Beim Sprechen vibrieren die Stimmlippen und erzeugen Obertöne (Harmonische). Die Vibration ist jedoch nie perfekt – das Signal enthält immer Rauschen. HNR beschreibt, wie viel mehr „Musik“ als „Zischen“ in der Stimme steckt. Sind die Lippen beschädigt, wird die Vibration ungleichmäßiger – es entsteht mehr Rauschen, HNR sinkt und die Sprünge (Variabilität) nehmen zu. Dieses Muster haben die Autoren erkannt.

Wichtige Haftungsausschlüsse

  • Es handelt sich um eine Pilot- und explorative Analyse: ohne klinische Validierung und mit Einschränkungen hinsichtlich der Stichprobe von Frauen – daher waren die Effekte nicht signifikant. Es sind umfangreichere und vielfältigere Daten sowie eine Überprüfung der Modelle in verschiedenen Kliniken und in verschiedenen Sprachen erforderlich.
  • Die Stimme ist ein „mehrwertiges“ Ding: Sie wird durch eine Erkältung, Rauchen, Reflux, ein Mikrofon und Lärm im Raum beeinflusst. Jeder „Heimtest“ sollte den Kontext berücksichtigen können – und dennoch als Filter für eine Überweisung an einen HNO-Arzt dienen und nicht als Klick-Diagnose.

Wie geht es weiter?

  • Erweitern Sie den Datensatz (auch für Frauen und Altersgruppen), standardisieren Sie Aufgaben und Akustik (Lesen einer Phrase, verlängertes „aaa“ usw.), probieren Sie multimodale Modelle aus (Stimme + Fragebogensymptome/Risikofaktoren).
  • Verknüpfen Sie akustische Signale mit Untersuchungsergebnissen (Endoskopie, Stroboskopie) und der Dynamik nach der Behandlung – so kann das HNR-Profil auch zur Überwachung genutzt werden.
  • Setzen Sie die „offene Wissenschaft“ fort: Bridge2AI-Voice veröffentlicht bereits Versionen des Datensatzes und der Tools – dies ist eine Chance, schnell echte Pilotprojekte in Kliniken zu erreichen.

Abschluss

Es ist möglich, Stimmbandprobleme an der Stimme zu „hören“ – und die betroffene Person möglicherweise schneller an den richtigen Spezialisten zu überweisen. Derzeit ist dies ein guter Anhaltspunkt (HNR und seine Variabilität), aber dank großer offener Datenmengen haben Stimmbiomarker endlich die Chance, zu einem zuverlässigen Screening-Tool zu werden.

Quelle: Jenkins P. et al. Stimme als Biomarker: Explorative Analyse gutartiger und bösartiger Stimmlippenläsionen. Frontiers in Digital Health, 2025 (zur Veröffentlichung angenommen). Daten – Bridge2AI-Voice (NIH/PhysioNet).

You are reporting a typo in the following text:
Simply click the "Send typo report" button to complete the report. You can also include a comment.