Home Gesetze & Hintergrundinformationen Gerichtsurteile & -verfahren Hirntod Organspende & Organspender Organempfänger Organhandel Erfahrungsberichte Allg. Informationen Veröffentlichungen 10_Begriffe3.html

Vorträge

Patienteneinschätzung - Score-Systeme

Überwindung der Subjektivität des Arztes durch objektive Entscheidungen eines Computerprogramms?

Inhaltsverzeichnis

Was sind Score-Systeme?
Wie soll sichergestellt werden, daß das Programm mißt, was es vorgibt zu messen?
Zweifel und Kritik
Vorhandene Anwendungsbereiche von Schweregradklassifikationssystemen
Anwendung auch im Individualfall?
Zukünftige Entwicklungen
Schlußfolgerungen
Literatur

Was sind Score-Systeme?

Die Entwicklung von Score-Systemen begann in den USA. (2, S. 477) Score-Systeme sind sogenannte Schweregradklassifikationssysteme oder Punktsummensysteme, die vorgeben, eine quantitative Aussage über den Schweregrad einer Erkrankung, ihrer Prognose und deren Verlauf treffen zu können. Mittlerweile gibt es bereits diverse Softwareprogramme, die jeweils unterschiedlich aufgebaut sind und auch unterschiedlich verwendet werden.

APACHE: Acute Physiology and Chronic Health Evaluation Score; SAPS: Simplified Acute Physiology Score; TISS: Therapeutic Intervention Scoring System; RIP: Riyadh Intensiv Care Unit Program; HIS: Hannover Intensiv Score; KISS: Kombiniertes Intensiv Scoring System; TS: Trauma Score; TI: Trauma Index; HTI: Hospital Trauma Index; ISS: Injury Severity Score; AIS: Abbreviated Injury System; MOFS: Multi-Organ-Failure-Score; MPI: Mannheimer Peritonitis Index; GCS: Glasgow Coma Scale.

Ich möchte mich an dieser Stelle dem vermeintlich besten Programmen zuwenden - dem APACHE-II bzw. APACHE-III Programm. Als hauptsächliches Kriterium wird in ihnen die Letalität berechnet. Das bedeutet, daß die Computerprogramme ausrechnen, mit welcher Wahrscheinlichkeit ein Patient versterben wird und sie können sogar ausrechnen, welche Kosten wahrscheinlich entstehen werden, wenn weiter therapiert wird. (6) Je höher also die Letalitätswahrscheinlichkeit ausgerechnet wird, desto schwerer wird die Erkrankung eingeschätzt. Ziel der Entwicklung dieser Programme war es, die subjektive Entscheidung eines Arztes durch die „objektive“ Entscheidung eines Computers zu ersetzen.

Wie soll sichergestellt werden, daß das Programm mißt, was es vorgibt zu messen?

Es wird üblicherweise so verfahren, daß einzelnen Parametern (z.B. Temperatur, Herzfrequenz, art. Blutdruck, best. Blutwerten, dem neurologischen Status usw.) Punktwerte zugewiesen werden, die dann zu einem Gesamtpunktwert des Scores addiert werden. Im APACHE-II Score werden Punkte (max. 70) für akut physiologische Parameter, für das Alter, zur Bewertung chronischer Vorerkrankungen und zur Bewertung der Bewußtseinslage (Glasgow Coma Scale) verteilt. Es wird angenommen, daß eine steigende Punktzahl einen höheren Schweregrad der Erkrankung markiert und somit eine schlechtere Prognose für die Patienten gegeben ist (11, S. 1).

Das APACHE-II Programm vergleicht die Punktwerte der Patienten mit den Daten von „17440 Patienten, die auf den Intensivstationen amerikanischer Kliniken gelegen hatten und deren Krankheitsverlauf, bis zum Tod oder der Entlassung, akribisch dokumentiert worden war“ (5, S. 158) und errechnet die Letalitätswahrscheinlichkeit. Das APACHE-II Programm wurde an ca. 6000 Intensivpatienten prospektiv (vorausschauend) validiert (gültig erklärt). (3, S. 37).

Als „Reaktion auf neue wissenschaftliche Erkenntnisse“ (3, S. 37) wurde 1991 das APACHE-III-Programm eingeführt. Diese Version enthält mehr Parameter als die APACHE-II-Version und die Glasgow Coma Scale wurde erweitert und modifiziert. Die Gesamtpunktzahl beträgt > 300 Punkte. Auch diese Version wurde in einer prospektiven Studie an einem großen Patientenkollektiv (ca. 17000 Patienten) validiert.

Um keine Fehler zu begehen, muß natürlich die Qualität des Scores geklärt werden. Die vorhergesagte Qualität eines Scores soll um so besser sein, je größer die Übereinstimmung zwischen geschätzter und eingetretener Letalität ist. Dies wird mittels eines statistischen Verfahrens, der „receiver-operating charakteristics analysis (ROC)“, versucht. Die sogenannte „Sensitivität (= die Eignung, das Versterben während des Krankenhausaufenthalts richtig vorherzusagen)“ und die sogenannte „Spezifität (= Eignung, bei denen, die versterben, nicht das Überleben vorherzusagen)“ werden statistisch berechnet und können dann graphisch dargestellt werden. Die ROC-Analysen werden sogar „zum 'golden standard' der Beschreibung von Scoresystemen“ erklärt. (3, S. 37)

Zweifel und Kritik

Die Hersteller des Softwareprogramms haben scheinbar keine Mühen gescheut, um ihre Programme sicher zu machen. Dennoch sind aus vielerlei Gründen Zweifel angebracht. Zwar suggeriert die große Anzahl von Patientendaten, mit denen das APACHE-Programm die aktuellen Daten eines Patientenkollektivs oder einzelner Patienten abgleicht, daß hier große Objektivität vorhanden zu sein scheint. Aber es gibt Forschungsergebnisse, die an der verbesserten Objektivität des Computerprogramms gegenüber der subjektiven Entscheidung eines Menschen - dem Arzt, Bedenken zulassen.

Beispielsweise haben Patienten überlebt, bei denen ein 100%iges Sterberisiko - nach entsprechend hohem Scorewert - prognostiziert wurde. (2, S. 482) Außerdem müssen bestimmte Werte im APACHE-Programm von Menschen erhoben werden, was mit Fehlern behaftet sein kann. Beispielsweise müssen die Pflegekräfte eine Pflegedokumentation durchführen, die oft nur eine „Negativstatistik“ darstellt. Es werden eher die „schlechten“ Blutdrücke, Herzfrequenzen oder Zustände in die Kurve eingetragen und seltener die „Guten“. Natürlich sollte nach erfolgter Intervention, z.B. mit einem Medikament, auch dokumentiert werden, ob diese auch eine Besserung nach sich zog. Wenn jedoch eine Aufnahme kam oder aus anderen Gründen - Reanimation bei einem anderen Patienten - keine Zeit blieb, um eine Kontrolle durchzuführen, hat man über längere Zeit nur „schlechte“ Werte dokumentiert. Die Computerprognose für den Patienten kann jedoch nur besser werden, wenn oft „gute“ Werte gemessen und auch eingetragen werden.

Ein wesentlich gravierenderes Problem des APACHE-Scores stellt meiner Ansicht nach die Glasgow Coma Skala dar. Problematisch ist die neurologische Beurteilung von Patienten, die aufgrund ihrer Grunderkrankung (z.B. kranielle Verletzung) dauernd sediert werden müssen. „Wir schätzten den Grad der Bewußtseinsstörung, wie er ohne sedierende Maßnahmen zu vermuten wäre, anhand aller anamnestischen, klinischen und bildgebenden Befunde ein [...]. In ähnlicher Weise verfuhren wir bei der Berechnung von APACHE-III.“ (3, S. 38) Auch diese Aussage verdeutlicht meiner Ansicht nach, die Unsicherheit des Programms, weil hier der Mensch die entscheidende Rolle bei der Beurteilung spielt. Und, ob wirklich immer erfahrene Ärzte im Dienst sind, um eine Beurteilung abzugeben, ist aus meiner Erfahrung heraus sehr fraglich. Wie hoch die Fehlerwerte sind, wenn Ärzte, die mit der GCS vertraut sind, eine Prognose abgeben, belegt eine Studie.

In einer Vergleichsstudie von WEIKENMEIER (13) zur prognostischen Wertigkeit von Koma-Skalen bei Schädel-Hirn-Verletzten, werden die Glasgow Coma Skala und die Brüssler Coma Skala mit anderen neuen Skalen verglichen. Die höchste Korrektheit bezogen auf die Prognose, richtig vorausgesagter Tod, betrug bei der Glasgow Coma Skala nur 86% (13, S. 98). Die höchste Korrektheit bezogen auf die Prognose, richtig vorausgesagtes Überleben, betrug bei der Glasgow Coma Skala etwa 72% (13, S. 100). Diese doch sehr hohen Fehlerquoten gehen natürlich auch in den APACHE-II bzw. -III mit ein.

Ein weiteres Beispiel, daß meiner Ansicht nach sehr gut herausstellt, daß das APACHE-Programm unsicher ist, ist in der Dissertation von SCHRÖTER (11, S. 21) dokumentiert. „Am 2. Tag zeigte der - eigentlich für die ersten 24 Stunden konzipierte - APACHE-II seine größte Aussagekraft und Trennschärfe, vom 4. Tag an fällt die Aussagekraft bis unter die Zufallswahrscheinlichkeit, der APACHE-II liefert folglich von diesem Zeitpunkt an keine prognostisch verwertbaren Informationen mehr.“

Und auch SCHUSTER (12, S. 1238) stellt heraus, daß „Aussagen zur Letalität, die sich auf Punktwerte aus Schweregradscores beziehen, [...] eher verwirrend und weitgehend manipulierbar [sind].“

Vorhandene Anwendungsbereiche von Schweregradklassifikationssystemen

Trotz der oben erwähnten Mängel des APACHE-Programms werden seine Vorzüge hervorgehoben und in verschiedenen Kliniken, z.b. im Klinikum der Universität Regensburg, im Städtischen Krankenhaus München-Neuperlach, in der Universitätsklinik Würzburg oder der Universitätsklinik für Anästhesiologie der Universität Ulm genutzt. Im Ausland werden sie schon sehr häufig verwendet. In den USA wurde schon 1994 in 400 Kliniken das APACHE-Programm zum Softwarestückpreis von damals 650 000 Dollar verwendet. (5, S. 158) Und auch in über 20 britischen Kliniken vertrauen die Mediziner der Computersoftware. (6)

Auf Patientengruppen bezogen, soll das APACHE-Programm eine sehr hohe Prognosequalität - bezogen auf die Letalitäts- bzw. die Überlebenswahrscheinlichkeit - haben.(2, 3, 3, 4, 5, 7, 11, 12) Aber nicht nur die Subjektivität des Arztes soll durch das APACHE-Programm ersetzt und objektiviert werden. Es gibt bereits diverse Anwendungsschwerpunkte des APACHE-Programms und anderer Klassifikationssysteme:

Die individuellen Berechnung des Letalitätsrisikos,
Der Vergleich von Patientengruppen,
Die Einschätzung der Erkrankungsschwere von Intensivpatienten,
Die Beurteilung von polytraumatisierten Patienten vor Hubschraubertransporten,
Die Identifikation von besonders gefährdeten Patienten,
Die Dokumentation des Leistungsaufwands,
Die Bewertung der Therapiemaßnahmen,
Das Erstellen von Effektivitäts- und Qualitätskontrollen,
Das Erstellen von Risikoprofilen,
Rationalisierung,
Wissenschaftliche Untersuchungen, Beispiel: Multicenterstudien,
Das Erstellen von Kosten--/Nutzenanalysen,
In den USA: zur Triage von Patienten - bezogen auf die Wahl des Transportmittels oder des Versorgungszentrums (1, Trauma Score, S. 223 + 226),
Auch in den USA: zur Triage bei Massenunfällen (USA), um die Reihenfolge der Primärversorgung festzulegen (1, Trauma Score, S. 226).

Anwendung auch im Individualfall?

Die obige Liste verdeutlicht, daß ein Hauptanwendungsfeld, die Anwendung im Individualfall darstellt und auch nahelegt. Es werden definitiv Daten von einzelnen Patienten eingegeben, die jederzeit auf ihn zurückzuführen sind. Es kann nicht bestritten werden, daß das APACHE-II und auch das APACHE-III Programm - wie auch andere - für den Individualfall verwendet werden oder zukünftig Anwendung finden sollen. (2, S. 477)

Eine Entscheidung auf Therapieabruch oder Nichteinsatz von Intensivmedizin im Individualfall auf der Basis eines Computerprogramms, ist jedoch - aus vielerlei Gründen - sehr fragwürdig. Aber selbst in den Reihen der Anwender besteht darüber „Übereinstimmung“, [...] „daß eine Patientenbeurteilung abzulehnen ist, die sich ausschließlich [Hervorhebung im Original !] auf einen Score als Entscheidungskriterium für grundlegende therapeutische Entscheidungen stützt.“ (2, S. 482)

„Nach überwiegender Auffassung sind die Scores für den Einzelfall mit einer so hohen Unsicherheit behaftet, daß sie als Entscheidungsgrundlage für den individuellen Patienten nicht einsetzbar sind.“(12, S. 1238)

„Weder APACHE II, noch MPI oder die Kombination aus beiden sind aber in ihrer individuellen Vorhersage zuverlässig genug, um beim einzelnen Patienten gravierende Entscheidungen, z.B. einen Therapieabbruch, zu begründen.“ (4, S. 352; vgl. auch 1, S. 222; vgl. 3, S. 41; vgl. 10, S. 135; vgl. 11, S. 2 )

Es ist interessant, daß die Anwender des Programms einer individuellen Prognose selbst sehr skeptisch oder ablehnend gegenüberstehen, womit das Hauptanwendungsfeld dieser Programme wegfallen müßte und gleichzeitig die Frage auftaucht, welchen Sinn Gruppenvergleiche zwischen Patientenkollektiven (hohe prognostische „Sicherheit“, siehe oben) machen. Therapieabruch für ganze Patientengruppen (z.B. HIV), obwohl dies im Einzelfall bedeuten kann, daß Patienten versterben, die eine reelle Chance auf ein Überleben hatten. Die oben zitierten Anwender haben trotz ihrer Zweifel, keine Bedenken, die Einführung dieser Computersoftware als Routinediagnostik zu fordern.

Zukünftige Entwicklungen

Der Einsatz der Score-Systeme wird als Routinediagnostik für Intensivstationen empfohlen. (2, S. 482; 4, S. 352; 7, S. 84; 12, S. 1237) Daß Computer in Krankenhäusern „bald über Leben und Tod“ entscheiden ist für Prof. Haverich „vorstellbar“. (6) Nun frage ich mich, ob dies in der Hauptsache zum Wohl der Patienten geschehen soll. Angesichts der Entwicklungen in unserem Gesundheitswesen (z.B. Budgetierung der Krankenhäuser) muß sich meiner Einschätzung nach jeder Anwender der Score-Systeme, der heute noch der Meinung ist, daß hier nur im Sinne des Patienten gehandelt wird, fragen lassen, ob Naivität, Eigeninteresse, Verdrängung oder Absicht hinter dieser „Selbst-Täuschung“ steht. Möglicherweise werden ärztliche Entscheidungen schneller als manchem lieb sein werden, nicht mehr nach dem Stand der medizinischen Möglichkeiten oder moralischen und ethischen Werten bzw. Normen getroffen. Finanzielle Aspekte werden dazu führen, daß die Beurteilung der Prognose einzelner Patienten und auch von Patientenkollektiven durch Score-Systeme getroffen werden und auch die Entscheidung über den Beginn oder den Abbruch einer Behandlung, der Computer übernehmen wird. Dies verdeutlichen folgende Aussagen:

Noch scheint es nach BEIN & TAEGER (1) „in Mitteleuropa nicht vorstellbar [im Gegensatz zur USA, Anmerkung des Autors!], daß das Ergebnis einer Punktewertung die Wahl des Transportmittels oder Versorgungszentrums entscheidet.“(1, S. 226) Nach meiner Einschätzung wird das Vorhandensein von Score-Systemen, die die schon am Einsatzort Anwendung finden können, auch den Einsatz bei uns nach sich ziehen, wenn finanzielle Gründe dafürsprechen./p>

E. Neugebauer & B. Bouillon sehen die „Gefahr“, daß „ökonomische Zwänge auch in Deutschland relevant werden“ könnten. T. Bein & K. Unertl meinen, daß „[b]egrenzte Ressourcen im personellen, räumlichen, apparativen und finanziellen Bereich zwingen uns, die vorhandenen Möglichkeiten sinnvoll zu nutzen.“ (2, S. 476 + vgl. S. 482; vgl. 3, S. 40)

„Aber der Kostendruck nimmt von Jahr zu Jahr zu - und irgendwann könnten Verwaltung und Krankenkassen solche Systeme vorsehen. Das kann man dann nur so machen, daß per Datenübertragung die Computerprognose für einen Patienten direkt an die Krankenkasse weitergeleitet und dort bestimmt wird.“ (6)

Wenn es um den Einsatz von knappen Ressourcen geht, wird die „Lebensqualität“ zu einem entscheidenden Kriterium für eine sinnvolle Nutzung werden, obwohl dieses Kriterium aus meiner Sicht ein sehr fragwürdiges, wenn nicht gar gefährliches Kriterium darstellt:

„Neben der Prognosestellung „Überleben/Nicht-Überleben“ kommt der Qualität[Hervorhebung im Original !]des Überlebens (Restitutio ad integrum, geringgradige Einschränkung, schwere Einschränkung, persistierender vegetativer Status) eine zentrale Bedeutung zu, da von ihr die spätere Lebensbewältigung (Bewältigung des Alltags, Störungen des kognitiven Denkens, psychosoziale Rehabilitation) abhängt.“ (1, S. 225; vgl. 2, S. 482 und 10, S. 135 f)

Bleibt die Frage, wer über den Sinn einer Therapie oder die zukünftige „Lebensqualität“ entscheiden wird. Der Mensch oder der Computer?

Schlußfolgerungen

RÖSE hat auf diese Frage eine Antwort: „Intensivmedizin - Hilfe zum Leben um jeden Preis? [...]: nein! Wer aber stellt den Maßstab, bildet das Preisgericht? Ohne Zweifel ist das in allererster Linie der Patient selbst, auch wenn er nicht danach befragt werden kann.“ (10, S. 137)

Möglicherweise wird diese Prognose auf einige wenige Patienten zutreffen, auch wenn sie nicht mehr befragt werden können. Wenn dann die Angehörigen und die Mediziner eine Weiterbehandlung befürworten, die Budgetierung des behandelnden Krankenhauses oder der Patient sich dies auch leisten können, bleibt möglicherweise der Patient der Maßstab.

Wenn diese Bedingungen jedoch nicht gegeben sind, werden in den Krankenhäusern, die mit einem APACHE-Programm oder einem anderen Score-System ausgerüstet sind, die Computer den Maßstab und das „Preis-Gericht“ bilden.

Für manchen Patienten wird das „Urteil“ des Computers tödlich enden, obwohl eine Überlebenschance gegeben war,weil diese Programme eine individuelle Prognose der Letalität nicht zulassen. „Wenn das Überleben eines Menschen von wirtschaftlichen Gründen abhängig gemacht wird, dann sind wir ethisch da, wo die Nazis aufgehört haben.“ (6) So wurde Dr. Montgomery in einem Interview zitiert. Prof. Haverich bestätigte, daß der „Vergleich [...] seine Berechtigung [hat], weil wirtschaftliche Gründe - ebensowenig wie rassische - kein Kriterium für die Weiterbehandlung vom Patienten sein dürfen.“ (6)

Ein Link zum Artikel "Score-Systeme für die Intensivmedizin. - Überwindung der Subjektivität des Arztes durch objektive Entscheidungen eines Computerprogramms?"

Literatur

Bein, T. & Taeger, K. Score-Systeme in der Notfallmedizin. In: Anästhesiologie, Intensivmedizin, Notfallmedizin, Schmerztherapie 28 (1993) 222-227. Georg Thieme Verlag 1993.
Bein, T. & Unertl, K. Möglichkeiten und Grenzen von Score-Systemen in der Intensivmedizin. In: Anästhesiologie, Intensivmedizin, Notfallmedizin, Schmerztherapie 28 (1993) 476-483. Georg Thieme Verlag 1993.
Bein, T. u.a. Vergleich von APACHE-II und APACHE-III zur Einschätzung der Erkrankungsschwere von Intensivpatienten. In: Anaesthesist (1995) 44: 37-42. Springer-Verlag 1995.
Demmel, N. u.a. Prognosescores bei Peritonitis: Mannheimer Peritonitis-Index oder APACHE-II? In: Langenbecks Archiv für Chirurgie (1994) 379: 347-352. Springer-Verlag 1994.
Der Spiegel. Noten in 20 Fächern. 2/1994. S. 158 f.
Haverich, A. Computer entscheiden, wer sterben muß ... In: Hörzu S.26.
Heinz, L. (Regie). Geld oder Leben. ARD 02.12.96. 21:00-22:30. BR & MDR Gemeinschaftsproduktion 1996.
Möllmann, M. & Lawin, P. Schweregradklassifikationssysteme in der Intensivmedizin. In: Lawin, P. (Hrsg.) Praxis der Intensivbehandlung. Georg Thieme Verlag 1994. S. 78-84.
Nikolaus, T. u.a. Beurteilung des Risikos von Hilfs- und Pflegebedürftigkeit sowie des Mortalitätsrisikos älterer Menschen. In: Deutsche medizinische Wochenschrift 120 (1995), 1457-1462. Georg Thieme Verlag 1995.
Neugebauer, E. & B. Bouillon. Was können Scoresysteme leisten? In: Der Unfallchirurg (1994) 97: 172-176
Riedel, A. Schweregrad-Indices, ihre Praktikabilität und ihre Aussagekraft für die traumatologische Intensivmedizin. Eine Untersuchung an polytraumatisierten Patienten unter besonderer Berücksichtigung der Extrembereiche des Injury Score (ISS). Inaugural-Dissertation zur Erlangung der Doktorwürde der Medizinischen Fakultät der Technischen Universität zu München. Promoviert am 09. November 1988.
Röse, W. Intensivmedizin - Hilfe zum Leben um jeden Preis? In: Intensiv 4 (1996) 134 - 137. Georg Thieme Verlag 1996.
Schröter, H. Score-Systeme in der Intensivmedizin. Inaugural-Dissertation zur Erlangung der Doktorwürde der Medizinischen Fakultät der Bayrischen Julius-Maximilians-Universität zu Würzburg. Promoviert im Juli 1993.
Schuster, H.-P. Die Bedeutung von Score-Systemen für die Voraussage von Behandlungsergebnissen in der Intensivmedizin. In: Internist (1996) 37: 1237-1243. Springer-Verlag 1996.
Weikenmeier, A. Die prognostische Wertigkeit von Koma-Skalen bei Schädel-Hirn-Verletzten. Glasgow Coma-Score und Brüsseler Koma-Skala im Vergleich zu zwei neu erstellten Skalen. Inaugural-Dissertation zur Erlangung der Doktorwürde der Medizinischen Fakultät der Universität zu Köln. Promoviert am 11. Mai 1995.

zurück zum Anfang

Startseite

update: 10.01.2004 by: Roberto Rotondo