Gemeinhin ist man gewohnt, der Aussagekraft eines Testverfahrens eher zu vertrauen, wenn der Versuch oft durchgeführt wurde, also die Anzahl der vorliegenden Resultate groß ist. Der Statistiker spricht hier vom Gesetz der großen Zahl. Bei Bernoulli-Ketten und beim Rechnen mit der Normalverteilung wird für gewöhnlich eine große Stichprobe angestrebt. Diese Binsenweisheit kann freilich auch sehr falsch sein: Manche eigentlich zuverlässige Tests erbringen gerade bei großen Stichproben, oder bei der Grundgesamtheit, sehr unzuverlässige Ergebnisse. Ein Beispiel für paradoxe Resultate der Betriebsstatistik:
|
Arbeitgeber tendieren bekanntlich dazu, möglichst viel über ihre Beschäftigten wissen zu wollen. Gentests im Zusammenhang mit dem Einstellungsverfahren sind, ganz gleich ob legal oder nicht, kaum mehr eine Zukunftsvision. Sie finden vermutlich längst statt, nur vielleicht bislang noch verdeckt: legal, illegal, scheißegal. Dabei kann sowas ein Desaster für die Mitarbeiter werden – nicht trotz, sondern gerade weil die Grundgesamtheit getestet wird. Ein Zahlenbeispiel zeigt, weshalb.
Ein Großunternehmen führe bei seinen Beschäftigten einen Gesundheitstest durch. Dieser sei in der Lage, mit einer Wahrscheinlichkeit von 99% jeden zu erkennen, der die fragliche Krankheit hat. Dieser Wert wird als Sensitivität des Testverfahrens bezeichnet. Die Wahrscheinlichkeit, jemanden, der die getestete Krankheit nicht hat, auch als frei von der Krankheit zu erkennen, sei 98%. Das ist die Spezifität des Testverfahrens. Diese Werte scheinen auf den ersten Blick gut, sind es aber nicht.
Das Unternehmen habe 10.000 Mitarbeiter, und führe den Test bei jeder Einstellung durch. Die Grundgesamtheit wird also getestet, und nicht nur eine Stichprobe. Nur 2% der Mitarbeiter haben tatsächlich die fragliche Krankheit. Sie sind für das Unternehmen nicht tragbar und sollen entdeckt und entlassen werden. Das sind also, rein statistisch, 200 Kündigungen. Wer aber kriegt die?
Bei einer Sensitivität von 99% erkennt der Test voraussichtlich 198 der 200 Kranken, die entlassen werden sollen. Zwei Kranke schlüpfen durchs Raster. Das sieht ja noch ganz gut aus – für den Arbeitgeber. Tatsächlich sind aber 98% der Grundgesamtheit oder 9.800 Mitarbeiter frei von der fraglichen Krankheit. Bei einer Spezifität von 98% werden davon aber nur 9.604 Personen auch als negativ getestet. Bei 2% der Gesunden oder 196 Personen versagt der Test und meldet fälschlich die gesuchte Krankheit. Auch diese Arbeitnehmer werden entlassen: zusammen mit den wirklich Kranken also 196 + 198 = 394 Kündigungen. Von denen aber 196 oder 49,75% unbegründet sind! Obwohl der Test mit 98% oder 99% sehr zuverlässig zu sein scheint, sind doch die Hälfte (!) der Testresultate falsch. Auch ein sehr zuverlässiger Test kann dennoch eine sehr große Fehlerquote haben.
Das alles mag theoretisch und hergeholt klingen, ist es aber nicht: Zwar dürfen Arbeitgeber derzeit noch nicht ohne weiteres alle Mitarbeiter einem Gentest unterziehen, aber viele Versicherungen machen die Aufnahme von einer Gesundheitsprüfung abhängig. Und, wenn man sie läßt, bald auch von einem Gentest, der auf mögliche künftige Krankheiten verweist. Und bei den großen Versicherern ist die Grundgesamtheit weit größer als die 10.000 Beispielarbeitnehmer. Mit vielen menschlichen Tragödien und einer Menge falscher Abweisungen von Anträgen ist also zu rechnen.
Hinweis: Die neue Datei "Sensitivität und Spezifität.xls", die ab dem Datum dieses Beitrages auf allen BWL CDs enthalten ist, kann verwendet werden, die hier dargestellte Gesetzmäßigkeit zu überprüfen und Aufgaben zu diesem Thema zu stellen.
Links zum Thema: Gauß ohne Schrecken: so funktioniert das Rechnen mit der Normalverteilung (Teil 1-3) | (Teil 2-3) | (Teil 3-3) | Mathematische Grundlagen: wenn in Hamburg ein Schmetterling flattert… | Zinseszinsrechnung: warum die Händler aus dem Tempel vertrieben wurden | Formelsammlung der Betriebswirtschaft (interne Links)