Das Konfidenzintervall – die anschauliche Alternative zum p-Wert

PDF

, ,

C. Baulig1, B. Al-Nawas2, F. Krummenauer1

Ein Nachteil des p-Werts besteht in der Fixierung auf die Angabe der Signifikanz eines Studienergebnisses; zur Bewertung der darin enthaltenen klinischen Relevanz müssen weitere deskriptive Angaben verfügbar gemacht werden. Idee der Konfidenzintervalle ist die Kombination eines Maßes der statistischen Signifikanz und der klinischen Relevanz von Studienergebnissen in einem Ausdruck. Wie beim Signifikanztest wird auch beim Konfidenzintervall eine Bewertung des Studienergebnisses modulo einer Rest-Irrtumswahrscheinlichkeit vorgenommen. Wird z. B. in einer Studie die Inzidenz von Implantatverlusten geschätzt, so gibt das 95 %-Konfidenz-
intervall einen Bereich um den in der Studie geschätzten Inzidenzwert herum an, in welchem der „wahre“ Wert der Inzidenz mit 95 %iger Wahrscheinlichkeit liegt. Mit einer Rest-Irrtumswahrscheinlichkeit von 5 % liegt die „wahre“ Inzidenz außerhalb dieses Intervalls. Die das Intervall charakterisierende Wahrscheinlichkeit von 95 % den „wahren“ Wert zu umschließen, wird auch als Konfidenzniveau des Intervalls bezeichnet. Je höher das Konfidenzniveau, desto präziser die Charakterisierung des „wahren“ Werts der Inzidenz. Dabei charakterisiert die Breite des Konfidenzintervalls die Präzision, mit welcher die Studie die Inzidenz schätzt – je höher die Fallzahl einer Studie, desto geringer die Breite des Intervalls und desto höher die Genauigkeit zur Beschreibung der Inzidenz auf Basis der Studie.

Schlüsselwörter: Konfidenzintervall, Konfidenzniveau

Konfidenzintervalle

Die so genannten Konfidenzintervalle bieten einen zum Signifikanztest und dem daraus resultierenden p-Wert alternativen Zugang zur Bewertung statistischer Signifikanz. Diese Intervalle kombinieren die Idee von Effektmaßen der klinischen Relevanz und einer Bewertung der statistischen Signifikanz in
einem Ausdruck. Sie gewinnen nicht zuletzt aufgrund ihrer anschaulichen Interpretierbarkeit immer mehr an Akzeptanz bei der Publikation von Studien; zahlreiche Zeitschriften verlangen sogar die Angabe von Konfidenzintervallen vorrangig vor der von p-Werten.

Generell ist ein (1-?)-Konfidenzintervall ein Bereich um einen Schätzwert der Studie, in welchem mit der Wahrscheinlichkeit 1-? der „wahre“ interessierende Wert enthalten ist. Wird in einer Studie
die Inzidenz von Implantatverlusten als Zielparameter geschätzt, so gibt deren 95 %-Konfidenzintervall einen Bereich um den in der Studie geschätzten Inzidenzwert herum an, in welchem der „wahre“ Wert der Inzidenz mit 95 %iger Wahrscheinlichkeit liegt. Mit einer Rest-Irrtumswahrscheinlichkeit von 5 % liegt die „wahre“ Inzidenz außerhalb dieses Intervalls.

Die das Intervall charakterisierende Wahrscheinlichkeit von 95 %, den „wahren“ Wert zu umschließen, wird auch als Konfidenzniveau (1-?) des Intervalls bezeichnet. Wie bei Signifikanztests resultieren aus Konfidenzintervallen Aussagen, die auf eine Grundgesamtheit von Patienten modulo dieser Rest-Irrtumswahrscheinlichkeit von ? übertragbar sind; Konfidenzintervalle korrespondieren somit zum Signifikanzkonzept. Der klare Vorteil der Konfidenzintervalle ist jedoch, dass sie zusätzlich zur Signifikanz-Information noch die klinische Relevanz des durch sie beschriebenen Studienergebnisses charakterisieren.

Beispiel: Konfidenzintervall einer Inzidenz

Angelehnt an eine Untersuchung von Al-Nawas et al. [1] seien folgende Ergebnisse angenommen: Untersucht sei die zweijährige Überlebenszeit von enossalen Implantaten im bestrahlten Kiefer in Abhängigkeit von der applizierten Strahlendosis, wobei 72 Patienten mit einer Dosis von maximal 40 Gy und 111 Patienten mit einer Dosis von mehr als 40 Gy behandelt worden seien. Als binärer Endpunkt der Studie sei die Zielgröße „Implantat nach 24 Monaten noch komplikationsfrei im Kiefer? [ja / nein]“ betrachtet. Tabelle 1 zeigt die an Al-Nawas et al. angelehnten Studienergebnisse [1]. Mittels gängiger Statistiksoftware können die 95 %-Konfidenzintervalle zu den Daten aus Tabelle 1 berechnet werden: Für die Gruppe der Patienten mit maximal 40 Gy Strahlendosis ergibt sich für die beobachtete Inzidenz von zehn Implantatverlusten (14 %) das
95 %-Konfidenzintervall zu [6 %; 22 %]. Demnach kann für Patienten, die mit
einer Strahlendosis von maximal 40 Gy behandelt wurden, zwei Jahre nach Implantation bei einer statistischen Sicherheit von 95 % von einer maximalen Implantatverlust-Inzidenz von 22 % ausgegangen werden (obere Grenze des Konfidenzintervalls), minimal muss
eine Verlust-Inzidenz von 6 % erwartet werden (untere Grenze).

In der Gruppe der Patienten mit
einer Strahlendosis von mehr als 40 Gy wurden 26 Implantatverluste (23 %) beobachtet, es ergab sich das 95 %-Konfidenzintervall zu [15 %; 31 %].

Simultane (bonferronisierte) Konfidenzintervalle

Naheliegend wäre es, die beiden obigen Konfidenzintervalle direkt zu vergleichen und damit auf Unterschiede zwischen den Bestrahlungs-Armen zu schließen. Auch bei Konfidenzintervallen muss dabei jedoch auf das Problem des multiplen Testens verwiesen werden [2]: Die aus einem (1-?)-Konfidenzintervall ableitbare Aussage ist mit einer Irrtumswahrscheinlichkeit von ? behaftet. Werden wie im obigen Beispiel zwei parallele 95 %-Konfidenzintervalle betrachtet, können sich also die erwartbaren Irrtumswahrscheinlichkeiten kumulieren (hier also zu 2 x 5 % = 10 %). Wie bei Signifikanztests kann auch hier diesem Problem Rechnung getragen werden, indem
z. B. die Bonferroni-Korrektur angewandt wird. Idee dieser Korrektur ist das „Aufteilen“ des Signifikanzniveaus ?. Diese Strategie kann auch bei Konfidenzintervallen verwendet werden: Werden zwei Intervalle simultan bestimmt, sollte jedes mit der Irrtumswahrscheinlichkeit von „?/2“ behaftet sein, es werden also (1 – ?/2)-Konfidenzintervalle benötigt. Im obigen Beispiel wurden zwei parallele Konfidenzintervalle zum Gesamtniveau
95 % benötigt, d. h. das Konfidenzniveau ? = 5 % wird nach Bonferroni-Korrektur aufgeteilt auf die Intervalle als ?/2 = 2,5 %. Somit sind zwei Intervalle zum jeweiligen Konfidenzniveau 1 – ?/2 = 1 – 2,5 % = 97,5 % zu erstellen. Bedingt durch die schärfere Anforderung an die statistische Aussagekraft (konkret durch das höhere Konfidenzniveau 97,5 %) der einzelnen Intervalle bei gleich bleibenden Fallzahlen, stellen sich diese graduell breiter dar (Abb. 1) als die „separat“ betrachteten 95 %-Konfidenzintervalle.

Konfidenzintervall einer Risikodifferenz

Zum Vergleich der Inzidenzen zwischen den Patientengruppen kann weiter die Differenz der beiden obigen Inzidenzen betrachtet werden, welche sich aus Tabelle 1 zu 23 % – 14 % = 9 % ergibt. Auch für diese Risikodifferenz kann ein 95 %-Konfidenzintervall bestimmt werden, welches sich aus den vorliegenden Daten zu [-2 %; 21 %] ergibt. Mit diesem Intervall kann die Größenordnung des Unterschieds zwischen den beiden Studieninzidenzen bewertet werden, ohne dass die einzelnen Intervalle einer Bonferroni-Korrektur unterzogen werden müssen: Mit einer statistischen Sicherheit von 95 % rangiert der „wahre” Inzidenzen-Unterschied zwischen -2 % und +21 %. Somit kann nicht statistisch gesichert davon ausgegangen werden, dass die Inzidenz von Implantatverlusten nach Bestrahlungsdosis > 40 Gy höher ist als nach Bestrahlungsdosis ? 40 Gy: Laut Konfidenzintervall kann die „wahre” Inzidenz von Implantatverlusten nach höherer Bestrahlungsdosis um bis zu 2 % geringer sein als nach geringerer Bestrahlungsdosis (untere Intervallgrenze)!

Diese Interpretation kann zu einer formalen Signifikanz-Entscheidung weiter interpretiert werden mit dem Ergebnis, dass sich die Verlust-Inzidenzen in der vorliegenden Datenlage nicht zum
5 %-Niveau statistisch signifikant unterscheiden (siehe auch den folgenden Splitter).

Fallzahl und Intervallbreite

Die einer Studie zugrunde liegende Fallzahl geht explizit in die Berechnung von Konfidenzintervallen ein [3]. Dabei gilt die Faustregel „je höher die Fallzahl, desto schmaler das resultierende Konfidenzintervall“. Anschaulich entspricht dies im obigen Beispiel der Tatsache, dass mit wachsender Fallzahl sich auch die Aussagekraft der Studie hinsichtlich der Charakterisierung der Inzidenzen durch Konfidenzintervalle erhöht. Werden im obigen Beispiel statt 72 versus 111 Patienten die doppelten Fallzahlen angenommen (144 versus 222 Patienten) bei gleichen Inzidenzen von 14 % versus 23 %, so resultieren deutlich schmalere Konfidenzintervalle, z. B. von [8 %; 20 % ] für die Patienten mit einer maximalen Bestrahlungsdosis von 40 Gray; dieses ist schmaler und damit „präziser“ in der Charakterisierung der wahren Verlustinzidenz dieser Patienten als das auf 72 Patienten basierende Intervall [6 %; 22 %] (siehe oben). Die Breite eines Konfidenzintervalles hängt direkt von der Fallzahl der zugrunde liegenden Studie ab.

Korrespondenzadresse:

Prof. Dr. Frank Krummenauer

Institut für Medizinische Biometrie und Epidemiologie

Medizinische Fakultät der Universität Witten/Herdecke

Alfred Herrenhausen-Straße 50

D-58448 Witten

Tel.: 0 23 02 / 92 67 60

Fax: 0 23 02 / 92 67 01

E-Mail: Frank.Krummenauer@uni-wh.de

Literatur:

1 Al-Nawas B, Klein MO, Ludwig C, Körholz J, Grötz KA: Unterkieferkontinuitäts-Rekonstruktionen und Implantatversorgung – prognostische Wertigkeit von Strahlendosis, Osteoplastik, Implantatoberfläche und Behandler. (54. Kongress Deutsche Gesellschaft für Mund-Kiefer-Gesichtschirurgie, Aachen 2004)

2 Krummenauer F, Al-Nawas B, Baulig C: (2008) Primäre klinische Endpunkte: Es sollte nur einen geben. Zähnärztl Z Impl 2008;24:215–217

3 Krummenauer F: Grundlagen der Medizinischen Biometrie – ein Leitfaden zur Auswertung und Publikation Klinischer Daten. Aachen, Shaker Verlag 2002

Fussnoten

1 Institut für Medizinische Biometrie und Epidemiologie (Direktor: Prof. Dr. F. Krummenauer), Medizinische Fakultät der Privaten Universität Witten/Herdecke, Alfred Herrenhausen-Straße 50, 58448 Witten

2 Klinik und Poliklinik für MKG-Chirurgie (Direktor: Prof. Dr. Dr. Wilfried Wagner), Johannes-Gutenberg-Universität Mainz, Langenbeckstr. 1, 55101 Mainz


(Stand: 27.06.2011)

DGI Nachrichten aktuell

Implantieren in Zeiten von Corona? 
Der Präsident der DGI, Prof. Dr. Dr. Knut A. Grötz mit einem Statement

zum Statement Prof. Grötz

Aktuelle Ausgabe 2/2020

Im Fokus

  • CMD: Implantatprothetische Therapie
  • Zahnimplantate bei Diabetes mellitus
  • Zirkonoxid in Einzelzahnlücken

FORTBILDUNGSANGEBOTE DGI

Die DGI bietet ein umfassendes und überregionales Fortbildungsangebot an. 

WERDEN SIE AUTOR

Sie haben ein spannendes Thema aus dem Bereich der Implantologie und würden gerne einen Artikel dazu in der ZZI veröffentlichen? Dann nutzen Sie unseren Editorial Manager und reichen Sie ihr Manuskript direkt bei uns ein.

Manuskript einreichen