Meta-Analyse und Forest Plot – mehrere Studien wissen mehr als eine ...

PDF

, ,

C. Baulig1, S. Knippschild1, F. Krummenauer1

Ein Schlüsselelement quantitativer systematischer Reviews ist die statistische Synthese der Studien-weisen Ergebnisse in Form der Meta-Analyse. Diese Synthese ermöglicht es, die Ergebnisse der einzelnen Studien im Kontext aller anderen Studien zu verstehen und einzuordnen, gleichzeitig aber auch die Einzel-Informationen zu einer Gesamtaussage zu kombinieren. In dieser Übersicht sollen anhand eines vereinfachten fiktiven Beispiels aus der Zahnärztlichen Implantologie eine Meta-Analyse sowie deren verschiedene numerische und graphische Elemente vorgestellt werden: Berichten mehrere Studien zur gleichen Fragestellung ihre Ergebnisse in Form der gleichen Effektgröße wie etwa der Risikodifferenz, so kombiniert die Meta-Effektgröße diese Studien-weisen Effektgrößen als Maß des Ergebnisses einer jeden Einzel-Studie, wobei die Kombination die einzelnen Studien gewichtet berücksichtigt unter Orientierung an der Präzision der jeweiligen Studie. Der Forest Plot stellt dann sowohl die Effektgröße der Einzel-Studien als auch die daraus kombinierte Meta-Effektgröße jeweils nebst Konfidenzintervall graphisch zusammen.

Schlüsselwörter: Meta-Analyse; (Meta-)Effektgröße; Forest Plot

A key tool in the quantitative evaluation of Systematic Reviews consists of meta-analysis techniques, which enable the understanding of single trials in the context of the total trial information available in the literature as well as the aggregation of the latter into a joint clinical information. By means of the meta-analysis of five fictitious implantological RCTs the key numerical and graphical information formats usually provided by a meta-analysis will be demonstrated: As soon as several RCTs provide their result information in terms of the same effect size parametrisation such as the risk difference, the latter can be combined as a meta effect size estimate by averaging the individual trials’ effect size estimates, where each individual size estimate is weighted according to the individual trial’s precision, respectively. Forest Plots will then graphically represent the individual trial’s effect sizes in combination with this meta effect size estimate as well as the precision of both by means of respective confidence intervals.

Keywords: meta-analysis; (meta) effect size; forest plot

Aufgrund der stetig steigenden Anzahl an wissenschaftlichen Veröffentlichungen ist es eine zunehmende Herausforderung für niedergelassene Zahnärzte, Kliniker und Wissenschaftler, über ein medizinisches Themengebiet umfassend und aktuell informiert zu bleiben und jeweils dem aktuellen Wissensstand entsprechende Therapieempfehlungen abzuleiten. Ein grundlegendes Problem erwächst dabei zum einen aus der notwendigen Fokussierung auf qualitativ hochwertige Studienberichte, da die Beurteilung der Qualitätsmerkmale auf den ersten Blick oft nicht möglich ist [5]; die Aggregation der dann immer noch umfangreichen Einzel-Informationen hochwertiger Studien ist eine zweite Hürde. Zur Bündelung von Wissen aus vielen einzelnen Studien besteht dabei die Möglichkeit, Ergebnisse der Untersuchungen zu einer bestimmten Fragestellung systematisch zusammenzufassen. Im Rahmen solcher systematischer Übersichtsarbeiten (Systematic Reviews) ist es obligat, dass primär mit einem klar strukturierten Vorgehen Studien zu einer bestimmten Fragestellung identifiziert [1] und deren Ergebnisse dann zusammengefasst dargestellt werden.

Anerkannt führend für die Erstellung von systematischen Übersichtsarbeiten ist die Cochrane Collaboration, in Deutschland repräsentiert durch das Deutsche Cochrane Zentrum (DCZ). Zentrales Ziel ist die Bereitstellung bestmöglicher wissenschaftlicher Grundlagen zur Entscheidungsfindung im Gesundheitssystem. Dieses Ziel wird vor allem durch die Erstellung, Aktualisierung und Verbreitung systematischer Übersichtsarbeiten (Systematic Reviews) zur Bewertung von Therapien erreicht. Die resultierenden Cochrane Reviews werden dann in der Cochrane-Datenbank Systematischer Reviews („Coch-rane Library“) veröffentlicht [4].

In der Ergebnis-Formatierung systematischer Reviews wiederum kann grob zwischen zwei Stufen unterschieden werden: Während systematische Übersichten die Resultate der einzelnen Studien darstellen und bewerten, werden bei einer Meta-Analyse die Ergebnisse dieser Studien mittels statistischer Methoden quantitativ zusammengefasst und sogenannte kombinierte Effektschätzer berechnet [1]. Dabei wird jeder Studie ein Gewicht zugeordnet, das sich im Wesentlichen an der Fallzahl und der Streuung des Ergebnisses der betreffenden Studie orientiert. Eine Meta-Analyse kann also Teil eines systematischen Reviews sein, muss es aber nicht [1].

Tabelle 1 zeigt einen fiktiven Datensatz für eine Meta-Analyse. Angenommen wird, dass aus einer PubMed-basierten Recherche insgesamt fünf randomisierte klinische Studien gefunden werden konnten zum Vergleich der Verlustraten zweier Implantate unter schiedlicher Länge (hier: 6 versus 11 mm) in einem jeweiligen Nachbeobachtungszeitraum von 5 Jahren; die Fragestellung sowohl der Einzel-Studien als auch der Meta-Analyse lautet also: „Gibt es einen Unterschied hinsichtlich der Verlustrate nach 5 Jahren zwischen Implantaten der Länge 6 mm versus 11 mm?“. Die Studien unterscheiden sich hinsichtlich ihrer Fallzahlen dabei von „sehr kleinen“ Studien mit einer Fallzahl von 24 Teilnehmern pro Studienarm bis hin zu „größeren“ Studien mit einer Fallzahl von 100 Teilnehmern pro Studienarm (Tab. 1). Berechnet wurde in diesem Beispiel für jede einzelne Studie die Risikodifferenz (Differenz der Verlustraten zwischen den beiden Studienarmen) als Maß des Unterschieds zwischen den Implantaten, d.h. als sogenannte „Effektgröße“ [8]. Eine negative Risikodifferenz bedeutet für die betreffende Studie, dass die 11 mm langen Implantate eine niedrigere Verlustrate aufweisen als die 6 mm langen Implantate; für Studie 1 ergibt sich etwa die Risiko-
differenz als 3/24–5/24 = –0.083, d.h. 11 mm lange Implantate zeigten in Studie 1 eine um circa 8 % geringere Verlustrate als 6 mm lange Implantate im 5-jährigen Beobachtungszeitraum. Während diese Informationen jedoch nur die Aussage der einzelnen Studien beschreiben mit Risikodifferenzen zwischen –4 % bis –10 %, versucht eine Meta-Analyse aus diesen fünf Studien-weisen Informationen zum Therapie-Unterschied eine Gesamt-Information abzuleiten, im konkreten Fall also eine „Meta-Risikodifferenz“ der Verlustraten. Nachfolgend werden an dieser fiktiven Beispiel-Analyse die wichtigsten Kenngrößen und Darstellungs-Formate einer solchen Meta-Analyse erläutert.

Effektgröße und Präzision
einer Einzel-Studie

In dem hier vorliegenden Beispiel wird als Effektmaß die absolute Risikodifferenz zwischen den Verlustraten der beiden Implantate berechnet. Allgemein beschreibt die Effektgröße das Ausmaß des Studienergebnisses; sie könnte im vorliegenden Beispiel auch durch relative Risiken charakterisiert werden. Steht hingegen eine stetige Zielgröße in den zu kombinierenden Studien im Vordergrund wie etwa die Sulkus-Taschentiefe [mm], so kann die Effektgröße auch durch den Median als Effektschätzer beschrieben werden. Auch eine Prävalenz kann je nach Fragestellung in einer Studie die entscheidende Effektgröße sein [3], etwa im Kontext epidemiologischer Untersuchungen zur Mundgesundheit in einer Bevölkerung nach Einführung von Präventionsmaßnahmen. Der aus einer Studie ermittelte Wert der Effektgröße wird dabei stets als Schätzwert der Effektgröße bezeichnet, die Methode zu dessen Bestimmung (z.B. Risikodifferenz oder Median) auch als Effektschätzer.

Für jede einzelne Studie, die in die Meta-Analyse eingeschlossen wird, werden zuerst der Wert der Effektgröße (hier der Wert der absoluten Risikodifferenz) sowie das entsprechende 95%-Konfidenzintervall bestimmt. Im Beispiel weist Studie 1 (Abb. 1 – grüner Kasten) für 11 mm lange Implantate eine Verlustrate von 12,5 % und für 6 mm lange Implantate eine Verlustrate von 20,8 % auf. Die absolute Risikodifferenz aus diesen beiden Werten beträgt dann 12,5 %–20,8 % = –8,3 % (oder wie in Tab. 1 dargestellt –0,083), das 95%-Konfidenzintervall ergibt sich dafür zu [–0,293; 0,126].

Abbildung 1 zeigt eine graphische Zusammenstellung der Studien-weisen Effektgrößen und Konfidenzintervalle. Konkret zeigt diese für Meta-Analysen übliche grafische Darstellung die Effektgröße als gefülltes Quadrat („risk difference“) sowie das 95%-Konfidenzintervall („95% CI“) als Verlängerungen, ausgehend von diesem Quadrat nach links und rechts. Direkt erkennt man, dass Studie 1 ein wesentlich breiteres 95%-Konfidenzintervall aufweist als etwa Studie 3. Somit besitzt Studie 3 eine höhere „Präzision“ als Studie 1 [2]. Diese Charakterisierung der Präzision einer Studie ist also in erster Linie abhängig von der Fallzahl der betreffenden Studie: Studien mit einer größeren Fallzahl liefern präzisere Schätzungen der Effektgröße als kleinere Studien (und damit auch schmalere Konfidenzintervalle).

Gewichtung von
Einzel-Studien

Die gefüllten Quadrate in Abbildung 1 haben unterschiedliche Größen. Dies reflektiert die Gewichtung, die den 5 Einzel-Studien in der Meta-Analyse zugeordnet wurde. Dabei besteht ein im Wesentlichen umgekehrt proportionaler Zusammenhang zwischen der Präzision und der Gewichtung einer Studie: Studien mit einer höheren Präzision wird bei dem hier gewählten statistischen Modell ein höheres Gewicht in der Gesamtschau aller 5 Studien zugewiesen als Studien mit einer geringen Präzision – im Beispiel erhält also z.B. Studie 3 mit einem schmaleren 95%-Konfidenzintervall und einer höheren Fallzahl als Studie 1 eine stärkere Gewichtung. Das jeweilige numerische Ausmaß der Gewichtung der 5 einzelnen Studien ist in Abbildung 1 im blauen Kasten unter „relative weight“ zusammengestellt.

Meta-Effektgröße

Ziel einer Meta-Analyse ist die Schätzung eines Gesamteffekts, auch als „Meta-Effektgröße“ bezeichnet, aus allen eingebrachten Studien-weisen Effektgrößen durch deren Kombination. Dabei werden eine gemeinsame Effektgröße und ein zugehöriges Maß ihrer Präzision (wieder in Form eines 95%-Konfidenzintervalles) geschätzt [3], indem im Wesentlichen die Studien-weisen Effektgrößen gewichtet durch die Präzision der jeweiligen Einzel-Studie gemittelt werden. Die Ergebnisse dieser Meta-Schätzung zum obigen fiktiven Beispiel zeigt Abbildung 1 (roter Kasten). Graphisch wird die Meta-Effektgröße durch eine Raute (im englischen Sprachraum hier oft als „diamond“ bezeichnet) dargestellt. Die Lage des „diamond“ zeigt die Effektgröße, die Breite entspricht der Präzision der Schätzung.

Im Beispiel liegt der „diamond“ bei –0,058 und erstreckt sich von –0,104 bis –0,012. Somit beträgt die „Meta-Risikodifferenz“ zwischen den Verlustraten von 11 mm gegenüber 6 mm langen Implantaten –6 % (95%-Konfidenzintervall –10 %; –1 %). Konkret liegt also das absolute Verlustrisiko eines 11 mm gegenüber einem 6 mm langen Implantat nach 5 Jahren um etwa 6 % niedriger mit einer Unsicherheit gemäß 95%-Konfidenzintervall von circa 1 %–10 %. Es ist dabei auch anhand der Fallzahlen der 5 Einzel-Studien (Tab. 1) motivierbar, warum trotz zweier Einzel-Studien mit einer Verlustraten-Differenz von –10 % im Ergebnis eine Meta-Risikodifferenz von circa –6 % nahe der Effektgröße der größten Studie („Studie 3“) resultierte: Die Studien mit den stärkeren Effektgrößen zeigten eher geringere Fallzahlen und wurden in der Meta-Schätzung der Risikodifferenz entsprechend geringer gewichtet.

Zusammenfassend kann also die „Meta-Effektgröße“ als gewichtetes Mittel der einzelnen Studien-Effektgrößen verstanden werden, wobei die konkrete Form der Gewichtung von Einzel-Studien in einer Meta-Analyse vom verwendeten statistischen Modell abhängt [3].

Abbildung 1 zeigt neben den Studien-weisen 95%-Konfidenzintervallen auch das 95%-Konfidenzintervall zur Meta-Effektgröße (roter Kasten). Das 95%-Konfidenzintervall der Meta-Effektgröße in Abbildung 1 zeigt an, dass in der Gesamtschau aller 5 Einzel-Studien ein zum Niveau 5 % signifikanter Unterschied zwischen den 5-jährigen Implantat-Verlustraten zugunsten der 11 mm langen Implantate besteht: Das 95%-Konfidenzintervall zur Meta-Risikodifferenz umfasst nicht den Wert „0 %“, sodass ein zum Niveau 5 % signifikanter Unterschied zwischen den Verlustraten gefolgert werden kann [7]. Es fällt auf, dass keine der 5 Einzel-Studien einen zum (lokalen) Signifikanzniveau 5 % signifikanten Unterschied zwischen den 5-jährigen Verlustraten der beiden Implantate in sich birgt; für jede der Einzel-Studien umfasst das 95%-Konfidenzintervall zur Differenz der Verlustraten den Wert „0 %“ [7]. In der Gesamtschau aller 5 Studien hingegen kann auf die Information zu 2 x 249 Patienten zurückgegriffen werden – eine effektive Fallzahl, die die konsistenten (lokal nicht signifikanten) Ergebnisse der Einzel-Studien zugunsten der 11 mm langen Implantate in ein statistisch signifikantes Meta-Ergebnis kombinieren konnte [6].

p-Wert zur Signifikanz-
bewertung der Effektgröße

Entsprechend der Signifikanzprüfung über die Konfidenzintervalle der Risikodifferenz (hier konkret der Verlustraten-Differenz) kann auch ein p-Wert zum Vergleich der 5-jährigen Implantat-Verlustraten abgeleitet werden [7] sowohl für die Risikodifferenzen der Einzel-Studien als auch für die Meta-Risikodifferenz. Der im vorliegenden Beispiel berechnete „Meta-p-Wert“ ergab sich zu 0,013 und damit wiederum als Indikator eines zum Niveau 5 % statistisch signifikanten (Meta-)Unterschieds zwischen den Implantat-Verlustraten [7].

Forest Plot

Die Ergebnisse einer Meta-Analyse können anschaulich im sogenannten Forest Plot kombiniert werden; Abbildung 1 stellt den zum obigen fiktiven Beispiel entsprechenden Forest Plot dar und fasst sämtliche bereits berichteten Kenngrößen numerisch und graphisch kompakt zusammen: Für die 5 Einzel-Studien ist numerisch die absolute Risikodifferenz als Studien-weises Maß der Effektgröße dargestellt (Spalte „risk difference“) mit zugehörigem Studien-weisen 95%-Konfidenzintervall (Spalten „lower limit“ und „upper limit“), einem Studien-weisen p-Wert zum Vergleich der Verlustraten zwischen dem jeweiligen Studienarm mit 11 mm langen Implantaten zum Studienarm mit 6 mm langen Implantaten (Spalte „p-value“) sowie dem relativen Gewicht, mit dem die jeweilige Einzel-Studie in die Meta-Analyse einging aufgrund ihrer Präzision respektive Fallzahl (Spalte „relative weight“). Die unterste Zeile der numerischen Darstellung gibt die aus den Einzel-Studien 1–5 bestimmte Meta-Risikodifferenz an nebst entsprechendem 95%-Konfidenzintervall und p-Wert zum Vergleich der (Meta-)Verlustraten zwischen 11 mm langen versus 6 mm langen Implantaten.

Graphisch dargestellt sind die Studien-weisen Risikodifferenzen (Studienweises Maß der Effektgröße) als Quadrat mit jeweiligem 95%-Konfidenzintervall als Spanne, ferner darunter die Meta-Risikodifferenz (Meta-Effektgröße) als Raute, deren Zentrum den Wert der Meta-Risikodifferenz angibt.

Korrespondenzadresse

Jun.-Prof. Dr. Christine Baulig MSc.

Institut für Medizinische Biometrie und Epidemiologie

Fakultät für Gesundheit der Universität Witten/Herdecke

Alfred-Herrhausen-Straße 50

D-58448 Witten

Tel.: 02302 926763

Fax: 02302 92644 785

christine.baulig@uni-wh.de

Literatur

1. Al-Nawas B, Baulig C, Krummenauer F: Von der Übersichtsarbeit zur Meta-Analyse – Möglichkeiten und Risiken. Z Zahnärztl Impl 2010;26:4:400–404

2. Baulig C, Al-Nawas B, Krummenauer F: Das Konfidenzintervall – die anschau-liche Alternative zum p-Wert. Z Zahnärztl Impl 2009;25:1:55–57

3. Borenstein M, Hedges LV, Higgins JPT, Rothstein HR: How a Meta-Analysis works, in „Introduction to Meta-Analysis“, J.W.S. Ltd, Editor. United Kingdom 2009, 3–7

4. Cochrane Database of Systematic Reviews (CDSR). 2015 [online]. Available: www.cochranelibrary.com. [Zugriff am: 03/03/2015].

5. Knippschild S, Baulig C, Hirsch J, Krummenauer F: Das CONSORT-Statement zur standardisierten Berichterstattung Randomisierter Klinischer Prüfungen – Evidenz durch Transparenz. Z Zahnärztl Impl 2014;31:1:
64–78

6. Krummenauer F, Al-Nawas B, Baulig C: Statistische Signifikanz – nur ein Fallzahl-Phänomen? Z Zahnärztl Impl 2010;26:1:78–81

7. Krummenauer F, Al-Nawas B, Baulig C: Konfidenzintervall und Signifikanztest – zwei Darstellungen einer Aussage. Z Zahnärztl Impl 2009;25:2:170–172

8. Krummenauer F, Baulig C, Al-Nawas B: Risikomaße – kompakt, aber vielfältig interpretierbar. Z Zahnärztl Impl 2008;24:1:2–4

9. Ressing M, Blettner M, Klug S J: Systematic literature reviews and meta-analyses: part 6 of a series on evaluation of scientific publications. Dtsch Arztebl Int 2009;106:27:456–63

Fussnoten

1 Institut für Medizinische Biometrie und Epidemiologie, (Direktor: Prof. Dr. F. Krummenauer), Fakultät für Gesundheit der Universität Witten/Herdecke, Alfred-HerrhausenStraße 50, 58448 Witten


(Stand: 09.06.2015)

DGI Nachrichten aktuell

In Memoriam an Karl-Ludwig Ackermann. Ein Nachruf von Prof. Dr. Günter Dhom und Gedenken an einen ganz „Großen“ der Zahnmedizin. 

zum Nachruf an Dr. Ackermann

Aktuelle Ausgabe 3/2020

Im Fokus

  • Kippkonus-Abutment
  • Statine und Bisphosphonate
  • Teleskopierende Hypridbrücke

FORTBILDUNGSANGEBOTE DGI

Die DGI bietet ein umfassendes und überregionales Fortbildungsangebot an. 

WERDEN SIE AUTOR

Sie haben ein spannendes Thema aus dem Bereich der Implantologie und würden gerne einen Artikel dazu in der ZZI veröffentlichen? Dann nutzen Sie unseren Editorial Manager und reichen Sie ihr Manuskript direkt bei uns ein.

Manuskript einreichen