Randomisation in Klinischen Studien – durch Zufall zum Erfolg ...

PDF

, ,

F. Krummenauer1, C. Baulig1, J. Hirsch1

Randomisierte Klinische Studien stellen seit Mitte des 20. Jahrhunderts den Goldstandard zur empirischen Erkenntnisgewinnung in der Klinischen Medizin dar. Dabei wird unter Randomisation eine Zufallsaufteilung von Patienten oder Probanden auf alternative Therapien verstanden, um unbewusste wie auch bewusste Einflussnahmen des behandelnden und dokumentierenden Studienpersonals auf die Therapiewahl in Abhängigkeit von der individuellen Befindlichkeit eines Studienteilnehmers auszuschließen. Auf diese Weise werden – auch unbeabsichtigte – Ungleichheiten zwischen den Studienkollektiven vermieden, anhand deren die Therapien verglichen werden sollen. Unterschätzt wird dabei jedoch die Art der Entstehung sachgerechter Randomisationlisten für eine Klinische Studie: Nur unter durchgängiger Sicherstellung der Zufälligkeit und Nichtvorhersagbarkeit der Zuordnung der für einen Studienpatienten anstehenden Therapie kann wirklich von einer Vergleichbarkeit der Studienkollektive ausgegangen werden; ferner ist die Reproduzierbarkeit der Grundlage der Therapiezuteilung zu gewährleisten, um Manipulationsvorwürfen vorzubeugen. Die einfache Randomisation auf der Basis Computer-generierter Zufallszahlen oder direkt daraus erzeugter Randomisationslisten genügt grundsätzlich allen Kriterien, kann aber nicht zu jeder Zeit der Studie gleiche Patientenzahlen in den zu vergleichenden Studienarmen gewährleisten. Um jederzeit vergleichbare Stichprobengrößen zu sichern, etwa mit dem Ziel balancierter Zwischenauswertungen einer Klinischen Studie, empfiehlt sich die Block-Randomisation. Vor allem in unverblindeten Studien sollte jedoch zur Sicherung der Nicht-Vorhersagbarkeit der anstehenden Therapie einzelner Studienteilnehmer die Blocklänge variiert werden. Um zusätzlich zwischen den Studienarmen Balanciertheit von Cofaktoren sicherzustellen, sollte die Randomisation ferner stratifiziert erfolgen: Wird etwa eine Studie multizentrisch geplant, wird die Randomisation nach Studienzentren stratifiziert, d.h. jedes Zentrum erhält eine separate Randomisationsliste zur Gewährleistung einer hinreichend häufigen Zuordnung sämtlicher zu vergleichender Therapien in jedem Zentrum. Ebenso kann eine Randomisation nach bekannten prognostischen Merkmalen wie dem Rauchverhalten bei Beginn einer implantologischen Versorgung stratifiziert werden, um Therapieunterschiede schon per Studiendesign vom prognostischen Einfluss dieser Faktoren zu bereinigen. Sämtliche Spezifika des Randomisations-Schemas müssen bereits im Studienprotokoll avisiert werden.

Schlüsselwörter: Klinische Studie; Randomisation; Block-Randomisation; Stratifikation

Randomized Clinical Trials represent the gold standard in empirical clinical research since the early 1950s and postulate the random allocation of clinical trial patients to respective therapeutic offers to both ensure unbiased comparability of samples and to avoid any selection mechanism – either intended or accidental – due to expectations of the trial staff. Stringent random allocation as well as allocation concealment of each trial participant’s therapy choice as well as posterior reproducibility of the underlying randomisation scheme will prevent from ending up in biased trial samples as well as from the allegation of non-random treatment allocation by trial staff. Simple randomisation schemes satisfy both requirements, but may not ensure similar patient numbers among trial arms for most times during recruitment. If, for example, for the sake of a planned interim analysis of the trial, comparable sample sizes shall be ensured during the entire recruitment period, block randomisation schemes are invoked. In particular in unblinded investigation, however, such block randomisations schemes should vary block sizes to avoid treatment predictability for at least some patients and thereby the possibility of manipulated allocation concealment. If, in addition, prevalences of prognostic factors must be controlled for to avoid prognostic bias between trial samples, randomisation schemes should be stratified for such prognostic factors: if smoking habits are known as prognostic for the outcome of an indicated implantological treatment, separate randomisation lists should be generated for smokers and non-smokers, respectively, to directly de-confound treatment outcome differences from the prognostic effect of smoking. Multicenter trials therefore strongly call for site-stratification of randomisation schemes to ensure a sufficient number of allocations of each treatment alternative in each of the trial sites under consideration; each site will then allocate the respective treatment series of its trial participants by means of a separate random list. The intended randomisation scheme must be pre-specified in detail in the clinical trial protocol.

Keywords: clinical trial; randomisation; block randomisation; stratification

Bereits in den 40er Jahren des letzten Jahrhunderts wurde von Sir Austin Bradford Hill erstmalig das Konzept der Randomisation in einer Patientenstudie genutzt, nachdem die grundlegende Idee in den 20er Jahren von Sir Ronald Fisher als Mittel zur Sicherung der Strukturgleichheit in agrikulturellen Versuchsanlagen eingeführt wurde. Die dabei zugrunde liegende Konzeption und Intention der Randomisation hat sich bis heute nicht verändert, stellt jedoch inzwischen den Goldstandard der Erkenntnisgewinnung in der empirischen Klinischen Forschung dar [4]. Im Kern soll durch die Randomisation von Studienteilnehmern – also die allein zufallsbedingte Zuweisung der individuellen Therapie auf darüber vorher aufgeklärte Probanden bzw. Patienten – sicherstellen, dass zwischen den entstehenden Stichproben abgesehen vom Unterschied in der Therapiegabe Strukturgleichheit herrscht. Wird dann zwischen den Stichproben nach Gabe unterschiedlicher Therapien ein Unterschied im klinischen Ergebnis festgestellt, kann aufgrund der sonstigen Strukturgleichheit auf einen kausalen Therapieunterschied geschlossen werden. Die Randomisation von Patienten auf ein Verum versus ein unwirksames Placebo macht insbesondere via Randomisation den kausalen Wirksamkeitsnachweis einer neu vorgeschlagenen Therapie empirisch zugänglich.

Anforderungen an
Randomisations-Schemata

Die „zufällige“ Aufteilung von Studienteilnehmern auf konkurrierende Therapien respektive auf Verum versus Placebo ist als Standard in der Klinischen Forschung anerkannt, gleichzeitig jedoch nicht selten in ihren Anforderungen missverstanden und unterschätzt: Von kausale Aussagen ermöglichenden Randomisationsmethoden kann erst ausgegangen werden, wenn diese strikt den Anforderungen der Zufälligkeit und Nicht-Vorhersagbarkeit der Therapiegabe („random allocation concealment“) sowie der posterioren Reproduzierbarkeit des zugrunde liegenden Zuordnungsmechanismus genügen [4, 5]. An einigen möglichen Vorgehensweisen soll illustriert werden, dass vermeintlich „zufällige“ Zuteilungsmethoden mindestens eine dieser 3 Anforderungen verletzen und damit die Validität und Glaubhaftigkeit einer Klinischen Studie merklich reduzieren können.

Szenario 1: Ein Implantologie möchte 2 Design-verwandte Implantate verschiedener Hersteller bezüglich deren Standdauer vergleichen. Dafür bietet sich der randomisierte Vergleich entlang zweier Stichproben an, deren Patienten jeweils nur ein Implantat benötigen. Da beide Implantate bereits CE-zertifiziert und damit insbesondere als sicher bestätigt sind, würde ein solches Forschungsvorhaben auch absehbar von einer lokalen Ethikkommission genehmigt werden. Als Methode zur Therapiezuteilung schlägt er vor, stets abwechselnd eines der beiden Implantate zu setzen; auf diese Weise gibt er jegliche Einflussnahme durch seine prognostische Einschätzung des Patienten bei Voruntersuchungen auf und vermeidet durch die stetige Abwechslung, dass an bestimmten Tagen wiederholt nur bestimmte Implantate gesetzt würden und „seine Tagesform“ den Therapieunterschied verschleiern könnte. Handelt es sich hier um eine legitime Methode zur Randomisation?

Szenario 2: Statt der strikt alternierenden Implantatwahl wird vorgeschlagen, vor Bestellung des jeweiligen Implantats eine Euro-Münze zu werfen und jeweils bei „Zahl“ Implantat I und bei „Wappen“ Implantat II zu ordern. Handelt es sich hierbei um eine legitime Methode zur Randomisation?

Szenario 3: In einer Folgeuntersuchung sollen die beiden Implantate bei Patienten mit einem Mindestbedarf von 2 Implantaten verglichen werden, wobei nur Patienten einbezogen werden mit Bedarf an einem Implantat auf beiden Seiten des Unterkiefers. Hier bietet sich an, die beiden Implantate „intraindividuell“, also innerhalb des gleichen Patienten, gegenüber stellen zu können unter Ausschaltung der biologischen Heterogenität verschiedener Patienten [2]. Konkret soll durch Werfen einer Münze entschieden werden, welches Implantat im linken und welches im rechten Unterkiefer inseriert werden soll. Handelt es sich hierbei um eine legitime Methode zur Randomisation?

Szenario 4: Um die Patientenzahl zu reduzieren, wird die in Szenario 3 beschriebene Untersuchung an Patienten mit einem Mindestbedarf von 4 Implantaten durchgeführt, wobei jeweils 2 Implantate im rechten und 2 im linken Unterkiefer benötigt werden sollen. Die Implantantwahl soll wiederum entlang anhand eines Münzwurfs erfolgen: Bei „Zahl“ wird im rechten Unterkiefer zweimal das Implantant I inseriert, bei „Wappen“ zweimal das Implantat II. Handelt es sich hierbei um eine legitime Methode zur Randomisation?

Die obigen Vorgehensweisen muten durchaus plausibel an – und entstammen aus realen Anfragen im Rahmen der methodischen Sprechstunde der Autoren. Dennoch würde trotz offenkundig ehrenwerter Intention der jeweiligen Randomisations-Ansätze keine der obigen Vorgehensweisen als Randomisation im strengen Sinne anerkannt werden können, wenn die obigen Anforderungen der Zufälligkeit, Nicht-Vorhersagbarkeit und Reproduzierbarkeit hinterfragt werden:

Szenario 1: Bei einer strikten Alternierung der Implantatwahl erfolgt die Therapiezuordnung nicht zufällig, sondern „deterministisch“ und in diesem einfach durchschaubaren Schema insbesondere ab einem gewissen Durchlauf von Rekrutierungen für jeden künftigen Patienten vorhersehbar; der Ansatz stellt also eine grobe Verletzung der Anforderung „random allocation concealment“ dar. Speziell in offenen Studien ist es nicht zulässig, dass der Behandler vor Beginn der Therapie die Randomisations-Vorgabe beeinflussen kann: Der Vorwurf von Reihenfolgeänderungen in der Studienrekrutierung zugunsten vermeintlich besonders gut geeigneter Patienten unter Kenntnis der für den nächsten Studieneinschluss anstehenden Therapie könnte niemals ausgeräumt werden. Speziell die alternierende Vorgehensweise ist zudem dem Ziel der Strukturgleichheit zwischen den Stichproben nicht zuträglich: Nur wenn die gleiche Therapie mehrfach hintereinander angewandt wird (sogenannter „run“), kann davon ausgegangen werden, dass bestimmte Cofaktor-Ausprägungen, z.B. des Rauchenverhaltens auch innerhalb solcher „runs“ mindestens einmal auftreten und damit am Ende der Rekrutierung in beiden Therapiearmen vertreten sein werden. Die alternierende Therapiezuordnung würde hier absehbar Asymmetrien in der Verteilung von prognostisch relevanten Cofaktoren zwischen den Therapiearmen bedingen. Das Gleiche gilt für ebenso „vermeintlich zufällige“ Zuordnungen aufgrund des ersten Buchstabens des Nachnamens der Studienteilnehmer: Das Vorkommen bestimmter Initialen kann mit einem Immigrantenstatus assoziiert sein, d.h. die Therapiegabe würde aufgrund dieser Assoziation eine massive Selektion einbringen können.

Szenario 2: Das Werfen einer „fairen“ – also nicht manipulierten – Münze ist als Basis einer Zufallszuteilung absolut legitim. Ein Problem im regulatorischen Sinne stellt jedoch bei dem hier beschriebenen Vorgehen die mangelnde Reproduzierbarkeit des Vorgehens dar, d.h. eine Beweislast zur tatsächlich immer nur einmal geworfenen Münze könnte nicht bedient werden im Falle einer Überprüfung der Studienabläufe durch Überwachungsbehörden. Da speziell in implantologischen Studien die Therapie gegenüber dem Behandler zumeist nicht maskiert werden kann, ist dem Vorwurf vorzubeugen, in Kenntnis der individuellen Situation eines Patienten von der nach erstmaligem Münzwurf anstehenden Therapie nicht überzeugt gewesen zu sein und so lange weiter geworfen zu haben, bis die nach eigenem zahnärztlichen Ermessen hier „besser passende Therapie erworfen“ wurde. Insbesondere kann bei dem in Szenario 2 beschriebenen Vorgehen nicht belegt werden, dass jeder Patient nach Einwilligung zur Studienteilnahme auch wirklich umgehend randomisiert wurde – faktisch müsste umgehend nach Einwilligung die Münze geworfen, die daraus erwachsene Therapiewahl von Zeugen bestätigt sowie dokumentiert und nach Erhalt des entsprechend georderten Implantats umgesetzt werden. Jenseits dieses eher regulatorischen Problems der mangelnden Reproduzierbarkeit stellt das Vorgehen jedoch eine sachgerechte Methode zur Randomisation dar, da Zufälligkeit und damit Nicht-Vorhersagbarkeit der Therapie für jeden Patienten gesichert würden. Man spricht bei solchen konsekutiv randomisierenden Schemata auch von „einfacher“ Randomisation.

Szenario 3: Wie in Szenario 2 besteht auch hier das primär regulatorische Problem der mangelnden Reproduzierbarkeit; ansonsten stellt aber auch das in Szenario 3 beschriebene Vorgehen eine legitime Strategie dar, obwohl intuitiv die Anforderung der Nicht-Vorhersagbarkeit der Therapiegabe als verletzt angesehen werden könnte: Wird die Münze geworfen, ist für beide Implantate die Zuordnung bekannt, d.h., nach dem Setzen des Implantats im rechten Kiefer besteht keine zufällige Auswahl mehr für das Implantat im linken Kiefer. Wird aber strikt das Vorgehen eingehalten, dass stets Implantat I rechts und Implantat II links inseriert werden, kann keine Einflussnahme des Behandlers zugunsten einer vermeintlich prognostisch besser inversen Implantatzuordnung erfolgen. Diese sogenannte „intraindividuelle“ Randomisation (siehe unten) stellt bezüglich der Anforderung des random allocation concealment eine legitime Vorgehensweise dar, solange aus der Kenntnis der „zweiten“ Therapie nach Bekanntwerden der „ersten“ kein Nutzen gezogen werden kann: Würden die beiden Implantate auf verschiedene Patienten zugeordnet, würde faktisch die alternierende Vorgehensweise aus Szenario 1 entstehen mit allen dort beschriebenen prinzipiellen Manipulationsmöglichkeiten und -vorwürfen.

Szenario 4: Auch hier handelt es sich jenseits der mangelnden Reproduzierbarkeit um ein legitimes Randomisationsverfahren, die sogenannte „Cluster-Randomisation“: Die beiden Implantate einer Kieferseite werden „als Cluster“ der gleichen Therapie zugeordnet, wie in Szenario 3 ist jedoch die dem Clustern übergeordnete Links-/Rechts-Randomisation durchaus legitim. In der statistischen Auswertung dürfen die beiden Implantate einer Kieferseite dann jedoch nicht als Einzelbeobachtungen behandelt werden, da deren klinischer Verlauf als hochgradig korreliert erwartet werden muss (und damit keine unabhängige Information zweier Beobachtungen bedingt). Sollen etwa die Standzeiten der Implantate bewertet werden, so müssen die Standzeiten der beiden Implantate des rechten respektive des linken Oberkiefers jeweils kombiniert in die Auswertung eingebracht werden.

Obige Szenarien demonstrieren, dass vermeintlich zufällige Therapiezuweisungen massive Verzerrungen einer Studie nach sich ziehen können. Gleichzeitig werden aber auch speziell für die Belange der dentalen Implantologie, die wie in Szenario 3 motiviert innerhalb eines Patienten „intraindividuelle“ Therapievergleiche vornehmen kann, attraktive und effiziente Methoden der Randomisation nutzbar.

Wie entstehen
Randomisationslisten?

Das im obigen Szenario 2 beschriebene Manko mangelnder Reproduzierbarkeit kann am besten gelöst werden, indem auf publizierte Listen von Zufallszahlen zugegriffen oder direkt eine auf das anstehende Studiendesign ausgerichtete Randomisationsliste erstellt wird, die dann für jeden Studienpatienten dessen anstehende Therapie vorgibt. Solche Listen können beispielsweise bei universitären Instituten für Medizinische Biometrie und Epidemiologie in Auftrag gegeben werden oder bei regulatorischen Dienstleistern wie den universitären Koordinierungszentren für Klinische Studien (KKS). Ausgestattet mit entsprechender Software, kann dort zeitnah eine entsprechende Liste erstellt werden, die für die in der Studie geplante Patientenzahl die für nacheinander zu rekrutierende Patienten jeweils anstehende Therapie vorgibt. Hierbei ist es üblich, dass der Behandler diese Liste nicht kennt, um Manipulationsvorwürfen im Vorfeld entgegenzuwirken.

Eine probate Möglichkeit besteht in der patientenweisen elektronischen Anforderung der jeweils anstehenden Therapievorgabe laut Randomisationsliste, sobald ein Patient in die Studienteilnahme eingewilligt hat und dessen Therapie begonnen bzw. eingeleitet werden soll. Eine „Fax-Randomisation“ oder auch eine automatische internetbasierte Abfrage der nun anstehenden Therapie laut Randomisationsliste beantwortet dann die patientenweisen Anfragen der Prüfzahnärzte an die zentrale Stelle, die üblicherweise von den Studienzentren unabhängig die Randomisationsliste verwaltet.

Die Entstehung solcher Listen erfolgt salopp formuliert über Zufallsgeneratoren, die in entsprechender Software implementiert sind. Diese nutzen Einstellgrößen, z.B. die Systemzeit bei Anforderung der Liste, und verarbeiten dann die Ziffern der Systemzeit so, dass eine Serie als zufällig zu verstehender Ziffern resultiert. Diese Ziffernserien werden dann den zu vergleichenden Therapien zugeordnet, bei 2 zu vergleichenden Implantaten etwa binärisiert (Implantat I bei Ziffern „0“–„4“ und Implantat II bei Ziffern „5“–„9“): Ergibt sich für eine Studie mit 2 x 5 Patienten respektive Implantaten aus der Systemzeit bei Listenanforderung die Ziffernserie „9071565114“, so würde aufgrund dieser Ziffernserie Patient 1 Implantat II erhalten, Patient 2 Implantat I usw.; es ergäbe sich die Therapie-Zuweisungsfolge II – I – II – I – II – II – II – I – I – I. Wie schon eingangs motiviert, treten hier „runs“ von dreimal hintereinander gleichen Implantaten auf, was dem intuitiven Verständnis von Zufall eher widerspricht – aber für die Sicherung der Strukturgleichheit elementar ist [4].

Stratifizierte Randomisation

Ist für die zu evaluierenden Therapien bereits ein prognostischer Faktor der zugrunde liegenden Erkrankung bekannt, z.B. das Rauchverhalten als prognostische Determinante eines dentalen Implantats, so bietet sich der Einbezug dieses Faktors in die Randomisation an: Wie oben kann eine Serie von Zufallszahlen und darauf basierend eine Randomisationsliste auch stratifiziert nach dem prognostischen Faktor – also separat für jede Ausprägung des prognostischen Faktors oder Risikofaktors – erstellt werden. Wird eine Studie mit insgesamt 2 x 200 Patienten zum Vergleich der Implantate I und II geplant und soll nach dem Rauchverhalten der Studienteilnehmer stratifiziert randomisiert werden, resultiert jeweils für Raucher und Nichtraucher eine separate Randomisationsliste mit 2 x 100 Therapievorgaben. Wichtig ist hierbei, dass stratifizierte Randomisations-Schemata also nicht die Gesamt-Patientenzahl einer Studie erhöhen (etwa eine Verdopplung durch eine separate Studie für Raucher und Nichtraucher), sondern lediglich innerhalb des eigentlich interessierenden vergleichenden Studiendesigns direkt die Therapiegabe getrennt für die jeweiligen Strata randomisiert vorgeben. Die Studie wird dann auch unter Berücksichtigung dieser Stratifizierungskriterien ausgewertet, jedoch auf der Basis des Gesamtdatensatzes aller 200 Raucher und Nichtraucher.

Klarer Vorteil der stratifizierten Randomisation ist die Sicherung der Strukturgleichheit zwischen den beiden primär angestrebten Therapiearmen unter Wahrung einer Balance des Studiendesigns bezüglich der bekannten Risiko- oder Prognosefaktoren. Es wird vermieden, dass trotz Randomisation überproportional viele Patienten mit diesem Faktor in einer der Therapiegruppen auftreten: Eine Stratifikation der Randomisation im obigen Beispiel des Implantatvergleichs nach dem Rauchverhalten vermeidet also, dass in der Studie eines der beiden Implantate überproportional häufig bei Rauchern implantiert wird und damit allein aufgrund dieser prognostischen Asymmetrie der Studienarme ein Implantatunterschied suggeriert würde.

Vor diesem Hintergrund wird auch in multizentrischen Studien die Randomisation grundsätzlich anhandg der Zentren stratifiziert: Üblicherweise ist die Rekrutierungs-Geschwindigkeit verschiedener Prüfzentren stark unterschiedlich, grundsätzlich rekrutieren diese aber parallel. Würde nun in einer bizentrischen Studie die obige Zufallsziffern-Serie „9071565114“ zur Implantat-Zuweisungsfolge „II – I – II – I – II – II – II – I – I – I“ führen, ist nicht ausgeschlossen, dass allein durch die Rekrutierungs-Taktung sämtliche Patienten mit Vorgabe „Implantat II“ aus dem ersten Studienzentrum und sämtliche Patienten mit Vorgabe „Implantat I“ aus dem zweiten Studienzentrum beigesteuert würden. Ergibt sich dann bei Auswertung der Studie ein Unterschied in der Standzeit der beiden Implantate I und II, kann dieser nicht zweifelsfrei auf die Implantate zurückgeführt werden, da eventuell auch ein Zentreneffekt – eventuell eine besonders hohe Affinität oder Vertrautheit der Zentrenoperateure mit „ihrem“ Implantat – vorliegen könnte. Eine Stratifikation der Randomisation nach den Studienzentren sichert, dass jedes Studienzentrum die gleiche Anzahl beider Implantate innerhalb der von diesem Zentrum zu rekrutierenden Patientenserie inserieren wird. Dementsprechend wird auch jedes Zentrum eine eigene Randomisationsliste für seine Patienten führen bzw. bei zentraler Randomisation anhand einer eigenen Liste administriert werden.

Gleichzeitig zeigt obiger Fall der multizentrischen Studie die Grenzen der stratifizierten Randomisation: Dieser Ansatz ist nur für wenige Faktoren mit wenigen Ausprägungen gangbar, da sonst zu viele Sub-Listen mit sehr kleinen Fallzahlen pro Zentrum entstünden. Soll eine bizentrische Studie nach Zentrum und Rauchverhalten der Patienten stratifizieren, so ergeben sich schon 4 parallele Sub-Listen mit jeweils 25 % der Patienten der gesamten Studie. Mit wachsender Zentrenzahl und Differenzierung der Cofaktoren-Raster würden die Beiträge einzelner Zentren zur Gesamtstudie so gering, dass der Nutzen ihres Einbezugs den logistischen Mehraufwand für die Führung der Gesamtstudie ggf. nicht mehr rechtfertigt.

Block-Randomisation

Die in Szenario 3 beschriebene „intraindividuelle“ Randomisation, also die zufällige Zuweisung zweier alternativer Therapien auf die Kieferseiten desselben Patienten, stellt einen Spezialfall der sogenannten „Block-Randomisation“ dar: Werden Patienten anhand eines „einfachen“ Randomisations-Schemas wie oben motiviert anahnd einer Serie von Zufallsziffern den Therapiealternativen zugewiesen, ist keine Balanciertheit der beiden Stichprobenumfänge garantierbar bis zum Ende der Studie. Wie oben erläutert, können „runs“ und asymmetrische Rekrutierungs-Geschwindigkeiten in parallelen Zentren dazu führen, dass zu bestimmten Zeitpunkten innerhalb der Rekrutierungsphase schon sehr viel mehr Patienten mit Implantat II als mit I versorgt wurden. Auch wenn die Randomisationsliste insgesamt also eine balancierte Fallzahl für die Therapiearme vorgibt, würde zu einem solchen Zeitpunkt im Fall einer kurzfristig notwendig werdenden Interimsanalyse [3] eine merklich asymmetrische Stichprobengröße in den Therapiearmen in die Auswertung eingehen.

Um dies über den gesamten Studienzeitraum zu balancieren, kann in Blöcken randomisiert werden: Unter einem „Block“ wird dabei eine feste Anzahl aufeinander folgender Patienten in der Studie verstanden, die in gleichen Teilen auf die zu vergleichenden Therapien randomisiert werden. Wird also in Blöcken der Länge 4 auf 2 Implantate randomisiert, würden jeweils 4 konsekutiv rekrutierte Patienten zu gleichen Teilen auf die beiden Implantate randomisiert. Die konkrete Reihenfolge der Randomisation innerhalb eines solchen Blocks, ob also I – II – II – I oder II – II – I – I oder auch II – I – II – I wird dabei wiederum über Zufallszahlen bestimmt und variiert von jedem Block zum nächsten. Durch diese Variation der konkreten Abfolgen innerhalb der Blöcke von jeweils 4 Patienten wird in einer Behandler-seitig offenen Studie eine Vorhersagbarkeit der Therapie zwar nicht gänzlich ausgeschlossen (für den vierten Patienten ist nach Kenntnis der ersten 3 Implantatwahlen die Implantatvorgabe absehbar); durch eine vom Behandler unabhängige Rekrutierung – und damit die Vermeidung von Patientenselektionen durch den Behandler – wird dennoch im Ergebnis ein random allocation concealment realisiert.

Klarer Vorteil der Block-Randomisation ist die anhand der gesamten Rekrutierungsdauer stets nahezu balancierte Zuweisungshäufigkeit der konkurrierenden Therapien innerhalb des schon rekrutierten Patientenkollektivs. Ein merklicher Nachteil besteht jedoch im oben angedeuteten Risiko einer Vorhersagbarkeit der Therapie für einzelne Patienten und dem zur Vermeidung anstehenden logistischen Mehraufwand für die Studienkoordination. Faktisch sind Block-Randomisationen mit einer fest vorgegebenen Blocklänge wie im obigen Beispiel eher ein Instrument für Studien, in welchen eine Maskierung der Therapie möglich ist. In offenen Studien empfiehlt es sich, die Blocklänge anhand der Randomisationsliste zu variieren und insbesondere gegenüber dem Studienpersonal geheim zu halten: Wenn die Blocklänge 4 nicht bekannt gewesen wäre oder zwischen aufeinander folgenden Blöcken variiert, würde im obigen Beispiel keine Vorhersagbarkeit mehr erwachsen. Im Ergebnis sind also auch offene Studien Block-randomisiert führbar, insbesondere sind die Konzepte der Block-Randomisation und der Stratifikation problemlos kombinierbar.

Cluster-Randomisation

Das eingangs beschriebene Szenario 4 randomisiert jeweils 2 Implantate auf eine Seite des Unterkiefers, sodass diese beiden Implantate ein „Cluster“ von untereinander nicht mehr als unabhängig anzusehenden Beobachtungseinheiten darstellen. Solche auch als „Cluster-Randomisation“ bekannten Strategien können durchaus legitime Randomisations-Schemata bedingen, sofern bei Planung von Studienfallzahl und -auswertung nicht die einzelnen Beobachtungseinheiten innerhalb der Cluster als einzeln informativ missverstanden werden: Wie zu Szenario 4 schon erläutert, würde hier etwa die mittlere Standzeit der beiden Implantate des rechten Unterkiefers mit der mittleren Standzeit der beiden Implantate des linken Unterkiefers verglichen, nicht aber die 4 Implantate als eigenständige Informationen behandelt werden können.

Die „Cluster-Randomisation“ stellt eine attraktive Methode für Untersuchungen in der Dental Public Health dar, wo ein „Cluster“ z.B. aus sämtlichen Patienten einer Zahnarztpraxis besteht, in der ein orales Präventionsprogramm eingeführt wurde. Ein „Kontroll-Cluster“ könnte dann aus einer Praxis rekrutiert werden, in der dieses Programm noch nicht umgesetzt ist. Die Randomisation bezieht sich dann nicht mehr auf die einzelnen Patienten, sondern würde auf die Praxen bezogen durchgeführt werden, d.h. für eine Reihe von an der Studienteilnahme interessierten Praxen würde dann per Randomisation entschieden werden, ob diese ein „Verum-Cluster“ oder ein „Kontroll-Cluster“ werden, ob also das Präventionsprogramm dort implementiert wird oder (noch) nicht. In beiden Praxen dürfen deren Patienten nicht zwingend als unabhängig betrachtet werden, da sie jeweils nicht individuell auf die jeweilige Therapiealternative („Prävention ja oder nein“) randomisiert wurden und innerhalb der Praxen nur eine der beiden Alternativen implementiert wurde (also wie oben motiviert ein Zentren-Effekt zu erwarten ist). Die gesamte Studie würde in dieser Situation eine Reihe von Praxen mit respektive ohne Präventionsprogramm rekrutieren und randomisieren, also das Präventionsprogramm entlang dieser Praxen als „Cluster-randomisiert“ evaluieren. Hierbei ist der logistische Aufwand solcher Cluster-randomisierter Studien zum Teil enorm, ihre Aussagekraft jedoch nicht selten begrenzt: Innerhalb der Praxen werden nicht alle Patienten an der Studie teilnehmen wollen, sodass innerhalb der Cluster intrinsische Selektionsmechanismen auftreten können, die den eigentlichen randomisierten Vergleich verschleiern. Vor diesem Hintergrund werden Methoden der Cluster-Randomisation durchaus kritisch diskutiert und stellen nach wie vor einen Schwerpunkt der klinisch-epidemiologischen Forschung dar [1].

Zusammenfassung

  • 1. Randomisation soll in Klinischen Studien Strukturgleichheit zwischen den Stichproben bezüglich möglicher Störgrößen sichern, die sonst den Therapieunterschied in der statistischen Auswertung verschleiern könnten.
  • 2. Randomisation bedeutet die rein zufällige Zuordnung konkurrierender Therapien auf Studienteilnehmer unter Ausschaltung der ärztlichen Entscheidungsfreiheit. Jede Form der Randomisation muss vor Studienbeginn von einer lokal zuständigen Ethikkommission positiv votiert worden sein.
  • 3. Die entscheidenden Anforderungen an ein Randomisations-Schema sind Zufälligkeit und Nicht-Vorhersagbarkeit der Therapiegabe sowie Reproduzierbarkeit des zugrunde liegenden Zuordnungs-Schemas.
  • 4. Randomisationslisten sollten mittels sachgerechter statistischer Software erstellt und von einer vom Behandler unabhängig agierenden Stelle erzeugt und verwaltet werden. Eine effiziente Möglichkeit der jeweils zeitnahen Anforderung der für einen rekrutierten Patienten anstehenden Therapie ist auf Basis entsprechend validierter elektronischer Kommunikationsmodule möglich, welche umgehend nach Anforderung einer Randomisation – auch z.B. innerhalb eines operativen Versorgungsablaufes – die Rückmeldung der aktuell anstehenden Therapievorgabe ermöglichen.
  • 5. Die Vergabe der Therapie anhand des Behandlungsdatums, der Initialen des Patienten oder auch anhand alternierender oder sonstiger nicht auf Zufallszahlen basierender Randomisations-Schemata ist nicht legitim; eine merkliche Verzerrung der Studie kann die Folge sein, was wiederum den Vorwurf wissenschaftlichen Fehlverhaltens und nicht ethischer Patientenführung in wissenschaftlichen Experimenten nach sich ziehen könnte.
  • 6. Die Randomisation in multizentrischen Studien erfolgt stets Zentren-stratifiziert, d.h. jedes Zentrum wird anhand einer eigenen Sub-Randomisationsliste für seine Patienten die Therapiezuweisung vornehmen. Diese Vorgehensweise stellt sicher, dass in allen Studienzentren sämtliche Therapien zur Anwendung kommen und in der Gesamtstudie unter Korrektur für Behandler-spezifische Therapiepräferenzen verglichen werden können.
  • 7. Speziell in der dentalen Implantologie bietet sich die intraindividuelle Randomisation als Spezialfall der sogenannten „Block“-Randomisation an: Auf die Kieferquadranten eines Patienten werden 2 konkurrierende Therapien randomisiert und dann intraindividuell verglichen. Hierbei muss jedoch wie bei jeder offenen Studie sichergestellt werden, dass für den Behandler keine Entscheidungsfreiheit etwa durch Auswahl der Kieferquadranten oder durch Änderung der Reihenfolge in der Therapiezuordnung auf die Kieferquadranten besteht.
  • 8. Werden mehrere Implantate eines Patienten als „Cluster“ randomisiert, also jeweils der gleichen Therapie unterzogen, können diese nicht als eigenständig informative Beobachtungseinheiten in der Auswertung berücksichtigt werden, sondern müssen etwa anahnd medianer Kennwerte sämtlicher Implantate eines jeweiligen „Clusters“ behandelt werden. In „Cluster-randomisierten“ Studien werden häufig Praxen oder Kliniken bezüglich zu vergleichender Versorgungsalternativen randomisiert, die Patienten einer Praxis („Cluster“) werden dann der gleichen Versorgung unterzogen (Abb. 1).

Korrespondenzadresse

Prof. Dr. Frank Krummenauer

Institut für Medizinische Biometrie
und Epidemiologie

Fakultät für Gesundheit der Universität Witten/Herdecke

Alfred-Herrhausen-Straße 50

D-58448 Witten

Tel.: 02302 926760

Fax: 02302 92644825

Frank.Krummenauer@uni-wh.de

Literatur

1. Hemming K, Girling AJ, Sitch AJ, March J, Lilford RJ: Sample size calculation for cluster randomised controlled trials with a fixed number of clusters. BMC Med Res Methodology 2011;30: 102

2. Hirsch J, Baulig C, Krummenauer F: Signifikanztests für intraindividuelle Therapievergleiche – Vorsicht vor Signifikanzverlusten ... Z Zahnärztl Implantol 2013,29:160–165

3. Krummenauer F, Al-Nawas B, Baulig C: Studienplanung in der Implantologie (III): Geplante Interimanalysen – „Spicken“ in Klinischen Studien. Z Zahnärztl Implantol 2011;27:72–80

4. Schulz KF, Grimes DA: Generierung von Randomisierungslisten in randomisierten Studien: Zufall, nicht Auswahl. Zeitschrift für Ärztliche Fortbildung und Qualität im Gesundheitswesen 2007;101:419–426

5. Schumacher M, Schulgen G: Methodik klinischer Studien – Methodische Grundlagen der Planung, Durchführung und Auswertung (3. Aufl.). Springer Verlag, Berlin Heidelberg 2008

Fussnoten

1 Institut für Medizinische Biometrie und Epidemiologie (Direktor: Prof. Dr. F. Krummenauer), Fakultät für Gesundheit der Universität Witten/Herdecke, Alfred-Herrhausen-Straße 50, 58448 Witten


(Stand: 12.06.2015)

DGI Nachrichten aktuell

In Memoriam an Karl-Ludwig Ackermann. Ein Nachruf von Prof. Dr. Günter Dhom und Gedenken an einen ganz „Großen“ der Zahnmedizin. 

zum Nachruf an Dr. Ackermann

Aktuelle Ausgabe 3/2020

Im Fokus

  • Kippkonus-Abutment
  • Statine und Bisphosphonate
  • Teleskopierende Hypridbrücke

FORTBILDUNGSANGEBOTE DGI

Die DGI bietet ein umfassendes und überregionales Fortbildungsangebot an. 

WERDEN SIE AUTOR

Sie haben ein spannendes Thema aus dem Bereich der Implantologie und würden gerne einen Artikel dazu in der ZZI veröffentlichen? Dann nutzen Sie unseren Editorial Manager und reichen Sie ihr Manuskript direkt bei uns ein.

Manuskript einreichen