9789144109237

Page 1

LONGITUDINELLA STUDIER OCH ÖVERLEVNADSDATA EN INTRODUKTION FÖR KLINIKERN CLAES JOGRÉUS HÅKAN OLSSON


Kopieringsförbud Detta verk är skyddat av upphovsrättslagen. Kopiering, utöver lärares och studenters begränsade rätt att kopiera för undervisningsändamål enligt Bonus Copyright Access kopieringsavtal är förbjuden. För information om avtalet hänvisas till utbildningsanordnarens huvudman eller Bonus Copyright Access . Vid utgivning av detta verk som e-bok, är e-boken kopieringsskyddad. Den som bryter mot lagen om upphovsrätt kan åtalas av ­a llmän åklagare och dömas till böter eller fängelse i upp till två år samt bli skyldig att erlägga ersättning till ­upphovsman eller rättsinnehavare. Studentlitteratur har både digital och traditionell bokutgivning. Studentlitteraturs trycksaker är miljöanpassade, både när det gäller papper och tryckprocess.

Art.nr 39033 ISBN 978-91-44-10923-7 Upplaga 1:1 © Författarna och Studentlitteratur 2015 www.studentlitteratur.se Studentlitteratur AB, Lund Omslagslayout: Jens Martin, Signalera Omslagsillustration: Shutterstock/In Green Printed by Graficas Cems S.L., Spain 2015


Innehåll Avsnitt märkta med * är mer matematiskt krävande och kan se som överkurs. Innehåll ............................................................................................................................ 3 Förord ............................................................................................................................... 7 Teckenförklaring ............................................................................................................. 9 1. Introduktion .............................................................................................................. 11 Varför analys av överlevnadsdata? ........................................................................ 11 2. Grundläggande sannolikhetsteori och statistik .................................................... 17 Grundläggande definitioner .................................................................................... 17 Binomialfördelningen............................................................................................... 19 Poissonfördelningen ................................................................................................. 20 Normalfördelningen ................................................................................................. 21 Några regler för väntevärde och varians för en funktion.................................... 25 Grundläggande definitioner för livslängdsfördelningar ..................................... 26 Några exempel på vanliga livslängdsfördelningar .............................................. 27 Skattningsmetoder .................................................................................................... 29 Statistiska test ............................................................................................................ 32 3. Longitudinella studier och epidemiologi .............................................................. 39 Mortalitetsmått .......................................................................................................... 39 Sensitivitet, specificitet och prediktiva värden .................................................... 42 Randomisering och jämförande studier................................................................. 43 Kohortstudier ............................................................................................................ 44 Fall-kontrollstudier ................................................................................................... 44 Design ......................................................................................................................... 46 Confounding ............................................................................................................. 50 Matchning .................................................................................................................. 52 Standardisering: direkt och indirekt ...................................................................... 58 *Ratkvoter och Mantel-Haenszel-metoder ............................................................ 67 Longitudinella studier med endast två mättillfällen ............................................ 72 4. Modeller utan kovariater: Life-tables, Kaplan-Meier-skattning med mera ...... 75 Skattning av överlevnadssannolikheter ................................................................. 75 Statistiska jämförelser av grupper: lograngtest .................................................... 83 *Test för trend ................................................................................................................. 90 Exponentialfördelning ............................................................................................. 92 Weibullfördelning..................................................................................................... 93

© FÖRFATTARNA OCH STUDENTLITTERATUR

3


5. Modeller med kovariater: linjär regression ........................................................... 97 Allmänt om regression ............................................................................................. 97 Stegvis multipel regression.................................................................................... 109 Poissonregression ................................................................................................... 114 6. Modeller med kovariater: logistisk regression.................................................... 119 Enkel logistisk regression ...................................................................................... 119 Multipel logistisk regression ................................................................................. 121 *Betingad logistisk regression ............................................................................... 126 *Multinomial logistisk regression ......................................................................... 126 *Ordinal logistisk regression ................................................................................. 129 7. Modeller med kovariater: Coxmodellen .............................................................. 131 Proportional hazards eller Accelerated failure? ................................................. 131 Coxmodellen med konstanta kovariater.............................................................. 132 Test av goodness-of-fit: grafisk metod ................................................................. 133 Dummyvariabler och interaktioner ...................................................................... 139 Residualer: grafer och statistiska test ................................................................... 139 Vad händer om proportional hazards-antagandet inte gäller? ........................ 140 *Jämförelse mellan logistisk regression och Coxregression .............................. 144 8. Utvidgning av Coxmodellen ................................................................................. 147 Tidsberoende kovariater ........................................................................................ 147 Stratifiering .............................................................................................................. 151 *Frailtymodeller ...................................................................................................... 154 9. Variansanalys (ANOVA) ....................................................................................... 157 Variansanalys med ensidig indelning ........................................................................ 157 *Upprepade mätningar (repeated measures) ...................................................... 161 10. Planläggning av en longitudinell studie ............................................................ 163 Hur många patienter behövs vid jämförelse av två grupper? .......................... 163 *Hur många patienter behövs när en Coxmodell används? ............................. 165 11. Statistisk programvara och litteratur ................................................................. 169 SPSS .......................................................................................................................... 169 Stata .......................................................................................................................... 190 R ................................................................................................................................ 190 Litteratur för fördjupade studier .......................................................................... 191 12. Analys av överlevnadsdata i aktion: kliniska exempel .................................... 193 Kliniska synpunkter på dödlighet ........................................................................ 193 Ett exempel: överlevnadsanalys vid bröstcancer................................................ 201

4

© FÖRFATTARNA OCH STUDENTLITTERATUR


Appendix A. Ordlista över några bio-statistiska och epidemiologiska termer på svenska och engelska ................................................................................................. 203 Appendix B. Dödsorsaker.......................................................................................... 207 Appendix C. Statistiska tabeller ................................................................................ 209 *Appendix D. Några formler och härledningar för den matematiskt intresserade ....................................................................................................................................... 221 Appendix E. Vilken analysmetod skall jag använda? ............................................ 225 Appendix F. Artikel om prognostiska faktorer vid bröstcancer ........................... 229 Litteratur ...................................................................................................................... 241 Register......................................................................................................................... 247

© FÖRFATTARNA OCH STUDENTLITTERATUR

5


3. Longitudinella studier och epidemiologi

Mortalitetsmått Några historiska notiser Den första stora mortalitetsstudien genomfördes av John Graunt (1620-1674) som studerade mortaliteten i London. Mortalitetssiffrorna klassificerades med avseende på dödsorsak, men varken ålder eller kön var tillgängliga. Graunt visade regulariteten av olika mänskliga livshändelser som födelser, dödsfall, giftermål, att det föddes fler pojkar än flickor samt att dödligheten var högre i London än på landsbygden. Graunts arbete är fortfarande intressant eftersom han var före sin tid ifråga om vetenskaplig metod. Det var dock en stor svårighet på hans tid att inga folkräkningar i modern mening var tillgängliga. Detta berodde delvis på sekretess ifråga om uppgifter som kunde användas av andra länder för att bedöma ett lands militära kapacitet, t.ex. folkmängd, och delvis på den allmänna skepticismen mot statlig inblandning i människors liv, ibland uttryckt genom upplopp. Den systematiska tabuleringen av dödsfall, migration, överlevnadssannolikheter m.m. i en så kallad life-table studerades vidare av Edmond Halley (1665-1742), mest känd för Halleys komet. Han påpekade att noggrannheten och validiteten för en lifetable blir större om den konstrueras för populationer med försumbar migration; hans eget studieobjekt var staden Breslau (numera Wroclaw). Den svenske statistikern och astronomen Pehr Wargentin (1717-1783) som genom att organisera Kongliga Tabellverket (numera Statistiska centralbyrån) 1757 startade den första statistiska centralbyrån i Europa, konstruerade också den första livslängdstabellen för en hel nation. Han publicerade tabeller över ålders- och könsspecifika dödssiffror för Sverige under epoken 1757-1763. Tabellen visade bland annat att män vanligen hade högre dödssiffror än kvinnor i samma åldersgrupp. Ett vanligt sätt att beskriva dödligheten som funktion av tiden är den så kallade intensitetsfunktionen eller dödsintensitetsfunktionen  (t ). På engelska används

© FÖRFATTARNA OCH STUDENTLITTERATUR

39


vanligen termen hazard function. Denna funktion definieras enkelt uttryckt som sannolikheten att en person skall dö i ett intervall nära t dividerad med detta intervalls längd. Om det är stor sannolikhet att dö vid tiden t så är alltså intensitetsfunktionen stor vid t. Många försök gjordes att hitta en matematisk formel för dödsintensitetsfunktionen. Sådana formler, ofta kallade ”laws of mortality”, ger instrument för att studera trender och göra befolkningsprognoser. Det tidigast kända exemplet på en sådan formel kommer från de Moivre som 1725 föreslog den första intensitetsfunktionen:

 (t ) 

1 , wt

där t är åldern och w är en konstant som är lika med den högsta tänkbara åldern. Denna intensitet ger överlevnadsfunktionen t S (t )  1  . w Denna formel beskriver dödligheten ganska väl för högre åldrar men är ingen bra modell för yngre åldersgrupper, vilket redan de Moivre själv insåg. En av de mest berömda intensitetsfunktionerna föreslogs av William Makeham, se Makeham (1867), nämligen

 (t )  a  be kt . Om konstanten a sätts lika med 0 kallas formeln Gompertz formel. 1935 använde de svenska statistikerna Harald Cramér och Herman Wold sig av Makehams formel för att prediktera framtida mortalitet i Sverige. Ett annat försök för att finna en formel för dödsintensiteten gjordes av den danske statistikern T.N. Thiele 1872. Hans metod utgår från idén att den mänskliga livscykeln kan delas upp i tre naturliga intervall som vart och ett har sina egna karakteristiska dödsorsaker: barndom, vuxen ålder och ålderdomen. Ibland läggs en fjärde term till för att beskriva dödsorsaker som har approximativt samma intensitet oberoende av åldern. I den enklaste formen, dvs utan denna fjärde term, kan intensitetsfunktionen skrivas som

 (t )  1 (t )  2 (t )  3 (t ), där

1 (t )  a1e b1t ,

2 (t )  a 2 e  b2 (t  c )

40

2 /2

,

© FÖRFATTARNA OCH STUDENTLITTERATUR


och

3 (t )  a3e b3t . Alla konstanterna i formlerna ovan antas vara positiva. Den första termen representerar det dominerande bidraget till dödsintensiteten under barndomen, den andra den dominerande intensiteten i vuxen ålder och den tredje termen dominerar under ålderdomen. För att kunna göra rättvisande jämförelser av överlevnad mellan två eller flera grupper är det nödvändigt att jämföra överlevnaden i undergrupper som liknar varandra med hänsyn till ålders- och könsfördelning. Åldersspecifika rater definieras ofta i femårsgrupper: 0-4 år, 5-9 år etc. I många sammanhang finner man att bredare åldersintervall gör att grupperna inte blir jämförbara. Dödsrater beräknas ibland yrke för yrke eller per geografisk enhet, t.ex. per kommun. För att jämföra total mortalitet eller morbiditet mellan grupper – inte bara specifika åldersgrupper – används standardisering. En metod är att beräkna det förväntade antalet dödsfall i en viss population om den hade haft samma ålderssammansättning som någon ”normalpopulation”, t.ex. Sveriges population ett visst årtal. En alternativ metod är att beräkna antalet förväntade dödsfall i populationen om den hade samma åldersspecifika dödsrater som som referenspopulationen men den autentiska åldersfördelningen. Standardisering av rater för att göra populationer jämförbara diskuteras utförligt med konkreta exempel i avsnittet Standardisering senare i detta kapitel. Ett annat sätt att göra grupper jämförbara är matchning, se avsnittet Matchning i detta kapitel. En intressant översikt av biostatistikens historiska utveckling är Westergaard (1932), medan en översikt av statistikens allmänna utveckling ges i Stigler (1990) och Stigler (2002). -----------------------------------------------------------------------------------------------------------Prevalens och incidens Förekomsten av en sjukdom i en viss population beskrivs av den så kallade prevalensen, som är andelen av befolkningen som har sjukdomen, ofta angiven som antal sjuka per 100 000 invånare. Incidensen är hur stor andel som insjuknar varje år, ofta mätt som antal nya fall per 100 000 invånare. Om incidensen är hög, men sjukdomen bara varar en kort tid så kan prevalensen vara relativt låg. Om däremot det är fråga om en långvarig sjukdom så blir även prevalensen hög. ------------------------------------------------------------------------------------------------------------

© FÖRFATTARNA OCH STUDENTLITTERATUR

41


Sensitivitet, specificitet och prediktiva värden Medicinska test av olika slag ger ju inte nödvändigtvis rätt resultat. Att kunna beskriva sannolikheten för att få ett visst svar på testet är viktigt för att kunna förstå hur bra testmetoden är. Å ena sidan vill man ju att ett negativt provresultat verkligen innebär att patienten är frisk och å andra sidan vill man att ett positivt provresultat skall innebära att patienten har den aktuella sjukdomen, bland annat för att inte oroa patienten i onödan. Situationen kan illustreras med tabellen nedan, där a, b etcetera innebär antal patienter i respektive ruta.

Testet positivt Testet negativt Totalt

Sjuka

Friska

Totalt

a

b

a+b

c a+c

d b+d

c+d a+b+c+d=n

-----------------------------------------------------------------------------------------------------------Sensitiviteten är sannolikheten att en sjuk person ger positivt utslag på testet, dvs a/(a+c). Specificiteten är sannolikheten att en frisk person ger ett negativt resultat på testet, dvs d/(b+d). För att man skall anse att testet är bra krävs det alltså både en hög sensitivitet och en hög specificitet. -----------------------------------------------------------------------------------------------------------Exempel 3.1. I en grupp med 50 individer är 30 sjuka och 20 friska. Av de 30 sjuka har 24 positivt resultat på testet och sex negativt. Av de sjuka har 18 negativt resultat och två positivt. Sensitiviteten är då 24/30 = 0.8 medan specificiteten är 18/20=0.9. Det är ofta användbart att beskriva personerna med hjälp av prediktiva värden. Det Positiva Prediktiva Värdet (PPV) definieras av

PPV  sannolikheten att patienten är sjuk om testet är positivt 

a . ab

Det Negativa Prediktiva Värdet (NPV) definieras av

NPV  sannolikheten att patienten är frisk om testet är negativt 

d . cd

Vi får tabellen på nästa sida.

42

© FÖRFATTARNA OCH STUDENTLITTERATUR


Testet positivt Testet negativt Totalt

Sjuka

Friska

Totalt

24

2

26

6 30

18 20

24 50

PPV, dvs sannolikheten att patienten är sjuk om testet visar positivt värde är 24/26 = 0.92. NPV, dvs sannolikheten att patienten är frisk om testet visar negativt värde, är 18/24 =0.75. ------------------------------------------------------------------------------------------------------------

Randomisering och jämförande studier Randomisering är en metod att allokera individer till en grupp på ett slumpmässigt sätt så att varje individ har samma chans att hamna i en viss grupp. För varje patient bestäms det slumpmässigt om han eller hon skall få behandling A eller den mer beprövade behandling B. Proceduren genomförs lättast med en slumptalsgenerator i datorn. Den grundläggande idén är att grupperna skall vara så lika som möjligt utom ifråga om den faktor man skall studera. En annan fördel med randomisering är att den eliminerar selektionseffekter. Till exempel kan en läkare vilja ge den mer beprövade medicinen till de sjukaste patienterna. De patienter som har bättre prognos får däremot den nya medicinen. Detta kallas informativ censurering. Randomiseringsschemat skall hållas hemligt för forskaren så att han/hon inte vet vem som får den ena eller andra behandlingen, en så kallad blind studie. Ofta talar man inte heller om för patienten vilken behandling de får för att undvika placeboeffekten. När varken forskaren eller patienten vet vilken behandling som ges talar man om en dubbel blind studie. Ibland kan en icke slumpmässig allokering ge resultat som påminner om randomisering, t.ex. då den förra är i stort sett den enda metod som är etiskt försvarbar. OM en behandling kan ha skadliga bieffekter kan vi inte bara allokera patienter till denna behandling. Istället jämför man med randomisering patienter som redan får denna medicin med jämförbara patienter som får en mer beprövad (och säkrare) behandling. I vissa situationer kan en icke-randomiserad studie likna en randomiserad studie, t.ex. om varannan patient får en viss behandling eller när patienter med jämnt födelseår får samma behandling. Det finns också en del argument mot randomisering. En icke-randomiserad studie är ofta billigare. Ibland är icke-randomiserade studier närmare en realistisk situation. Om t.ex. en behandling bara ges till patienter som själva vill ha

© FÖRFATTARNA OCH STUDENTLITTERATUR

43


just denna och som själva har valt den kan behandlingen bli mer effektiv än om den ges till motvilliga patienter. Inom epidemiologin är de dominerande typerna av studier longitudinella studier och tvärsnittsstudier. Den longitudinella studien handlar om studium av sjukdomen över tiden medan tvärsnittstudien, ibland kallad prevalensstudien, mäter antalet sjukdomsfall vid en viss fix tidpunkt, den s.k. prevalensen. Tvärsnittsstudier diskuteras inte i denna bok. Longitudinella studier är antingen prospektiva, dvs man följer individerna från och med nu framåt itiden eller retrospektiva, dvs individerna följs bakåt i tiden. Två specialfall är fall-kontroll- och kohortstudier. En fall-kontrollstudie är normalt retrospektiv medan kohortstudien kan vara antingen prospektiv eller retrospektiv. Då fall-kontroll- och kohortstudier ofta används kommer de att diskuteras nedan.

Kohortstudier En kohort är en grupp individer med någon gemensam egenskap som följs upp över en viss tid: Ett exempel är en födelsekohort som består av t.ex. personer födda samma år. Ett annat exempel är en grupp individer som har arbetat vid en viss fabrik under en viss tidsperiod. En kohortstudie kan vara prospektiv, vilket innebär att sjukdomen inte har startat när studien påbörjas, eller retrospektiv, vilket innebär att sjukdomen startade innan studien påbörjades och individerna följs bakåt i tiden. I stället för begreppet kohortstudie talar man ibland om uppföljningsstudie. Mer om kohortstudier kan man läsa t.ex. i Rothman (2002) eller Rothman & Greenland (1998).

Fall-kontrollstudier Fall-kontrollstudien går från effekt till orsak i motsats till kohortstudien. Den jämför en grupp individer som har en viss sjukdom (fallen) med en annan grupp som inte har sjuk-domen (kontrollerna). Tanken är att fall och kontroller skall vara lika varandra i många övriga avseenden, t.ex. åldersgrupp, kön etc. Mer om detta diskuteras i avsnittet Matchning senare i detta kapitel. Den som vill ha en allmän översikt över hur fall-kontroll-studier fungerar kan läsa t.ex. i Rothman (2002) eller Rothman & Greenland (1998). Fall-kontrollstudien är ofta retrospektiv, dvs vi har data som handlar om individer med sjukdomen och försöker sedan finna kontroller som är så lika fallen som möjligt med avseende på möjliga confoundingfaktorer. Det finns dels

44

© FÖRFATTARNA OCH STUDENTLITTERATUR


individuell matchning där varje fall har en eller flera matchade kontroller och gruppvis matchning. Fall-kontrollstudien är ofta mer ekonomisk än kohortstudien. Om en sällsynt sjukdom studeras behövs det en mycket stor kohort för att hitta några med denna sjukdom. Med andra ord kommer större delen av arbetet att gå åt till att studera individer som inte har den aktuella sjukdomen. För att få en överskådlig översikt listas nedan för- och nackdelar med fallkontrollstudien i jämförelse med kohortstudien. Fördelar 1. Anpassad till studium av sällsynta sjukdomar och sådana med lång latenstid 2. Snabb och effektiv att planera och genomföra 3. Kräver relativt få individer 4. Existerande register kan ofta användas 5. Ingen risk för deltagande individer (fallen har redan sjukdomen och kontrollerna är per definition friska under studien) Nackdelar 1. Ger ingen komplett beskrivning av sjukdomens utveckling med tiden 2. Bygger på register ifråga om tidigare exponering, vilket försvårar validering av informationen 3. Val av jämförelsegrupp kan ibland vara svår och kostbar 4. Kontroll av externa variabler kan vara inkomplett 5. Sjukdomsrater för exponerade respektive oexponerade individer kan inte bestämmas Antal kontroller per fall: 1:1 eller r:1? Antal kontroller per fall, r, kan variera mellan strata eller vara konstant. Endast det senare fallet diskuteras i det följande. Antalet kontroller per fall beror förstås på kostnaden för att hitta och undersöka kontroller och precisionen vid undersökning av fall och kontroller. Låg precision ifråga om mätning av kontroller gör att fler kontroller behövs. Det visar sig ofta i praktiken att det är meningslöst med r>5, se avsnittet Matchning senare i kapitlet. Det vanligaste valet är r=1 men det finns ingen anledning att alltid välja detta värde. Antal kontroller måste alltid väljas med hänsyn till den aktuella situationen och att alltid välja r=1 kan anses som en dålig vana.

© FÖRFATTARNA OCH STUDENTLITTERATUR

45


Randomiserade eller ”historiska” kontroller? Låt oss betrakta en klinisk studie som är designad helt enkelt för att studera om en ny behandling är bättre än standardbehandlingen. Det normala i detta fall är att randomisera, ofta med en eller två kontroller per fall och att jämföra de två grupperna. Emellertid vill en del läkare ge alla fallen den nya behandlingen och jämföra dem med tidigare, ”liknande” patienter. Problemet är uppenbart: vad betyder ”liknande” i sammanhanget? Det kan mycket väl vara systematiska differenser mellan de gamla observationerna och de nya beroende på ändrade rutiner av olika slag, skillnader mellan läkare, omedveten eller medveten selektionsbias – uteslutnng av några patienter som är sjukare än andra eller som är äldre än de övriga kan göra stor skillnad i undersökningens resultat. Det är i de flesta fall klokt att randomisera om inte undersökningen ses enbart som en pilotundersökning. Fördelen med ”historiska” kontroller är att randomisering, som kan vara svårt att förklara för patienten, speciellt ur etisk synpunkt, undviks och gruppen som får den nya behandlingen är större än den hade varit annars, eftersom de nu även inkluderar de individer som skulle ha varit kontroller. Kontrollerna är också fler, eftersom det ofta är lätt att få tag i långa serier av historiska kontroller. En rimlig kompromiss för någon som vill genomföra en större studie med användning av enbart historiska kontroller är att randomisera i proportionerna 2:1, om inte den nya behandlingen kan misstänkas vara så mycket bättre så att randomisering skulle vara oetiskt. Två tredjedelar av individerna är då tillgängliga för jämförelse med de historiska kontroller man väljer, medan de som endast tror på resultat från randomiserade studier har en nästan lika bra randomiserad studie som om den mer vanliga 1:1-allokeringen hade använts. Mer om fall-kontrollstudier kan man läsa i t.ex. Breslow & Day (1980a), Greenland & Rothman (1998) och Armenian (2009).

Design En av de viktigaste uppgifterna när en klinisk undersökning planeras är att konstruera någon slumpmässig allokeringsprocedur för att eliminera risken att personer med t.ex. en viss ålder, kön, eller interkurrent sjukdom har större sannolikhet än genomsnittspatienten att få en viss behandling. Sådana fel i allokeringsprocessen kan påverka resultaten och göra att studien blir helt missvisande. Blindstudier är också en viktig fråga. Den idealiska situationen är när en dubbel-blind studie kan utföras , dvs när varken läkaren eller patienten vet vilken behandling som ges. Detta är inte alltid möjligt att utföra. Ofta är dock blind allokering möjlig, dvs patienten är omedveten om vilken behandling han

46

© FÖRFATTARNA OCH STUDENTLITTERATUR


får. Ett alternativ är att behandlingsresultatet utvärderas av en annan läkare som inte känner till vilken behandling som har getts. Etiska problem är viktiga att diskutera i början av studien, både på grund av dess principiella betydelse som på grund av att man ofta behöver godkännande av en etisk kommitté innan studien får genomförs. Oftast kan statistisk metodologi användas för att minimera kostnaden vid ett givet krav på precision eller att maximera precisionen vid en given kostnad. Vi skall ge några exempel hur detta går till senare i denna bok, men ofta är det lämpligt att konsultera en professionell statistiker. Utgiften för detta är ofta liten i jämförelse vad man kan spara både ekonomiskt och arbetsmässigt genom att lägga upp studien på ett effektivt och korrekt sätt. Detta har ju också etiska fördelar eftersom man troligen kommer att behöva färre patienter. Vilket mått på sjukligheten man än använder är det viktigt att notera inte bara hur många patienter som dör eller insjuknar utan även att notera så exakt som möjligt när detta inträffar. Speciellt när det gäller kroniska sjukdomar när tiden från början av studien till insjuknande eller död är relativt lång ger denna tidsvariabel viktig information. Information från livslängdsdata diskuteras utförligt i Kapitel 4-8. Den generella principen ifråga om informationsinsamling är att samla in så mycket information som möjligt i början av studien, bara absolut nödvändiga data senare i studien och att analysera data mycket noggrant. Många problem senare i studien kan undvikas om designen görs korrekt – lämpligen i samarbete med en professionell statistiker. Nedan följer en översikt över lämpliga frågor att ställa i planeringsstadiet. Vad är det huvudsakliga syftet med studien? Är studien explorativ, bekräftande eller förklarande (analytisk)? De statistiska metoderna som bör användas är olika beroende på studiens syfte och vi rekommenderar att en professionell statistiker konsulteras på ett tidigt stadium. Hur mycket information måste samlas in för studium av överlevnaden? Vi föreslår att åtminstone följande information samlas in för varje patient:

1. Kön 2. Födelsedatum © FÖRFATTARNA OCH STUDENTLITTERATUR

47


3. Datum för första livshändelsen 4. Datum för senaste uppföljning (för död om patienten dött) 5. Status vid senaste uppföljning (död eller levande) 6. Dödsorsak (om tillgänglig) Följande klassificering är ofta lämplig. 1. Levande utan återfall i sjukdomen 2. Levande med återfall i sjukdomen 3. Levande, återfall okänt 4. Död utan återfall i sjukdomen 5. Död med återfall i sjukdomen 6. Död, återfall okänt. 7. Lost to follow up utan återfall i sjukdomen 8. Lost to follow up med återfall i sjukdomen 9. Lost to follow up, återfall okänt Kombinerad behandling (ev. cross-overs)

Ej inkluderad

Inkluderad. Randomisering (Intention to treat.)

48

Analys av noncompliers

Ej behandlad Behandlad

Endast en behandling

Analyserad

© FÖRFATTARNA OCH STUDENTLITTERATUR


Hur många patienter behövs? Detta är en av de viktigaste frågorna, såväl ur effektivitetssynpunkt som ur etisk synpunkt. Generellt gäller att ju mindre skillnad mellan två grupper man vill kunna detektera, desto fler patienter behövs. Frågan behandlas utförligt i Kapitel 10. Hur lång måste insamlings- och uppföljningstiden vara? Även denna fråga diskuteras i Kapitel 10, men vi kan redan nu påpeka att en lång insamlingstid kan göra att den totala tiden för studien kortas av väsentligt. Exklusion, loss to follow-up och andra bortfall Rigorös uppföljning är nödvändig för att få rättvisande resultat. Varje patient som inte får den avsedda behandlingen behöver inte dras bort ur studien. För en viss patient har kanske läkaren en viss behandling som han föredrar. Om denna preferens är stark, dvs läkaren anser att han vet vad som är bäst för patienten, så skall inte patienten tas med i en randomiserad studie från början, bland annat av etiska skäl. I protokollet för en klinisk studie bör också ingå instruktioner om vad man skall göra med patienter som förmodligen inte klarar av någon av behandlingarna, patienter vars sjukdom kan förväntas ta en ovanlig vändning, patienter som bor långt från sjukhuset så att behandlingen kan bli svårare, patienter som kan förväntas försvåra samarbetet etc. Vi rekommenderar också att endast inkludera patienter som troligen kommer att besöka samma sjukhus under hela sjukdomstiden. I en klinisk studie räknar man med tre kategorier av patienter som inte kommer med i studien (”missing patients”): 1) 2) 3)

De som exkluderas innan randomiseringen. De som randomiseras, men sedan avsiktligt exkluderas som om de aldrig hade randomiserats. De som oavsiktligt förlorats under uppföljningen och vars data endast kan inkluderas i den statistiska analysen till det datum då de försvinner ur studien.

Sporadiska förluster och patienter som avsiktligt dras bort ur studien kan ge ett systematiskt fel (bias) och under designstadiet bör detta diskuteras igenom noggrant. Det föreslås ibland att om det blir en avsevärd avvikelse från den planerade behandlingen skall patienten ifråga inte inkluderas i den slutliga

© FÖRFATTARNA OCH STUDENTLITTERATUR

49


jämförelsen av behandlingar eller bara vara med tills avvikelsen uppstår. Detta är fel. Den grupp som avviker från ett protokoll och den som avviker från ett annat kan skilja sig så mycket åt ifråga om överlevnad så att exkludering av dessa grupper allvarligt snedvrider analysen av de återstående patienterna. Det enda fall där avvikande patienter kan påverka slutsatserna är när de är väsentligt fler i en grupp än i en annan och skiljer sig väsentligt ifråga om överlevnadstid från dem som följer protokollet, men då skall de förstås uteslutas. Å andra sidan är det ett allvarligt fel att exkludera från den statistiska analysen något dödsfall i den behandlade gruppen som ägt rum efter randomiseringen men innan behandlingen, medan alla obehandlade kontroller behålls. Den säkraste tumregeln är att alltid lämna kvar alla randomiserade patienter i studien eftersom det i en stor studie ger någon större skillnad i resultaten endast om det finns en skillnad mellan andelen exkluderade i olika grupper som är så stor så att det antyder att det var olämpligt att de inkluderades. Definitionen av tid i studien är viktig. Överlevnad i en klinisk studie mäts från det datum som randomiseringen skedde, inte från den dag som symtomen visade sig eller starten av behandlingen. Med denna regel kommer alltså tidiga dödsfall innan behandlingsstart att inkluderas i analysen. Tiden i studien varar tills patientens död eller – om patienten inte dör under studien, till det datum då studien avslutas. Om patienten förloras, t.ex. för att han flyttar, så avslutas tiden i studien den dag patienten förloras.

Confounding och interaktion I många sammanhang förvrängs inflytandet av en riskfaktor på utfallet genom inverkan av någon bakgrundsfaktor. Denna förvrängning uppstår när följande två villkor är uppfyllda: 1) Riskgrupperna skiljer sig åt med avseende på värdet på bakgrundvariabeln, men differensen är inte en direkt följd av skillnaden på riskfaktorns värde. 2) Bakgrundsfaktorn inverkar på utfallet. Bakgrundsfaktorer som uppfyller de två villkoren ovan kallas confoundingfaktorer eller förväxlingsfaktorer. På detta sätt kan det verka som det finns ett beroende mellan en riskfaktor och utfallet medan sambandet i själva verket orsakas av att missat att kompensera för bakgrundsfaktorn. Anta t.ex. att man tycker sig se ett samband mellan kaffekonsumtion och lungcancer: personer som dricker mer än fem koppar kaffe per dag har

50

© FÖRFATTARNA OCH STUDENTLITTERATUR


väsentligt högre risk att få lungcancer än de personer som inte dricker kaffe alls. Confoundingfaktorn är här rökning. De som dricker mest kaffe röker oftare än de som inte dricker kaffe alls! En confoundingfaktors samband med en sjukdom kan vara en kausal eller en ickekausal effekt som beror på confoundingfaktorns samband med andra faktorer än exposition för riskfaktorn. Dessutom måste en confoundingfaktors samband med utfallet måste kunna påvisas vid frånvaro av riskfaktorn. Det kan finnas olika grader av confounding – frågan är inte bara om man har confounding eller inte. Effektmodifiering skiljer sig från confounding trots att termerna ofta används nästan synonymt. Confounding är ett systematiskt fel som kan uppträda i en studie medan effektmodifiering är det verkliga biologiska fenomenet att effekten av exponering skiljer sig åt mellan olika strata. Ofta används ordet interaktion istället för effektmodifiering.

effekt Stratum 1

Stratum 2

dos Figur 3.1. Effektmodifiering. När den gemensamma effekten av två riskfaktorer är större än den förväntade effekten talar man om synergism, i motsatt fall om antagonism. När något av dessa fenomen uppträder talar man om interaktion. Problemet är att man kan mena olika saker med ”den förväntade effekten”. Ett sätt att beskriva faktorernas sammanlagda effekt är att den additiva modellen där den förväntade effekten är summan av de förväntade effekten. Ett annat sätt är att använda en multiplikativ modell, dvs den sammanlagda effekten är produkten av de enskilda effekterna.

© FÖRFATTARNA OCH STUDENTLITTERATUR

51


När det finns mer än en confoundingfaktor är situationen mer komplex. En orsak är att confoundingfaktorerna kan bero på varandra på ett okänt sätt. Beroende confoundingfaktorer diskuteras inte i denna bok.

Matchning När två grupper jämförs är det angeläget att de liknar varandra ifråga om alla variabler som kan påverka utfallet utom den faktor som studeras. Med andra ord, den studerade gruppen (indexgruppen) och referensgruppen skall vara så lika varandra som möjligt med avseende på confoundingfaktorer. Matchning är en procedur där man för varje individ i den studerade gruppen parar ihop denna med en eller flera i en kontrollgrupp som har liknande karakteristika som den studerade gruppen. I en fall-kontrollstudie består indexgruppen av individer som har en viss sjukdom, medan referensgruppen består av friska individer. I en kohortstudie består indexgruppen av individer som är exponerade för en viss riskfaktor medan referensgruppen består av de oexponerade. Matchning är en metod för att kontrollera för confoundingfaktorer redan i designstadiet, i kontrast till metoder som regression, se Kapitel 5, 6 och 7, som kontrollerar för confoundingfaktorer i analysstadiet. Om valet av kontrollindivider görs från ett register och faktorn man matchar på är t.ex. ålder, är det möjligt att matchningen i realiteten också inkluderar andra faktorer på grund av korrelationer i registret. Två individer med samma ålder listade efter varandra i registret har ofta likheter, t.ex. första bokstaven i efternamnet. Detta ger en (okänd) grad av ”social” matchning. Om kontrollerna väljs på detta sätt har inte alla individer i en viss ålder samma chans att vara med. Detta kallas ibland dold matchning. Matchningsschemat är olika för matchning på kontinuerliga variabler (t.ex. ålder) och matchning på diskreta (kategoriska) variabler (t.ex. kön). Kontinuerliga variabler kategoriseras ofta för att förenkla analysen eller av andra orsaker, se Kapitel 5, 6 och 7, och vi skall därför fokusera diskussionen på matchning på kategoriska variabler. För fullständighetens skull ger vi dock några råd angående matchning på kontinuerliga variabler. Matchning på närmaste granne Två personer matchas genom att man hittar den kontroll som ifråga om vissa egenskaper ligger närmast det aktuella fallet. Resultatet av närmaste-granne-

52

© FÖRFATTARNA OCH STUDENTLITTERATUR


matchning (nearest-neighbour matching) beror uppenbarligen på ordningsföljden mellan individerna, se Exempel 3.2 nedan. Det finns tre versioner: 1) Fallen rankas efter värdet på confoundingvariabeln från den högsta till den lägsta (HL-ranking) 2) Rankning från den lägsta till den högsta (LH-ranking) 3) Slumpmässig ordning Slumpmässig ordning är ofta en rimlig kompromiss. Med denna metod ordas de N fallen slumpmässigt och vi betecknar de ordnade värdena på confoundingvariabeln med X 11 , ... , X 1N . Vi startar med X 11 och definierar en matchad kontroll som den kontroll vars värde X 01 är närmast X 11 . Om det finns flera värden som har samma avstånd till X 11 väljs kontrollen slumpmässigt bland dessa. -----------------------------------------------------------------------------------------------------------Exempel 3.2. Vi studerar en situation då vi har en grupp fall som består av män som är 37, 42 respektive 47 år gamla. Kontrollgruppen består av män i åldrarna 32, 33, 40, 45 respektive 54 år. HL-ranking ger att fallet som är 47 år matchas med kontrollen som är 45 år, fallet som är 42 år matchas med kontrollen som är 40 och fallet som är 37 matchas med kontrollen som är 33. LH-ranking ger 37-40, 42-45 och 47-54. Anta att den slumpmässiga ordningen i gruppen fall är 47, 37 och 42. Vi får då 47-45, 37-40 och 42-22. -----------------------------------------------------------------------------------------------------------Reduktionen av bias beror starkt på antalet kontroller, se Cochran & Rubin (1973). Detta är naturligt eftersom större antal möjliga kontroller innebär en större chans att hitta en match. Med hjälp av simulering fann Cochran & Rubin att om kvoten mellan variansen för fall och kontroller är 1 medan kvoten mellan antalet kontroller och fall är 2, 3 respek-tive 4 reducerades biasen med 69, 84 respektive 89%. Stratifierad matchning I många fall är confoundingvariabeln i grunden kategorisk (alltså inte en kategoriserad kontinuerlig variabel) Ibland är den dock kontinuerlig men har kategoriserats. Rökare kan till exempel dels in i de tre grupperna (strata) rökare som röker högst 10 cigaretter per dag, 11-20 eller mer än 20 per dag. I varje stratum formas slumpmässigt matchade par. Denna metod, stratified matching, är alltså ett mellanting mellan slumpmässig matchning och verklig kategorimatchning. Man kan visa att skattningen av oddskvoten från stratifierade matchade stickprov har större medelkvadratfel och i vissa fall även större bias än en skattning som

© FÖRFATTARNA OCH STUDENTLITTERATUR

53


bygger på slumpmässig matchning. De stora medelkvadratfelen beror på att det inte alltid finns kontroller till alla fall. Frekvensmatchning I parmatchning formas individuella matchade par. Ett annat sätt att matcha är att inte individ till individ utan grupp till grupp, s.k. frequency matching. Fallen delas in i strata och jämförelseobjekten letas upp så att antalet fall och kontroller är samma i varje stratum. Man har studerat reduktionen i bias med denna metod, se bl.a. Cochran & Rubin (1973). Förutsättningarna är att fördelningarna av värden från fall- respektive kontrollgruppen båda är normalfördelade och med samma varians. Med två strata med samma antal individer reducerades bias med 69% och med tre strata av samma storlek blev reduktionen 79%. Cochran (1968) visade att skillnaden mellan biasreduktion med frekvensmatchning och med stratifiering är försumbar, men föredrog frekvensmatchning eftersom man då får mer precisa skattningar i små stickprov. Kategorimatchning Kategorimatchning (category matching) är en bred term som betecknar att fall och kontroll tillhör samma kategori i vid mening. Kategoriindelningen är bestämd från början i motsats till t.ex. matchning på närmaste granne. Ett esempel är fixa ålders-grupper, t.ex. så att ett fall i åldern 60-64 år matchas med en kontroll i samma åldersgrupp. Att matcha eller inte matcha Matchning kan leda till en effektiv justering för potentiella confoundingeffekter från många faktorer som kan vara svåra att kontrollera för på något annat sätt. Ofta är den matematiska formen på sambandet mellan confoundingvariabeln och den undersökta variabeln okänd. Det kan t.ex. vara svårt att veta om sambandet är linjärt eller inte. Sådana svårigheter gör det problematiskt att inkludera confoundingvariabeln som en term i t.ex. en regressionsanalys. Dessutom är matchning ett bekvämt sätt att eleiminiera variabeln ifråga – inga komplicerade beräkningar och test av olika modeller är nödvändiga. Matchning är ibland den uppenbara metoden eftersom den sparar tid och pengar. När fallen i en fall-kontrollstudie väljs från medicinska register på olika sjukhus eller inom olika företag är det lämpligt att välja kontrollerna från samma sjukhus respektive företag som kontrollerna. Matchning vid valet av referensgrupp med avseende på ett antal givna confoundingfaktorer medger att man senare, under analysfasen, kontrollerar för andra confoundingfaktorer, t.ex. med logistisk regression, se Kapitel 6. Att kategorimatcha en referensgrupp och en indexgrupp

54

© FÖRFATTARNA OCH STUDENTLITTERATUR


Claes Jogréus är universitetslektor i matematisk statistik vid Blekinge Tekniska Högskola och har mångårig erfarenhet som statistisk konsult, främst inom medicin och vårdvetenskap. Håkan Olsson är professor i onkologi och chef för cancerepidemiologiska enheten, bägge vid medicinska fakulteten, Lunds Universitet, samt överläkare vid Skånes Universitetssjukhus och har många års erfarenhet av cancerepidemiologisk forskning.

LONGITUDINELLA STUDIER OCH ÖVERLEVNADSDATA EN INTRODUKTION FÖR KLINIKERN Analys av medicinska data fram till en viss tidpunkt – död eller insjuknande – har blivit allt viktigare, t.ex. vid studier av cancer och hjärt- och kärlsjukdom. Moderna programpaket erbjuder möjlighet till avancerade analyser, men kräver ofta mycket tid att sätta sig in i. Huvudvikten i den statistiska framställningen ligger på logistisk regression, Coxanalys och angränsande områden. Den röda tråden i boken är behovet av att designa en studie med omsorg och ställa de rätta frågorna. Exemplen illustreras ofta med exempel på hur de kan genomföras i något programpaket, främst SPSS. Syftet med denna introduktion är att erbjuda dels en guide för den kliniskt verksamme läkaren och annan kvalificerad vårdpersonal och dels material till grundkurser inom ämnet, både för läkare och statistiker. Den grundar sig på författarnas långa praktiska erfarenhet av kliniska studier och är skriven för att vara ett stöd inom planering och genomförande av en klinisk studie. För att läsa den behövs bara de allra enklaste begreppen inom statistik som p-värden, chitvåtest och normalfördelning.

Art.nr 39033

www.studentlitteratur.se


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.