9789144104270

Page 1

Introduktion till

medicinsk statistik

Johan Bring Adam Taube Per Wikman


Omslagsbild: Florence Nightingale (1820–1910) var inte enbart en pionjär som sjuksköterska utan verkade även mycket aktivt för att relevanta sjukvårdsdata skulle samlas in och utnyttjas för att förbättra verksamheten. Under Krimkriget (1854–1856) presenterade hon data som visade att bland soldaterna var antalet dödsfall i sjukdomar betydligt vanligare än dödsfall orsakade av själva striderna. Omslagsbilden återger ett diagram av Nightingales hand där storleken av de kilformiga ytorna för varje månad är proportionella mot antalet dödsfall. Ytorna närmast centrum representerar dödsfall på grund av krigiska blessyrer, de mörkare ytorna därnäst visar dödsfall av andra orsaker och de stora yttre fälten dödsfall i sjukdomar som skulle kunna ha förhindrats eller botats.

Kopieringsförbud Detta verk är skyddat av upphovsrättslagen. Kopiering, utöver lärares och studenters begränsade rätt att kopiera för undervisningsändamål enligt Bonus Copyright Access kopieringsavtal är förbjuden. För information om avtalet hänvisas till utbildningsanordnarens huvudman eller Bonus Copyright Access. Vid utgivning av detta verk som e-bok, är e-boken kopieringsskyddad. Den som bryter mot lagen om upphovsrätt kan åtalas av allmän åklagare och dömas till böter eller fängelse i upp till två år samt bli skyldig att erlägga ersättning till upphovsman eller rättsinnehavare. Studentlitteratur har både digital och traditionell bok­utgivning. Studentlitteraturs trycksaker är miljöanpassade, både när det gäller papper och tryckprocess.

Art.nr 31898 ISBN 978-91-44-10427-0 Upplaga 2:1 © Författarna och Studentlitteratur 2006, 2015 www.studentlitteratur.se Studentlitteratur AB, Lund Omslagslayout: Francisco Ortega Printed by Holmbergs i Malmö AB, Sweden 2015


INNEHÅLL

Förord till denna andra utökade upplaga  7 1 Inledning  9

1.1 1.2

Några historiska notiser  10 Den statistiska metodläran  14

2 Statistisk deskription  17

2.1 Variabler 17 2.2 Centralmått 21 2.3 Spridningsmått 27 2.4 Diagram 33 Övningsuppgifter   41 3 Introduktion till R  49

3.1 3.2 3.3 3.4 3.5 3.6 3.7

Varför R?  50 Installera R  50 Grundläggande operationer  50 Dataset 52 Hjälp 55 Funktioner 55 Inläsning av data  56

©  F ö r fa t t a r na och S t ud e n t li t t e r a t u r

3


Innehåll

4 Något om sannolikheter  61

4.1 Några enkla sannolikhetsregler  61 4.2 Fördelningar 65 4.3 Binomialfördelningen 66 4.4 Normalfördelningen 71 Övningsuppgifter 76 5 Speciella mått  81

5.1 Prevalens och incidens  81 5.2 Sensitivitet och specificitet  82 5.3 ROC-kurva 88 5.4 Relativ risk, oddskvot  91 Övningsuppgifter   94 6 Statistisk inferens: grundbulten  97

6.1 Samplingfördelningen 97 Övningsuppgifter 103 7 Konfidensintervall  105

7.1 Från prediktion till inferens  106 7.2 Konfidensintervall för proportioner   108 7.3 Konfidensintervall för medelvärden  113 7.4 Konfidensintervall för oddskvot  115 7.5 Bootstrap 116 Övningsuppgifter 120 8 Hypotesprövning  127

8.1 Stegen i hypotesprövning  127 8.2 Hypotesprövning avseende medelvärden  132 8.3 Ett icke-parametriskt alternativ: Mann–Whitney  135 8.4 Analys av korstabeller  137 8.5 Multipla test  143 Övningsuppgifter 146 4

©  F ö r fa t t a r na och S t ud e n t li t t e r a t u r


Innehåll

9 Korrelation och regression  151

9.1 Korrelation 151 9.2 Ett icke-parametriskt alternativ: Spearmans rangkorrelation 154 9.3 Regression 155 Övningsuppgifter   168 10 Hur många observationer behövs?  177

10.1 Konfidensintervallsansats 178 10.2 Hypotesprövningsansats 179 Övningsuppgifter 184 11 Att analysera överensstämmelse  187

11.1 Kappa-analys 187 11.2 Hypotesprövning kontra konfidensintervall  192 11.3 Bland–Altman-diagram 194 Övningsuppgifter 196 12 Analys av överlevnadsdata  199

12.1 Datas grundstruktur – ett enkelt räkneexempel  200 12.2 Presentation av överlevnadsdata  204 12.3 Snedvridande censurering  206 Övningsuppgifter 206 13 Bayesiansk statistik  209

Appendix 213 Facit till övningsuppgifter  221 Sakregister 231

©  F ö r fa t t a r na och S t ud e n t li t t e r a t u r

5



KAPITEL 2

Statistisk deskription

2.1

Variabler

Ett centralt begrepp inom statistiken är variabel. En variabel är en storhet som varierar från individ till individ och med andra ord kan anta olika värden. Exempel på variabler är längd, vikt, blodtryck, diagnos, muskelstyrka, Hb och yrke. Variabler kan klassificeras på olika sätt. En intuitiv förklaring till några klassificeringar av variabler följer nedan. Kvantitativa variabler antar numeriska värden – till exempel ålder och vikt. Kvalitativa variabler antar ej numeriska värden – till exempel diagnos, åsikter och kön. Kontinuerliga variabler kan anta alla tänkbara värden i ett visst intervall – till exempel blodtryck och vikt. Diskreta variabler kan anta distinkta värden i ett visst intervall – till exempel antal barn, kön och antal prickar på en tärning. Variabler kan även delas in efter olika skalnivåer. Variabler vars observationer kan placeras in i olika kategorier – till exempel kön, diagnos och län – är mätta på en nominalskala. Observationer som kan rangordnas – till exempel skolbetyg, attitydskalor och cancerstadium (till exempel I, II, III, IV) – finns på en ordinalskala. Observationer vars avstånd är jämförbara – till exempel temperatur där en ökning från 10 till 20 grader är en lika stor ökning som från 20 till 30 grader – är mätta på en intervallskala. Observationer som har en absolut nollpunkt – till exempel ålder, vikt och blodtryck – mäts på en kvotskala. Som namnet antyder är det möjligt att bilda meningsfulla kvoter

©  F ö r fa t t a r na och S t ud e n t li t t e r a t u r

17


2  Statistisk deskription

på en kvotskala. Om vi bildar kvoten mellan en vikt på 6 kg och en vikt på 3 kg erhålls kvoten 2. Det innebär att den första vikten är dubbelt så stor som den andra. Att bilda kvoter på en ordinalskala – till exempel av variabeln cancerstadium – är inte meningsfullt. En variabels skalnivå påverkar vilka statistiska analyser och mått som är lämpliga. För att kunna välja korrekt statistikmetod är det därför viktigt att känna till de olika skalnivåerna. För att göra de matematiska framställningarna enklare används inom statistiken symboler för att representera olika variabler. Vanligt är att välja bokstaven x för att beskriva en variabel. Vi kan till exempel definiera x = ålder. Tabell 2.1  Exempel på en variabel. Individ

Ålder (x) år

Vincent

23

Gabriel

28

Mustafa

23

Astrid

19

Annika

30

Vi kommer att använda detta symbolspråk i den fortsatta framställningen. En vanligt förekommande mätmetod i medicinska studier är att använda sig av VAS-skalan (visuell analog skala). Vid studier av smärta kan en fråga se ut som i figur 2.1. Svaren avläses genom att mäta hur många millimeter från vänster som krysset sitter. Det är ofta problematiskt att statistiskt analysera den typen av data på grund av svårigheter med skalnivån. Det är lätt att vilseledas och tro att variabeln är mätt på kvotskala eftersom svaret anges i millimeter (längd är mätt på kvotskala). Svaret ska dock mäta patientens smärta och då blir

Hur vill du beskriva din smärta under den senaste timmen? Sätt ett kryss på linjen. Ingen smärta

Outhärdlig smärta

Figur 2.1  Exempel på VAS-skala för smärta.

18

©  F ö r fa t t a r na och S t ud e n t li t t e r a t u r


2  Statistisk deskription

kvoter inte meningsfulla; att någon svarat vid till exempel 40 mm innebär inte att den har dubbelt så ont som den som svarade vid 20 mm. VAS-skalan brukar betraktas som ordinal vad avser jämförelser inom individen, det vill säga när samma patient svarat vid flera tillfällen. Det är dock inte självklart att villkoren för en ordinalskala är uppfyllda när man jämför svar från olika patienter. En patient som svarat 40 mm behöver inte ha mer smärta jämfört med en annan patient som svarat 30 mm. Smärta är ett bra exempel på de svårigheter man kan stöta på när man vill representera något medicinsk tillstånd med hjälp av en siffra. Vid medicinska studier är det viktigt att noga fundera över variablernas definitioner för att få en god förståelse för vad det är som egentligen mäts. Anta att vi vill studera en behandling mot munsår. Hur ska patientens hälsa mätas i detta avseende? Vi kan till exempel be patienten att på en VAS-skala markera graden av obehag. Vi kan mäta hur många dagar patienten har haft sitt munsår. Det kanske är möjligt att mäta storleken på såret i kvadratmillimeter? Vid kliniska prövningar krävs oftast att man har en primär effektvariabel (eng. primary endpoint). Det är då ofta svårt att välja vilken som är mest relevant. Det är viktigt att även fundera över hur variabeln ska hanteras statistiskt. Det vi förmodligen vill mäta är patientens hälsa eller välbefinnande. Men hur är välbefinnandet relaterat till till exempel läkningstid av munsåret? I figur 2.2 belyses tre hypotetiska samband. Den räta linjen i mitten illustrerar det fall där välbefinnandet är linjärt relaterat till antalet läkningsdagar. Den prickade linjen indikerar att välbefinnandet sjunker snabbt i början för att sedan plana ut. Den streckade linjen indikerar att en kort läkningstid inte är några större problem för patienten men om såret blir kvar flera dagar så sjunker välbefinnandet. Det som mäts är läkningstid men det vi kanske vill uttala oss om är patientens välbefinnande eller hälsa. Det är därför viktigt att förstå sambandet mellan den variabel som vi mäter (till exempel läkningstid) och den aspekt som vi egentligen vill uttala oss om (till exempel välbefinnande). Mätningsteori är en disciplin som studerar just dessa frågor. Ett fundamentalt begrepp inom statistiken är parameter, i statistisk litteratur ofta betecknat med grekiska bokstäver (se figur 1.1). En parameter är en konstant som antar ett värde till skillnad från en variabel där värdet varierar från individ till individ. Exempel på parametrar är: a) genomsnittsåldern i ©  F ö r fa t t a r na och S t ud e n t li t t e r a t u r

19


2  Statistisk deskription

Välbefinnande

Bra

Dåligt 2

4

6

8

10

12

14

Läkningstid (dagar)

Figur 2.2  Hypotetiska samband mellan läkningstid av munsår och välbefinnande.

Sverige (en beskrivning av en population), b) sannolikheten för krona vid kast med ett mynt (en beskrivning av en sannolikhetsfördelning), c) regressionskoefficienten för vikt som funktion av längd (en beskrivning av ett samband mellan två variabler). Förståelsen för skillnad mellan variabler och parametrar kommer förhoppningsvis att öka i samband med att de används längre fram i boken. Inom vissa naturvetenskapliga tillämpningsområden får dessvärre ofta termen parameter beteckna en variabel. För en fysiker kan alltså temperatur vara en parameter. För en statistiker är temperatur en variabel. BYN WOLENCOMI NORR OM ADDIS ABEBA

Följande exempel kommer att användas i flera kommande kapitel. Data kommer från ett nutritionsinstitut i Etiopien. Det gäller en grupp om trettio hushåll i den lilla byn Wolencomi nordväst om Addis Abeba. För dessa hushåll hade man dels vissa grunddata om ”antal hushållsmedlemmar” (z), dels noteringar om genomsnittligt kaloriintag per hushåll och dag under en viss vecka – ”verkligt intag” (y). Vidare hade man på grundval av hus20

©  F ö r fa t t a r na och S t ud e n t li t t e r a t u r


2  Statistisk deskription

hållsmedlemmarnas antal, ålder och kön räknat ut hur många kalorier varje hushåll borde ha konsumerat per dag – ”rekommenderat intag” (x). Eftersom de flesta invånarna i byn var fattiga hade många hushåll inte fått tillgång till så många kalorier som de skulle ha behövt. I centrum för intresset stod därför helt naturligt skillnaden mellan verkligt intag och rekommenderat intag. De data som ska användas här presenteras som en lista i tabell 2.2. Eftersom variabeln z endast kan anta vissa bestämda värden, i det här fallet heltal, är den en diskret variabel som dessutom är mätt på kvotskala. Variablerna verkligt intag (y) och rekommenderat intag (x) är mätta på kvotskala och kontinuerliga i den meningen att de i princip kan anta vilket värde som helst inom ett visst intervall. Ett variabelvärde kan också kallas en observation. Det observationsmaterial från Wolencomi som vi utnyttjat här var insamlat vid ett speciellt tillfälle och kan därför kallas tvärsnittsdata. Om de trettio hushållen sedan skulle följas upp exempelvis över olika årstider för att följa utvecklingen över tid så genereras longitudinella data. 2.2

Centralmått

En av statistikens viktiga uppgifter är att kunna sammanfatta stora datamängder på ett enkelt och begripligt sätt. Det kan göras med hjälp av olika mått, tabeller eller diagram. Centralmått anger en punkt på talaxeln kring vilken observationerna är centrerade. Här presenteras de tre vanligaste centralmåtten – medelvärde, median och typvärde. Medelvärdet (genomsnitt) beräknas med formeln (2.1)

där i anger observationsnummer och n = antalet observationer.

©  F ö r fa t t a r na och S t ud e n t li t t e r a t u r

21


2  Statistisk deskription Tabell 2.2  Grunddata för 30 hushåll i byn Wolencomi. Hushåll Antal hushållsmedlemmar (z)

Rekommenderat kaloriintag (x)

Faktiskt kaloriintag (y)

1

6

14 660

6 790

2

9

22 830

13 460

3

5

14 940

4 560

4

7

16 430

8 530

5

4

10 980

7 260

6

7

15 960

16 910

7

3

8 200

7 560

8

8

21 260

19 140

9

6

11 960

15 300

10

7

17 230

9 810

11

5

11 360

8 480

12

10

24 460

19 300

13

10

24 180

24 300

14

7

15 180

16 170

15

10

26 940

28 800

16

12

31 930

18 650

17

4

8 970

8 540

18

9

23 000

12 130

19

3

7 500

8 570

20

10

26 090

22 130

21

6

14 280

15 870

22

5

11 890

11 710

23

4

10 700

22 340

24

5

10 960

7 730

25

6

13 760

26 340

26

21

50 990

24 320

27

11

26 710

20 690

28

4

9 440

4 520

29

12

27 930

24 450

30

6

14 810

13 130

22

©  F ö r fa t t a r na och S t ud e n t li t t e r a t u r


2  Statistisk deskription

Anta att vi mätt kolesterolvärdet för fem personer. Tabell 2.3  Exempel på data avseende kolesterolhalt. Individ

Kolesterol (mmol/L)

Vincent

4,2

Gabriel

4,3

Mustafa

4,7

Astrid

8,7

Annika

4,9

Medelvärdet blir då mmol/L >mean(x)

#beräkning av medelvärde med programvaran R

Medianen är det mittersta värdet när vi rangordnat observationerna i storleksordning. Om det är ett jämnt antal värden brukar medianen anges som medelvärdet av de två mittersta observationerna. I exemplet blir median­värdet 4,7. >median(x)

#beräkning av median

Typvärdet är det mest förekommande värdet. Det är sällan ett lämpligt mått i de fall man har kontinuerliga variabler som i tabell 2.3. Vilket mått som är lämpligast att använda beror bland annat på vilken skalnivå en variabel är mätt på. Är det en variabel som mäts på en nominal­ skala så kan varken median eller medelvärde beräknas. Då kan vi endast använda oss av typvärdet. För kontinuerliga variabler på intervall- eller kvotskala kan både median och medelvärde vara lämpliga. För typvärde och median finns inga enkla matematiska formler som för medelvärdet. Av samma skäl är programmatisk beräkning av typvärde inte lika trivial som övriga centralmått, det låter sig inte göras på en rad. I tabell 2.3 blev medelvärdet 5,4 mmol/L och medianen 4,7 mmol/L. Här ©  F ö r fa t t a r na och S t ud e n t li t t e r a t u r

23


2  Statistisk deskription

kan medianen vara ett mer representativt mått jämfört med medelvärdet. I situationer där det finns enstaka avvikande observationer brukar man ofta föredra att använda medianen som centralmått. Medelvärdet har å sin sida en fördel i att det utnyttjar mer information i datamaterialet (alla observationers värden ingår i formeln för beräkning av ett medelvärde). Det är gängse att i de statistiska läroböckerna presentera dessa alternativa mått just som centralmått. Det betyder inte att de mäter samma sak, utan de svarar egentligen på olika frågor beträffande materialet. Betrakta till exempel en inkomstfördelning för en viss grupp personer. Vilken inkomst är sådan att hälften av personerna har en lägre och hälften en högre inkomst? Svar: Medianinkomsten. Vilken inkomst är vanligast (har högst frekvens)? Svar: Typinkomsten. Om gruppens totala inkomst skulle delas lika mellan alla inkomsttagare, vad skulle då deras inkomst bli? Svar: Medelinkomsten. Det kan noteras att det finns ytterligare möjliga centralmått. I stället för att addera n stycken observationsvärden och sedan dela med n (aritmetiska genomsnittet) är det möjligt att multiplicera samtliga observationsvärden och sedan dra n:te roten ur produkten. Detta ger det geometriska medel­ värdet, som kommer till användning i vissa speciella sammanhang, till exempel farmakologi, men inte berörs vidare i denna bok.

(2.2)

>exp(mean(log(x)))

(Det kan dock observeras att logaritmen för det geometriska genomsnittet svarar mot det aritmetiska medelvärdet av observationernas logaritmer, ett faktum vi utnyttjat i kodexemplet här. ) I bland gäller det i statistiskt arbete att hantera vägda medelvärden. Grund­ idén kan illustreras med följande exempel: Anta att man har tre dunkar med alkohol, innehållande 2, 4 och 6 liter. Alkoholkoncentrationerna i respektive dunk är 30 procent, 20 procent respektive 50 procent. Vilken koncentration skulle erhållas om allt innehåll blandades i en och samma dunk? Den totala mängden alkohol blir då 2 · 0,3 + 4 · 0,2 + 6 · 0,5 = 4,4 och den totala mängden vätska 12 liter. Koncentrationen blir alltså 4,4/12 = 0,37 (37 procent). I denna 24

©  F ö r fa t t a r na och S t ud e n t li t t e r a t u r


2  Statistisk deskription

procedur har de enskilda koncentrationerna vägts samman med respektive volym vätska. Formellt skrivs ett vägt medelvärde som (2.3) >(2*0.3+4*0.2+6*0.5)/(2+4+6)

Det är inte fel att räkna ett ”ovägt” medelvärde men detta besvarar en annan fråga. Medelvärdet av koncentrationerna blir i det aktuella exemplet (30+20+50)/3 = 33 procent, vilket mäter den genomsnittliga koncentrationen per dunk. WOLENCOMI

Vi återvänder till exemplet med data från byn Wolencomi. Om det är önskvärt att ge något sammanfattande mått, en enda siffra, på hur stora de aktuella hushållen är så är ett alternativ att ange typvärdet. För att hitta typvärdet sammanställs data från tabell 2.2 i en frekvenstabell, se tabell 2.4. Typvärdet blir i detta fall z = 6, det vill säga det z-värde som har den högsta frekvensen. Det skulle emellertid lätt ha kunnat inträffa att flera variabelvärden haft lika höga frekvenser. Då hade inte ett entydigt typvärde kunnat anges. Ett annat alternativ är att leta upp medianen. Vi sorterar då alla de trettio värdena i storleksordning (kallas även rangordning) och sedan anges ett värde som delar upp materialet i två likstora delar: 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 6, 6, 6, 6, 6, M, 7, 7, 7, 7, 8, 9, 9, 10, 10, 10, 10, 11, 12, 12, 21 medianvärde I detta fall råkade det finnas ett jämnt antal observationsvärden. Vi får då ta medelvärdet mellan de två mittersta värdena vilket ger 6,5. Det viktigaste sammanfattande måttet erhålls emellertid genom att först räkna ut det sammanlagda antalet hushållsmedlemmar i de trettio hushållen, här 222 personer, och sedan dividera antalet medlemmar med antalet hushåll (n, här 30). Man får då det genomsnittliga antalet personer per hushåll, det vill

©  F ö r fa t t a r na och S t ud e n t li t t e r a t u r

25


2  Statistisk deskription Tabell 2.4  Frekvenstabell för antalet hushållsmedlemmar. Antal hushållsmedlemmar (z)

Andel hushåll (%) (relativ frekvens)

Kumulativ procent

3

2

6,7

6,7

4

4

13,3

20,0

5

4

13,3

33,3

6

5

16,7

50,0

7

4

13,3

63,3

8

1

3,3

66,6

9

2

6,7

73,3

10

4

13,3

86,6

11

1

3,3

89,9

12

2

6,7

96,6

13

0

0,0

96,6

14

0

0,0

96,6

15

0

0,0

96,6

16

0

0,0

96,6

17

0

0,0

96,6

18

0

0,0

96,6

19

0

0,0

96,6

20

0

0,0

96,6

21

1

3,3

99,9

Totalt

26

Antal hushåll (absolut frekvens)

30

100

©  F ö r fa t t a r na och S t ud e n t li t t e r a t u r


2  Statistisk deskription

säga medelvärdet som här blir z = 222/30 = 7,4. När det talas om ” medel­värdet” så är det, om inget annat anges, det aritmetiska medelvärdet som avses. Vilket mått som ska väljas när ett material ska presenteras beror ytterst på vilka frågor som ska besvaras. Först kan konstateras att i 21 av 30 hushåll når den aktuella konsumtionen inte upp till det rekommenderade intaget. Läkaren eller nutritionisten som vill skaffa sig en uppfattning om hur stor kaloribrist de studerade individerna i Wolencomi är utsatta för, kan till exempel beräkna differenserna d = y – x vilket ger ”brist per hushåll” eller till exempel kvoterna k = y/x. Kvoterna beskriver hur stor andel av det rekommenderade intaget som respektive hushåll verkligen konsumerar. Anta att vi sedan beräknar medelvärdet av kvoterna:

Detta ger då genomsnittlig brist (i procent) per hushåll. I en sådan beräkning får alla hushåll lika stor vikt oavsett hushållets storlek. Vill vi ha ett mått där större hushåll får större vikt kan vi beräkna ett vägt medelvärde.

Som vikter kan man lämpligen använda antalet hushållsmedlemmar eller rekommenderat kaloriintag. Det rekommenderade kaloriintaget är ett indirekt mått på hushållets storlek, men tar även hänsyn till hushållsmedlemmarnas ålder och kön. Om vi använder antalet hushållsmedlemmar som vikt får vi ett mått som mäter den procentuella kaloribristen per individ i stället för per hushåll, vilket det oviktade medelvärdet svarade på. 2.3

Spridningsmått

Det är i regel viktigt att känna till vilken variation det finns i ett datamaterial. I tabell 2.5 har män och kvinnor samma medelvärde (51,4) och medianvärde (51) avseende en viss hormonhalt. Ändå är olikheten stor mellan grupperna. Den beskrivs lämpligen med hjälp av något spridningsmått, till exempel variationsvidd, eller standardavvikelse. ©  F ö r fa t t a r na och S t ud e n t li t t e r a t u r

27


2  Statistisk deskription Tabell 2.5  Hormonhalten, plasma PTH (ng/L), hos 11 män och 11 kvinnor. Män

Kvinnor

45

32

56

45

52

55

51

65

49

37

48

81

50

52

52

41

54

45

48

61

60

51

Variationsvidden anger avståndet mellan den lägsta och högsta observationen. För kvinnorna i tabell 2.5 blir variationsvidden 81 – 32 = 49. >max(x)-min(x)

Standardavvikelsen anger (ungefär) den genomsnittliga avvikelsen från medelvärdet. Standardavvikelsen beräknas enligt följande formel: (2.4) >sd(x)

För kvinnorna i tabell 2.5 är medelvärdet 51,4 och standardavvikelsen blir:

28

©  F ö r fa t t a r na och S t ud e n t li t t e r a t u r


2  Statistisk deskription

Om vi beräknar spridningsmåtten för data i tabell 2.5 så erhålls följande resultat: Tabell 2.6  Exempel på deskriptiva mått baserat på materialet i tabell 2.5 (ng/L). Män

Kvinnor

Medelvärde

51,4

51,4

Median

51,0

51,0

Variationsvidd

15,0

49,0

4,2

13,9

Standardavvikelse

Vi ser här att spridningsmåtten mycket väl avspeglar att grupperna inte har samma spridning. Ett vanligt sätt att presentera grunddata till en undersökning redovisas i tabell 2.7. Varje medelvärde åtföljs av ± standardavvikelse. Sättet har dock kritiserats och vanligare är att skriva x (SD) i stället för x ± SD, eftersom intervallet som den senare notationen leder till inte har någon meningsfull tolkning för de flesta läsare.

Tabell 2.7  Exempel på presentation av deskriptiv statistik i en klinisk prövning. Källa: Tallstedt et al. New England Journal of Medicine, 326, 1734 (1992).

©  F ö r fa t t a r na och S t ud e n t li t t e r a t u r

29


2  Statistisk deskription

Kvartilavståndet anger avståndet mellan den första och tredje kvartilen. För att förstå kvartilavståndet så måste vi börja med att definiera kvartilerna. Man utgår då ifrån att observationerna ordnats i storleksordning. De tre kvartilerna q1, q2 och q3 anger de tre värden som delar in materialet i fyra lika stora grupper. q1 motsvarar det värde där 25 procent av observationerna är mindre än q1 och 75 procent är större än q1 . q2 motsvarar det värde där 50 procent av observationerna är mindre än q2 och 50 procent är större än q2 . q2 är samma värde som medianen. q3 motsvarar det värde där 75 procent av observationerna är mindre än q3 och 25 procent är större än q3. Kvartil­ avståndet definieras som avståndet mellan q1 och q3. Intervallet mellan q1 och q3 omfattar alltså halva observationsmängden. Som spridningsmått anges ibland kvartilavvikelse (quartile deviation), vilket är (q3 – q1)/2. Olika läroböcker och datorprogram använder sig av något olika metoder för att beräkna kvartiler. Det innebär att resultatet kan bli något olika beroende på val av programvara. Ett enkelt sätt att beräkna q1 och q3 är dock att beräkna q1 som medianen i den nedre halvan av materialet och q3 som medianen i den övre halvan av materialet (när data är sorterade i storleksordning). Om det är ett udda antal observationer ska den mittersta observationen ingå i både den nedre och den övre halvan av materialet. Exempel: I tabell 2.8 finns data för dos av levodopa för 10 patienter med Parkinsons sjukdom. Beräkna de tre kvartilerna samt kvartilavståndet. Tabell 2.8  Data för 10 patienters dos av levodopa. Patient Levodopa [mg/dag]

A

B

550

750

C

D

E

1 500 1 450 1 000

F

G

H

I

J

700

850

1 350

600

300

Tabell 2.9  Observationerna sorterade i storleksordning. J

A

I

F

B

G

E

H

D

C

300

550

600

700

750

850

1 000

1 350

1 450

1 500

q1

q2 = 800

q3

>quantile(x, 0.25) #1:a kvartil >quantile(x, 0.5) #median >quantile(x, 0.75) #3:e kvartil

30

©  F ö r fa t t a r na och S t ud e n t li t t e r a t u r


2  Statistisk deskription

Kvartilavståndet = 1 350 – 600 = 750 Varians är ett annat spridningsmått som ofta förekommer i statistiskt arbete. Variansen är standardavvikelsen i kvadrat. Variansen används sällan som ett rent deskriptivt mått i den medicinska litteraturen, men är en viktig storhet i statistisk teori. Ytterligare ett spridningsmått är variationskoefficienten (CV) (eng. coeffi­ cient of variation) som ofta kommer till användning i medicinskt-statistiska sammanhang. Inte sällan gäller det upprepade mätningar av samma prov. Det kan till exempel handla om att jämföra mätnoggrannheten mellan olika laboratoriemetoder. Koefficienten beräknas enligt följande formel: (2.5) >(sd(x)/mean(x))*100

Om standardavvikelsen i mätningarna blir större ju större medelvärdet är, kan detta vara ett lämpligt mått. Om SD är densamma oavsett nivån på medelvärdet, blir CV givetvis stor om medelvärdet är nära noll och allt mindre ju större x är. Extremvärden (outliers)

Vid analys av data kan det ibland dyka upp enstaka avvikande observationer, det vill säga observationer som ligger (för sig själva) långt bort från de flesta övriga. Dessa observationer kallas för extremvärden (outliers). Det finns ingen universell metod för att avgöra om en observation ska betraktas som avvikande eller ej. Statistikern John Tukey föreslog följande kriterium: En observation (x) ska betraktas som avvikande om

eller

(2.6)

>x>quantile(x,0.75)+1.5* (quantile(x, 0.75) - quantile(x, 0.25))

©  F ö r fa t t a r na och S t ud e n t li t t e r a t u r

31


2  Statistisk deskription

det vill säga om observationen ligger mer än 1,5 kvartilavstånd högre än tredje kvartilen eller mer än 1,5 kvartilavstånd lägre än första kvartilen. För de tio Parkinsonpatienterna erhölls följande kvartiler avseende deras levodopadoser: q1 = 600, q2 = 800, q3 = 1350. Gränserna för avvikande observationer blir därför som följer:

eller

Av värdena i tabell 2.8 framgår att ingen patients levodopados är avvikande från de övriga enligt dessa kriterier. Det finns inga generella regler för hur extrema observationer ska hanteras. Ett vanligt förfaringssätt är att göra beräkningarna både med och utan extremvärdena för att se i vad mån de påverkar slutresultaten. Vi kommer senare även att stöta på icke-parametriska metoder som baseras på observa­ tionernas rangordning i stället för de faktiska mätvärdena. Med de metoderna minskas inflytandet av extrema observationer. WOLENCOMI

Vi återvänder till vår etiopiska by för att besvara frågan: Hur varierar antalet hushållsmedlemmar bland de trettio studerade hushållen? Den enklaste (och grövsta) ansatsen är att ange det största och det minsta förekommande variabelvärdet, det vill säga z = 21 och z = 3 och beräkna differensen (variationsvidden), det vill säga 21 – 3 = 18. Det bör dock observeras att värdet kan påverkas starkt av en extrem observation. Det största hushållet, som onekligen ligger långt från de övriga, ger variationsvidden ett extra stort värde. Detta mått säger därför i det aktuella exemplet inte särskilt mycket om hela fördelningen för z-variabeln. Genom att rangordna alla observationer är det lätt att få fram kvartilvärden: 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 6, 6, 6, 6, 6, M, 7, 7, 7, 7, 8, 9, 9, 10, 10, 10, 10,11, 12, 12, 21 q1 = 5 q2 = 6,5 q3 = 10

32

©  F ö r fa t t a r na och S t ud e n t li t t e r a t u r


2  Statistisk deskription

Skillnaden mellan den övre (q3) och den nedre kvartilen (q1) ger kvartil­ avstånd, här 10 – 5 = 5. Denna storhet anger alltså bredden av det intervall på vilket de mittersta femtio procenten av materialet är placerade. Sedan erhålls kvartilavvikelsen som (10 – 5)/2 = 2,5. Lika väl som att dela upp materialet i fyra likstora delar är det möjligt att göra uppdelningar med andra så kallade fraktiler, till exempel söka upp de nio värden, deciler, som delar materialet i tio likstora delar eller de nittionio värden, percentiler, som delar upp materialet i hundra likstora delar. Det viktigaste spridningsmåttet är emellertid standardavvikelsen, som är mycket användbar i den statistiska analysen. För de trettio hushållen erhålls:

När det i allmänna ordalag talas om spridningen för en variabel så är det för det mesta standardavvikelsen som avses. Detta viktiga mått återkommer ofta i denna bok. Här får det räcka att understryka dels att ju mer utspridda observationerna är på talaxeln desto större blir SD, dels att om alla observationer har samma värde, det vill säga att det inte finns någon variation, så är SD = 0. För det mesta gäller att variationsvidden är av storleksordningen 4 SD. Det aritmetiska medelvärdet, variansen och standardavvikelsen är viktiga byggstenar i de metoder för statistisk inferens som presenteras längre fram i boken. 2.4

Diagram

Att använda diagram ger goda möjligheter att på ett pedagogiskt sätt förmedla viktig information. Vi ska här gå igenom diagrammet boxplot (lådagram) som är mycket användbart. I figur 2.3 illustreras de olika komponenterna i en boxplot. Strecket mitt i lådan anger medianvärdet. Övre och undre gräns av lådan motsvarar 3:e och 1:a kvartil. Höjden på lådan motsvarar följaktligen kvartilavståndet och blir en visuell presentation av spridningen i materialet. Strecken utifrån lådan ritas till högsta respektive lägsta observation, som inte är en avvikande observation (eng. outlier). De flesta datorprogram använder Tukeys kriterium för att avgöra om en observation ska betraktas som

©  F ö r fa t t a r na och S t ud e n t li t t e r a t u r

33


2  Statistisk deskription

avvikande eller ej (se kapitel 2.3). Notera dock att det ibland förekommer andra definitioner för hur en boxplot ritas, till exempel är det inte ovanligt att linjerna dras ut till den 95:e och 5:e percentilen i stället för till lägsta och högsta värde. Boxplot är även ett lämpligt diagram för att jämföra grupper eller följa en viss grupp över tiden. I diagrammet i figur 2.4 jämförs mäns och kvinnors hormonvärden från tabell 2.5. Av diagrammet framgår att de svarta strecken mitt i respektive låda (som visar medianvärden) har samma läge. Vi ser även tydligt att kvinnornas låda är betydligt större än männens. Det beror på den större spridningen bland kvinnorna, se tabell 2.6. I respektive grupp finns det en individ som avviker från de övriga i gruppen. Dessa individers observationsnummer är även utritade, nr 11 och nr 6. I nästa avsnitt får vi fler exempel på boxplots och exempel på andra typer av diagram.

* *

Extremvärden

Största (ej extrema)

3:e kvartil

Median

1:a kvartil

Figur 2.3  Komponenter i en boxplot. Minsta (ej extrema)

34

>boxplot(x)

©  F ö r fa t t a r na och S t ud e n t li t t e r a t u r



Johan Bring har ansvarat för ett flertal kurser inom medicinsk statistik inom både universitetsvärlden och åt läkemedelsindustrin. Han har arbetat med medicinska tillämpningar i FN i New York samt vid Regionalt Onkologiskt Centrum i Uppsala. Som konsult i företaget Statisticon AB bistår han i dag forskare och läkemedelsindustri med statistisk analys och planering av medicinska studier. Han är på deltid även knuten till Högskolan i Gävle som adjungerad professor. Professor Adam Taube har sedan slutet av 1950-talet ansvarat för ett stort antal kurser och för forskarutbildning i medicinsk statistik vid Uppsala Universitet. Åren 1972–75 arbetade han för UNESCO som professor i statistik vid universitetet i Addis Abeba och 1989–97 upprätthöll han en forskartjänst vid Cancerfonden med inriktning på medicinsk statistik. Per Wikman är statistiker med särskild inriktning mot medicinsk statistik och kliniska prövningar. Han har erfarenhet som lärare från bl.a. forskarutbildningskursen i statistik på medicinska fakulteten vid Uppsala universitet. Expert på programspråket R.

Introduktion till medicinsk statistik Den här boken ger grundläggande kunskaper inom medicinsk statistik, kunskaper som är väsentliga för såväl den egna forskningen som kritisk granskning av andras resultat. Tanken med boken är inte att göra läsaren till statistiker utan att läsaren ska få en bättre förståelse för de grundläggande principerna inom statistiken och på så sätt framför allt bättre kunna tillgodogöra sig vetenskaplig litteratur. Denna andra upplaga har bland annat utökats med avsnitt om Bayesiansk statistik, logistisk regression och en introduktion till den statistiska programvaran R. Antalet formler är med avsikt begränsat. Till varje kapitel ges övningsuppgifter för att befästa viktiga begrepp och metoder. Boken lämpar sig för grundkurser i medicinsk statistik inom läkarutbildningen, apotekarprogrammet, sjukgymnastutbildningen och liknande utbildningar och den täcker många olika områden inom statistiken.

Andra upplagan Art.nr 31898

www.studentlitteratur.se


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.