9789147143801 by Smakprov Media AB

Praktisk statistik för medicin och hälsa

Upplaga 3

ISBN 978-91-47-14380-1

Förläggare: Kristina Iritz Hedberg

Projektledare: Annika Sandström

Redaktör: Lisa Grafström

Formgivning: Fredrik Elvander

Ombrytning: Exaktaprinting AB

Omslagsbild: Fredrik Elvander (Shutterstock)

Illustrationer: Monica Schmidt, Exaktaprinting: 1.1, 1.2, 1.5, 1.6, 2.1, 2.2, 3.1, 3.4, 3.6, 4.1, 4.2, 4.3, 4.6, 5.2-5.8, 6.2-6.6, 7.1, 7.3, 7.4, 8.1-8.5, 9.1, 9.3, 10.1, 10.2, 11.1, 12.1-12.10, 12.12, 13.2, 13.6-13.8, 14.3, 15.1, 15.4-15.7

Jonny Hallberg, 1.3, 1.4, 2.3, 3.2, 3.3, 3.5, 4.4, 4.5, 5.1, 6.1, 7.2, 8.6-8.8, 9.2, 9.4, 11.2, 12.11, 12.13, 12.14, 12.15, 13.1, 13.3-13.5, 13.9-13.12, 14.1, 14.2, 14.4, 15.2, 15.3 15.8

Produktionsledare: Lars Wallin

Tredje upplagan 1

Repro: Integra Software Services, Indien Tryck: People Printing, Kina 2024

Kopieringsförbud

Detta verk är skyddat av upphovsrättslagen. Kopiering, utöver lärares och elevers begränsade rätt att kopiera för undervisningsbruk enligt

BONUS-avtal, är förbjuden. BONUS-avtal tecknas mellan upphovsrättsorganisationer och huvudman för utbildningsanordnare, t.ex. kommuner och universitet.

Intrång i upphovsmannens rättigheter enligt upphovsrättslagen kan medföra straff (böter eller fängelse), skadestånd och beslag/förstöring av olovligt framställt material. Såväl analog som digital kopiering regleras i BONUS-avtalet. Läs mer på www.bonuscopyright.se.

Liber AB, 113 98 Stockholm

Kundservice tfn 08-690 90 00 kundservice.liber@liber.se www.liber.se

Innehållsförteckning

Förord 9

1. Vad är statistik? 11

1.1

Grundläggande begrepp 11

Deskriptiv och analytisk statistik 13

Mål- och studiepopulation 14

Urval och statistisk osäkerhet 15

Systematiska fel 17

Generaliserbarhet och transporterbarhet 19

1.2 Att planera ett forskningsprojekt 20

Forskningsplan från ax till limpa 20

Olika typer av undersökningar 22

Dimensioneringsberäkning 27

Etiska överväganden 30

* Formulering av enkätfrågor 32

1.3 Genomförandet 34

Insamling och hantering av data 34

Statistisk analys 35

Val av statistisk metod 36

* Systematiska översikter och metaanalyser 37

Rapportering 38

Tillgängliggörande och arkivering 40

Sammanfattning 42

Övningsuppgifter 43

2. Organisera insamlade data 45

2.1 Variabler 45

Pseudonymisering 45

Bakgrund, behandling och utfall 46

Kvantitativa och kategoriska variabler 48

Binära variabler 50

Tid till händelse 50

Beräknade variabler och kategoriseringar 50

2.2 Skalnivåer 52

Nominalskala 52

Ordinalskala 52

Intervallskala 53

Kvotskala 55

2.3 Inmatning av data 55

Inmatning i kalkylprogram 56

Kodning av binära och andra kategoriska variabler 57

Kodning av saknade värden 58

* Datatablåer för upprepade mätningar 59

Sammanfattning 61

Övningsuppgifter 62

3. Deskriptiv statistik 64

3.1 Flödesschema för deltagande 65

3.2 Redovisning av kvantitativa variabler 66

Genomsnittsmått 67

Histogram 70

Fördelningskurvor 72

* Log-transformationer och geometriskt medelvärde 73

Spridningsmått 75

* Variationskoefficient – spridning och mätosäkerhet i procent av medelvärdet 78

Min–max, kvartiler och percentiler 79

Uteliggare och extremvärden 82

Lådagram (box plot) – illustrera skillnader i median och kvartiler 84

Värdesiffror och avrundning 85

3.3 Redovisning av kategoriska variabler 86

Tabeller och stapeldiagram 86

Kategorisering av kvantitativa variabler 91

Sammanfattning 91

Övningsuppgifter 93

4. Räkna med slumpen 94

4.1 Slumpmässighet 94

Slumpsituation 95

Vad uttrycker sannolikheten? 95

Relativa frekvenser – empiriska sannolikheter 96

4.2 Räkneregler för sannolikheter 98

Ömsesidigt uteslutande händelser 98

Oberoende händelser 99

Oberoende variabler, observationer och grupper 101

Betingade sannolikheter 102

Subjektiva sannolikheter 106

Oddset för en händelse 106

4.3 Binomialfördelningen 109

Binomialfördelningens utseende 111

Sammanfattning 113

Övningsuppgifter 114

5. Normalfördelningen och referensintervall 116

5.1 Grundläggande egenskaper hos normalfördelningen 116

Vad kan vara normalfördelat? 120

Standardisering av normalfördelade variabler 123

Normalfördelningstabell 124

Varför är normalfördelningen så användbar? 127

5.2 Referensintervall 128

Referensintervall för normalfördelade målpopulationer 128

Percentilmetoden – referensintervall för snedfördelade målpopulationer 129

* Referensintervall med hjälp av log-normalfördelningen 131

Ta hänsyn till mätosäkerheten när provsvar bedöms 133

Sammanfattning 135

Övningsuppgifter 136

6. Konfidensintervall – statistisk felmarginal 137

6.1 Centrala gränsvärdessatsen 138

6.2 Medelfel – uppskattningens standardavvikelse 141

* Från medelfel till konfidensintervall 142

6.3

Konfidensintervall för medelvärden i stora undersökningar 145

Konfidensgrad och felrisk – vad menas med ”95 % säkerhet”? 146

Systematiska fel 147

Hur stor ska undersökningen vara för att felmarginalen ska bli liten? 148

6.4

Konfidensintervall för medelvärden i små undersökningar 149

t-fördelningen 151

Frihetsgrader 152

I hur små grupper vågar man använda t-fördelningen? 154

6.5 Konfidensintervall för andelar 155

* Andelen positiva utfall är normalfördelad i stora undersökningar 156

Beräkningsformel för andelar i stora undersökningar 157

Sammanfattning 159

Övningsuppgifter 160

7. Pröva hypoteser med statistiska test 162

7.1

Formulering av hypoteser 164

Parametriska och icke-parametriska test 164

Nollhypotes och alternativhypotes 165

Signifikansgränsen anger risken för falskt positivt fynd 165

7.2

Testa hypoteser om ett medelvärde 167

Testutfallet kan avgöras med hjälp av konfidensintervall 167

P-värdet för t-test av ett medelvärde 168

I vilka situationer kan t-test av ett medelvärde användas? 171

Signifikanta och icke-signifikanta resultat behöver inte vara väsensskilda 172

7.3

Testa hypoteser om en andel 173

Binomialtest 173

Sammanfattning 175

Övningsuppgifter 176

8. Medelvärdesjämförelser 178

8.1 Två oberoende grupper 179

Konfidensintervall för differensen mellan två oberoende medelvärden 180

Vanligt t-test för två oberoende grupper 182

* Upprepade mätningar per individ 186

8.2 Parade mätningar 187

Konfidensintervall för differensen mellan två beroende medelvärden 187

Parat t-test 189

Hur ska data se ut för att parat t-test ska kunna användas? 191

* Att jämföra skillnader i förhållande till utgångsläget 192

8.3

Dimensioneringsberäkningar 193

Dimensionering utifrån statistisk styrka 193

Dimensionering utifrån statistisk precision 197

* Dimensionering om utfallet är snedfördelat 199

8.4 Variansanalys – utvidgning till fler än två oberoende grupper 200

Sammanfattning 203

Övningsuppgifter 204

9. Binära utfall och data i korstabeller 206

9.1 Två oberoende grupper 207

2 × 2-korstabell 207

Riskdifferens – absolut riskreduktion 208

* Antal som behöver behandlas 211

Relativ risk och relativ riskreduktion 212

Oddskvot 214

* Vaccineffektivitet 217

Chitvå-test i 2 × 2-korstabeller 218

Frihetsgrader hos en korstabell 220

Chitvå-fördelningen 222

9.2 Parade mätningar 223

Konfidensintervall för differensen mellan två beroende andelar 224

McNemars exakta test 226

9.3 Dimensioneringsberäkningar 227

Dimensionering utifrån statistisk styrka 227

Dimensionering utifrån statistisk precision 230

9.4 Testa samband i korstabeller större än 2 × 2 231

Sammanfattning 233

Övningsuppgifter 234

10. Medianjämförelser 236

10.1 Medianvärdet i en undersökningsgrupp 237

* Medianen blir inte normalfördelad ens i en stor undersökning 237

Icke-parametriska metoder bygger på att utfallen kan rangordnas 238

Konfidensintervall för medianvärden 239

Teckentest – pröva hypoteser om ett medianvärde 241

10.2 Två oberoende grupper 243

Mediandifferensen mellan två oberoende grupper 243

Mann–Whitneys test 244

10.3 Parade mätningar 247

Konfidensintervall för medianvärdet av parade differenser 247

Wilcoxons teckenrangtest 250

10.4 Dimensioneringsberäkningar 251

10.5 Kruskal–Wallis test – utvidgning till fler än två oberoende grupper 253

Sammanfattning 256

Övningsuppgifter 257

11. Rapportering och tolkning av p-värden 259

11.1 Rapportering av p-värden 259

P-värde eller konfidensintervall? 259

Tumregler för p-värdesrapportering 260

11.2 Tolkning av p-värden 261

P-värdet är inte sannolikheten att nollhypotesen är sann 263

A posteriori-sannolikheter 264

Att förkasta eller inte förkasta är sällan frågan 268

11.3 Multipla test 269

P-värdeskorrektion enligt Bonferroni 271

* Hochbergs metod 272

Prioriterad teststrategi 274

Sammanfattning 276

Övningsuppgifter 277

12. Korrelation och regression 279

12.1

Sambandsanalyser 280

Deskriptiv, förklarande eller prediktiv analys 280

Beroende och oberoende variabler 281

Kategoriska oberoende variabler 281

Spridningsdiagram 283

Pearsons korrelationskoefficient 284

Fallgropar vid tolkning av korrelationskoefficienter 288

Spearmans rangkorrelationskoefficient 290

12.2 Enkel linjär regression 292

Regressionsparametrar – skärningspunkt och lutning 293

Vilken linje beskriver insamlade data bäst? 293

Residualer – individuella avvikelser från regressionslinjen 296

Konfidensintervall och p-värde för skärningspunkt och lutning 298

När bör man använda linjär regressionsanalys? 299

12.3 Multipel linjär regression 301

Flervariabelanalys 301

Orsaksdiagram 302

Tolkning av regressionsparametrarna 303

Justera för förväxlingsfel i gruppjämförelser 306

12.4 Logistisk regression 313

Sammanfattning 317

Övningsuppgifter 318

13. Epidemiologisk metodik 320

13.1 Tvärsnittsundersökningar 322

Prevalensjämförelser 322

Upprepade tvärsnittsurval 324

13.2 Kohortuppföljningar 325

Sjukdomsrisk – incidensandel 326

Sjukdomsfrekvens – incidens 328

* Poisson-regression 332

13.3 Överlevnadsanalys 336

Överlevnadskurvor (Kaplan–Meier) 336

Hasardkvoter och logranktest 341

* Cox-regression 345

13.4 Dynamiska populationer 349

Sjukdomsrisk – kumulativ incidens 352

Förväntad livslängd (medellivslängd) 354

* Överdödlighet 356

13.5 Fall–kontrollundersökningar 357

Oddskvot – samband mellan exponering och utfall 358

Val av kontroller 362

Sammanfattning 364

Övningsuppgifter 365

14. Diagnostiska test 367

14.1 Sensitivitet, specificitet och prediktiva värden 368

Indextest och referenstest 368

Diagnostisk träffsäkerhet – sensitivitet och specificitet 368

Prediktiva (diagnostiska) värden 370

Likelihoodkvoter 373

* Diagnostiska test med fler än två möjliga testresultat 376

14.2 Avvägning mellan hög sensitivitet och hög specificitet 378

ROC-kurva – illustrera klassificeringsförmågan vid olika tröskelvärden 380

Arean under ROC-kurvan mäter klassificeringsförmågan 382

14.3 Jämförelser av diagnostiska test 383

Oberoende grupper 383

Parade mätningar 385

Sammanfattning 388

Övningsuppgifter 389

15. Överensstämmelse 391

15.1 Samband och överensstämmelse 392

15.2 Överensstämmelse mellan kvantitativa variabler 395

Bland–Altmandiagram 395

Samstämmighetsintervall 397

15.3 Överensstämmelse mellan kategoriska variabler 401

Kappa – hur mycket bättre är överensstämmelsen än slumpen? 403

Tolkning av kappa 405

Konfidensintervall för uppskattad överensstämmelse 406

Svagheter hos kappa 407

Sammanfattning 408

Övningsuppgifter 409

Referenser 411

Länkar 416

* Markerar fördjupningsavsnitt som bidrar till ökad förståelse, men som inte är nödvändiga för sammanhanget.

Förord

Lärobok och praktisk handbok

Statistik har en central roll i forskning som rör medicin och hälsa. Kunskaper i statistik är avgörande för att kunna planera och genomföra forskningsprojekt, men också för att kritiskt granska egna och andras forskningsresultat. Boken ger en praktiskt inriktad introduktion till statistikämnet och är lämplig som lärobok på utbildningar på såväl grundnivå som avancerad nivå inom medicin, vårdvetenskap, epidemiologi och folkhälsovetenskap. Boken är även en utmärkt handbok för yrkesverksamma och forskare inom dessa områden. Inga förkunskaper i ämnet krävs. Den som har läst statistik tidigare kan emellertid använda boken som en introduktion till tankesätt och principer som är specifika för statistik inom medicin och hälsa.

Nyheter i den här upplagan

Boken har samma grundstruktur och genomtänkta upplägg som tidigare upplagor och som rönt stor uppskattning hos många läsare. I den nya upplagan har statistiska metoder för binära utfall fått en större och mer framträdande plats än tidigare. Kapitlet om korrelation och regression har utvidgats med en utförlig introduktion till logistisk regression, som är en användbar modell för binära utfall. Kapitlet om epidemiologisk metodik har också utvidgats, bland annat med en introduktion till Cox-regression. Även den är en modell för binära utfall, men som tar hänsyn till tidpunkterna då utfallen inträffar. Nytt är också att varje kapitel avslutas med övningsuppgifter. Totalt innehåller boken fler än 250 övningsuppgifter av varierande svårighetsgrad.

Boken har många beröringspunkter med och referenser till epidemiologiboken Praktisk epidemiologi för medicin, vård och folkhälsa. Dessa båda böcker kan därför med fördel användas parallellt i undervisningen.

Problemorienterad framställning

Bokens pedagogiska idé skiljer sig markant från liknande läroböcker inom ämnet. I bokens många exempel sätts de praktiska tillämpningarna snarare än den matematiska teorin i centrum. Exemplen är avgränsade med gröna ramar för att särskilja från den övriga texten. Framställningen i boken är problemorienterad, dvs. först presenteras en frågeställning och därefter de statistiska verktyg som behövs för att besvara frågan. Vanliga statistiska begrepp introduceras ofta både på svenska (markerade i fetstil) och engelska (kursiverade) Det gör orden lätta att hitta i texten, exempelvis med hjälp av bokens omfattande register.

Arbetsbok

Datamaterial

Statistiska begrepp och metoder presenteras överskådligt i separata fakta- och formelrutor. Alla beräkningar avslutas med det som är svårast, men också mest spännande med statistik, nämligen att försöka förstå vad resultatet innebär. Mycket stor vikt läggs vid redovisning och tolkning av undersökningsresultat.

Den tydliga uppdelningen i beräkning och tolkning av resultat gör boken möjlig att läsa på olika nivåer. Den som så önskar kan lägga mindre tonvikt vid formelrutor och beräkningsdetaljer vid en första genomläsning och i stället koncentrera sig på resultattolkningen, dvs. slutsatserna av de statistiska analyserna.

Boken är fylld av praktiska rekommendationer kring hur data inom medicin och hälsa bäst bör analyseras, redovisas och tolkas. Rekommendationerna presenteras ofta i separata rutor med rubriken Tänkvärt. Viktiga landvinningar och spännande kuriosa i utvecklingen av statistik till en vetenskaplig disciplin presenteras med rubriken Historik. Fördjupningsavsnitt markerade med * bidrar till ökad förståelse men kan hoppas över utan att sammanhanget går förlorat. I texten ges under rubriken Lästips! förslag på fördjupad läsning inom olika tillämpningsområden. De finns också samlade i referenslistan i slutet av boken.

Statistiska fördelningar

FAKTA FORMEL TÄNKVÄRT HISTORIK LÄSTIPS!

Bokens hemsida

Det är en sedan länge en självklarhet att statistiska beräkningar görs med datorprogram. Trots detta bör man ha lite kunskap om hur ett statistiskt ana lysresultat växer fram. Flertalet av beräkningarna som redovisas i boken kan enkelt utföras med hjälp av färdiga Microsoft Excel-arbetsböcker som finns på liber.se (sök på bokens titel). I forskningsprojekt som kräver mer avancerad statistisk analys bör alltid en erfaren statistiker involveras och man behöver också tillgång till ett statistikprogrampaket såsom STATA, R eller SPSS. Framställningen i boken är emellertid inte knuten till någon bestämd programvara. På liber.se finns även ett stort antal datamaterial för nedladdning som används i bokens exempel och övningsuppgifter. Dessutom finns facit till ett urval av övningsuppgifterna, ett flödesschema för deltagande i kliniska undersökningar samt tabeller över vanliga statistiska fördelningar.

Det är min uttalade ambition att alla som arbetar med, utbildar sig inom, eller har intresse av medicin, epidemiologi, vård- eller folkhälsovetenskap ska kunna ha nytta och glädje av bokens innehåll. Välkommen att läsa och arbeta vidare med boken!

Jonas Björk, Lund, juni 2024

A

ABO-systemet 48, 98, 100 absolut risk, se risk akut koronart syndrom 103 alternativhypotes 165, 264 analytisk statistik 14 antal som behöver behandlas, se NNT antikroppar 16, 157, 239, 243, 324 antropometriska mått 72, 120 arkivering 40 avrundning 85 avvikande värde 36, 69, 82, 192, 290

B

baslinjedata 66

Bayes teorem 105, 108, 266, 375 Bayes, Thomas 105 bayesiansk statistik 105, 106, 271 bedömningsinstrument 401 beroende händelse 99

statistiskt 101, 186, 187, 224, 274 bias, se systematisk avvikelse, systematiskt fel binomialfördelningen 109, 112, 174, 226 binomialtest 173, 241 biobanksprov 361 bivariabelanalys 279, 321 blodtryck 186, 200, 283, 294 bly 13, 132

BMI (body mass index) 51, 76, 80, 91, 130, 283, 286, 294, 327 Bonferroni-korrektion 271 bortfall 65 partiellt 87, 341 bröstcancer 207, 208, 337

cancer i urinblåsan 359

Cardano, Gerolamo 94

CB-138 se PCB

CB-153, se PCB censurering 330, 336 centrala gränsvärdessatsen 127, 138, 155

chitvå-fördelning 222, 231, 233, 244 chitvå-test 218, 221, 231, 343 common cause, se gemensam orsaksfaktor confounder, se förväxlingsfaktor confounding, se förväxlingsfel covid-19 173, 175, 217, 314 cross over-undersökning 192

D

DAG (directed acyclic graph), se orsaksdiagram datadelning 41 datatablå 46, 55, 59, 338 D-dimertest 368, 371, 374, 378 deskriptiv analys 14, 26, 280, 322 deskriptiv statistik 13, 64 diabetes 350, 352 diagnostikundersökning 26, 40, 104, 322, 367 diagnostiskt test 367 diagnostiskt värde, se prediktivt värde dikotom variabel, se variabel, binär dimensioneringsberäkning 27, 149, 193, 199, 251 statistisk precision 29, 149, 197, 228 statistisk styrka 193, 227, 253, 298 dubbelblindning 24, 192, 217 dubbelsidigt test 166 dynamisk population 27, 349, 359, 362 uppföljning av 22, 349 dödsfrekvens, se mortalitet

E

effektmått 165 effektstorlek 261 standardiserad 194 EKG, se elektrokardiografi ekvivalensstudie 166 elektrokardiografi 103 enkelsidigt test 166 enkätfråga 57 enkätfrågor formulering av 32 enkätundersökning 25, 28, 32, 58, 87, 231, 322 envariabelanalys 279 epidemiologi 22, 320

epidemiologisk metodik 25, 320 epidemiologisk undersökning 25, 40, 320 etik forskar- 30 forsknings- 30 etikprövningslag 30

etikprövningsmyndigheten 30, 35, 41, 55 etiologisk fraktion 218

EU:s dataskyddsförordning 30, 34, 45, 55 exakta konfidensintervall 159, 369 exakta statistiska test 223 exklusionskriterier 15, 83 exponering 14, 18, 24, 47, 57, 66, 281, 303, 322, 325, 358 extremvärde 82, 192, 290 F

facitmetod 391

fall–kontrollundersökning 22, 27, 215, 217, 357

falskt negativt resultat 274, 375 falskt positivt fynd 166, 172, 192, 193, 202, 255, 265 falskt postitivt resultat, se falskt positivt fynd felmarginal standardiserad 198 statistisk 16, 27, 29, 138, 144, 145, 148, 153, 157, 173, 181, 199, 229, 323, 340 felrisk se signifikansgräns felterm, se residual Fisher, Ronald Aylmer 151, 222 Fishers exakta test 223 flervariabelanalys 279, 301, 321 flödesschema för deltagande 65 folkhälsoenkät 25, 79, 89, 130, 147 forskningsfråga 21, 38 forskningshuvudman 31 forskningsperson 27, 31, 45 forskningsplan 20, 23, 30, 35, 165 forskningsrapport 38, 148, 260 forskningsregister 20, 34, 45 FPRP (false positive report probability) 266 frekvens absolut 87, 157, 208 förväntad cell- 218, 221, 231 observerad cell- 218, 221, 231 relativ 87, 96, 157, 208

frihetsgrader 150, 152, 154, 220, 222, 232, 344

födelsevikt 117, 126, 138, 153 fördelningsfri metod, se icke-parametrisk metod

fördelningsfunktion 72, 116, 125 fördelningskurva 72, 116, 125, 170, 246 förklarande analys 281, 302, 345 förklaringsgrad 286, 288, 304 förväntad livslängd, se medellivslängd

förväxlingsfaktor 18, 175, 281, 303, 306, 316, 321 förväxlingsfel 18, 281, 306, 310, 321, 345, 358

GGalton, Francis 292, 312

Gauss, Carl Friedrich 127, 312

GDPR, se EU: s dataskyddsförordning gemensam orsaksfaktor 18, 281, 303, 306, 311 generaliserbarhet 19, 64, 147 genomsnittsmått 67, 70, 75, 137, 240, 299 GFR (glomerulär filtrationshastighet) 248, 250, 376, 378, 386, 392 Gosset, William 151, 222 graviditet 86, 91, 109, 128, 138, 338

Hhasardkvot 341, 344, 345, 347 hasard 341, 345 kumulativ 97, 337 proportionell 348 havandeskapsförgiftning 86 histogram 13, 70, 117, 121, 130, 139, 164, 190, 238, 300 hjärt–kärlsjukdom 331, 334, 360 hjärtsvikt 67, 200, 254, 341, 346 Hochbergs metod 272 hypotesprövning, se statistisk hypotesprövning

Iicke-parametrisk metod 36, 129, 236, 238, 290

icke-parametriskt test 165, 236 icke-signifikant resultat 172, 260, 268

incidens 328, 332, 333, 341, 345, 354 -differens 333, 351 -kvot 333, 341, 345, 351, 359 beräkning av 329, 350 kumulativ 97, 352 incidensandel 97, 326 incidenta fall 330 indextest 368 informationsfel 18 informerat samtycke 31 inklusionskriterier 15, 65, 83 inmatning av data 34, 55 interaktionseffekt 305 intercept, se skärningspunkt

K kalibrering 395 kalkylprogram 56 Kaplan–Meierkurva 336, 342 kappa 403 tolkning av 405 viktat 407 karpaltunnelsyndrom 59 kategorier 377 kategorisering 51, 91, 334, 337, 401 kausal effekt 281 kausalitet, se orsakssamband klinisk prövning 22, 23, 65, 86, 207, 208, 217, 218, 265, 270, 275, 337 kodnyckel 35, 46, 56 kohort 26, 314, 325 del- 326 sluten 27 studie- 326 syntetisk 352, 354 kohortuppföljning 22, 27, 314, 325, 331, 346, 360 konstant uppföljningstid 326 varierande uppföljningstid 328 konfidensgrad 146, 152, 166 konfidensintervall 143, 167, 259, 299 andel 155, 158, 340 differens mellan två beroende andelar 224 differens mellan två oberoende medelvärden 180 för oddskvot 215, 315 geometriskt medelvärde 155

hasardkvot 344 incidens 333 incidensdifferens 333 , 351 incidenskvot 333 kappa 405, 406 korrelationskoefficient 288 linjär regression 298 medelvärde 144, 145, 149 medelvärde av parade differenser 187 mediandifferens 243 medianvärde 239, 241 medianvärde av parade differenser 247 NNT (number needed to treat) 211 relativ riskreduktion 212, 214 riskkvot 214 konkurrerande risk (competing risk) 330, 341 kontaktallergi 224, 226, 323 kontroll, se kontrollgrupp kontrollgrupp 24, 187, 190, 192, 312 korrelation 279, 288, 298, 394, 395 korrelationskoefficient intraklass- 401

Pearsons 284, 286, 287, 290, 294, 394

Spearmans rang- 290 korstabell 207, 218 parvisa bedömningar 402 kovarians 286 kranskärlsoperation 323 kroppslängd 51, 79, 147, 148, 164, 167, 283 kroppsvikt 49, 67, 70, 79, 190 Kruskal–Wallis test 253 Kruskal, William 253 kvalitativ forskning 12 kvantil 75, 301 kvantitativ forskning 12 kvartil 75, 80, 84, 119, 121 beräkning av 81 kvartilavstånd 80, 82 känslighetsanalys 35, 83, 192, 321, 357 L

Laplace, Pierre-Simon 127 leukemi 190

likelihoodkvot 106, 108, 373, 376 beräkning av 375 negativ 375 positiv 375

livslängdstabell 354

log-normalfördelning 131 log-transformation 73, 75, 131, 155, 171, 199, 300 logranktest 341, 344

longitudinell undersökning 22, 26, 324

Lund–Malmö-formeln 376, 386, 392 lungemboli 368, 371, 374 lungfunktion 280, 300 lutning 289, 293, 295, 298, 304, 345 lådagram 84

Mann–Whitneys test 244, 246, 251, 253

Mann, Henry 244 matchad undersökning 36, 163, 187, 190, 223, 247

medelfel 141, 143, 168, 183 medellivslängd 354 medelvärde 67, 75, 117, 128, 145, 149, 178, 179, 180, 182, 187 aritmetiskt 67 beräkning av 69, 75 geometriskt 73, 75, 155 moment 292

medelvärden 182 medelvärdesjämförelse 178, 185, 187 median 67, 75, 80, 81, 84, 119, 128, 237, 239, 241, 242

beräkning av 69 mediandifferens 243, 247 medianjämförelse 236 metaanalys 37, 40, 268, 387 metadata 41 min–max, se variationsvidd minsta kvadratmetoden 293, 297, 312 mixade modeller 186 modell

linjär 294, 313 multiplikativ 316, 335, 348 modified Rankin scale 53 de Moivre, Abraham 127, 155 mortalitet 328, 331, 334, 347, 354, 360 multipla test 269 målpopulation 14, 19, 64, 72, 120, 128, 142, 147, 154, 158, 164, 225, 237, 264, 295 mätfel 83, 120

mätosäkerhet 78, 133 njurfunktion 68, 70, 247, 248, 250, 376, 386, 392, 396

NNT (number needed to treat) 211 noggrannhet (accuracy) 397 nollhypotes 165, 171, 174, 185, 221, 246, 260, 263, 298, 344 normalfördelning 72, 116, 138, 150, 156, 164, 180, 292, 300 egenskaper 119 standardiserad 118, 123, 124, 151 normalfördelningstabell 124 NT-proBNP 67, 254

oberoende grupper 101, 163, 179, 193, 200, 207, 227, 230, 243, 251, 253, 308, 344, 383 händelser 99, 101, 338 observationer 101, 154, 186 test 271 observationsområde 296 observationsundersökning 22, 24, 307, 320 odds 106, 108, 214, 313, 374 räkneregler 108 oddskvot 214, 217, 314, 358, 362, 376 beräkning av 215 oddsreduktion relativ 216 oenighet slumpmässig 401, 407 systematisk 401, 407 orsaksdiagram 302, 310

p-värde 88, 102, 168, 259 dubbelsidigt 170 korrektion 271 rapportering av 259 tolkning av 261 p-värdeshackande 270 panelundersökning 324 parade mätningar 187, 223, 247, 385, 395 parameter 111, 117, 143, 151, 164, 294 regressions- 293, 315, 334, 347, 359

parametrisk 129

parametrisk metod 36, 129, 164, 236, 299

parametriskt test 164, 299

PCB 82, 84, 139, 188, 237, 240, 302, 304

Pearson, Karl 151, 292 percentil 75, 79, 80, 129, 301 beräkning av 81 percentilmetoden 129 PICOS-modellen 38

placebo 23, 24, 86, 217, 270, 275 placeboeffekt 24, 192 prediktionsintervall 299 prediktiv analys 14, 281 prediktivt värde 370 negativt 371 positivt 371 preklinisk forskning 36, 64, 251 prevalens 26, 28, 29, 157, 280, 322, 323, 324, 371, 373, 383 -differens 323 -kvot 325

prevalenta fall 351, 352 primärdata 37, 41 procent, se frekvens, relativ procentenheter 28, 209, 211, 224, 323 jämfört med procent 28 provsvar 128, 367, 378, 382 mätosäkerhet 133

PSA (prostataspecifikt antigen) 378 pseudonymisering 31, 45 publikationsbias 38

randomiserad klinisk prövning, se klinisk prövning randomisering 23, 192 rangordning av utfall 238, 248, 290 referensintervall 128, 129, 299, 397 referenskategori 282, 334, 347, 359, 363 referensmetod, se facitmetod referenstest 368 regression 292 Cox- 321, 345 kvantil- 301 linjär 280, 292, 299, 301, 321 logistisk 313, 321, 359 Poisson- 321, 332

towards the mean 312 relativ risk, se riskkvot reliabilitet, se tillförlitlighet residual 295, 296, 300, 303, 313 Rh-systemet 49, 100, 109, 156 riktad acyklisk graf, se orsaksdiagram riktlinjer 40

CONSORT 40, 65, 88 PRISMA 38, 40 QUADAS 387

STARD 40, 387 STROBE 40 risk 209 -differens 208, 227 -kvot 207, 212, 213, 214, 217 absolut 209, 363 riskreduktion absolut 209 relativ 212 ROC-kurva 381 area under 382 rökning 28, 47, 49, 57, 282, 331, 334, 359, 360

saknade värden kodning av 58 samband 280, 283, 292, 302, 310, 392 negativt 284, 307 orsaks- 26, 175, 280, 289, 302 positivt 283, 307 sambandsanalys 47, 280, 301 samspelseffekt, se interaktionseffekt samstämmighet, se överensstämmelse samstämmighetsintervall 391, 397, 400 sannolikhet 95 a posteriori 105, 264, 266, 267, 373 a priori 105, 264, 267, 373, 383 betingad 102, 168, 266, 367 empirisk 96 omvandling till odds 375 räkneregler 98 subjektiv 106, 264 sant positivt fynd 378, 380 screening 369, 383 selektionsfel 18 semi-parametrisk modell 348 sensitivitet 368, 370, 373

hög 378, 380

sensitivt test 369, 379, 380 seroprevalens 16, 157, 324

SF (short form health survey 36) 33, 49, 89 signifikansgräns 146, 165, 172, 261, 266, 268 signifikant resultat 172 sjukdomsfrekvens, se incidens sjukdomsrisk, se risk skalnivå 52 intervallskala 53 kvotskala 55, 122 nominalskala 52, 407 ordinalskala 52, 90, 200, 236, 290, 401, 407 skärningspunkt 293, 298, 303, 306, 335, 363 slumpmässighet 94 slumpmässigt fel 16, 148 slumpsituation 95, 111, 146 snedfördelning 301 moment 292 negativ 71 positiv 69, 71, 131, 139 Spearman, Charles 292 specificitet 367, 368, 370, 373, 378, 385 hög 378, 380 specifikt test 369, 379, 380 spridningsdiagram 188, 200, 201, 280, 283, 288, 304, 392, 396 spridningsmått 75 standardavvikelse 67, 75, 90 beräkning av 76, 78 binomialfördelning 111 lika i alla grupper 179, 200 medelfel 141, 144 moment 292 normalfördelning 117, 122, 128, 140, 399 residualer 296 standardisering normalfördelad variabel 123 stapeldiagram 25, 110 statistisk analysplan 20, 35 statistisk hypotesprövning 162, 167, 173, 183, 202, 219, 226, 231, 242, 265, 268, 343 statistisk osäkerhet 15, 17, 27, 137, 260 statistisk precision 27, 29, 148, 193, 197, 199, 228

statistisk signifikans 168, 172, 261, 268 statistisk styrka 27, 193, 196, 227, 229, 253, 255, 266, 272, 274, 298, 383

statistiskt test 162, 259, 383 exakt 222, 223 val av 163 stickprov, se urval stickprovsfördelning 139, 142, 156, 237 stokastisk, se slumpmässighet stolpdiagram, se stapeldiagram stratifierad analys 305, 334 studie, se undersökning studiepopulation 14, 19, 64, 137, 158 studieprotokoll 23 subaraknoidalblödning 403, 407 symmetrisk fördelning 71, 132 syreupptagningsförmåga 120, 122, 124, 129, 142, 145, 180, 195, 198, 263, 308, 310 systematisk avvikelse 391, 395 systematisk översikt 37, 387 systematiskt fel 17, 147, 175, 341

Tt-fördelningen 150, 151, 171, 185 t-test ett medelvärde 168 parat 189, 251, 395 två oberoende grupper 182, 184, 310 teckentest 226, 241, 251 telomerer 359 teststrategi 201, 254 prioriterad 274 testsvar, se provsvar tid-till-händelse 50, 336 tillförlitlighet 401 interbedömar- 401 test–återtest- 401 totalundersökning 15, 17, 78 TPRP (true positive report probability) 266 transporterbarhet 19, 64 träddiagram 98, 100, 103 tvärsnittsundersökning 22, 25, 29, 157, 181, 308, 320, 322, 368 typ 1-fel, se falskt positivt fynd typ 2-fel, se falskt negativt fynd

U undersökning 12, 22 empirisk 12 kvalitativ 12

kvantitativ 12

urvals- 15, 78 upprepade mätningar 37, 59, 78, 133, 186, 300, 398, 401 urinvägsinfektion 218 urval 15, 128, 157, 322, 357, 362 ackumulerat 363 densitets- 359 fall–kohort- 363 obundet slumpmässigt 17 slumpmässigt 95, 109, 139, 237 upprepade tvärsnitts- 157, 324 uteliggare (outlier) 82, 291 definition av 82

Vvaccineffektivitet 217 validitet 18, 401 extern 19 intern 18 variabel 45, 61, 316 bakgrunds- 46, 66, 87 behandlings- 46 beroende 281

binär 50, 57, 109, 155, 206, 313 centrering av 50, 305, 306 diskret 48, 91, 332 exponerings- 47, 321 indikator- 58, 282, 308, 334 kategorisk 48, 57, 86, 401, 407 kontinuerlig 48, 91, 117, 246, 292, 299, 301, 316, 348 kvantitativ 48, 66, 395 nyckel- 35, 45 oberoende 281 utfalls- 47, 137, 163, 279, 321 varians 76, 197, 200, 401 beräkning av 76 variansanalys 200, 253, 255, 401 variationskoefficient 78, 133, 395 beräkning av 78 variationsvidd 75, 80 visuell analog skala (VAS) 54 våldstolerans 244, 252 värdesiffra 52, 67, 85, 153

WWallis, Allen 253

Whitney, Donald 244

Wilcoxons rangsummetest 244 Wilcoxons teckenrangtest 248, 250

ömsesidigt uteslutande händelser 98

öppen publicering 40

överdödlighet 356 relativ 357

överensstämmelse 391, 392 kategoriska variabler 401 kvantitativa variabler 395

överlevnad sjukdomsfri 208, 337

överlevnadsanalys 37, 50, 210, 336

överlevnadsfunktion 337

Praktisk statistik för medicin och hälsa är en bok vars pedagogiska idé skiljer sig markant från liknande läroböcker. Här står de praktiska tillämpningarna i centrum: först presenteras exempel och praktiska frågeställningar och därefter introduceras de statistiska begrepp och metoder som behövs för att besvara frågorna. Mycket stor vikt läggs vid hur man bör analysera, tolka och redovisa samt kommunicera undersökningsresultat.

Boken är lämplig som grundläggande lärobok i statistik för utbildningar på såväl grundnivå som avancerad nivå inom medicin, vård och folkhälsovetenskap. Den är också en utmärkt handbok för forskare och andra yrkesverksamma. Inga förkunskaper i ämnet krävs. För den som har läst statistik tidigare ger boken en värdefull introduktion till de tänkesätt och principer som är speciﬁka när statistiska metoder tillämpas inom medicin och hälsa.

I denna nya upplaga behandlas bland annat dimensioneringsberäkningar, hantering av forskningsdata, regressionsanalyser och statistiska metoder för epidemiologiska undersökningar mer utförligt än tidigare. Varje kapitel avslutas med övningsuppgifter av varierande svårighetsgrad, totalt ﬂer än 200 stycken. Knutet till bokens exempel och övningsuppgifter ﬁnns ett stort antal empiriska datamaterial som kan laddas ner från liber.se.

Boken använder samma begrepp, grundstruktur och genomtänkta upplägg som Praktisk epidemiologi – för medicin, vård och folkhälsa. Dessa böcker kan därför med fördel användas parallellt.

Författare

Jonas Björk är professor i epidemiologi vid Lunds universitet. Han har mångårig erfarenhet av undervisning på grund- och forskarutbildningar vid medicinska fakulteten och arbetar aktivt på nationell nivå för att förbättra förutsättningarna för storskaliga befolkningsundersökningar som använder forskningsdata länkade med individuella registeruppgifter.