Innehållsförteckning
Förord 9
1. Vad är statistik? 11
1.1
Grundläggande begrepp 11
Deskriptiv och analytisk statistik 13
Mål- och studiepopulation 14
Urval och statistisk osäkerhet 15
Systematiska fel 17
Generaliserbarhet och transporterbarhet 19
1.2 Att planera ett forskningsprojekt 20
Forskningsplan från ax till limpa 20
Olika typer av undersökningar 22
Dimensioneringsberäkning 27
Etiska överväganden 30
* Formulering av enkätfrågor 32
1.3 Genomförandet 34
Insamling och hantering av data 34
Statistisk analys 35
Val av statistisk metod 36
* Systematiska översikter och metaanalyser 37
Rapportering 38
Tillgängliggörande och arkivering 40
Sammanfattning 42
Övningsuppgifter 43
2. Organisera insamlade data 45
2.1 Variabler 45
Pseudonymisering 45
Bakgrund, behandling och utfall 46
Kvantitativa och kategoriska variabler 48
Binära variabler 50
Tid till händelse 50
Beräknade variabler och kategoriseringar 50
2.2 Skalnivåer 52
Nominalskala 52
Ordinalskala 52
Intervallskala 53
Kvotskala 55
2.3 Inmatning av data 55
Inmatning i kalkylprogram 56
Kodning av binära och andra kategoriska variabler 57
Kodning av saknade värden 58
* Datatablåer för upprepade mätningar 59
Sammanfattning 61
Övningsuppgifter 62
3. Deskriptiv statistik 64
3.1 Flödesschema för deltagande 65
3.2 Redovisning av kvantitativa variabler 66
Genomsnittsmått 67
Histogram 70
Fördelningskurvor 72
* Log-transformationer och geometriskt medelvärde 73
Spridningsmått 75
* Variationskoefficient – spridning och mätosäkerhet i procent av medelvärdet 78
Min–max, kvartiler och percentiler 79
Uteliggare och extremvärden 82
Lådagram (box plot) – illustrera skillnader i median och kvartiler 84
Värdesiffror och avrundning 85
3.3 Redovisning av kategoriska variabler 86
Tabeller och stapeldiagram 86
Kategorisering av kvantitativa variabler 91
Sammanfattning 91
Övningsuppgifter 93
4. Räkna med slumpen 94
4.1 Slumpmässighet 94
Slumpsituation 95
Vad uttrycker sannolikheten? 95
Relativa frekvenser – empiriska sannolikheter 96
4.2 Räkneregler för sannolikheter 98
Ömsesidigt uteslutande händelser 98
Oberoende händelser 99
Oberoende variabler, observationer och grupper 101
Betingade sannolikheter 102
Subjektiva sannolikheter 106
Oddset för en händelse 106
4.3 Binomialfördelningen 109
Binomialfördelningens utseende 111
Sammanfattning 113
Övningsuppgifter 114
5. Normalfördelningen och referensintervall 116
5.1 Grundläggande egenskaper hos normalfördelningen 116
Vad kan vara normalfördelat? 120
Standardisering av normalfördelade variabler 123
Normalfördelningstabell 124
Varför är normalfördelningen så användbar? 127
5.2 Referensintervall 128
Referensintervall för normalfördelade målpopulationer 128
Percentilmetoden – referensintervall för snedfördelade målpopulationer 129
* Referensintervall med hjälp av log-normalfördelningen 131
Ta hänsyn till mätosäkerheten när provsvar bedöms 133
Sammanfattning 135
Övningsuppgifter 136
6. Konfidensintervall – statistisk felmarginal 137
6.1 Centrala gränsvärdessatsen 138
6.2 Medelfel – uppskattningens standardavvikelse 141
* Från medelfel till konfidensintervall 142
6.3
Konfidensintervall för medelvärden i stora undersökningar 145
Konfidensgrad och felrisk – vad menas med ”95 % säkerhet”? 146
Systematiska fel 147
Hur stor ska undersökningen vara för att felmarginalen ska bli liten? 148
6.4
Konfidensintervall för medelvärden i små undersökningar 149
t-fördelningen 151
Frihetsgrader 152
I hur små grupper vågar man använda t-fördelningen? 154
6.5 Konfidensintervall för andelar 155
* Andelen positiva utfall är normalfördelad i stora undersökningar 156
Beräkningsformel för andelar i stora undersökningar 157
Sammanfattning 159
Övningsuppgifter 160
7. Pröva hypoteser med statistiska test 162
7.1
Formulering av hypoteser 164
Parametriska och icke-parametriska test 164
Nollhypotes och alternativhypotes 165
Signifikansgränsen anger risken för falskt positivt fynd 165
7.2
Testa hypoteser om ett medelvärde 167
Testutfallet kan avgöras med hjälp av konfidensintervall 167
P-värdet för t-test av ett medelvärde 168
I vilka situationer kan t-test av ett medelvärde användas? 171
Signifikanta och icke-signifikanta resultat behöver inte vara väsensskilda 172
7.3
Testa hypoteser om en andel 173
Binomialtest 173
Sammanfattning 175
Övningsuppgifter 176
8. Medelvärdesjämförelser 178
8.1 Två oberoende grupper 179
Konfidensintervall för differensen mellan två oberoende medelvärden 180
Vanligt t-test för två oberoende grupper 182
* Upprepade mätningar per individ 186
8.2 Parade mätningar 187
Konfidensintervall för differensen mellan två beroende medelvärden 187
Parat t-test 189
Hur ska data se ut för att parat t-test ska kunna användas? 191
* Att jämföra skillnader i förhållande till utgångsläget 192
8.3
Dimensioneringsberäkningar 193
Dimensionering utifrån statistisk styrka 193
Dimensionering utifrån statistisk precision 197
* Dimensionering om utfallet är snedfördelat 199
8.4 Variansanalys – utvidgning till fler än två oberoende grupper 200
Sammanfattning 203
Övningsuppgifter 204
9. Binära utfall och data i korstabeller 206
9.1 Två oberoende grupper 207
2 × 2-korstabell 207
Riskdifferens – absolut riskreduktion 208
* Antal som behöver behandlas 211
Relativ risk och relativ riskreduktion 212
Oddskvot 214
* Vaccineffektivitet 217
Chitvå-test i 2 × 2-korstabeller 218
Frihetsgrader hos en korstabell 220
Chitvå-fördelningen 222
9.2 Parade mätningar 223
Konfidensintervall för differensen mellan två beroende andelar 224
McNemars exakta test 226
9.3 Dimensioneringsberäkningar 227
Dimensionering utifrån statistisk styrka 227
Dimensionering utifrån statistisk precision 230
9.4 Testa samband i korstabeller större än 2 × 2 231
Sammanfattning 233
Övningsuppgifter 234
10. Medianjämförelser 236
10.1 Medianvärdet i en undersökningsgrupp 237
* Medianen blir inte normalfördelad ens i en stor undersökning 237
Icke-parametriska metoder bygger på att utfallen kan rangordnas 238
Konfidensintervall för medianvärden 239
Teckentest – pröva hypoteser om ett medianvärde 241
10.2 Två oberoende grupper 243
Mediandifferensen mellan två oberoende grupper 243
Mann–Whitneys test 244
10.3 Parade mätningar 247
Konfidensintervall för medianvärdet av parade differenser 247
Wilcoxons teckenrangtest 250
10.4 Dimensioneringsberäkningar 251
10.5 Kruskal–Wallis test – utvidgning till fler än två oberoende grupper 253
Sammanfattning 256
Övningsuppgifter 257
11. Rapportering och tolkning av p-värden 259
11.1 Rapportering av p-värden 259
P-värde eller konfidensintervall? 259
Tumregler för p-värdesrapportering 260
11.2 Tolkning av p-värden 261
P-värdet är inte sannolikheten att nollhypotesen är sann 263
A posteriori-sannolikheter 264
Att förkasta eller inte förkasta är sällan frågan 268
11.3 Multipla test 269
P-värdeskorrektion enligt Bonferroni 271
* Hochbergs metod 272
Prioriterad teststrategi 274
Sammanfattning 276
Övningsuppgifter 277
12. Korrelation och regression 279
12.1
Sambandsanalyser 280
Deskriptiv, förklarande eller prediktiv analys 280
Beroende och oberoende variabler 281
Kategoriska oberoende variabler 281
Spridningsdiagram 283
Pearsons korrelationskoefficient 284
Fallgropar vid tolkning av korrelationskoefficienter 288
Spearmans rangkorrelationskoefficient 290
12.2 Enkel linjär regression 292
Regressionsparametrar – skärningspunkt och lutning 293
Vilken linje beskriver insamlade data bäst? 293
Residualer – individuella avvikelser från regressionslinjen 296
Konfidensintervall och p-värde för skärningspunkt och lutning 298
När bör man använda linjär regressionsanalys? 299
12.3 Multipel linjär regression 301
Flervariabelanalys 301
Orsaksdiagram 302
Tolkning av regressionsparametrarna 303
Justera för förväxlingsfel i gruppjämförelser 306
12.4 Logistisk regression 313
Sammanfattning 317
Övningsuppgifter 318
13. Epidemiologisk metodik 320
13.1 Tvärsnittsundersökningar 322
Prevalensjämförelser 322
Upprepade tvärsnittsurval 324
13.2 Kohortuppföljningar 325
Sjukdomsrisk – incidensandel 326
Sjukdomsfrekvens – incidens 328
* Poisson-regression 332
13.3 Överlevnadsanalys 336
Överlevnadskurvor (Kaplan–Meier) 336
Hasardkvoter och logranktest 341
* Cox-regression 345
13.4 Dynamiska populationer 349
Sjukdomsrisk – kumulativ incidens 352
Förväntad livslängd (medellivslängd) 354
* Överdödlighet 356
13.5 Fall–kontrollundersökningar 357
Oddskvot – samband mellan exponering och utfall 358
Val av kontroller 362
Sammanfattning 364
Övningsuppgifter 365
14. Diagnostiska test 367
14.1 Sensitivitet, specificitet och prediktiva värden 368
Indextest och referenstest 368
Diagnostisk träffsäkerhet – sensitivitet och specificitet 368
Prediktiva (diagnostiska) värden 370
Likelihoodkvoter 373
* Diagnostiska test med fler än två möjliga testresultat 376
14.2 Avvägning mellan hög sensitivitet och hög specificitet 378
ROC-kurva – illustrera klassificeringsförmågan vid olika tröskelvärden 380
Arean under ROC-kurvan mäter klassificeringsförmågan 382
14.3 Jämförelser av diagnostiska test 383
Oberoende grupper 383
Parade mätningar 385
Sammanfattning 388
Övningsuppgifter 389
15. Överensstämmelse 391
15.1 Samband och överensstämmelse 392
15.2 Överensstämmelse mellan kvantitativa variabler 395
Bland–Altmandiagram 395
Samstämmighetsintervall 397
15.3 Överensstämmelse mellan kategoriska variabler 401
Kappa – hur mycket bättre är överensstämmelsen än slumpen? 403
Tolkning av kappa 405
Konfidensintervall för uppskattad överensstämmelse 406
Svagheter hos kappa 407
Sammanfattning 408
Övningsuppgifter 409
Referenser 411
Länkar 416
Register 417
* Markerar fördjupningsavsnitt som bidrar till ökad förståelse, men som inte är nödvändiga för sammanhanget.
Förord
Lärobok och praktisk handbok
Statistik har en central roll i forskning som rör medicin och hälsa. Kunskaper i statistik är avgörande för att kunna planera och genomföra forskningsprojekt, men också för att kritiskt granska egna och andras forskningsresultat. Boken ger en praktiskt inriktad introduktion till statistikämnet och är lämplig som lärobok på utbildningar på såväl grundnivå som avancerad nivå inom medicin, vårdvetenskap, epidemiologi och folkhälsovetenskap. Boken är även en utmärkt handbok för yrkesverksamma och forskare inom dessa områden. Inga förkunskaper i ämnet krävs. Den som har läst statistik tidigare kan emellertid använda boken som en introduktion till tankesätt och principer som är specifika för statistik inom medicin och hälsa.
Nyheter i den här upplagan
Boken har samma grundstruktur och genomtänkta upplägg som tidigare upplagor och som rönt stor uppskattning hos många läsare. I den nya upplagan har statistiska metoder för binära utfall fått en större och mer framträdande plats än tidigare. Kapitlet om korrelation och regression har utvidgats med en utförlig introduktion till logistisk regression, som är en användbar modell för binära utfall. Kapitlet om epidemiologisk metodik har också utvidgats, bland annat med en introduktion till Cox-regression. Även den är en modell för binära utfall, men som tar hänsyn till tidpunkterna då utfallen inträffar. Nytt är också att varje kapitel avslutas med övningsuppgifter. Totalt innehåller boken fler än 250 övningsuppgifter av varierande svårighetsgrad.
Boken har många beröringspunkter med och referenser till epidemiologiboken Praktisk epidemiologi för medicin, vård och folkhälsa. Dessa båda böcker kan därför med fördel användas parallellt i undervisningen.
Problemorienterad framställning
Bokens pedagogiska idé skiljer sig markant från liknande läroböcker inom ämnet. I bokens många exempel sätts de praktiska tillämpningarna snarare än den matematiska teorin i centrum. Exemplen är avgränsade med gröna ramar för att särskilja från den övriga texten. Framställningen i boken är problemorienterad, dvs. först presenteras en frågeställning och därefter de statistiska verktyg som behövs för att besvara frågan. Vanliga statistiska begrepp introduceras ofta både på svenska (markerade i fetstil) och engelska (kursiverade) Det gör orden lätta att hitta i texten, exempelvis med hjälp av bokens omfattande register.
Arbetsbok
Datamaterial
Statistiska begrepp och metoder presenteras överskådligt i separata fakta- och formelrutor. Alla beräkningar avslutas med det som är svårast, men också mest spännande med statistik, nämligen att försöka förstå vad resultatet innebär. Mycket stor vikt läggs vid redovisning och tolkning av undersökningsresultat.
Den tydliga uppdelningen i beräkning och tolkning av resultat gör boken möjlig att läsa på olika nivåer. Den som så önskar kan lägga mindre tonvikt vid formelrutor och beräkningsdetaljer vid en första genomläsning och i stället koncentrera sig på resultattolkningen, dvs. slutsatserna av de statistiska analyserna.
Boken är fylld av praktiska rekommendationer kring hur data inom medicin och hälsa bäst bör analyseras, redovisas och tolkas. Rekommendationerna presenteras ofta i separata rutor med rubriken Tänkvärt. Viktiga landvinningar och spännande kuriosa i utvecklingen av statistik till en vetenskaplig disciplin presenteras med rubriken Historik. Fördjupningsavsnitt markerade med * bidrar till ökad förståelse men kan hoppas över utan att sammanhanget går förlorat. I texten ges under rubriken Lästips! förslag på fördjupad läsning inom olika tillämpningsområden. De finns också samlade i referenslistan i slutet av boken.
Statistiska fördelningar
FAKTA FORMEL TÄNKVÄRT HISTORIK LÄSTIPS!
Bokens hemsida
Det är en sedan länge en självklarhet att statistiska beräkningar görs med datorprogram. Trots detta bör man ha lite kunskap om hur ett statistiskt ana lysresultat växer fram. Flertalet av beräkningarna som redovisas i boken kan enkelt utföras med hjälp av färdiga Microsoft Excel-arbetsböcker som finns på liber.se (sök på bokens titel). I forskningsprojekt som kräver mer avancerad statistisk analys bör alltid en erfaren statistiker involveras och man behöver också tillgång till ett statistikprogrampaket såsom STATA, R eller SPSS. Framställningen i boken är emellertid inte knuten till någon bestämd programvara. På liber.se finns även ett stort antal datamaterial för nedladdning som används i bokens exempel och övningsuppgifter. Dessutom finns facit till ett urval av övningsuppgifterna, ett flödesschema för deltagande i kliniska undersökningar samt tabeller över vanliga statistiska fördelningar.
Det är min uttalade ambition att alla som arbetar med, utbildar sig inom, eller har intresse av medicin, epidemiologi, vård- eller folkhälsovetenskap ska kunna ha nytta och glädje av bokens innehåll. Välkommen att läsa och arbeta vidare med boken!
Jonas Björk, Lund, juni 2024
A
ABO-systemet 48, 98, 100 absolut risk, se risk akut koronart syndrom 103 alternativhypotes 165, 264 analytisk statistik 14 antal som behöver behandlas, se NNT antikroppar 16, 157, 239, 243, 324 antropometriska mått 72, 120 arkivering 40 avrundning 85 avvikande värde 36, 69, 82, 192, 290
B
baslinjedata 66
Bayes teorem 105, 108, 266, 375 Bayes, Thomas 105 bayesiansk statistik 105, 106, 271 bedömningsinstrument 401 beroende händelse 99
statistiskt 101, 186, 187, 224, 274 bias, se systematisk avvikelse, systematiskt fel binomialfördelningen 109, 112, 174, 226 binomialtest 173, 241 biobanksprov 361 bivariabelanalys 279, 321 blodtryck 186, 200, 283, 294 bly 13, 132
BMI (body mass index) 51, 76, 80, 91, 130, 283, 286, 294, 327 Bonferroni-korrektion 271 bortfall 65 partiellt 87, 341 bröstcancer 207, 208, 337
C
cancer i urinblåsan 359
Cardano, Gerolamo 94
CB-138 se PCB
CB-153, se PCB censurering 330, 336 centrala gränsvärdessatsen 127, 138, 155
chitvå-fördelning 222, 231, 233, 244 chitvå-test 218, 221, 231, 343 common cause, se gemensam orsaksfaktor confounder, se förväxlingsfaktor confounding, se förväxlingsfel covid-19 173, 175, 217, 314 cross over-undersökning 192
D
DAG (directed acyclic graph), se orsaksdiagram datadelning 41 datatablå 46, 55, 59, 338 D-dimertest 368, 371, 374, 378 deskriptiv analys 14, 26, 280, 322 deskriptiv statistik 13, 64 diabetes 350, 352 diagnostikundersökning 26, 40, 104, 322, 367 diagnostiskt test 367 diagnostiskt värde, se prediktivt värde dikotom variabel, se variabel, binär dimensioneringsberäkning 27, 149, 193, 199, 251 statistisk precision 29, 149, 197, 228 statistisk styrka 193, 227, 253, 298 dubbelblindning 24, 192, 217 dubbelsidigt test 166 dynamisk population 27, 349, 359, 362 uppföljning av 22, 349 dödsfrekvens, se mortalitet
E
effektmått 165 effektstorlek 261 standardiserad 194 EKG, se elektrokardiografi ekvivalensstudie 166 elektrokardiografi 103 enkelsidigt test 166 enkätfråga 57 enkätfrågor formulering av 32 enkätundersökning 25, 28, 32, 58, 87, 231, 322 envariabelanalys 279 epidemiologi 22, 320
epidemiologisk metodik 25, 320 epidemiologisk undersökning 25, 40, 320 etik forskar- 30 forsknings- 30 etikprövningslag 30
etikprövningsmyndigheten 30, 35, 41, 55 etiologisk fraktion 218
EU:s dataskyddsförordning 30, 34, 45, 55 exakta konfidensintervall 159, 369 exakta statistiska test 223 exklusionskriterier 15, 83 exponering 14, 18, 24, 47, 57, 66, 281, 303, 322, 325, 358 extremvärde 82, 192, 290 F
facitmetod 391
fall–kontrollundersökning 22, 27, 215, 217, 357
falskt negativt resultat 274, 375 falskt positivt fynd 166, 172, 192, 193, 202, 255, 265 falskt postitivt resultat, se falskt positivt fynd felmarginal standardiserad 198 statistisk 16, 27, 29, 138, 144, 145, 148, 153, 157, 173, 181, 199, 229, 323, 340 felrisk se signifikansgräns felterm, se residual Fisher, Ronald Aylmer 151, 222 Fishers exakta test 223 flervariabelanalys 279, 301, 321 flödesschema för deltagande 65 folkhälsoenkät 25, 79, 89, 130, 147 forskningsfråga 21, 38 forskningshuvudman 31 forskningsperson 27, 31, 45 forskningsplan 20, 23, 30, 35, 165 forskningsrapport 38, 148, 260 forskningsregister 20, 34, 45 FPRP (false positive report probability) 266 frekvens absolut 87, 157, 208 förväntad cell- 218, 221, 231 observerad cell- 218, 221, 231 relativ 87, 96, 157, 208
frihetsgrader 150, 152, 154, 220, 222, 232, 344
födelsevikt 117, 126, 138, 153 fördelningsfri metod, se icke-parametrisk metod
fördelningsfunktion 72, 116, 125 fördelningskurva 72, 116, 125, 170, 246 förklarande analys 281, 302, 345 förklaringsgrad 286, 288, 304 förväntad livslängd, se medellivslängd
förväxlingsfaktor 18, 175, 281, 303, 306, 316, 321 förväxlingsfel 18, 281, 306, 310, 321, 345, 358
GGalton, Francis 292, 312
Gauss, Carl Friedrich 127, 312
GDPR, se EU: s dataskyddsförordning gemensam orsaksfaktor 18, 281, 303, 306, 311 generaliserbarhet 19, 64, 147 genomsnittsmått 67, 70, 75, 137, 240, 299 GFR (glomerulär filtrationshastighet) 248, 250, 376, 378, 386, 392 Gosset, William 151, 222 graviditet 86, 91, 109, 128, 138, 338
Hhasardkvot 341, 344, 345, 347 hasard 341, 345 kumulativ 97, 337 proportionell 348 havandeskapsförgiftning 86 histogram 13, 70, 117, 121, 130, 139, 164, 190, 238, 300 hjärt–kärlsjukdom 331, 334, 360 hjärtsvikt 67, 200, 254, 341, 346 Hochbergs metod 272 hypotesprövning, se statistisk hypotesprövning
Iicke-parametrisk metod 36, 129, 236, 238, 290
icke-parametriskt test 165, 236 icke-signifikant resultat 172, 260, 268
incidens 328, 332, 333, 341, 345, 354 -differens 333, 351 -kvot 333, 341, 345, 351, 359 beräkning av 329, 350 kumulativ 97, 352 incidensandel 97, 326 incidenta fall 330 indextest 368 informationsfel 18 informerat samtycke 31 inklusionskriterier 15, 65, 83 inmatning av data 34, 55 interaktionseffekt 305 intercept, se skärningspunkt
K kalibrering 395 kalkylprogram 56 Kaplan–Meierkurva 336, 342 kappa 403 tolkning av 405 viktat 407 karpaltunnelsyndrom 59 kategorier 377 kategorisering 51, 91, 334, 337, 401 kausal effekt 281 kausalitet, se orsakssamband klinisk prövning 22, 23, 65, 86, 207, 208, 217, 218, 265, 270, 275, 337 kodnyckel 35, 46, 56 kohort 26, 314, 325 del- 326 sluten 27 studie- 326 syntetisk 352, 354 kohortuppföljning 22, 27, 314, 325, 331, 346, 360 konstant uppföljningstid 326 varierande uppföljningstid 328 konfidensgrad 146, 152, 166 konfidensintervall 143, 167, 259, 299 andel 155, 158, 340 differens mellan två beroende andelar 224 differens mellan två oberoende medelvärden 180 för oddskvot 215, 315 geometriskt medelvärde 155
hasardkvot 344 incidens 333 incidensdifferens 333 , 351 incidenskvot 333 kappa 405, 406 korrelationskoefficient 288 linjär regression 298 medelvärde 144, 145, 149 medelvärde av parade differenser 187 mediandifferens 243 medianvärde 239, 241 medianvärde av parade differenser 247 NNT (number needed to treat) 211 relativ riskreduktion 212, 214 riskkvot 214 konkurrerande risk (competing risk) 330, 341 kontaktallergi 224, 226, 323 kontroll, se kontrollgrupp kontrollgrupp 24, 187, 190, 192, 312 korrelation 279, 288, 298, 394, 395 korrelationskoefficient intraklass- 401
Pearsons 284, 286, 287, 290, 294, 394
Spearmans rang- 290 korstabell 207, 218 parvisa bedömningar 402 kovarians 286 kranskärlsoperation 323 kroppslängd 51, 79, 147, 148, 164, 167, 283 kroppsvikt 49, 67, 70, 79, 190 Kruskal–Wallis test 253 Kruskal, William 253 kvalitativ forskning 12 kvantil 75, 301 kvantitativ forskning 12 kvartil 75, 80, 84, 119, 121 beräkning av 81 kvartilavstånd 80, 82 känslighetsanalys 35, 83, 192, 321, 357 L
Laplace, Pierre-Simon 127 leukemi 190
likelihoodkvot 106, 108, 373, 376 beräkning av 375 negativ 375 positiv 375
livslängdstabell 354
log-normalfördelning 131 log-transformation 73, 75, 131, 155, 171, 199, 300 logranktest 341, 344
longitudinell undersökning 22, 26, 324
Lund–Malmö-formeln 376, 386, 392 lungemboli 368, 371, 374 lungfunktion 280, 300 lutning 289, 293, 295, 298, 304, 345 lådagram 84
M
Mann–Whitneys test 244, 246, 251, 253
Mann, Henry 244 matchad undersökning 36, 163, 187, 190, 223, 247
medelfel 141, 143, 168, 183 medellivslängd 354 medelvärde 67, 75, 117, 128, 145, 149, 178, 179, 180, 182, 187 aritmetiskt 67 beräkning av 69, 75 geometriskt 73, 75, 155 moment 292
medelvärden 182 medelvärdesjämförelse 178, 185, 187 median 67, 75, 80, 81, 84, 119, 128, 237, 239, 241, 242
beräkning av 69 mediandifferens 243, 247 medianjämförelse 236 metaanalys 37, 40, 268, 387 metadata 41 min–max, se variationsvidd minsta kvadratmetoden 293, 297, 312 mixade modeller 186 modell
linjär 294, 313 multiplikativ 316, 335, 348 modified Rankin scale 53 de Moivre, Abraham 127, 155 mortalitet 328, 331, 334, 347, 354, 360 multipla test 269 målpopulation 14, 19, 64, 72, 120, 128, 142, 147, 154, 158, 164, 225, 237, 264, 295 mätfel 83, 120
mätosäkerhet 78, 133 njurfunktion 68, 70, 247, 248, 250, 376, 386, 392, 396
NNT (number needed to treat) 211 noggrannhet (accuracy) 397 nollhypotes 165, 171, 174, 185, 221, 246, 260, 263, 298, 344 normalfördelning 72, 116, 138, 150, 156, 164, 180, 292, 300 egenskaper 119 standardiserad 118, 123, 124, 151 normalfördelningstabell 124 NT-proBNP 67, 254
oberoende grupper 101, 163, 179, 193, 200, 207, 227, 230, 243, 251, 253, 308, 344, 383 händelser 99, 101, 338 observationer 101, 154, 186 test 271 observationsområde 296 observationsundersökning 22, 24, 307, 320 odds 106, 108, 214, 313, 374 räkneregler 108 oddskvot 214, 217, 314, 358, 362, 376 beräkning av 215 oddsreduktion relativ 216 oenighet slumpmässig 401, 407 systematisk 401, 407 orsaksdiagram 302, 310
p-värde 88, 102, 168, 259 dubbelsidigt 170 korrektion 271 rapportering av 259 tolkning av 261 p-värdeshackande 270 panelundersökning 324 parade mätningar 187, 223, 247, 385, 395 parameter 111, 117, 143, 151, 164, 294 regressions- 293, 315, 334, 347, 359
parametrisk 129
parametrisk metod 36, 129, 164, 236, 299
parametriskt test 164, 299
PCB 82, 84, 139, 188, 237, 240, 302, 304
Pearson, Karl 151, 292 percentil 75, 79, 80, 129, 301 beräkning av 81 percentilmetoden 129 PICOS-modellen 38
placebo 23, 24, 86, 217, 270, 275 placeboeffekt 24, 192 prediktionsintervall 299 prediktiv analys 14, 281 prediktivt värde 370 negativt 371 positivt 371 preklinisk forskning 36, 64, 251 prevalens 26, 28, 29, 157, 280, 322, 323, 324, 371, 373, 383 -differens 323 -kvot 325
prevalenta fall 351, 352 primärdata 37, 41 procent, se frekvens, relativ procentenheter 28, 209, 211, 224, 323 jämfört med procent 28 provsvar 128, 367, 378, 382 mätosäkerhet 133
PSA (prostataspecifikt antigen) 378 pseudonymisering 31, 45 publikationsbias 38
R
randomiserad klinisk prövning, se klinisk prövning randomisering 23, 192 rangordning av utfall 238, 248, 290 referensintervall 128, 129, 299, 397 referenskategori 282, 334, 347, 359, 363 referensmetod, se facitmetod referenstest 368 regression 292 Cox- 321, 345 kvantil- 301 linjär 280, 292, 299, 301, 321 logistisk 313, 321, 359 Poisson- 321, 332
towards the mean 312 relativ risk, se riskkvot reliabilitet, se tillförlitlighet residual 295, 296, 300, 303, 313 Rh-systemet 49, 100, 109, 156 riktad acyklisk graf, se orsaksdiagram riktlinjer 40
CONSORT 40, 65, 88 PRISMA 38, 40 QUADAS 387
STARD 40, 387 STROBE 40 risk 209 -differens 208, 227 -kvot 207, 212, 213, 214, 217 absolut 209, 363 riskreduktion absolut 209 relativ 212 ROC-kurva 381 area under 382 rökning 28, 47, 49, 57, 282, 331, 334, 359, 360
S
saknade värden kodning av 58 samband 280, 283, 292, 302, 310, 392 negativt 284, 307 orsaks- 26, 175, 280, 289, 302 positivt 283, 307 sambandsanalys 47, 280, 301 samspelseffekt, se interaktionseffekt samstämmighet, se överensstämmelse samstämmighetsintervall 391, 397, 400 sannolikhet 95 a posteriori 105, 264, 266, 267, 373 a priori 105, 264, 267, 373, 383 betingad 102, 168, 266, 367 empirisk 96 omvandling till odds 375 räkneregler 98 subjektiv 106, 264 sant positivt fynd 378, 380 screening 369, 383 selektionsfel 18 semi-parametrisk modell 348 sensitivitet 368, 370, 373
hög 378, 380
sensitivt test 369, 379, 380 seroprevalens 16, 157, 324
SF (short form health survey 36) 33, 49, 89 signifikansgräns 146, 165, 172, 261, 266, 268 signifikant resultat 172 sjukdomsfrekvens, se incidens sjukdomsrisk, se risk skalnivå 52 intervallskala 53 kvotskala 55, 122 nominalskala 52, 407 ordinalskala 52, 90, 200, 236, 290, 401, 407 skärningspunkt 293, 298, 303, 306, 335, 363 slumpmässighet 94 slumpmässigt fel 16, 148 slumpsituation 95, 111, 146 snedfördelning 301 moment 292 negativ 71 positiv 69, 71, 131, 139 Spearman, Charles 292 specificitet 367, 368, 370, 373, 378, 385 hög 378, 380 specifikt test 369, 379, 380 spridningsdiagram 188, 200, 201, 280, 283, 288, 304, 392, 396 spridningsmått 75 standardavvikelse 67, 75, 90 beräkning av 76, 78 binomialfördelning 111 lika i alla grupper 179, 200 medelfel 141, 144 moment 292 normalfördelning 117, 122, 128, 140, 399 residualer 296 standardisering normalfördelad variabel 123 stapeldiagram 25, 110 statistisk analysplan 20, 35 statistisk hypotesprövning 162, 167, 173, 183, 202, 219, 226, 231, 242, 265, 268, 343 statistisk osäkerhet 15, 17, 27, 137, 260 statistisk precision 27, 29, 148, 193, 197, 199, 228
statistisk signifikans 168, 172, 261, 268 statistisk styrka 27, 193, 196, 227, 229, 253, 255, 266, 272, 274, 298, 383
statistiskt test 162, 259, 383 exakt 222, 223 val av 163 stickprov, se urval stickprovsfördelning 139, 142, 156, 237 stokastisk, se slumpmässighet stolpdiagram, se stapeldiagram stratifierad analys 305, 334 studie, se undersökning studiepopulation 14, 19, 64, 137, 158 studieprotokoll 23 subaraknoidalblödning 403, 407 symmetrisk fördelning 71, 132 syreupptagningsförmåga 120, 122, 124, 129, 142, 145, 180, 195, 198, 263, 308, 310 systematisk avvikelse 391, 395 systematisk översikt 37, 387 systematiskt fel 17, 147, 175, 341
Tt-fördelningen 150, 151, 171, 185 t-test ett medelvärde 168 parat 189, 251, 395 två oberoende grupper 182, 184, 310 teckentest 226, 241, 251 telomerer 359 teststrategi 201, 254 prioriterad 274 testsvar, se provsvar tid-till-händelse 50, 336 tillförlitlighet 401 interbedömar- 401 test–återtest- 401 totalundersökning 15, 17, 78 TPRP (true positive report probability) 266 transporterbarhet 19, 64 träddiagram 98, 100, 103 tvärsnittsundersökning 22, 25, 29, 157, 181, 308, 320, 322, 368 typ 1-fel, se falskt positivt fynd typ 2-fel, se falskt negativt fynd
U undersökning 12, 22 empirisk 12 kvalitativ 12
kvantitativ 12
urvals- 15, 78 upprepade mätningar 37, 59, 78, 133, 186, 300, 398, 401 urinvägsinfektion 218 urval 15, 128, 157, 322, 357, 362 ackumulerat 363 densitets- 359 fall–kohort- 363 obundet slumpmässigt 17 slumpmässigt 95, 109, 139, 237 upprepade tvärsnitts- 157, 324 uteliggare (outlier) 82, 291 definition av 82
Vvaccineffektivitet 217 validitet 18, 401 extern 19 intern 18 variabel 45, 61, 316 bakgrunds- 46, 66, 87 behandlings- 46 beroende 281
binär 50, 57, 109, 155, 206, 313 centrering av 50, 305, 306 diskret 48, 91, 332 exponerings- 47, 321 indikator- 58, 282, 308, 334 kategorisk 48, 57, 86, 401, 407 kontinuerlig 48, 91, 117, 246, 292, 299, 301, 316, 348 kvantitativ 48, 66, 395 nyckel- 35, 45 oberoende 281 utfalls- 47, 137, 163, 279, 321 varians 76, 197, 200, 401 beräkning av 76 variansanalys 200, 253, 255, 401 variationskoefficient 78, 133, 395 beräkning av 78 variationsvidd 75, 80 visuell analog skala (VAS) 54 våldstolerans 244, 252 värdesiffra 52, 67, 85, 153
WWallis, Allen 253
Whitney, Donald 244
Wilcoxons rangsummetest 244 Wilcoxons teckenrangtest 248, 250
Ö
ömsesidigt uteslutande händelser 98
öppen publicering 40
överdödlighet 356 relativ 357
överensstämmelse 391, 392 kategoriska variabler 401 kvantitativa variabler 395
överlevnad sjukdomsfri 208, 337
överlevnadsanalys 37, 50, 210, 336
överlevnadsfunktion 337
Praktisk statistik för medicin och hälsa är en bok vars pedagogiska idé skiljer sig markant från liknande läroböcker. Här står de praktiska tillämpningarna i centrum: först presenteras exempel och praktiska frågeställningar och därefter introduceras de statistiska begrepp och metoder som behövs för att besvara frågorna. Mycket stor vikt läggs vid hur man bör analysera, tolka och redovisa samt kommunicera undersökningsresultat.
Boken är lämplig som grundläggande lärobok i statistik för utbildningar på såväl grundnivå som avancerad nivå inom medicin, vård och folkhälsovetenskap. Den är också en utmärkt handbok för forskare och andra yrkesverksamma. Inga förkunskaper i ämnet krävs. För den som har läst statistik tidigare ger boken en värdefull introduktion till de tänkesätt och principer som är specifika när statistiska metoder tillämpas inom medicin och hälsa.
I denna nya upplaga behandlas bland annat dimensioneringsberäkningar, hantering av forskningsdata, regressionsanalyser och statistiska metoder för epidemiologiska undersökningar mer utförligt än tidigare. Varje kapitel avslutas med övningsuppgifter av varierande svårighetsgrad, totalt fler än 200 stycken. Knutet till bokens exempel och övningsuppgifter finns ett stort antal empiriska datamaterial som kan laddas ner från liber.se.
Boken använder samma begrepp, grundstruktur och genomtänkta upplägg som Praktisk epidemiologi – för medicin, vård och folkhälsa. Dessa böcker kan därför med fördel användas parallellt.
Författare
Jonas Björk är professor i epidemiologi vid Lunds universitet. Han har mångårig erfarenhet av undervisning på grund- och forskarutbildningar vid medicinska fakulteten och arbetar aktivt på nationell nivå för att förbättra förutsättningarna för storskaliga befolkningsundersökningar som använder forskningsdata länkade med individuella registeruppgifter.