Jan Bystrรถm & Jonas Bystrรถm
Jan Bystrรถm Jonas Bystrรถm ISBN 978-91-27-12236-9
9 789127 122369
Bystrom_Gr_k_statistiken.hela.6.indd 1
11-06-16 15.28.59
Grundkurs i statistik.InD.indd 4
2011-06-30 10:08:17
Förord
En reviderad utgåva av Grundkurs i statistik? Ja, nu är det aktuellt igen! Boken utkom ursprungligen 1973 och har sedan reviderats vid åtskilliga tillfällen, främst beroende på att en av utgångspunkterna för innehållet är vardagsanknytningen och verklighetsförankringen. Boken har genom åren använts av tusentals studerande och lärare. Detta har gett oss möjligheten att ta del av deras reaktioner och synpunkter. Vi tackar för det gensvaret. Ytterligare en anledning till bokens långa liv är att tillämpningen och användningen av statistik i olika sammanhang har förändrats under den tid som gått, men också att vi som ”producenter” av statistiskt material har fått mer och mer raffinerade möjligheter att bearbeta och göra beräkningar. Att det blivit enklare att hantera siffermaterial minskar emellertid inte behovet av att veta vad man gör. Det är rimligt att anta att en grundbok i statistik ska handla om mått, formler och metoder som ”kokar soppa” på numerisk information. Och det gör den också, men först och främst måste vi bli vänner med och förstå siffror. Det nya i den här utgåvan av boken är inte presentationen av nya mått eller metoder, utan att vi här fokuserar ännu mer på att vi alla idag lever i ett kunskapssamhälle som ställer ökande krav på oss att ta del av undersökningar av olika slag för att vara uppdaterade, delaktiga och kunna fatta välgrundade beslut. Därmed blir det också naturligt att i boken lyfta fram användaraspekten och den kritiska granskningen vid hantering av statistiskt material. Samtidigt aktualiseras också vad du själv måste vara medveten om då du gör undersökningar, bedriver forskning eller brottas med numerisk information vid bearbetning och analys med hjälp av statistiska mått och metoder. Men framför allt att du måste vara klar över att siffror är inte bara siffror! Om den som utnyttjar statistiska metoder eller tekniker inte förstår vilka grundantaganden och kon-
Grundkurs i statistik.InD.indd 5
2011-06-30 10:08:17
sekvenser som gäller så kan skadan bli större än vinsten. Statistik är trots allt ett ovärderligt hjälpmedel för att bidra till att skapa viss ordning och reda i kunskapen om vår dynamiska tillvaro. En grundbok i statistik ska ligga i tiden och vara förankrad i såväl verklighet som praktik. Därför har vi valt att använda åtskilliga autentiska citat och exempel ur media och undersökningar för att nå den nära vardagsanknytningen. Därmed skapas också goda möjligheter att föra statistiska resonemang utifrån egna aktuella erfarenheter och tankar. Samtidigt har vi valt att låta en del material från tidigare upplagor vara kvar eftersom de illustrerar statistiska metoder eller angreppssätt på ett tydligt vis. En närmare presentation av boken – dess utgångspunkter, upplägg och struktur – återkommer vi till i ett särskilt avsnitt (0.5). Vår förhoppning är att du efter att ha arbetat med boken kan tänka dig att instämma i pedagogikprofessor Torbjörn Stockfelts reaktion, när boken första gången utkom: ”Du som läser den kommer att upptäcka att du med nöje blir klokare – inte bara i statistiskt avseende.” Jan Byström och Jonas Byström
Grundkurs i statistik.InD.indd 6
2011-06-30 10:08:17
Innehåll
0 0.1 0.2 0.3 0.4 0.5 0.6
Vad handlar det egentligen om? Du är statistikberoende! 11 Vi är nyfikna och vetgiriga 13 Statistikens inneboende kraft? 14 Vad är statistik? 16 Statistik, boken och du 18 Nu är det din tur. Ex 0:1–5 21 Hängde du med? 24
2.6 Om olika slags undersökningar 70 Nu är det din tur. Ex 2:1–5 75 2.7 Reliabilitet och validitet 77 2.8 Något om enkäter och intervjuer 79 2.9 Etiska regler och skydd för personen 82 Nu är det din tur. Ex 2:6–12 84 2.10 Kunskap och sunt förnuft i kombination 87 2.11 Hängde du med? 88
1 Samhällsstatistik 1.1 Vad handlar det egentligen om? 25 1.2 Kapitlet 26 1.3 Demokrati och folkbildning 27 1.4 SCB – en samlande kraft 28 1.5 Struktur och fallgropar 31 1.6 Andra statistikproducerande aktörer 34 Nu är det din tur. Ex 1:1–5 36 1.7 Tillförlitlighet och begränsningar 37 1.8 Integritet och sekretess 51 Nu är det din tur. Ex 1:6–12 53 1.9 Krav på kvalitetsredovisning 57 1.10 Hängde du med? 59
3 Siffror är inte bara siffror 3.1 Vad handlar det egentligen om? 89 3.2 Kapitlet 90 3.3 Nyckeltal och index 90 3.4 Den magiska siffran 94 3.5 Datanivåer 99 3.6 Diskret och kontinuerlig variabel 103 3.7 Smygkvantifiering 104 Nu är det din tur. Ex 3:1–10 104 3.8 Avstamp 109 3.9 Hängde du med? 111
2 Statistik – som vetenskaplig metod 2.1 Vad handlar det egentligen om? 60 2.2 Kapitlet 61 2.3 Att forska 61 2.4 Forskningsprocessen 63 2.5 Statistisk metod och forskning 66
4 4.1 4.2 4.3 4.4
Grundkurs i statistik.InD.indd 7
Tabeller Vad handlar det egentligen om? 112 Kapitlet 114 Enkel frekvenstabell 114 Olika slags frekvens 116 Nu är det din tur. Ex 4:1–4 119
2011-06-30 10:08:17
4.5 4.6 4.7 4.8
Klassindelning 121 Nu är det din tur. Ex 4:5–7 125 Andra slags tabeller 126 Att läsa tabell 128 Nu är det din tur. Ex 4:8–14 130 Hängde du med? 135
5 Grafisk framställning 5.1 Vad handlar det egentligen om? 136 5.2 Kapitlet 137 5.3 Stolpdiagram och histogram 138 5.4 Trappstegskurva och summa polygon 142 Nu är det din tur. Ex 5:1–5 144 5.5 Spridningsdiagram 145 5.6 Andra alternativ 147 Nu är det din tur. Ex 5:6–12 151 5.7 Se upp för fallgropar 154 5.8 Normalfördelning 161 5.9 Några andra fördelningsformer 163 Nu är det din tur. Ex 5:13–20 164 5.10 Sammanfattning 168 5.11 Hängde du med? 170 6 Centralmått 6.1 Vad handlar det egentligen om? 171 6.2 Kapitlet 172 6.3 Typvärde 173 6.4 Median 174 6.5 Aritmetiskt medelvärde 179 Nu är det din tur. Ex 6:1–10 183 6.6 Granskning av aritmetiskt medel värde 187 Nu är det din tur Ex 6:11–19 191 6.7 Sammanfattning 196 6.8 Hängde du med? 197 7 Spridningsmått 7.1 Vad handlar det egentligen om? 198
Grundkurs i statistik.InD.indd 8
7.2 7.3 7.4 7.5 7.6 7.7 7.8
Kapitlet 199 Variationsvidd 200 Kvartilavvikelse 201 Nu är det din tur. Ex 7:1–6 204 Standardavvikelse och varians 207 Nu är det din tur. Ex 7:7–14 212 Varför spridningsmått? 215 Sammanfattning 220 Hängde du med? 221
8 Korrelation 8.1 Vad handlar det egentligen om? 222 8.2 Kapitlet 223 8.3 Spridningsdiagram 224 8.4 Olika slags samband 225 Nu är det din tur. Ex 8:1–6 229 8.5 Prediktion och regression 232 8.6 Korrelationskoefficienter 235 Nu är det din tur. Ex 8:7–11 245 8.7 Starkt eller svagt samband? 247 8.8 Tolkning av samband 248 Nu är det din tur. Ex 8:12–17 251 8.9 Hängde du med? 253 9 Sannolikhet och normal fördelning 9.1 Vad handlar det egentligen om? 254 9.2 Kapitlet 255 9.3 Sannolikhet 256 Nu är det din tur. Ex 9:1–3 263 9.4 Beräkning av sannolikhet 264 Nu är det din tur. Ex 9:4–5 267 9.5 Normalfördelning 269 Nu är det din tur Ex 9:6–11 270 9.6 Sannolikhet och normal fördelning 272 Nu är det din tur Ex 9:12–16 278 9.7 Hängde du med? 281
2011-06-30 10:08:17
10 Hypotesprövning med hjälp av z 10.1 Vad handlar det egentligen om? 282 10.2 Kapitlet 283 Nu är det din tur. Ex 10:1–3 284 10.3 Hypotesprövning med m1–m2 285 10.4 Testprotokoll för prövning m1–m2 294 Nu är det din tur. Ex 10:4–7 299 10.5 Hypotesprövning med m 301 Nu är det din tur. Ex 10:8–10 304 10.6 Testprotokoll för prövning med m 306 10.7 Sammanfattning 307 10.8 Hängde du med? 308 11 Hypotesprövning med χ2 11.1 Vad handlar det egentligen om? 309 11.2 Kapitlet 310 11.3 χ2-test för oberoende 311 11.4 χ2-test för goodness of fit 317 Nu är det din tur. Ex 11:1–3 319 11.5 Testprotokoll för prövning med χ2 320 Nu är det din tur. Ex 11:4–7 322 11.6 χ2 i fyrfältstabell 324 Nu är det din tur. Ex 11:8 325 11.7 Hängde du med? 326 12 Estimation 12.1 Vad handlar det egentligen om? 327 12.2 Kapitlet 328 12.3 Punktskattning 328 12.4 Intervallskattning av ett medel värde (µ) 329 Nu är det din tur. Ex 12:1–3 334 12.5 Intervallskattning av ett procent tal (P) 325
Grundkurs i statistik.InD.indd 9
Nu är det din tur. Ex 12:4–7 338 12.6 Avslutning 340 12.7 Hängde du med? 342
13 Stickprovsundersökning 13.1 Vad handlar det egentligen om? 343 13.2 Kapitlet 344 13.3 Om slumpmässiga urval 345 13.4 Obundet slumpmässigt urval 348 13.5 Stratifierat urval 352 13.6 Systematiskt urval 353 13.7 Klusterurval 354 13.8 Icke slumpmässigt urval 355 Nu är det din tur. Ex 13:1–6 356 13.9 Bortfallsproblemet 358 13.10 Eftertänksam granskning 361 Nu är det din tur. Ex 13:7–14 362 13.11 Hängde du med? 366 14 Avrundning 367 Not- och källförteckning 373 Facit 377 Symboler 386 Formler 387 Tabeller 389 z-värden 389 χ2-tabell 390 Tabell över slump-/felmarginaler 391 Tabell över slumptal 392 Sakregister 393
2011-06-30 10:08:17
kapitel 0
Vad handlar det egentligen om?
Innehåll Kapitel 0 1. Du är statistikberoende! 2. Vi är nyfikna och vetgiriga 3. Statistikens inneboende kraft? 4. Vad är statistik? 5. Statistik, boken
Kapitel 0 skulle lika gärna ha kunnat heta ”Inledning” eller ”Förord”
men av erfarenhet vet vi att de flesta då bara skulle ha bläddrat förbi det. På grund av bokens karaktär känner vi att det är angeläget att ta ett ordentligt avstamp genom att tillsammans med dig ställa frågan: Vad handlar det egentligen om? Det ger oss en möjlighet att presentera målsättning och utgångspunkter samt därmed också bokens upplägg. Varje kapitel kommer sedan att inledas med denna fråga för att ringa in den problematik du kommer att möta. Och det är det här som vi kommer att fördjupa oss i:
och du
”Går vi till statistiken så får vi veta att …” ”… så nu är det bevisat med hjälp av statistik att …” ”En klar majoritet av svenskarna tycker att …” ”… men förändringen är inte statistiskt säkerställd …”
★ Fyra vanliga uttalanden i media – men vad står de egentligen för? Blir du övertygad och i så fall om vad och varför?
Många artiklar och inslag i radio och TV börjar med orden ”Allt fler …” eller ”Det blir allt vanligare att …”. Vad förväntar du dig för fortsättning efter en sådan inledning? Skulle du instämma i påståendet ”Då känner jag mig trygg och vet att det finns en seriös bakgrund till det som jag nu kommer att få veta”?
Grundkurs i statistik.InD.indd 10
2011-06-30 10:08:17
kapitel 0
•
vad handlar det egentligen om?
|
11
0.1 Du är statistikberoende! Vare sig du vill det eller inte så är du och alla andra redan storkonsumenter av statistik och statistiskt material. Du kanske inte skulle kalla dig statistiker, men faktum är att du varje dag möter och tar del av åtskilligt material och uppfattningar som bygger på statistisk grund. Dessutom ställs du inför konkreta presentationer med siffror, tabeller, diagram … som är ren statistik. Du möter det i tidningar och andra medier, i samtal och intervjuer, och du gör det troligen oreflekterat – du tar uppgifterna som fakta. Din bild av tillvaron formas i stor utsträckning på detta sätt. Och när du i din utbildning eller som yrkesverksam tar till dig information, teorier och modeller som bygger på vetenskaplig grund så blir kopplingen till statistik ännu tydligare. I själva verket är det egentligen inga nyheter som du möter här i boken. Skillnaden är att du nu ska få anledning att stanna upp och tänka till lite extra. Vi ska gå bakom kulisserna och fördjupa oss. En målsättning är att du ska kunna ta fram och redovisa statistikmaterial, kunna genomföra en undersökning, bearbeta insamlad information samt analysera och presentera resultat. Alltså att själv bli klokare och även göra andra det! Vi tänkte börja med att be dig reflektera över de tidningscitat som följer nedan: Stockholms län och Halland har de lägsta ohälsotalen, på 27,9 respektive 29,5, medan Jämtland toppar med 40,0.1
★ Vad säger egentligen dessa siffror? Vad är ”ohälsotalet” (som fö-
rekommer ofta i media och debatt) för ett mått? Vilken nytta kan vi ha av ett ohälsotal? Jag säger till mina poliser att det bara är blåsning för statistikens skull som gäller. … inte försöka få tag på rattfyllerister. … Problemet bottnar i att Rikspolisstyrelsen satt upp statistiska mål men inte kvalitativa. (Ur intervju med ett stationsbefäl inom polisen angående nykterhetskontroller i trafiken.)2
Grundkurs i statistik.InD.indd 11
2011-06-30 10:08:17
12 |
grundkurs i statistik
★ Kan det ligga något i detta? Vilken påverkan på oss har behovet
av att kunna redovisa statistik? Styr det vårt beteende och i så fall hur? Socialdemokraterna har minskat med 2,5 % till 37,1 % och moderaterna ökat med 1,3 % till 27,2 %. Båda förändringarna är visserligen inom felmarginalerna men följer en tendens i höst.3
★ Vad betyder det att förändringarna ligger inom felmarginalerna? Hur påverkas din tilltro till resultatet av informationen om att det föreligger en tendens?
Depression, ångest och nedstämdhet blir allt vanligare bland kvinnor under graviditeten. Idag drabbas mellan tio och femton procent av de gravida.4
★ Varför inte ge ett mer exakt procenttal? Vad har du för tankar om definitioner och avgränsningar vid mätning av de olika tillstånden?
Personer som äter folsyra och vitamin B12 löper ökad risk att drabbas av cancer. … De har också 38 procent ökad risk att dö i cancer jämfört med kontrollgruppen.5
★ Vilka frågor skulle du vilja ha svar på angående undersökningen innan du tar till dig resultatet? Hur vill du definiera risk och hur skulle den kunna beräknas? Det är inget löfte men absolut mer än en förhoppning. (Meteorologen Mats på TV angående värme under kommande midsommarhelg.)6
★ Hur sannolikt tror du att det är att det ska bli varmt? Går det att sätta ett siffervärde på sannolikheten?
Fundera också över hur respektive resultat eller material har tagits fram. Vilka olika undersökningsmetoder tycker du dig kunna se i citaten? Litar du generellt sett på resultaten? Ja, vad kom du fram till? Väcks det några minnen eller tankar? Vi ska här inte fördjupa oss i svaren på frågorna eller i en diskussion
Grundkurs i statistik.InD.indd 12
2011-06-30 10:08:17
kapitel 0
•
vad handlar det egentligen om?
|
13
om dem, utan återkommer till det längre fram i boken. Men du har nu fått en viss uppfattning om vad som kommer att behandlas.
0.2 Vi är nyfikna och vetgiriga Vi människor har en stark drivkraft att veta och förstå för att på så sätt kunna kontrollera vår situation. Vi vill känna oss säkra och fatta kloka beslut både privat och gemensamt, på arbetsplatser, i före ningsliv och i samhället. Samtidigt lever vi nu i ett samhälle som ställer stora krav på att vi måste kunna orientera oss, vara uppdaterade och delaktiga i utvecklingen. Dagens kunskapssamhälle ställer oss alla inför nya och allt mer komplicerade utmaningar. Utvecklingen går snabbt och kunskap är en färskvara som ständigt måste förnyas. Utbildningsinstitutioner kan medverka till detta, men framför allt måste vi alla själva vara aktiva och medvetna kunskapssökare. Vårt spontana och osorterade ”vardagsvetande” formas genom erfarenheter, iakttagelser och upplevelser. Det kan utvecklas till djupare insikter genom att vi tar del av mer systematiskt genomförda utredningar, undersökningar, utvärderingar och kartläggningar. Men vår bild av tillvaron formas också genom resultat som kommer från forskning och vetenskap (det vill säga skapat vetande) där bland annat modeller, teorier och testade hypoteser förväntas bidra med en djupare förståelse. Stående mitt i kunskapssamhället förväntas vi som individer alltså söka och hantera relevant information. Det är här som statistik och statistiskt material i ökande utsträckning kommer in i våra liv. Vi nås av undersökningsresultat av olika slag genom tidningar, andra medier och våra datorer – oftast i form av raka slutsatser eller påståenden och förenklade framställningar. Resultat i form av eller med hänvisning till sifferuppgifter eller statistik har en särskild genom slagskraft. Vi påverkas i vår vardag och vi förväntas vara medvetna både i stort och smått. Så här funderar Jonas Gardell i boken Vill gå hem:
Om risker
En på miljonen dör av att under sin livstid ätit ett hundra grillade biffar. Det finns siffror på hur farligt det är att dricka en läskedryck om
Grundkurs i statistik.InD.indd 13
2011-06-30 10:08:17
14 |
grundkurs i statistik
dagen, det finns siffror på hur många som dör av att äta för många wienerbröd. Tacka Gud för att vetenskapsmännen kan slå fast fakta. Ungkarlar exempelvis kan inte räkna med att leva lika länge som gifta män. (Månne det beror på att det tar på krafterna att diska och städa själv?) Den som röker förkortar sitt liv med tre år. Nu undrar jag skulle morbror Torsten ha blivit överkörd tre år senare om han inte envisats med cigarillen efter middagen? Jag är ingen äventyrens man. Jag är ingen Indiana Jones. När jag ska vara riktigt äventyrlig brukar jag äta en grillad biff. Sedan känner jag efter ordentligt men har hittills kunnat konstatera att den här gången gick det ju bra.7
0.3 Statistikens inneboende kraft? ”Statistiskt bevisat” är ett vanligt uttryck man möter i samband med redovisningar av undersökningar såväl i media som i olika debatter. Men vad står det egentligen för?
Kraftig ökning av barnfylleriet
Barn- och ungdomsfylleriet är det värsta på flera år – och det med råge, enligt siffror som TT tagit fram. Ökningen i Stockholm kan bli så hög som 7 procent …8
Mobiltelefoner ökar inte risk för tumörer
Antalet cancerfall har inte ökat i takt med den ökade användningen av mobiltelefoner, visar en ny stor nordisk studie. … Vi måste dock fortsätta att följa statistiken. … Våra siffror är betryggande, men vi vet ingenting om längre perioder.9
Tidningsurklippen ovan förmedlar en känsla av att ”Vi vet på säker grund att …”. Hur kommer det sig att statistik och numerisk information inger sådant förtroende och respekt trots att många säger sig inte lita på statistik och hävdar att ”med statistik kan man ju bevisa allt”? Vad är det för något i statistiska metoder och presentationer som gör att de får ett sådant genomslag? Uppenbarligen kan statistik genom enkla mått sammanfatta komplicerade material och genom en siffra (eller flera) ge ett enkelt och tydligt svar. Att man genom statistiska metoder kan skaffa sig ett grepp om osäkerhetsfaktorer och sannolikheter känns uppenbarligen tillfreds-
Grundkurs i statistik.InD.indd 14
2011-06-30 10:08:17
kapitel 0
•
vad handlar det egentligen om?
|
15
ställande, även om vissa uttalanden och slutsatser trots allt kan bli lite svävande – ”Det ligger inom felmarginalerna” eller ”Det har vi siffror på”. Som beslutsunderlag är statistik ovärderligt för samhällsplanerare och politiska beslutsfattare, men också för alla slags företag och organisationer. I politiska debatter kan också statistikens tyngd bli tydlig. Följande citat om en politikers retoriska knep har vi klippt ur tidningen Vi (artikeln handlar om Fredrik Reinfeldt): Man bygger sin argumentation på statistik som ingen i debattsituationen har möjlighet att kontrollera.10
Även i det vardagliga samtalet kan man, för att understryka det man säger eller för att inte bli motsagd, dra till med ett ”det är statistiskt belagt (bevisat)”. Det man då vill säga är att detta inte är något som man själv har hittat på. Att utnyttja statistik kan ge en fördel och ett psykologiskt övertag i avgörande situationer:
Sverige har statistiken på sin sida mot Ungern
(Rubrik i dagspressen inför en VM-kvalmatch i fotboll.)11
Statistik kan också hjälpa oss att få inblick i och överblick över olika förhållanden i samhället, vilket är en demokratisk rättighet för oss alla. Det starka genomslaget för statistik förpliktigar också till medvetenhet och kritisk granskning av redovisade uppgifter. Begrunda dessa tidningsrubriker:
Polisen friserar siffror
Forskare kritiserar satsningen mot den organiserade brottslig heten.12
Lita inte blint på statistiken
Ungdomsarbetslösheten är inte så illa som den kan verka.13
Storsäljande hälsopiller saknar bevisad effekt
… de vetenskapliga studierna har allvarliga brister och visar – med ett enda undantag – att rosenrot helt saknar effekt.14
Grundkurs i statistik.InD.indd 15
2011-06-30 10:08:18
16 |
grundkurs i statistik
I dessa citat saknar vi underlag för att kunna ta ställning till det som påstås. För att förstå hela bilden måste vi själva alltid fråga oss: Hur vet vi det? När vi väl har ställt oss den frågan dyker troligen ett antal följdfrågor upp, som till exempel: Varifrån kommer det siffermaterial som uttalandena vilar på? Vad står aktuella siffror för? Vad är det man har mätt (och varför)? Hur har ett eventuellt urval gjorts? Knappast någon kan väl ha missat det klassiska påståendet:
Det finns tre slags lögner: lögner, förbannade lögner och statistik. Mark Twain
Så kanske man kan se det, eftersom statistik handlar om att försöka förstå en komplicerad verklighet genom att undersöka den med hjälp av olika avvägningar och förenklingar. Samtidigt är statistik ett mycket fruktbart sätt att höja vår kunskapsnivå och skapa lite reda i tillvaron. På samma gång borde vi nog också fråga oss själva: Är jag statistikbrukare eller statistikmissbrukare? Botemedlet för eller mot det senare lär väl vara att öka vår förmåga att ”umgås” med statistik, något som är vår ambition med den här boken.
0.4 Vad är statistik? Vi har ovan talat om statistik som något självklart, men vad är det då som kan sammanfattas inom det begreppet? Finns det egentligen någon entydig definition? Nja, det finns egentligen mängder av olika beskrivningar. Vi kan ju alltid börja med att citera Statistiska centralbyrån (SCB) som ger följande definition: Ordet statistik har två betydelser. Dels kan man mena sifferuppgifter som beskriver en företeelse eller en verksamhet, dels kan man avse metoder för att samla in, bearbeta och analysera statistiskt material. Språkligt och historiskt betyder statistik ungefär sifferuppgifter om staten.15
Grundkurs i statistik.InD.indd 16
2011-06-30 10:08:18
kapitel 0
•
vad handlar det egentligen om?
|
17
Men det finns också andra definitioner: Statistik är en samling metoder att fatta förnuftiga beslut inför det ovissa.
… eller varför inte: Statistikens uppgift är att ge information: den skildrar numeriskt samhällsföreteelsers tillstånd och utveckling.
… eller möjligen: Statistik är vetenskapen som lär oss att sålla ut information ur data.
Gemensamt för dessa sätt att beskriva statistik är att man försöker förstå tillvaron genom att konkretisera företeelser med hjälp av siffror, det vill säga kvantifiera, både för att beskriva men också för att få underlag för att söka förklaringar och orsakssamband. Statistik är inte matematik, men matematiken används som hjälpmedel. Det går inte att bortse från att statistik, vetenskapliga undersökningar och statistiska uppgifter alltid är ”sämre” än verkligheten när det gäller att vara exakt. Men vi har faktiskt fått tillgång till vissa redskap som ökar våra möjligheter att sortera information och att förstå. Det handlar inte bara om vad en information säger utan också hur den informationen tillkommit. Statistik om samhället är – oavsett om den tagits fram som offentlig statistik eller via forskning – en starkt styrande och utvecklande kraft. Men det finns alltid ett djupare samband mellan den verklighet som beskrivs och siffrorna. I Aftonbladet (2010) påminns vi om detta:
– Statistik är som en gatlykta – den lyser upp ett mycket litet område men är utmärkt att stödja sej på. Thorvald Gahlin, 1958
Arbetslöshet är inte bara siffror
… arbetslösheten är naturligtvis inte en statistisk fråga för de ungdomar som förtvivlat söker en plats på en arbetsmarknad som just nu är bottenfrusen.16
Grundkurs i statistik.InD.indd 17
2011-06-30 10:08:18
18 |
grundkurs i statistik
0.5 Statistik, boken och du Som vi kan se ovan är statistik inget entydigt begrepp. Statistik kan beskrivas som:
• Sammanställningar av data som belyser olika samhällsförhållan•
den, men kan lika väl vara till exempel ett företags sjukfrånvarostatistik. I dagligt tal kan vi tala om att ”göra statistik över …”. Ett sätt att bedriva vetenskap genom kvantitativa metoder.
Tyngdpunkten i boken ligger på det senare alternativet – men det finns ingen knivskarp gräns mellan dessa båda betydelser av begreppet statistik.
0.5.1 Boken syftar till att:
• lära ut grundläggande statistiska begrepp • presentera vanligt förekommande statistiska beräkningsmetoder • förmedla en (hälsosamt) kritisk inställning till siffermaterial • ge en inblick i statistisk undersökningsmetod. Samtidigt som olika exempel ska förankra statistiken i praktiken så tillför självklart boken också nya baskunskaper för analys och träning. Även om boken lyfter fram frågor om begränsningar och fällor så är huvudsyftet att visa på statistikens möjligheter och användningsområden. Syftet är inte att utbilda statistiker! Inför 2011 års revidering av boken har vi samtalat med företrädare för olika ämnen och institutioner inom den högre utbildningen om behovet av statistikkunskaper. I dessa samtal har vi stött på en utbredd uppfattning att statistik borde uppmärksammas betydligt mer i undervisning och forskning än vad som nu är fallet. Den djupare insikt i en fråga eller ett problem som eftersträvas, kopplas många gånger till kvalitativa undersökningar och metoder. Det är idag inte riktigt på modet med numeriska analyser och en statistisk undersökningsinriktning. Samtidigt är det uppenbart att användandet av statistiskt material kan tillföra ”djup” och ytterligare dimensioner. Det kan ske genom
Grundkurs i statistik.InD.indd 18
2011-06-30 10:08:18
kapitel 0
•
vad handlar det egentligen om?
|
19
utnyttjandet av olika statistiska mått och sannolikhetsbedömningar som ger en ökad tyngd vad gäller resultaten och som går längre än ”resonemangsvis”. Självfallet är det här inte frågan om ”antingen eller” utan om ”både och” i valet av forskningsinriktning och angreppssätt. Olika ansatser och metodval kan komplettera varandra och ge en belysning av de aktuella frågorna ur olika infallsvinklar. Sammanfattningsvis syftar boken till att du ska kunna läsa och förstå befintliga undersökningar och själv kunna samla in och bearbeta (numerisk) information. Grundläggande statistik är en nödvändig inledning till studier i ämnen där kvantitativa metoder, och därmed statistik problematik, är av väsentlig betydelse. Vi vill med hjälp av boken bidra till att öka din statistikmedvetenhet och förmåga att utnyttja statistik. Märk väl att denna grundläggande bok ger en starkt förenklad bild av statistiska metoder. Om du i praktiken kommer att ställas inför besvärliga statistiska problem bör du inte försöka knäcka dem själv – rådfråga en statistiker!
0.5.2 Bokens profil och struktur Boken utgår från den pedagogik och studietradition som finns inom folkbildningen, och då särskilt inom studiecirkelverksamheten. Den mest centrala utgångspunkten i sådana sammanhang är att alla människor har erfarenheter och kunskaper att knyta an till, systematisera och bygga vidare på. Självstudier varvas med gemensamt arbete i mindre grupper där dialogen är central, och studierna formas utifrån deltagarnas egna behov och förutsättningar. Verklighetsförankringen är en bärande pedagogisk utgångspunkt i boken. Citaten är autentiska och hämtade från olika medier. Bland dessa återfinns också en del material från tidigare upplagor. Mer centrala källor anges direkt i texten medan övriga redovisas i en källförteckning i slutet av boken för att inte störa läsningen. Inom statistiken är vi många gånger hänvisade till bedömningar av typen lämpligt eller mindre lämpligt vid användandet av mått och metoder och inte primärt rätt eller fel. Bokens målsättning är därför att skapa förståelse och en känsla för vad statistik är och vilka möjligheter statistik ger – något som sedan kan utvecklas och fördjupas. De citat och det material ur media som används i boken ger, helt
Grundkurs i statistik.InD.indd 19
2011-06-30 10:08:18
20 |
grundkurs i statistik
naturligt, inte alltid bakomliggande undersökning eller material full rättvisa. De kan emellertid vara ett bra underlag för att ställa viktiga frågor och träna analysförmågan. Boken har disponerats i tre block:
• Lite mer övergripande om statistik och sifferhantering (kapitel 1–4).
• Mått och metoder inom det som vi talar om som beskrivande statistik (kapitel 5–8).
• Förklarande statistik och stickprovsundersökningar (kapitel 9–13).
Och bokens olika kapitel har en likartad struktur:
• Rubriken Vad handlar det egentligen om?. • Introduktion till kapitlet. • Presentation av begrepp och metoder. • Övningsuppgifter (under rubriken Nu är det din tur). • Snabbkontrollen Hängde du med?. Övningsuppgifterna är av två slag: a) Individuellt inriktade (för bearbetning av presenterade mått och metoder). b) Diskussionsinriktade (där tidigare erfarenheter och samlade funderingar ska tas tillvara).
Många gånger finns i det senare fallet inget definitivt svar. I slutet av boken finns ett kortfattat facit och några kommentarer till uppgifterna. För den som vill veta mera eller få hjälp med lösningar kan ett besök på Natur & Kulturs hemsida (www.nok.se/ grundkursistatistik) vara berikande. Där finns ytterligare information kring övningsuppgifterna. På olika ställen i texten finns frågor och uppmaningar insprängda. Ta vara på dem! De syftar bland annat till att höja din mentala beredskap inför kommande avsnitt.
Grundkurs i statistik.InD.indd 20
2011-06-30 10:08:18
kapitel 0
•
vad handlar det egentligen om?
|
21
0.5.3 Både ”tankevärk” och hantverk Att hantera statistik – såväl som producent som konsument – handlar både om ”tankevärk” och hantverk. Statistikkunskaper och ett medvetet tänkande kommer du aldrig ifrån om du vill vara seriös och få fram resultat som vinner respekt. Men själva hantverket har du idag möjlighet att underlätta med hjälp av olika statistikverktyg. Så har det dock inte alltid varit. När boken kom i sin första upplaga 1973 var det självklart att alla beräkningar gjordes med papper och penna, eller möjligen med hjälp av någon räknesnurra. När miniräknarna sedan kom blev det lättare att göra beräkningar och idag finns ett stort utbud av lättillgängliga statistikprogram för datorer. Men trots alla dessa värdefulla och enkla hjälpmedel så är denna boks budskap tydligt: du bör även beräkna och tillämpa olika statistiska mått för hand. Att ha pillrat med siffrorna och byggt upp mått utifrån olika komponenter är viktigt för att förstå hur allt hänger ihop. Det kommer att ge en förståelse som du kommer att ha glädje av när du ska välja och tolka olika mått och metoder. Datorprogram kan göra våra beräkningar, men programmen gör inga djupgående tolkningar åt oss. De vet egentligen inte hur och varför de räknar. Det är vår egen utmaning att tolka och förstå den information som datorn ger. Vi kommer inte att lyfta fram eller i detalj presentera några datorprogram. Det är inte meningsfullt eftersom utvecklingen går så snabbt. Det finns en lång rad andra böcker och hemsidor om detta som du kan ha nytta av.
Nu är det din tur Ex 0:1 Vi har påstått att du är en (stor)konsument av statistiska undersökningar. Nu vill vi att du börjar fundera över vad du kan ställas inför när du tittar i en morgontidning en vanlig dag i slutet av oktober 2009: Antalet anmälda inbrott i villor och radhus har ökat med 23 procent under årets tre första kvartal jämfört med samma period förra året. I Stockholms län är ökningen 60 procent.17
Grundkurs i statistik.InD.indd 21
2011-06-30 10:08:18
22 |
grundkurs i statistik
Hur tror du att ökningen överensstämmer med faktiska förhållanden? Jämförbarheten med tidigare år? Vad skulle kunna påverka människors vilja att anmäla eller inte anmäla inbrott? Fredagar är den populäraste dagen för begravningar.
Vad ger dig detta för information? Vilka kan tänkas ha behov av den informationen? Varför just fredagar – vad beror det på? På tio år har var åttonde kommunal grundskola i Sverige försvunnit. Samtidigt har många friskolor etablerats. Skolverket undersöker nu vad förändringen betyder för kommunerna.
Vad innebär detta? Om du vill undersöka närmare vad det betyder i kommunerna – vilken information skulle du då ha behov av? Svenskarna äter mest godis i världen. Svenskarna äter 17 kilo godis per person och år, mest i världen och dubbelt så mycket godis som genomsnittet för EU.
”17 kilo” – hur kan man ha tagit reda på det? Och genomsnittet i EU: vad tror du om det måttet? Hur jämförbara kan godissiffrorna från olika länder tänkas vara? Vilka konsekvenser kan detta resultat förväntas få i Sverige? Dubbdäck är självklart för de flesta. 71 % av svenskarna kör med dubbade vinterdäck, 22 % väljer dubbfritt och 7 % väljer däck av allroundtyp, enligt en undersökning som gjorts på uppdrag av försäkringsbolaget If.
Hur kan en sådan undersökning ha genomförts? Och varför? Ex 0:2 ”Statistiskt bevisat”? Vad lägger du in i det begreppet? Vad säger det egentligen? Hur skulle du beskriva skillnaden mellan ”bevisat = helt sant” och ”statistiskt bevisat”?
Grundkurs i statistik.InD.indd 22
2011-06-30 10:08:18
kapitel 0
•
vad handlar det egentligen om?
|
23
Ex 0:3 Läs följande citat (som även återfinns ovan): Socialdemokraterna har minskat med 2,5 % till 37,1 % …
★ Det finns egentligen två sätt att tolka sifferuppgiften 2,5 % (det
vill säga den procentuella förändringen). Vilka? Vad skulle i så fall Socialdemokraterna haft för procentandel i de alternativa fallen vid föregående mätning?
Ex 0:4 Läs följande citat (som är hämtat ur Olof Peterssons bok Opi nionsbildning): Ett samhälle med ett stigande överskott på information … Hur gör folk för att hitta det värdefulla i allt bruset? … Människor har aldrig bara varit passiva mottagare – och de fortsätter i den digitala tidsåldern att ha minst lika stort behov av andras hjälp för att tolka och orientera sig i sin omvärld.18
★ Har du själv någon uppfattning om hur mycket du påverkas av information som har sin förankring i eller sägs komma från undersökningar och statistik av olika slag? Reflekterar du någon gång över hur presenterade resultat och slutsatser kommit till? Ex 0:5 Hört och sett i programmet Gomorron Sverige i SVT: Vi måste göra en rättelse, då en del text föll bort i ett inslag i torsdags. Då sades det att ”7 av 10 präster var positiva till att viga par av samma kön”, men det är inte statistiskt korrekt eftersom ett stort antal präster valt att inte besvara enkäten. Rätt resultat ska vara ”70 procent …”.19
★ Ja, hur ska resultatet formuleras på ett riktigt sätt? Vad tror du
att resultatet skulle ha blivit om samtliga tillfrågade präster skulle ha svarat? Det framgår att ett stort antal valt att inte svara. Har du någon idé om hur stort bortfallet i procent kan ha varit?
Grundkurs i statistik.InD.indd 23
2011-06-30 10:08:18
24 |
grundkurs i statistik
0.6 Hängde du med? Här får du också använda sunt förnuft och erfarenhet! 0:A En definition av statistik lyder: ”En samling metoder att fatta kloka beslut trots rådande osäkerhet.” Påstående: Osäkerheten som åsyftas i definitionen avser människors varierande förmåga att kunna hantera statistik.
☐ Rätt
☐ Fel 0:A
0:B Påstående: När vi tar del av resultatet av en stickprovsundersökning är en av de viktigaste frågorna att tänka på hur urvalet har gjorts.
☐ Rätt
☐ Fel 0:B
0:C Påstående: Med en kvalitativ undersökning kan man gå mer på djupet och fånga upp nyanser bättre.
☐ Rätt
☐ Fel 0:C
0:D Påstående: Felmarginaler är ett samlat mått för de olika fel räkningar och registreringsfel som kan ha gjorts.
☐ Rätt
☐ Fel 0:D
0:E Påstående: För att kunna beräkna/uttala sig om risker måste det finnas en kontrollgrupp med i en undersökning.
☐ Rätt
☐ Fel 0:E
0:F Påstående: I statistisk metod är hantering av slumpen en viktig del.
☐ Rätt
☐ Fel 0:F
0:G Påstående: En sannolikhets värde kan variera mellan 0 och 1.
☐ Rätt
☐ Fel 0:G
0:H Påstående: Ett högt ohälsotal i ett län visar att sjukvården där fungerar bra.
☐ Rätt
☐ Fel 0:H
0:I Påstående: Mörkertal i brottsstatistiken ger information om att inte alla brott anmäls.
☐ Rätt
☐ Fel 0:I
0:J Påstående: Det var Winston Churchill som lär ha sagt: ”Allt går att bevisa med statistik – bara du ljuger ihop den själv.”
☐ Rätt
☐ Fel 0:J
Grundkurs i statistik.InD.indd 24
2011-06-30 10:08:18
kapitel 1
Samhällsstatistik
1.1 Vad handlar det egentligen om? Vi börjar med att saxa ur tidningen Metro:
Svårt att fatta politiska beslut utan ett tillförlitligt statistiskt underlag
Statistik används i utarbetandet av lagar och förordningar, den utnyttjas som underlag för forskning och i samhällsdebatten … Statistiken har alltid handlat om demokrati och kunskap … förstå den komplexa verklighet vi lever i. … Statistiska centralbyrån (SCB) ansvarar för den officiella statistiken på de flesta samhällsområden i Sverige. … Statistik är också ett viktigt arbetsredskap för organisationer och företag som vill påverka människor.20
★ Vilken tilltro känner du spontant för samhällsstatistik från SCB? ★ Kan du komma på något område där du tycker att det saknas statistiska uppgifter om samhället?
Fundera också gärna över följande citat av Annette Kullenberg (i en artikel i Aftonbladet):
Innehåll Kapitel 1 1. Vad handlar det egentligen om? 2. Kapitlet 3. Demokrati och folkbildning 4. SCB – en samlan de kraft 5. Struktur och fallgropar 6. Andra statistik producerande aktörer 7. Tillförlitlighet och begränsningar 8. Integritet och sekretess 9. Krav på kvalitetsredovisning
Äntligen! Sifo ringer till mig!
Man är med i Sifo. Jag är upptäckt. Av slumpen förstås. Det är onsdagkväll när Gittan Karlsson ringer från Sifo. Vad tänker du rösta på? undrar Gittan. Äntligen räknas just jag på allvar. Nu är jag med i de där fina
Grundkurs i statistik.InD.indd 25
2011-06-30 10:08:18
26 |
grundkurs i statistik
staplarna och påverkar hela valresultatet. … Där kryllar jag med en massa andra väljare. Därför berättar jag gärna för Gittan hur jag tänker rösta. Fastän sen blir det knepigt, det här med Sifo, eftersom jag hör hur Gittan andas djupt och drar till med något helt annat, nämligen: – Har du ätit Risifrutti? – Va? Nej! – Jo, det står här. Får jag ta några frågor till? Vad ska man göra? Har man gått med i Sifo så har man. Härmed en varning till alla som svarar när Sifo ringer. Det tar flera år (känns det som) och ni kan ställas inför frågor som får håret att resa sig på era huvuden. … Känner mig gråtfärdig på en skala 1–10.21
★ Vad tänker du om tillförlitligheten på statistiska uppgifter som tas fram av privata företag och opinionsundersökningsinstitut?
★ Vilken bakgrundsinformation om en opinionsundersökning skulle du vilja få när du tar del av resultatet?
Kort uttryckt så handlar samhällsstatistik om beskrivningar av hur samhället ser ut. Ursprungligen handlade det om sammanställningar av befolkningsuppgifter men idag innefattar det allt från övergripande information inom en mängd olika samhällsområden, till individuella förhållanden. Andra beteckningar som ibland används för denna typ av numeriska uppgifter är offentlig, officiell eller statlig statistik. Då tänker man emellertid närmast på uppgifter som produceras av olika myndigheter. Dessa begrepp leder också tankarna till att det är uppgifter som är ”kontrollerade” och att man kan lita på dem. Frågor om tillförlitlighet och tilltro är centrala i all statistikhantering.
1.2 Kapitlet Var och hur produceras den samhällsstatistik som i stor utsträckning formar vår bild av tillvaron? Hur presenteras den och hur kan vi själva hitta information? I detta kapitel för vi inledningsvis ett resonemang om statistik och demokrati, och presenterar därefter Statistiska centralbyrån (SCB) som är navet i Sveriges officiella statistik. Därefter beskriver
Grundkurs i statistik.InD.indd 26
2011-06-30 10:08:18
kapitel 1
•
samhällsstatistik
|
27
vi hur man tar fram en statistisk undersökning och vilka fallgropar som finns utifrån SCB:s perspektiv. SCB är inte den enda organisation som tar fram samhällsstati stik. Några andra aktörer inom den privata sektorn är till exempel Demoskop och Sifo. Kapitlet skulle inte bli komplett om vi inte tog upp något om samhällsstatistikens tillförlitlighet och begränsningar samt om frågan om personlig integritet och sekretess. Som en avslutning ges en kort sammanfattning av kraven på kvalitetsredovisning.
1.3 Demokrati och folkbildning Ordet statistik är en förkortning av det ursprungliga begreppet ”statsaritmetik”. Från början var det en beteckning som hade med geografiska förhållanden, författningen, befolkningen och näringslivet att göra. Det handlade alltså om en renodlad samhällsvetenskap. Att det finns en klar koppling till demokrati och samhälle blir mycket tydligt även ur ett historiskt perspektiv. Mycket kortfattat kan vi konstatera att:
• Statistikens historia tar sin början i 1600-talets Europa. På den
•
•
tiden låg inriktningen på att kunna få en översikt över och kunna jämföra olika småstater. Samtidigt växte en ny syn på kritisk och sann kunskap fram. I Sverige lade 1686 års lag om kyrkobokföring grunden för befolkningsstatistiken. Under 1700-talet ökade intresset för stats- och samhällsbeskrivningar och metoderna utvecklades. I Sverige inrättades Tabellverket (en samling statistiska tabeller över befolkningen) 1749 och sju år senare såg Tabellkommissionen dagens ljus. Under 1800-talet utvecklades en allmän statistisk metodlära. Den industriella utvecklingen aktualiserade behovet av ekonomisk och social statistik, och i Sverige inrättades Statistiska beredningen som sedan övergår i Statistiska tabellkommission 1886.
Genombrottet för parlamentarismen och demokratin i Sverige under senare hälften av 1800-talet är nu den drivande kraften i den
Grundkurs i statistik.InD.indd 27
2011-06-30 10:08:18
28 |
grundkurs i statistik
Läs gärna boken Svensk statistikhistoria av Olle Sjöström (Gidlunds förlag, 2002)
statistiska utvecklingen, där kunskapen om samhällsutveckling och människors levnadsförhållanden sätts i fokus. Statistik blir inte bara en fråga för staten. Även inom andra grupper, som till exempel de framväxande folkrörelserna, sågs det som en viktig uppgift att skaffa sig makt över samhällsutvecklingen. Att veta hur förhållandena i samhället såg ut och vilken utveckling som skedde blev en rättighet för gemene man. Statistik hade vid sekelskiftet blivit en folkbildningsfråga. En person som på många vis kan sägas illustrera detta samband är Rickard Sandler (1884–1964). Han var en av förgrundsgestalterna inom den socialdemokratiska arbetarrörelsen och arbetade som folkhögskollärare på Hola och Brunnsviks folkhögskolor under åren 1905–1926. År 1911 skrev han en statistisk lärobok som riktade sig till arbetarrörelsen: ”Samhället sådant det är”, och var en av initiativtagarna till studieförbundet ABF (1912). Sandler blev sedermera även statsminister (1925–1926) och var chef för Statistiska centralbyrån 1926–1932. Vi kan här se hur de olika trådarna flätas samman – i en väl fungerande demokrati ska vi som medborgare inte bara vara informerade om olika samhällsfrågor utan också ha förmåga och möjlighet att ta egna ställningstaganden och kunna påverka utvecklingen.
1.4 SCB – en samlande kraft En organisation som har utvecklats och haft ett starkt inflytande under denna historiska period är Statistiska centralbyrån. SCB är även idag en central aktör när det gäller statistik i Sverige. De ska trygga och styra försörjningen av relevant statistisk information.
1.4.1 Verksamhet SCB är en central förvaltningsmyndighet som har som främsta uppgift att förse intressenter med statistik. De flesta uppdragen kommer från regeringen och olika myndigheter men kunderna finns också inom det privata näringslivet och bland forskare. 2009 åtog sig SCB totalt 9 800 uppdrag och producerade därtill 74 publikationer och cirka 400 pressmeddelanden. Av SCB:s verksamhetsidé framgår att arbetet med att förädla data till statistisk information ska präglas av hög metodkompetens, brett
Grundkurs i statistik.InD.indd 28
2011-06-30 10:08:18
kapitel 1
ämneskunnande, modern teknik och kostnadseffektivitet. Några andra grundstenar i SCB:s arbete är att:
• Statistiken ska vara opartisk, relevant och av god kvalitet samt • •
•
samhällsstatistik
|
29
Statistiska centralbyrån (SCB): www.scb.se
vara baserad på vetenskapliga grunder. Underlätta uppgiftslämnandet och skydda insamlade grunddata. I samverkan med andra utveckla de gemensamma statistiksystemen, både nationellt och internationellt.
Detta ska förverkligas av SCB:s cirka 1 400 medarbetare (årsmedeltal) som jobbar i Stockholm och Örebro, samt av cirka 150 så kallade fältintervjuare. SCB har också till uppgift att stödja och samordna det svenska systemet för officiell statistik. Organisationen har själv ansvaret för sektorsövergripande statistik, medan 26 andra myndigheter ansvarar för statistiken inom sina egna verksamhetsområden. Tanken bakom detta decentraliserade ansvar är att statistiken ska bli mer relevant för användarna samtidigt som statistiksystemet blir mer flexibelt och effektivt. Ansvariga myndigheter för officiell statistik är förenade i Statistiknätverket. Varje myndighet publicerar sin statistik på den egna webbplatsen, men den går även att nå från SCB:s webbplats via länkar. För att utveckla olika verksamhetsgrenar har ytterligare råd och nämnder upprättats. Viktiga uppgifter för dessa är att fånga upp förändrade statistikbehov, stärka relationer och kontakter samt hålla information aktuell. Medlemskapet i EU och utvecklingen av internationella statistiska system sätter också sin prägel på SCB:s verksamhet. Stora resurser avsätts för samarbete med nya användare och för att tillgodose gemensamma statistikbehov. Det påverkar naturligtvis också innehållet i den officiella statistikproduktionen. EU-kommissionen upprättade 2005 en uppförandekod för europeisk statistik22 för att definiera förutsättningarna för framställning av statistik vid de europeiska statistikbyråerna. Uppförandekoden omfattar 15 principer som betonar statistikmyndigheternas oberoende och lagenliga rätt att samla in uppgifter. I principerna ingår också riktlinjer om rättigheter och skyldigheter, kvaliteten på statistikproduktionen och produkterna samt offentliggörandet av uppgifter.
Grundkurs i statistik.InD.indd 29
2011-06-30 10:08:18
30 |
grundkurs i statistik
1.4.2 Tillgänglighet Sedan 1997 har SCB lagt ut databaser på internet för att ökad tillgängligheten. I Statistikdatabasen finns omfattande officiell statistik. Där finns mängder av tabeller ur vilka man fritt kan söka efter valfria uppgifter för visning på skärm eller för utskrift. Statistikdatabasen är tillgänglig utan kostnad, men registrering krävs vid större uttag. Skräddarsydda uttag kan också göras ur databaserna för digital leverans. Kurser för dem som vill använda Statistikdatabasen hålls löpande. SCB har också ett omfattande bibliotek som innehåller statistiska resultatrapporter och som är öppet för allmänheten. Där finns bland annat officiell statistik från olika länder, statistiska publikationer utgivna av internationella organ och internationella databaser. 1.4.3 Statistisk årsbok I ett kapitel om samhällsstatistik måste också ”bibeln” inom området lyftas fram:
Statistisk årsbok – boken om Sverige
Hur stor andel av 16–24-åringarna utsattes för något brott mot enskild person? Hur mycket tjänar en gnosjöbo? Hur stora löneskillnaderna är mellan män och kvinnor. Hur mycket pengar Medelsvensson lägger ner på godis respektive frukt. Detta, plus mycket, mycket mer får du svar på i årets mest sanna bok. (SCB, 2010.)23
Denna presentation ger en viss inblick i vad boken innehåller, men en komplettering kanske kan vara på sin plats: Statistisk årsbok utges årligen sedan 1914 av SCB och bygger på insamlade uppgifter från myndigheter, institutioner och enskilda. Boken är ett statistiskt uppslagsverk som på cirka 700 sidor fångar in hela det svenska samhället med hjälp av tabeller, diagram, kartor och klargörande texter. Den innehåller också ett svenskt och ett engelskt sakregister, en utförlig källförteckning samt ett kapitel med internationella jämförelser. Boken finns även för nedladdning. Följ med på en veritabel vandring i sifferskogen … uppmanar SCB.
Grundkurs i statistik.InD.indd 30
2011-06-30 10:08:18
kapitel 1
•
samhällsstatistik
|
31
1.5 Struktur och fallgropar Men för en ”vandring i sifferskogen” kan det krävas en karta och kompass, och en första fråga skulle då kunna vara hur man kan komma fram till de olika sifferuppgifterna.
1.5.1 En statistisk undersöknings struktur En statistisk undersökning följer oavsett omfattning en arbetsgång där olika moment ska hanteras i en viss bestämd ordning. Vi utgår här från SCB:s modell ”Hur går en statistisk undersökning till?”15, men väljer att göra det i förenklad form (eftersom vi återkommer till frågan i avsnitt 2.4). Arbetsgången innefattar följande:
• Det första man gör är att definiera själva problemet. Vilken fråga är det som ska lösas? Om det handlar om politiska, sociala eller ekonomiska frågor så kan man behöva ta in information från många håll.
• I nästa steg gäller det att formulera problemet i statistiska termer.
Först då kan man angripa frågan med statistiska metoder. Det är viktigt att precisera syftet och säkerställa att det finns förutsättningar att genomföra undersökningen.
• Därefter är det dags att ta ställning till vad som ska undersökas. Går det att tydligt definiera och ringa in det? Och hur får man sedan tag på rätt material? Om man begränsar sig och gör ett urval så måste man göra det på ett statistiskt korrekt vis genom att låta slumpen avgöra.
• Nu måste man precisera vad eller vilka egenskaper det är som
ska observeras eller mätas, det vill säga samla in data. Man bör fundera kring vilken karaktär den statistiska informationen har och hur den sedan skulle kunna bearbetas.
• Eftersom det här handlar om en undersökning som syftar till
att presentera statistiska (numeriska) uppgifter är det viktigt att man redan från början bestämmer sig för att använda en viss
Grundkurs i statistik.InD.indd 31
2011-06-30 10:08:19
32 |
grundkurs i statistik
tabellplan, det vill säga ett antal tabeller som resultatet senare ska presenteras i. Detta gör man med tanke på den kommande databearbetningen.
• Ta därefter ställning till vilken eller vilka mätmetoder som ska
användas, det vill säga hur uppgifterna ska samlas in. Handlar det till exempel om registerdata, en brevenkät eller om telefoneller besöksintervjuer?
• Upprätta sedan en blankett med relevanta frågor, ett så kallat
mätinstrument. Lägg stor vikt vid formuleringen av frågorna för att undvika missförstånd.
• Genomför därefter datainsamlingen. I detta läge gäller det att få in många svar så att bortfallet blir litet.
• I nästa steg påbörjas databearbetningen som innehåller flera
delmoment: a) granskning (att komplettera och rätta felaktiga data), b) kodning (att ge uppgifterna olika sifferbeteckningar) samt c) dataregistrering (att överföra uppgifterna till digital lagring).
• Nu påbörjas tabellframställningen. De tabeller och diagram som definierats i tabellplanen tas fram och eventuellt ytterligare statistiska mått beräknas.
• Analys och publicering är det sista steget i processen. Resultaten
bör presenteras i en lämplig form och på ett så lättillgängligt sätt som möjligt.
1.5.2 Fallgropar och felaktigheter i officiell statistik? Statistiska uppgifter har – vilket vi betonat tidigare i boken – en stark genomslagskraft både när det gäller samhällsutvecklingen och vår vardag. Det är därför rimligt att ta upp frågan vad som händer när det uppstår felaktigheter i den statistik som till exempel SCB tar fram. Och vilka är de vanligaste fallgroparna när det gäller officiell statistik? Några tidningsrubriker24 kan illustrera detta:
Grundkurs i statistik.InD.indd 32
2011-06-30 10:08:19
kapitel 1
•
samhällsstatistik
|
33
Fel hotar förtroendet för SCB Myndigheten kan inte sköta sitt uppdrag Och vidare: Rättvisande statistik är en grundbult i samhället och kan ses som en del av infrastrukturen. Om förtroendet för siffrorna sviktar så tappar vi greppet om vart utvecklingen är på väg. … Alla kan göra misstag men det får inte hända för ofta.
I citatet ovan handlade det om ett fel i de siffror för det kommunala skatteutjämningssystemet som SCB hade tagit fram, och vilka konsekvenser detta kan få framhålls ju onekligen med skärpa. År 2008 inträffade något som fick stor uppmärksamhet och som kom att kallas skofelet. Det handlade då om en beräkning av konsumentprisindex (KPI) där en felaktig prisangivelse på skor fick långtgående konsekvenser: … gav alltför hög inflation. Detta kan ha påverkat Riksbankens räntepolitik och fick konkret effekt på statskassan då basbeloppet räknades upp och Försäkringskassan rättade sig efter det i sina utbetalningar. Totalt innebar missen att staten förlorade 600–700 miljoner kronor.25
Tala om att en siffra kan få stor betydelse! Men vad hade då hänt på SCB? Hur kunde ett sådant fel uppstå? De orsaker som nämndes var den mänskliga faktorn, krångliga system, missförstånd hos dem som lämnat underlag, programmeringsfel och bortglömd uppdatering av tabellnamn. På SCB arbetar man systematiskt och målmedvetet med frågor som rör kvalitetssäkring, men att helt eliminera olika fallgropar är omöjligt. Stati stiken kan även bli bristfällig när beräkningsunderlaget inte håller tillräckligt hög standard, vilket SCB själva påpekar:
Många orsaker till fel i en undersökning
Fel är avvikelser från ett sant värde. De uppstår då man i realiteten mäter något annat än det man strävar efter att mäta. Fel kan uppkomma i varje moment i en undersökning. Redan i planeringen
Grundkurs i statistik.InD.indd 33
2011-06-30 10:08:19
Jan Bystrรถm & Jonas Bystrรถm
Jan Bystrรถm Jonas Bystrรถm ISBN 978-91-27-12236-9
9 789127 122369
Bystrom_Gr_k_statistiken.hela.6.indd 1
11-06-16 15.28.59