9789144140902

Page 1

0

Statistisk verktygslåda – att förstå och förändra världen med siffror

Mimmi Barmark Göran Djurfeldt


Kopieringsförbud Detta verk är skyddat av upphovsrättslagen. Kopiering, utöver lärares och studenters begränsade rätt att kopiera för undervisningsändamål enligt Bonus Copyright Access kopieringsavtal är förbjuden. För information om avtalet hänvisas till utbildningsanordnarens huvudman eller Bonus Copyright Access. Vid utgivning av detta verk som e-bok, är e-boken kopieringsskyddad. Den som bryter mot lagen om upphovsrätt kan åtalas av allmän åklagare och dömas till böter eller fängelse i upp till två år samt bli skyldig att erlägga ersättning till upphovsman eller rättsinnehavare. Studentlitteratur har både digital och traditionell bok­utgivning. Studentlitteraturs trycksaker är miljöanpassade, både när det gäller papper och tryckprocess.

Art.nr 36073 ISBN 978-91-44-14090-2 Upplaga 2:1 © Författarna och Studentlitteratur 2015, 2020 www.studentlitteratur.se Studentlitteratur AB, Lund Omslagslayout: Jakob Meijling Omslagsbild: Matton Collection Sweden Printed by Dimograf, Poland 2020


INNEHÅLL

Förord 7 1 Statistik – vad ska en samhällsvetare med det till?  9

Strävan mot en hållbar värld  10 Olika sorters fattigdom  11 Vådan av hierarkier  14 ”Big data”   17 Hans Rosling och Gapminder  19 Kombinerade metoder  20 Statistik är ett redskap   22 Bokens disposition  23 2 Forskningsfrågan  25

Frågor av olika slag  25 Vad är en enkät?   27 Att vilja beskriva något  28 Att vilja förklara något  29 X och Y  31 Vem sitter på svaren?  35 Avgränsa populationen  35 Tvärsnitt eller över tid  36

©  F ö r fa t t a r na oc h S t ud e n t li t t e r a t u r

3


Innehåll

3 Att mäta  39

Att mäta verkligheten  39 Att operationalisera sina begrepp  42 Att mäta rätt sak – validitet  45 Att använda en stabil ”måttstock” – reliabilitet  46 Frågor eller påståenden?  48 Att formulera svarsalternativ  51 Neutrala alternativ  54 Öppna frågor  55 Uttömmande …   58 … men ej överlappande svarsalternativ  59 Enkätens utformning  61 4 Urval och insamling  63

Poängen med slumpmässiga urval  63 En förutsägbar slump  67 Stickprovets storlek  69 Varianter av slumpmässiga urval  70 Problemet med bortfall  73 Insamling av material  75 Att presentera sin studie   79 När slumpmässigt urval inte är möjligt  82 5 Innan det roliga kan börja  85

Att skapa en databas  85 Inkodning i SPSS   88 Vad var frågan nu igen?  92 Skalnivåer 92 Omkodning av variabler   97 Konstruktion av nya variabler  100 Konstruktion av index  102

4

©  F ö r fa t t a r na oc h S t ud e n t li t t e r a t u r


Innehåll

6 Analys av en variabel  109

Hur har de svarat?  109 Centralmått 115 Spridningsmått 117 Hur pass säker är vår skattning?  122 Att beräkna säkerhet – en djupdykning  124 Översikt univariat analys  129 7 Analys av samband  131

Tre typer av sambandsanalys  131 Hur starkt är sambandet?   134 Hur säkra kan vi vara på sambandet?  134 Korstabellanalys 136 Medelvärdesanalys 141 Spridningsdiagram och Pearson’s r 148 Regressionsanalys 154 Översikt bivariat analys  159 8 Att arbeta med andras data  161

Är du lycklig lille vän?  162 Tips om mikrodata   163 Makrodata 165 Ladda ner data från internet  166 Göra urval ur stora datafiler  168 Slå samman data från olika källor  169 Vikten av källkritik  170 9 Något litet om multivariat analys  173

Barn gör oss inte lyckligare  173 Är du färdig – eller är det bara början?  175 Statistisk kontroll  176

©  F ö r fa t t a r na oc h S t ud e n t li t t e r a t u r

5


Innehåll

10 Från fråga till färdig rapport  181

Börja skriva!  181 Var övertydlig  182 De olika delarna i en rapport eller uppsats  182 Inledning och bakgrund  183 Teori och metod  184 Analys och resultat  185 Sammanfattning och diskussion  187 Helheten 188 Sakregister 189

6

©  F ö r fa t t a r na oc h S t ud e n t li t t e r a t u r


KAPITEL 1

Statistik – vad ska en samhällsvetare med det till?

En bekant lagd åt det konspirationsteoretiska hållet frågade en gång: Vad är statistik? Det hörs ju på ordet ”statistik”. Det är ett verktyg för staten att kontrollera oss med!

Han hade kunnat lägga till ”och den globala kapitalismen” så hade han fått en mer komplett konspirationsteori! Men man kan precis lika gärna vända på det och säga att statistiken är ett viktigt instrument för medborgarna att kontrollera staten och politikerna med. Ta som exempel problemet med fattigdom: genom att definiera fattigdom så att den går att mäta kan samhällsvetare räkna de fattiga. Genom att klargöra vad vi menar med jämställdhet så kan vi också mäta graden av jämställdhet mellan män och kvinnor i olika delar av världen. Ett annat exempel är ungdomsarbetslöshet: vi kan inte bekämpa den utan att först bli överens om hur vi definierar den för att sedan skaffa oss en rimlig uppfattning om dess utbredning. Med statistikens hjälp kan vi följa upp effekterna av politiska åtgärder: Har socialpolitiska åtgärder haft någon effekt på fattigdomen? Har skatten på plastpåsar bidragit till minskad nedskräpning? Har den reformerade föräldraförsäkringen inneburit att barn får närmare relationer till sina pappor? Vi som skrivit denna bok är inte så naiva att vi tror att statistik enbart är ett verktyg för rättvisa och världsförbättring. När säkerhetstjänsten – välj om du vill tänka på amerikanska NSA, ryska FSB eller svenska Säpo –registrerar oliktänkande, ”terrorister” eller andra samhällsomstörtare är registret och statistiken verktyg för att kontrollera delar av befolkningen. Den snabba tekniska utvecklingen har också inneburit nya möjligheter för stater att ©  F ö r fa t t a r na oc h S t ud e n t li t t e r a t u r

9


1  Statistik – vad ska en samhällsvetare med det till?

effektivt massövervaka samtliga medborgare. Statistiken blir då ett verktyg för att upptäcka och undanröja eventuella hot mot den sittande regimen. I den här boken fokuserar vi dock på potentialen i att med statistikens hjälp kartlägga och analysera sociala problem och orättvisor av olika slag. Vi ska titta på några olika exempel och vi börjar med de globala hållbarhetsmålen och fattigdom – den kanske största orättvisan av alla i en värld med resurser att ge alla ett drägligt liv.

Strävan mot en hållbar värld Vid millennieskiftet enades världens ledare, koordinerade av Förenta Nationerna, om de så kallade Millenniemålen. Dessa bestod av åtta mål som skulle uppnås före 2015. Bland dem fanns mål som att halvera fattigdomen, öka jämställdheten mellan män och kvinnor, minska barnadödligheten och se till att alla barn får gå i grundskola. Även om alla målen inte uppnåddes så betraktar de flesta resultaten som en framgång och målet om halverad fattig­ dom var ett av de mål som 2015 officiellt bedömdes som uppnått. Samma år antog så FN:s generalförsamling de så kallade Globala målen för hållbar utveckling. Dessa mål är 17 till antalet och syftar sammantaget till att världen år 2030 ska vara ”ekonomiskt, socialt och ekologiskt hållbar”. Målen handlar bland annat om att bekämpa klimatförändringarna, värna den biologiska mångfalden, ge alla tillgång till god utbildning och rent vatten, anständiga arbetsvillkor med mera. Ett av målen är också att den extrema fattigdomen ska vara helt utrotad till år 2030. Men hur undviker man då att det bara blir tomma ord av sådana här målsättningar? Ja, helt avgörande för att denna typ av åtaganden ska få några ordentliga effekter är att det i efterhand går att utvärdera graden av måluppfyllelse. Vi behöver kunna följa utvecklingen och slå fast om andelen fattiga faktiskt minskar, om människor blir friskare etc. Och en förutsättning för att detta ska vara möjligt är att vi är överens om vad vi menar med de olika begreppen samt hur vi bäst går tillväga för att mäta fenomenen i fråga. Vad menar vi mer exakt när vi talar om ”jämställdhet”, ”anständiga arbetsvillkor” och ”tillgång till rent vatten”? Om vi menar lite olika saker kommer vi heller aldrig att kunna bli överens om ett mål är uppnått eller inte. En mycket viktig och tidskrävande del av processen med att ta fram de globala målen handlade därför om just konkretiseringen av dessa. De 17 10

©  F ö r fa t t a r na oc h S t ud e n t li t t e r a t u r


1  Statistik – vad ska en samhällsvetare med det till?

övergripande målen har brutits ned i 169 mer specifika delmål. I relation till dessa delmål har man i sin tur kommit överens om 244 indikatorer, det vill säga konkreta, mätbara variabler som tillsammans ska visa om ett mål uppnåtts eller inte. När det gäller fattigdom så utgår man i det här fallet från Världsbankens definition. Enligt denna definition är den extremt fattig som har mindre än 1,90 PPP dollar1 per dag att leva på. Andelen av en befolkning som lever på mindre än detta utgör således den främsta indikatorn på fattigdom. Det finns dock fler indikatorer, exempelvis hur stor andel av befolkningen som omfattas av någon form av socialt trygghetssystem. Fyra år efter att målen antogs publicerade FN 2019 en rapport där man redogör för hur utvecklingen sett ut hittills när det gäller de 17 målen.2 Den visar till exempel att fattigdomen fortsätter att sjunka men att den inte sjunker lika snabbt som tidigare. Det ser därför ut som att målet om utrotad fattigdom inte kommer att nås till 2030 om inte ytterligare åtgärder vidtas. När det gäller utsläppen av växthusgaser ser det ännu mörkare ut – dessa fortsätter att öka trots målet om en minskning med 45 procent 2030 jämfört med 2010 års nivåer. Det kan tyckas dystert men det är just därför sådana här utvärderingar är så viktiga – genom att vi får svart på vitt att de åtgärder som vidtagits hittills inte är tillräckliga så ökar också pressen på makthavare och andra att göra mer framöver för att målen ska kunna nås. Väl underbyggda siffror som visar hur världen utvecklas i olika avseenden, siffror som kan accepteras av den stora majoriteten, är alltså avgörande för att vi tillsammans ska kunna hantera de utmaningar vi står inför.

Olika sorters fattigdom Hållbarhetsmålen utgår alltså från Världsbankens definition av fattigdom. Syftet med denna är att definiera gräns för hur mycket (eller snarare lite) en människa behöver för att kunna tillgodose sina allra mest grundläggande behov av sådant som mat, kläder, tak över huvudet och basal sjukvård. Men

1  PPP dollar är vad man kallar köpkraftsjusterade och ska återspegla den lokala köpkraften hos en amerikansk dollar. PPP dollar anses bättre avspegla nationella levnadsnivåer än dollar värderade efter officiella växelkurser. 2  Se https://unstats.un.org/sdgs/report/2019/

©  F ö r fa t t a r na oc h S t ud e n t li t t e r a t u r

11


1  Statistik – vad ska en samhällsvetare med det till?

om vi för ett ögonblick lämnar det globala perspektivet och koncentrerar oss på lilla Sverige – har vi inga problem med fattigdom här? Den senaste PPP-kursen för svenska kronan är 8,92 kronor.3 Det innebär att den internationella fattigdomsgränsen i svenska kronor i början av 2020talet är cirka 17 kronor per dag eller 517 kronor i månaden. Knappast några svenskar har det så knapert. Tack vare en relativt god ekonomi och sociala trygghetssystem är det få i Sverige som inte har råd med det allra nödvändigaste. Men innebär det att vi kan luta oss tillbaka eller finns det anledning att tala om fattigdom även i en svensk kontext? Människan är ju en social varelse och hur vi upplever vår egen levnadsstandard är i hög grad beroende av hur det ser ut i vår omgivning – det vill säga vi jämför oss med andra. Många barn kan vittna om det plågsamma i att tvingas gå i syskonens ärvda kläder, att inte kunna följa med kompisarna på bio och aldrig få åka på någon längre semesterresa. Dessa barn är ju inte fattiga enligt Världsbankens definition, det vill säga de är inte fattiga i absolut bemärkelse utan det handlar snarare om fattigdom i relativ bemärkelse. Men hur kan vi då mäta detta? OECD4, som är industriländernas ekonomiska samarbetsorganisation, använder en definition enligt vilken den är fattig som disponerar mindre än hälften av den nationella medianinkomsten (se kapitel 6 för en definition av medianen). Detta är alltså ett mått på relativ fattigdom: vem som kommer att definieras som fattig beror på hur mycket alla andra i samhället tjänar. Enligt Statistiska centralbyrån, vars uppdrag är att leverera statistik till regering, riksdag, myndigheter och allmänhet, var medianinkomsten i riket 30 900 kronor i månaden före skatt år 2018. Det skulle betyda att fattigdomslinjen enligt OECD:s definition var 15 450 kronor i månaden. Vilket i sin tur är cirka 30 gånger mer än den absoluta fattigdomsgränsen. Det säger något om klyftorna i världen – att den som är fattig i Sverige – som verkligen inte har mycket att leva på – ändå har 30 gånger mer att spendera än den som är fattig i ett fattigt land! Man kan diskutera exakt var gränsen för relativ fattigdom bör dras men måttet ger oavsett en viktig indikation på hur de ekonomiska klyftorna i ett samhälle förändras över tid. År 2013 var exempelvis andelen relativt 3  http://stats.oecd.org/Index.aspx?DataSetCode=PPPGDP, (nedladdat 2020-04-11). 4  Organization for Economic Cooperation and Development.

12

©  F ö r fa t t a r na oc h S t ud e n t li t t e r a t u r


1  Statistik – vad ska en samhällsvetare med det till?

fattiga i Sverige 14 procent, vilket var nästan en fördubbling jämfört med 1995.5 Det indikerar alltså att den ekonomiska ojämlikheten under denna period har ökat. För den som inte är ekonom kan det dock tyckas utomordentligt ”fattigt” att definiera fattigdom enbart i ekonomiska termer. I Sverige har vi tillgång till gratis utbildning, sjukvård till kraftigt subventionerade priser, rent och billigt vatten, någorlunda frisk luft att andas etc. Jämför man två personer som har samma inkomst (eller utgifter) där den ena har tillgång till allt detta och den andra saknar det, är det självklart att den senare är mycket fattigare än den förra. Världsbanken, OECD och andra har också fått mycket kritik för sin ”ekonomistiska” syn på fattigdom. Därför vill vi även kort nämna multidimensionell fattigdom, som är en bredare ansats för att mäta och forska om fattigdom som presenterades för några år sedan av engelska forskare under ledning av Sabina Alkire6. Detta fattigdomsmått innefattar bland annat tillgång till näring, utbildning, fritidsaktiviteter och information och har nu etablerats som ett av de viktigaste sätten att mäta fattigdom. Multidimensionell fattigdom mäts och rapporteras årligen av FN:s utvecklingsorgan, UNDP, i deras Human Development Report.7 Vad vi vill lyfta fram med detta exempel är att vi ofta behöver flera olika begrepp, definitioner och mått på saker och ting för att på ett bra och nyanserat sätt kunna beskriva och mäta vår omvärld. Det är ju inte så att ett sätt att mäta fattigdom är det generellt bästa utan snarare handlar det om att de olika fattigdomsbegreppen kan användas för att belysa olika saker. De kompletterar alltså, snarare än konkurrerar med, varandra. Vi ska nu gå vidare på temat ojämlikhet och titta på vilka konsekvenser sociala hierarkier kan få för vår hälsa.

5  Källa: OECD (2017) OECD Economic Surveys: Sweden 2017, OECD Publishing, Paris. 6  Alkire, S. & M.E. Santos (2010). Acute Multidimensional Poverty: A New Index for Developing Countries. OPHI Working Papers. Oxford, Oxford Poverty & Human Development Initiative, Oxford Department of International Development, Queen Elizabeth House, University of Oxford. 7  http://hdr.undp.org/en/statistics/mpi/, (nedladdat 2020-04-11).

©  F ö r fa t t a r na oc h S t ud e n t li t t e r a t u r

13


1  Statistik – vad ska en samhällsvetare med det till?

Vådan av hierarkier En av dem som betytt mest för forskningen om sociala orättvisor och ohälsa är Sir Michael Marmot, adlad för sina insatser. Som ung läkare blev han anlitad av den engelska regeringen för att arbeta med att förebygga ohälsa bland de anställda i Whitehall, den engelska motsvarigheten till Rosenbad, alltså regeringskansliet. Marmot blev förbluffad när han upptäckte att sjukligheten hade ett så nära samband med positionen i hierarkin. Det var inte de stressade cheferna som var mest sjuka och som hade kortast livslängd utan de som var underst i hierarkin: vaktmästare, städpersonal och sekreterare. I toppen av hierarkin klagade cheferna över stress, långa arbetstider och stort ansvar, vilket man skulle förvänta sig påverkade deras hälsa. Men så var det inte: i toppen av hierarkin tenderade folk att vara kärnfriska och deras förväntade livslängd var längre än den var för deras underlydande. Figur 1.1 är ett grupperat stapeldiagram och visar relativ dödlighet för en grupp Whitehall-anställda jämfört med andra inom samma åldersgrupp. Referensvärdet är här lika med 1 och markerat med en horisontell linje i figuren. Grupper som hade högre dödlighet än genomsnittet för åldersgruppen har alltså en stapel som ligger över referenslinjen, medan de som hade en lägre relativ dödlighet ligger under denna linje. Vi ser att det är fyra kategorier av anställda som jämförs: högre administrativa chefer, hand­läggare och mellanchefer, kontorspersonal och övriga. Dessutom jämförs dessa kategorier av anställda inom åldersgrupper. Ta som ett exempel den yngsta åldergruppen: vid 40 till 64 års ålder hade högre administrativa chefer 40 procents lägre dödlighet än genomsnittet för åldersgruppen.8 Nästa tjänstekategori, handläggare och chefer, hade i samma åldersgrupp cirka 10 procents lägre relativ dödlighet. Kontorspersonalen i samma åldersgrupp hade i sin tur 40 procent högre dödlighet än snittet medan den lägsta gruppen i hierarkin i samma åldersgrupp hade mer än 200 procent högre dödlighet. Teoretiskt sett finns det två möjliga förklaringar till det mönster vi ser i figur 1.1. Den första möjligheten är en selektionseffekt, det vill säga att männi­ skor med lägre förväntad livslängd ”väljer” eller blir hänvisade till att arbeta på lägre nivåer i hierarkin. Den andra möjligheten är att livsvillkoren för 8 Här räknar man 1 – 0,6 = 0,4 och översätter denna proportion till procent, d.v.s. 40 procent.

14

©  F ö r fa t t a r na oc h S t ud e n t li t t e r a t u r


1  Statistik – vad ska en samhällsvetare med det till? Relativ dödlighet

Tjänstekategori Högre administrativa chefer Handläggare och chefer Kontorspersonal Övriga

2,50

2,00

1,50

1,00

,50

0

40–64

65–69 Åldersgrupp

70–89

Figur 1.1  Relativ dödlighet bland anställda i regeringskansliet Whitehall.

olika kategorier av anställda skiljer sig åt. Till exempel kan arbetsvillkoren gynna hälsa och ett längre liv för dem som är högre i hierarkin samtidigt som de leder till högre sjuklighet och kortare livslängd för dem som befinner sig längst ner i hackordningen. Man kan tänka sig att både selektionseffekten och effekten av att befinna sig på en viss nivå i hierarkin samverkar och ger de resultat vi ser i figuren. Enligt Marmot är dock ohälsoeffekten av hierarkier den viktigaste förklaringen och han argumenterar för detta bland annat genom att visa hur skådespelare som vunnit en Oscar i genomsnitt lever längre än skådespelare som nominerats till, men inte vunnit, den eftertraktade statyetten. Dessa båda grupper lär ju ha väldigt likartade livsvillkor i övrigt så det enda som rimligen kan ligga bakom skillnaden i dödlighet är den sociala status som följer med att vinna priset. Marmot kallar därför detta fenomen för statussyndromet. Vi ska ge ytterligare ett exempel på sambandet mellan social position ©  F ö r fa t t a r na oc h S t ud e n t li t t e r a t u r

15


1  Statistik – vad ska en samhällsvetare med det till? Dödlighet procent 15,0

10,0

5,0

0

Doktorsgrad

Högre akademisk examen

Lägre akademisk examen

Gymnasieutbildning

Yrkesutbildning

Endast obligatorisk skolutbildning

Utbildningsnivå

Figur 1.2  Skillnader i dödlighet hos män med olika lång utbildning (svenska befolkningen 1990–96).

och hälsa. Det är den svenske sociologen Robert Eriksson som studerat hur dödligheten hos svenska män påverkas av deras utbildningsnivå. Han använde så kallade registerdata, i detta fall den svenska folkbokföringen, och kunde följa dödligheten för både män och kvinnor mellan 25 och 65 års ålder vid mantalsskrivningen 1990. Resultaten för män sammanfattas i figur 1.2 och sambandet mellan utbildning och dödlighet syns här mycket tydligt: lågutbildade män har exempelvis mer än dubbelt så hög dödlighet som högutbildade akademiker. Det finns alltså ett tydligt statistiskt samband mellan utbildning och livslängd: ju lägre utbildningsnivå, desto högre dödlighet. Med dessa exempel vill vi visa hur statistik kan användas som ett redskap i kampen mot olika former av orättvisa. Genom att ta fram siffror av detta slag kan vi på ett övertygande sätt synliggöra problem som finns i samhället. Siffror har en stark retorisk kraft och om dina siffror tål att granskas av kritiker och skeptiker när de presenteras i en uppsats, en utredning eller en 16

©  F ö r fa t t a r na oc h S t ud e n t li t t e r a t u r


1  Statistik – vad ska en samhällsvetare med det till?

forskningsrapport kan de bli allmänt accepterade och ett verktyg i kampen för en bättre, rättvisare värld.

”Big data” Har du precis som vi fått brev från din livsmedelshandlare som ger dig extraerbjudanden, men inte på vilka varor som helst utan på sådant som du brukar köpa? Anledningen till att detta är möjligt är förstås att dina inköp registreras i livsmedelskedjans databas när du drar ditt stamkundskort. Och så gör även alla andra ”stamkunders” inköp. Detta är ett exempel på ”big data” – enorma datamängder som lagras och bearbetas med ”data mining”, specialutvecklade program som trålar i datahaven efter användbar information. Data mining (eller ”informationsutvinning” som det ibland översätts till) ägnar sig även exempelvis våra säkerhetstjänster åt. Amerikanska National Security Agency, NSA, hamnade mitt i mediastormen när Edward Snowden år 2013 läckte detaljer om alla dess avlyssningar av mejl, internet och telefoner i hela världen. Sociologiprofessorn Stefan Svallfors nominerade Snowden till Nobels fredspris9, men Snowden kommer nog snarare att jagas av amerikans­ka agenter resten av livet. När detta skrivs har han nyligen fått permament uppehållstillstånd i Ryssland. Digitaliseringen har inneburit att mängden tillgänglig data ökar oerhört snabbt. Användandet av sociala medier har exempelvis inneburit att människor över hela världen dagligen delar med sig av sammantaget närmast ofattbara mängder text och bilder. Att all denna information utgör en potentiell guldgruva och är hett eftertraktad både av företag och andra intressenter är också en insikt som så sakteliga börjar sjunka in hos alla miljontals uppkopplade användare. En händelse som bidrog till detta var när det 2018 uppdagades att Facebook delat information om sina användare med företaget Cambridge Analytica. Användarna – de flesta amerikaner – var ovetandes om detta och hade än mindre godkänt det. Enligt en före detta anställd, Christopher Wiley, användes materialet för att hjälpa Donald Trump i presidentvalskampanjen 2016 – ett val som han sedan också vann. Med hjälp av informationen om 9  www.expressen.se/nyheter/snowden-nominerad-till-nobels-fredspris/, (nedladdat 2013-12-06).

©  F ö r fa t t a r na oc h S t ud e n t li t t e r a t u r

17


1  Statistik – vad ska en samhällsvetare med det till?

användarna och avancerade statistiska metoder lyckades företaget skapa relativt sofistikerade ”profiler” av dessa. Därefter skräddarsyddes riktat kampanjmaterial till de olika grupperna av användare. Liknande diskussioner, om än i mindre skala, uppstår med jämna mellanrum som exempelvis då det uppdagades hur vanligt förekommande appar på våra mobiltelefoner registrerar våra rörelsemönster dygnet runt. Informationen, som sedan säljs vidare till exempelvis detaljhandeln, visade sig vara så detaljerad och exakt att det enkelt går att identifiera enskilda individer trots att den formellt sett är anonymiserad.10 Men ”big data” är ju inte intressant enbart för kommersiella och politiska aktörer, utan även för forskningen. När den andra upplagan av denna bok skrivs så används den för att kartlägga människors rörelsemönster i coronapandemin. I vilken utsträckning följer människor i olika regioner Folkhälsomyndighetens rekommendationer? På vilken typ av platser tenderar många människor att mötas? Sådan information är viktig när rekommendationer ska utformas och andra åtgärder vidtas för att kontrollera smittspridningen. Och den kan användas för att utveckla en mer generell kunskap kring människors beteendemönster i pandemi-tider, kring riskkommunikation och liknande – kunskap som kan visa sig värdefull i liknande situationer framöver. Samtidigt som det finns klara risker med att så stora mängder detaljerad information kan samlas in och analyseras, öppnar det också nya möjligheter för forskningen. Intresset för ”big data” har därför vuxit explosionsartat inom en rad ämnesområden de senaste åren och nya metoder för att bearbeta och analysera denna typ av data utvecklas snabbt. En som relativt tidigt intresserade sig för potentialen i ”big data” var studenten James Ransom. När han skrev sin masteruppsats på Lunds universitet 2013 ville han undersöka hur denna typ av information kan användas för att bekämpa korruption.11 Han använde sig av BBC Monitoring Reports som dagligen följer och transkriberar nyhetsrapporter från drygt 150 länder på mer än 100 språk. (Transkribering innebär att talat språk överförs till skrift.) Med digitaliseringen har rapporterna anpassats så att nyhetstexter samlas in också från digitala medier. 10 https://www.dn.se/din-plats-till-salu/ 11 Ransom, J. (2013). Replicating Data Mining Techniques for Development: A Case Study of Corruption. Master thesis, Lund University.

18

©  F ö r fa t t a r na oc h S t ud e n t li t t e r a t u r


1  Statistik – vad ska en samhällsvetare med det till?

Under den femårsperiod Ransom valde att fokusera var ordet korruption nämnt i 34 666 artiklar. Så många texter läser man inte igenom på en kafferast! I stället utsattes urvalet av artiklar för en analys genom data mining. Programvara för data mining finns numera i vitt spridda dataprogram som SPSS, men Ransom använde sig i stället av gratisprogrammet Rapid Miner.12 Motivet för att undvika program som SPSS är att de är dyra, åtminstone för en privatperson eller en liten organisation. Ransom bearbetade sina många artiklar med en teknik som kallats ”linguistic data mining”. Tekniskt går det till så att varje ord i artiklarna görs till en dataenhet, med det underliggande antagandet att ”meningen” i en text kan representeras av en frekvenstabell över de vanligaste orden som använts i texten. Det säger sig självt att ordet mening i föregående stycke måste sättas inom citationstecken, och att knappast någon skulle vilja hävda att en texts mening i någon mer djuplodande betydelse kan fångas av en sådan tabell. Men utan att gå in på detaljer så har Ransom lyckats konstruera ett index som när det är färdigutvecklat kan avspegla samhällsdebatten i ett givet land och hur den utvecklats över tid. Man kan också rangordna länder och få fram ett komplement till Transparency Internationals13 ”corruption perception index”. James Ransoms masteruppsats är ytterligare ett exempel på hur enskilda forskare, studenter och andra kan använda statistik och data – i det här fallet big data – för att bidra till kampen mot världens många orättvisor. Som exemplet visar erbjuder digitaliseringen nya möjligheter för sådan forskning och aktivism. Men det gäller förstås att forskarna och aktivisterna lär sig att hantera redskapen.

Hans Rosling och Gapminder När den amerikanska tidskriften Foreign Policy listade årets 100 främsta tänkare år 2009 kom Hans Rosling med på listan: Motiveringen löd ”för att han får våra tankar att svindla med banbrytande statistik”. Och vidare: ”Roslings sätt att använda siffror för att slå sönder fördomar om rika och fattiga länder 12  Se http://rapid-i.com/content/view/181/ (nedladdat 2020-04-11). 13  Transparency International är en frivilligorganisation grundad i Tyskland och en av de viktigaste aktörerna i den globala kampen mot korruption.

©  F ö r fa t t a r na oc h S t ud e n t li t t e r a t u r

19


1  Statistik – vad ska en samhällsvetare med det till?

har gjort honom världsberömd.”14 Rosling, som avled 2017, kom att bli sin tids internationellt kanske mest kända svenska samhällsforskare – trots att han var medicinare. Hans huvudbudskap var att utvecklingen i världen är betydligt mer positiv än vad de flesta människor tror och han förmedlade detta budskap med massor av energi – och statistik! Boken ”Factfulness”, som han skrev tillsammans med sin son Ola Rosling och svärdotter Anna Rosling Rönnlund och som gavs ut efter hans död, har blivit en internationell bästsäljare. Bill Gates lär ha sagt att boken är en av de viktigaste han läst i sitt liv och han beslöt också att ge bort ett e-exemplar till alla som tog examen från college och universitet samma år. Tillsammans med sin son och svärdotter utvecklade Rosling mjukvaran bakom de ”bubbeldiagram” han har kommit att förknippas med. (Denna såldes sedan till Google och används nu av många andra.) De startade också stiftelsen Gapminder och deras hemsida är väl värt ett besök! Här kan den som enkelt vill skaffa sig en bild av utvecklingen i världen genom att själv kombinera variabler som BNP, barnadödlighet, koldioxidutsläpp, läskunnighet med mera.15 På Gapminders hemsida kan även den hugade testa sina kunskaper om, vad Rosling menade är, tretton ”grundläggande globala fakta”. Hur är det med dig – har du lika dålig koll som han menade att de flesta av oss har? 16

Kombinerade metoder Under senare år har behovet av och nyttan med att kombinera olika metoder kommit i centrum av debatten. Som så ofta inom samhällsvetenskaperna har vi fått en ny term för att beteckna detta, mixed methods, eller med vårt förslag till svensk term: kombinerade metoder. Genom att kombinera metoder kan man åstadkomma resultat som inte kan uppnås enbart genom statistiska metoder. De senares stora styrka är möjligheterna att generalisera. Statistik kallas ibland för de stora talens vetenskap: siffrorna gäller ofta stora grupper. Tyvärr tenderar individerna 14  Se http://sv.wikipedia.org/wiki/Hans_Rosling samt www.foreignpolicy.com/ articles/2009/11/30/the_fp_top_100_global_thinkers?page=0,32. Se också dokumentären ”Roslings värld”: http://dfilm.se/roslings-varld/. Referenserna nedladdade 2013-09-04. 15 https://www.gapminder.org/tools/#$chart-type=bubbles 16 http://forms.gapminder.org/s3/test-2018

20

©  F ö r fa t t a r na oc h S t ud e n t li t t e r a t u r


1  Statistik – vad ska en samhällsvetare med det till?

att försvinna i alla data. Möjligheterna att generalisera köps alltså till ett pris: individerna och deras verklighet försvinner. Det kan i sin tur innebära att det blir svårt att dra slutsatser om varför vissa samband finns, det vill säga vilka mekanismer som är inblandade. Ett exempel: i många sammanhang har statsvetare noterat att egna företagare i högre utsträckning röstar borgerligt än vad till exempel löntagare gör. Här har vi en korrelation som kan uttryckas genom en betingad sannolikhet. Väljarna har större sannolikhet att rösta på ett borgerligt parti om de är egna företagare än om de inte är det. Det är enkelt att anta att detta samband avspeglar ett orsakssamband, som i sin tur kan kopplas till exempelvis en teori om att man röstar efter sina ekonomiska intressen. Men är det så givet? Man kan också tänka sig att människor som har en benägenhet att rösta borgerligt också har en större benägenhet att bli egna företagare. Orsakssambandet kan alltså teoretiskt gå i två riktningar, antingen leder eget företagande till att man röstar borgerligt eller så leder borgerliga sympatier till att man startar eget. Man behöver bara tänka en stund för att inse att det förmodligen ligger ett dubbelriktat orsaksförhållande under det statistiska sambandet. Människor som är födda i företagarfamiljer har en större benägenhet att starta företag och att rösta borgerligt, men det är förmodligen också så att de som driver företag, oavsett bakgrund, har en större benägenhet att rösta borgerligt. Detta kan till viss del utredas statistiskt genom att testa om egna före­ tagare med borgerlig bakgrund har större tendens att rösta borgerligt än de som har annan bakgrund. (Vi återkommer till detta som en övningsuppgift i kapitel 9.) Ett annat sätt att få inblick i det statistiska sambandet är dock att intervjua ett antal företagare om deras livshistoria, deras familjebakgrund och värderingar, hur olika erfarenheter de gjort påverkat hur de uppfattar världen, etc. På så vi vis kan vi få en mer djuplodande bild av på vilka olika sätt politisk uppfattning och företagande kan vara relaterade till varandra. I metodundervisningen på landets samhällsvetenskapliga institutioner undervisar man numera oftast i både kvantitativa och kvalitativa metoder. Däremot verkar det fortfarande vara så att metoder ofta lärs ut i två olika block som ges olika vetenskapsteoretiska motiveringar, till exempel konstruktivism kontra realism. Metoderna lärs ut av olika lärare och man kan få intrycket att det är två väsensskilda ”familjer” av metoder, två olika påsar med sinsemellan olika sorters ”metodgodis”. Som student får man lära sig om ©  F ö r fa t t a r na oc h S t ud e n t li t t e r a t u r

21


1  Statistik – vad ska en samhällsvetare med det till?

fördelarna med kvant-metod på kvant-kursen och med kval-metod på kvalkursen och fram till nyligen (vårt intryck är att detta är på väg att förändras) har man sällan fått lära sig hur metoderna tillsammans kan användas för att belysa olika typer av frågor. Den skarpa uppdelningen i kvalitativa och kvantitativa metoder har också inneburit att de stora skillnaderna inom respektive kategori osynliggörs. Man glömmer lätt att statistikpåsen innehåller en rad olika metoder, användbara till olika saker. Det är likadant med den andra påsen, det är en enorm skillnad mellan komparativa studier av länder, som statsvetare ofta arbetar med, och serier av djupintervjuer som sociologer, vårdvetare, socionomer och andra är förtjusta i. Dessa metoder skiljer sig i sin tur från arkivstudier, som historiker och andra är specialister på. Ju större kännedom man har om det stora smörgåsbord av metoder som finns, desto större möjligheter har man att finna den kombination av metoder som är lämpligast för att belysa en viss fråga.

Statistik är ett redskap Vi kommer tillbaka till den inledande frågan om vad en samhällsvetare ska med statistik till. Som vi konstaterat tidigare så är statistik ett viktigt redskap för staten, vare sig vi talar om den stat som ska ha monopol på våldsanvändning och rättskipning i en välfungerande stat, eller om vi talar om den stat som ska förse sina medborgare med utbildning, sjukvård och pensioner. Staten använder statistik för att registrera, kontrollera och beskatta medborgarna, men samma redskap används för att utbilda och vårda dem. För samhällsvetare är stat, kommun och regioner de viktigaste arbets­ givarna. Samhällsvetarna är delar av det maskineri som används både för att kontrollera, utbilda och vårda befolkningen. Men samhällsvetare forskar också om samhället, inte sällan med en kritisk udd. På så vis är vi både en del av staten och kritiker av densamma. I ett demokratiskt välfungerande land finns ingen motsättning mellan dessa två roller utan tvärtom är den öppna, faktabaserade debatten en förutsättning för att samhället ska fungera och utvecklas. I det här kapitlet har vi gett några exempel på hur statistik och siffror spelar en central roll i den globala kampen för rättvisa och bättre levnadsvillkor. Vår bild är att inte bara vi, utan de flesta samhällsvetare vi möter, 22

©  F ö r fa t t a r na oc h S t ud e n t li t t e r a t u r


1  Statistik – vad ska en samhällsvetare med det till?

drivs av en vilja att göra världen lite bättre i något avseende. För att lyckas med det krävs både god samhällsvetenskaplig teori och goda metoder. Och även om vi med statistikens hjälp inte kan besvara alla frågor så finns det många viktiga frågor som inte kan besvaras på något annat sätt. Statistiken är därmed en central ”hjälpvetenskap” till samhällsvetenskapen och grundläggande kunskaper i statistik är svåra att undvara för den samhällsvetare som på ett eller annat sätt vill göra skillnad i världen.

Bokens disposition Efter denna inledning följer ett kapitel om att formulera forskningsfrågor och hur frågorna förhåller sig till metoden. Som vi konstaterat ovan kan inte alla frågor besvaras med kvantitativa data, och det finns även olika slags kvantitativa frågor. I kapitel 3 ställer vi frågan: Vad innebär det att mäta sociala fenomen och hur går det till? Därefter följer kapitel 4 om urval och insamling av data. Det är inte alltid nödvändigt att samla in egna data, men att förstå teknikerna för dataproduktion och alla vidhängande problem är nödvändigt om man vill förstå hur statistik ska tolkas, beskrivas och analyseras. Kapitel 5 handlar om inmatning och bearbetning av data. De två efterföljande kapitlen handlar om att analysera data, först en variabel i taget i kapitel 6 och därefter samband mellan två variabler i kapitel 7. Kapitel 8 ger en handfast introduktion till att arbeta med andras data, inklusive offentlig statistik. Kapitlet ger en översikt över de väldiga mängder av data som i dag finns tillgängliga via internet. I kapitel 9 får läsaren ett smakprov på vad som går att åstadkomma med multivariat analys och i kapitel 10 avslutar vi med att ge tips kring hur man bäst avrapporterar sina resultat. Vi instämmer med Hans Rosling: Statistik är roligt!17 Gott nöje vid läsningen och arbetet med denna bok. PÅ WEBBEN SA M M AN FAT TN I N G K APITE L 1  ÖV N I N GAR K APITE L 1

17  Se filmen på www.gapminder.org/videos/the-joy-of-stats/; nedladdat 2020-04-11.

©  F ö r fa t t a r na oc h S t ud e n t li t t e r a t u r

23


Mimmi Barmark är lektor i sociologi vid Sociologiska institutionen på Lunds universitet och har forskat om frivilligt deltidsarbete, sociala förklaringar till ohälsa och den mångkulturella gymnasieskolan. Hon har lång erfarenhet av undervisning i kvantitativ metod på olika nivåer. Göran Djurfeldt är professor emeritus vid Sociologiska institutionen på Lunds universitet. Han har forskat om jordbruks- och landsbygdsutveckling i Indien och i Afrika söder om Sahara. I sin forskning har han kombinerat statistiska och andra metoder. Som lärare har han lagt stor vikt vid att lära ut kvantitativ metod.

Statistisk verktygslåda 0 – att förstå och förändra världen med siffror Författarna till denna bok hävdar att statistik är ett viktigt verktyg för att förstå och förändra världen. Fattigdom kan inte förstås eller avskaffas utan att kunna mätas. Detsamma gäller andra orättvisor: för att studera dem måste vi kunna definiera och mäta dem. Barmark och Djurfeldts bok vänder sig speciellt till läsare som känner motstånd mot att närma sig kvantitativa metoder. Här ges en introduktion till grundläggande statistisk analys med fokus på principerna, vid att förstå vilken analysform som är bäst i en viss situation och vid att tolka resultaten. Boken går utmärkt att läsa utan att förstå en enda formel. Boken riktar sig främst till studenter på grundläggande nivåer inom samhällsvetenskapliga ämnen. Den kan läsas av alla som vill göra en enkätundersökning eller skaffa sig kunskaper i grundläggande statistisk analys. På bokens webbplats finns instruktionsfilmer och övningar tillgängliga. Till varje analysavsnitt finns en kort ”SPSS-guide” som anger hur man konkret genomför motsvarande analys i statistikprogrammet SPSS. Instruktioner för hur man kommer åt det digitala materialet finns på omslagets insida.

Andra upplagan Art.nr 36073

studentlitteratur.se


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.