Christer Thrane
Kvantitativ metode En praktisk tilnĂŚrming
Innhold Forord................................................................................................................................ 7 Kapittel 1 Forskning, kvantitativ metode og statistisk analyse ............................................ 13 1.1 Trines studentvenner og deres oppmøteprosent på forelesninger............ 13 1.2 Forskning, kvantitativ samfunnsforskning, kvantitativ metode – og denne boken ............................................................................................... 17 1.3 Problemløsning i hverdagen = besvaring av problemstillinger i forskning .............................................................................................................. 19 1.4 Hvorfor lære kvantitativ metode? ................................................................... 21 1.5 Faser innen kvantitativ samfunnsforskning ................................................... 22 1.6 Sentraltendens og spredning: gjennomsnitt og median; standardavvik og variasjonsbredde ................................................................ 24 1.7 Et større eksempel: Trines andre undersøkelse om oppmøteprosent på forelesninger .................................................................................................. 26 1.8 Oppsummering, bokens fokus og veien videre ............................................. 31 1.9 Noen ord til deg som underviser i kvantitativ metode – og som studenter kan hoppe over! ................................................................................ 32 Noter til kapittel 1............................................................................................................ 34 Kapittel 2 Nøkkelbegreper innen kvantitativ metode .............................................................. 35 2.1 Variabler, uavhengige variabler og avhengige variabler............................... 35 2.2 Verdier/kategorier ............................................................................................. 37 2.3 Enheter/observasjoner ...................................................................................... 38 2.4 Variablers målenivå ........................................................................................... 39 2.5 Teorier og begreper – og operasjonaliseringen av disse ............................. 41 2.6 Avslutning og veien videre ............................................................................... 49 Noter til kapittel 2............................................................................................................ 49
9
innhold
Kapittel 3 Tre hovedtyper kvantitative problemstillinger og analysetyper ........................ 51 3.1 Innledning: Tre statistiske analyseteknikker anvendt på studenters trenings- og livsstilsvaner.................................................................................. 51 3.2 Analyseteknikk 1: Sammenligning av gjennomsnitt i to grupper ............... 52 3.3 Analyseteknikk 2: Sammenligning av andeler i to grupper ........................ 56 3.4 Analyseteknikk 3: Regresjon (korrelasjon) .................................................... 59 3.5 Sammenligning av flere grupper, flere andeler og analyse av ordinale (avhengige) variabler ........................................................................................ 66 3.6 Studenters studievaner og -prestasjoner ...................................................... 72 3.7 Når enhetene ikke er mennesker ..................................................................... 75 3.8 Når ANOVA og regresjon er det samme: Regresjon med dummyvariabel .................................................................................................... 78 3.9 Oppsummering og avrunding .......................................................................... 79 Appendiks til kapittel 3: Utregning av regresjonskoeffisienten (b1) og konstanten (b0)................................................................................................................ 80 Noter til kapittel 3............................................................................................................ 83 Kapittel 4 Multippel regresjon ...................................................................................................... 85 4.1 Innledning............................................................................................................. 85 4.2 Kontroll for tredjevariabel (fjerdevariabel osv.) ............................................ 87 4.3 Regresjonsmodellens forklarte varians – R2 .................................................. 91 4.4 Regresjon med sett av dummyvariabler (dummies) ..................................... 92 4.5 Ikke-linearitet mellom uavhengig og avhengig variabel .............................. 94 4.6 Statistisk interaksjon (samspill) i regresjonsmodeller ................................ 97 4.7 Når avhengig variabel er en dummyvariabel ................................................. 100 4.8 Avslutning: Formaliteter, spuriøsitet og forutsetningene for regresjonsanalyse ............................................................................................... 102 Noter til kapittel 4........................................................................................................... 105 Kapittel 5 Slutningsstatistikk : Fra nøyaktig kunnskap om utvalg til litt mindre presis kunnskap om populasjoner ......................................................................................... 107 5.1 Innledning............................................................................................................. 107 5.2 Populasjoner, utvalg og tilfeldig trekning ....................................................... 108 5.3 Normalfordelingen ............................................................................................. 110 5.4 Repeterte utvalg, sentralgrenseteoremet og konfidensintervall ............... 115 5.5 Feilmargin, konsekvensen av utvalgsstørrelse og t-verdier ........................ 121
10
innhold
5.6 Hypotesetesting: For ANOVA, regresjon og krysstabulering .................... 123 5.7 Andre forhold og vurderinger rundt signifikanstesting og avrunding ...... 134 Oppsummering av de viktigste formlene i kapittel 5................................................ 141 Noter til kapittel 5............................................................................................................ 142 Kapittel 6 Typer av problemstillinger, forskningsdesign og skriving av bachelorog masteroppgaver ....................................................................................................... 144 6.1 Innledning............................................................................................................. 144 6.2 Innledning: Fire typer problemstillinger for kvantitative bachelorog masteroppgaver ............................................................................................ 144 6.3 Fire typer forskningsdesign: (1) tverrsnittsdesign, (2) longitudinelle design, (3) eksperimentelle design og (4) kombinasjonsdesign/ casestudier .......................................................................................................... 145 6.4 Eksempel på longitudinelt design (gjentatt tverrsnitt): Studenters treningsvaner før og nå ........................................................................................ 151 6.5 Eksempel på eksperimentelt design: Terningkast og beslutningen om å se en film på kino ..................................................................................... 156 6.6 Struktur på bachelor- og masteroppgaver ..................................................... 159 6.7 Avrunding om valg av problemstilling og forskningsdesign ....................... 160 Noter til kapittel 6............................................................................................................ 161 Kapittel 7 Kvantitativ metode i praksis: Andre momenter og avslutning ........................... 163 7.1 Innledning: Statistiske sammenhenger og statistisk avhengighet............. 163 7.2 Innsamling av egne data: Praktiske, juridiske og etiske aspekter .............. 164 7.3 Skjeve utvalg, varianter av tilfeldig trekning og lav svarprosent / manglende svar .................................................................................................. 165 7.4 Vurdering av effektstørrelser ........................................................................... 168 7.5 Litt mer om ulike typer validitet ....................................................................... 170 7.6 Litt mer om deskriptive analyser ..................................................................... 171 7.7 Ikke-linearitet i regresjon: Variant 2 (polynom) ........................................... 174 7.8 Avslutning og veien videre ............................................................................... 177 Appendiks til kapittel 7: Øvingsoppgaver med korte løsningsforslag................... 180 Noter til kapittel 7............................................................................................................ 193 Litteratur ......................................................................................................................... 195 Stikkord ............................................................................................................................ 197
11
Kapittel 1
Forskning, kvantitativ metode og statistisk analyse 1.1 Trines studentvenner og deres oppmøteprosent på forelesninger Trine er økonomistudent. Hun bor sammen med noen andre økonomi- og psykologistudenter på et studenthjem. Like etter at hun flyttet inn, la hun merke til at noen studenter stort sett alltid gikk på oppsatte forelesninger, mens andre var litt mere til og fra. Samtidig mente hun å ane at hvem som gikk på disse ikke var tilfeldig, og hun begynte å følge mer med. Ganske tidlig trodde hun å se et mønster: Selv om alle fulgte forelesninger jevnlig, virket det som om økonomistudentene gikk oftere på disse enn psykologistudentene. Det første hun tenkte kunne forklare dette, var at studentene i økonomi hadde flere forelesning per uke enn psykologistudentene. Men det stemte ikke. Trine bestemte seg for å gå mer systematisk frem for å finne ut om det hun ante, en slags forventning, stemte eller ei. I januar stilte hun derfor sine medstudenter spørsmålet «Hvor mange prosent av forelesningene fulgte du i høstsemesteret?» i et mini-spørreskjema. I Tabell 1.1 ser du de sytten svarene hun fikk, samt hva slags type student som ble spurt, satt opp i en datamatrise. (Og så ser du bort ifra at disse studentene har i overkant nøyaktig hukommelse!) Merk at Trine ikke ønsket å finne ut om økonomistudenten Per gikk oftere på forelesninger enn psykologistudenten Erik. Nei, hun ønsket å finne ut av den forventningen at økonomistudentene som gruppe gikk oftere på forelesninger enn gruppen av psykologistudenter. Det hun da trengte, var et oppsummerende tall for hvor ofte økonomistudentene samlet sett gikk på forelesninger – og et tilsvarende mål eller tall for studentene i psykologi. Gjennomsnittet er et slikt tall. For å finne ut hvor ofte studentene i psykologi gikk på forelesning i snitt, la Trine sammen alle oppmøteprosentene for disse (68 + 72 + 80 + 85 + 67 + 82 + 13
kapittel 1 Tabell 1.1 Trines datamatrise Type student:
Oppmøteprosent på forelesninger:
psykologi
68
psykologi
72
økonomi
86
økonomi
80
økonomi
88
psykologi
80
økonomi
85
psykologi
85
økonomi
87
økonomi
85
psykologi
67
økonomi
89
økonomi
91
økonomi
92
psykologi
82
psykologi
84
psykologi
86
84 + 86 = 624) og dividerte på antall psykologistudenter (8). Dette ga et snitt på 78 (624/8). Den gjennomsnittlige oppmøteprosenten for psykologistudentene var altså på 78 % for høstsemesteret. For økonomistudentene ble resultatet: (86 + 80 + 88 + 85 + 87 + 85 + 89 + 91 + 92)/9 = 87 eller 87 %. Oppsummert fikk Trine resultatet i Tabell 1.2. Tabell 1.2 Trines resultat Type student:
Oppmøteprosent på forelesninger, snitt:
Psykologistudentene som gruppe
78 %
Økonomistudentene som gruppe
87 %
Differanse
14
11 prosentpoeng: støtte til forventning
forskning, kvantitativ metode og statistisk analyse
Tabell 1.2 forteller at økonomistudentene hadde en oppmøteprosent på 87, mens psykologistudentene hadde en oppmøteprosent på 78. Oppmøtet var altså 11 prosentpoeng høyere blant økonomistudentene. Hvilken konklusjon trakk Trine? Jo, at resultatet støttet hennes forventning om en studentgruppeforskjell i oppmøteprosent basert på litt tilfeldige iakttakelser: Økonomistudenter går generelt oftere på forelesninger enn studenter i psykologi – i hvert fall blant studentene på studenthjemmet og gjeldende for sist høstsemester. Resultatet i Tabell 1.2 er en statistisk sammenheng mellom to forhold: (1) hva slags type student man er, og (2) hvor ofte man møter opp på forelesning. Alternativt kan vi si at det er statistisk avhengighet mellom hva slags type student man er (økonomi eller psykologi), og hvor ofte man går på forelesning. Det betyr at hva slags type student man er, spiller en rolle for om man går ofte eller noe sjeldnere på forelesning; at de to studentgruppene har ulik oppmøteprosent på forelesning. Men for at begreper som statistisk sammenheng eller avhengighet skal gi mening, må vi kunne tenke oss deres motsatser: statistisk ikke-sammenheng eller uavhengighet. Tabell 1.3 viser et resultat for Trines undersøkelse som kunne vært mulig gitt andre tall i Tabell 1.1. Resultatet er en statistisk ikke-sammenheng eller statistisk uavhengighet. Tabell 1.3 Tenkt resultat: Et eksempel på en statistisk ikke-sammenheng eller statistisk uavhengighet Type student:
Oppmøteprosent på forelesninger, snitt:
Psykologistudentene som gruppe
83 %
Økonomistudentene som gruppe
83 %
Differanse
0 prosentpoeng: ikke støtte til forventning
Det tenkte resultatet i Tabell 1.3 viser at hva slags student man er, ikke spiller noen rolle for om man går ofte eller noe sjeldnere på forelesning; at oppmøteprosenten på forelesninger er helt lik for de to studentgruppene. Oppmøteprosent er altså statistisk uavhengig av studentgruppe. Hadde Trine fått resultatet i Tabell 1.3 i sin undersøkelse, dvs. en statistisk ikke-sammenheng, måtte hun konkludert med at hennes forventning ikke fikk støtte i resultatene. Kvantitativ metode og statistisk analyse, temaene i denne boken, handler i hovedsak om fire basisaktiviteter:
15
kapittel 1
A. Hvordan designe og praktisk gjennomføre innhenting av kvantitativ informasjon, slik Trine hentet inn informasjon via et mini-spørreskjema. B. Hvordan beregne en statistisk sammenheng eller ikke-sammenheng, slik Trine beregnet gjennomsnittet i oppmøteprosent for to studentgrupper. I praksis gjøres denne beregningen via et statistisk analyseprogram. C. Hvordan tolke om det statistiske funnet i punkt B er en statistisk sammenheng eller en ikke-sammenheng, slik Trine tolket den 11 prosentpoeng høyere oppmøteprosenten blant økonomistudentene som støtte til hennes forventning. D. Hvordan presentere forskningsprosessen og spesielt det statistiske funnet og konklusjonen, slik Trine rapporterte i Tabell 1.2. Rammen rundt disse aktivitetene i denne boken er kvantitativ samfunnsforsk ning, noe som like gjerne kunne hett statistisk basert samfunnsforskning. Det å skille mellom statistisk avhengighet og statistisk uavhengighet som i Trines prosjekt, eller mellom statistiske sammenhenger og statistiske ikke-sammenhenger, er en sentral oppgave i denne konteksten. Fremgangsmåten og beregningene i Trines prosjekt er ellers ikke kompliserte overhodet. Dette illustrerer et annet og kanskje litt uventet poeng ved kvantitativ metode, nemlig at dette faget ikke forutsetter dyp kunnskap i matematikk eller statistikk. Trines prosjekt har også andre berøringspunkter med kvantitativ samfunnsforskning, kvantitativ metode og statistisk analyse, og disse kommer vi jevnlig tilbake til gjennom denne boken. Kort fortalt er de følgende: 1. Vi ser gjentatte enkelthendelser med en iboende systematikk, slik Trine etter hvert mente å se at enkelte økonomistudenter var oftere på forelesning, mens enkelte psykologistudenter var der noe sjeldnere. 2. Vi lager en generell forventning om et bestemt kvantitativt mønster eller trekk basert på disse gjentatte enkelthendelsene, slik Trine startet med å legge merke til enkeltstudenter og endte opp med en generell forventning om gruppeforskjeller i oppmøteprosenten på forelesninger. 3. Via datainnsamling og statistisk analyse undersøker vi om forventningen om bestemte kvantitative mønstre/trekk støttes av våre funn, slik Trine konfronterte sin forventning mot to gjennomsnittstall for to grupper studenter basert på et mini-spørreskjema. 4. Vi trekker en konklusjon i forhold til vår forventning, slik Trine konkluderte med at resultatene i hennes undersøkelse støttet hennes innledende 16
forskning, kvantitativ metode og statistisk analyse
iakttakelser som ble til en generell forventning. I praksis skjer det også at en forventning ikke støttes av en undersøkelses resultater.1 Notene i boken er plassert bakerst i hvert hovedkapittel, men du trenger ikke se på dem ved første gangs gjennomlesning.
1.2 Forskning, kvantitativ samfunnsforskning, kvantitativ metode – og denne boken Det sies om enkelte ting at de er vanskelige å definere, men at «jeg kjenner det igjen når jeg ser det». Slik er det også med forskning. Alle vet hva en forsker er, og alle kan se for seg en forsker i sitt arbeid, enten det er foran PC-en eller i et laboratorium blant musebur eller reagensrør. Samfunnsforskere forsker på samfunnsfenomen, og mye tid brukes foran PC-en. Forskere som driver med kvantitativ samfunnsforskning, dvs. bakteppet for denne boken, er opptatt av hva mange mennesker tenker, beslutter, velger og gjør. Og skal man undersøke hva mange mennesker – eller land, kommuner, bedrifter eller produkter, noe som også faller inn under samfunnsforskning – gjør, oppstår et behov for statistiske forenklinger og statistiske analyser. Kikk på Tabell 1.1, og prøv å se et systematisk mønster. Klarer du det? Kanskje. Tenk at du har 117 studenter i datamatrisen, og ikke 17. Da er det umulig å se noe som helst av systematiske mønstre. Siktemålet med forskning er komme frem til ny, sann kunnskap. For å få til dette bruker forskere en rekke ulike verktøy, som også kan forstås som ulike fremgangsmåter. Disse fremgangsmåtene, eller verktøyene, er samlet i en verktøy- eller metodekasse. Og mens litteraturforskere har sine verktøy, har medisinere helt andre verktøy, som igjen er forskjellige fra dinosaurforskernes. Samfunnsforskere har også sin egen verktøy- eller metodekasse. Denne har to rom; ett kvalitativt og ett kvantitativt. Det kvantitative rommet, denne bokens tema, handler om det vi gjør når vi designer undersøkelser, henter inn kvantitativ informasjon og deretter statistisk analyserer, tolker og presenterer denne informasjonen.2 Dette komprimeres i Figur 1.1.
17
kapittel 1
Forskning Metode Kvantitativ metode Statistiske analysemetoder
Figur 1.1 Forskning handler om å komme frem til ny, sann kunnskap. Metode er verktøykassen eller faget som inneholder alle fremgangsmåtene som brukes i forskning. Kvantitativ metode er ett av to rom i den metodiske verktøykassen, og de statistiske analyseteknikkene utgjør en vesentlig del av kvantitativ metode.
Denne boken handler om kvantitativ metode, og herunder spesielt statistisk analyse, innen rammen av samfunnsforskning – hvor også økonomifagene og samfunnsmedisin er inkludert. Når det er sagt, er det ingen prinsipiell forskjell på kvantitativ metode / statistisk analyse innen samfunnsfag, medisin og naturfag. Det som er forskjellig, er temaene man er opptatt av. Boken har ordet «praktisk» i tittelen; hva betyr det? Svaret er at mange bøker i kvantitativ metode serverer et stort koldtbord av statistiske mål, analyseteknikker og andre statistiske viderverdigheter. Så er det opp til studenten (og læreren) å plukke ut det som trengs eller virker fristende, noe som til en viss grad kan sammenlignes med å sette sammen et møbel fra Ikea – uten manual! Denne boken har som utgangspunkt at det er noen nokså få sammensetninger av enkeltretter som er av interesse når studenter tar fatt på sitt første kvantitative prosjekt i en akademisk kontekst (dvs. bacheloroppgave eller masteroppgave). Og i en slik sammenheng trenger man ikke smake på alt på bordet, men heller få noen gode tips om hva det kan være lurt å prøve ut og sette sammen på en bestemt måte. Det praktiske i denne boken ligger altså i et klarere need-to-know-fokus på det man mest trolig møter på som utfordringer i praktisk forstand de første gangene man gjennomfører et akademisk prosjekt bygget på kvantitativ metode.
18
forskning, kvantitativ metode og statistisk analyse
1.3 Problemløsning i hverdagen = besvaring av problemstillinger i forskning Det er grunn til å avdramatisere og avmystifisere forskning som en særegen aktivitet. Ta dette med problemløsning i hverdagen, som ikke skiller seg prinsipielt fra problemløsning i forskning, selv om det da heter å besvare en problemstilling. På begge arenaer gjelder følgende: (1) Man har et problem (problemstilling), dvs. et avvik mellom en faktisk nåsituasjon og en ønsket situasjon. Denne diskrepansen, som det heter på fint, er motoren for resten av prosessen. I hverdagen kan dette være at man ønsker å være i bedre fysisk form; i forskning kan det være at man ønsker mer kunnskap om hvordan arbeidsledighet påvirker selvfølelse. For Trine kan vi si at diskrepansen lå i forskjellen mellom å tro og å vite. (2) Man starter et prosjekt (studie) og gjør de nødvendige tiltak (analyser) for å rette opp avviket, dvs. løse problemet eller besvare problemstillingen. (3) Man trekker etter en tid en konklusjon i forhold til om prosjektet (studien) har løst problemet (problemstillingen), dvs. om det fortsatt er et avvik mellom faktisk nåsituasjon og ønsket situasjon. (4) Hvis svaret er nei, er prosjekt (studie) vellykket; hvis ja, start på nytt. Figur 1.2 viser noen nyanseforskjeller mellom hverdagsliv og forskning. I hverdagen ser vi; i forskning observerer man. Tilsvarende undres vi ofte i hverdagen, mens man funderer eller tenker i forskning. I hverdagen har vi forventninger; i forskningen har man hypoteser. Med hensyn til metode, dvs. fremgangsmåtene eller verktøyene, skiller hverdagsliv og forskning mer lag. I forskning er alt omkring undersøkelse og analyse systematisk og formalisert, som igjen henger sammen med målet om å komme frem til ny, sann kunnskap. Til hverdags har vi ikke dette målet i samme grad, noe som gjør systematiske og formaliserte analyser overflødige. Sagt annerledes er systematisk og formalisert analyse en forutsetning for å komme frem til ny, sann kunnskap, noe som igjen forklarer hvorfor vår hverdagskunnskap ofte er mer usikker. Når det er sagt, hører vi stadig at ny og sann forskning senere har blitt avkledd som usann av nyere forskning. Ny, sann kunnskap bør derfor sees på som et mål – eller som midlertidig sann frem til nyere forskning viser noe annet – heller enn som en endelig tilstand. Når forskere besvarer sin problemstilling, er det viktig at andre forskere skal kunne gå dem etter i sømmene for å sjekke om deres funn lar seg reprodusere.3 Derfor er det viktig at forskere skriver ned sine fremgangsmåter, dvs. at de dokumenterer sine metode valg nøye. (Så kan det å skrive ned hvordan man løste et problem heller enn å stole på hukommelsen også være lurt til hverdags, men det lar vi ligge.) 19
kapittel 1
Hverdagsliv
Forskningsliv
Løse problemer
Besvare problemstillinger
Se
Observere
Undre
Fundere eller «tenke»
Forventning
Hypotese
Metode: usystematisk, uformell analyse
Metode: systematisk, formell analyse
Kunnskap med usikkerhet
Kunnskap med større sikkerhet
Metode lagres i hukommelse
Metode skrives ned
Figur 1.2 Noen likheter og forskjeller mellom hverdagsliv og forskningsliv.
Brukes begrepene fra forskningen på Trines prosjekt, kan vi si at hun har besvart en problemstilling. Denne problemstillingen startet med noen observasjoner, gikk via fundering og ble til en hypotese. Så laget hun en systematisk og formell undersøkelse for å besvare problemstillingen. Men hensyn til analyse kokte denne ned til å sammenligne snittene for oppmøteprosenten på forelesninger for to studentgrupper. Denne typen statistisk analyse, en sammenligning av snitt for to grupper,4 er svært aktuell i mange tilfeller innen kvantitativ samfunnsforskning og beslektede emner. Noen eksempler er: • Pedagogen som vil sammenligne læringseffekten av to ulike pedagogiske opplegg • Psykologen som vil sammenligne kvinner og menns holdning til uforpliktende sex • Sosiologen som vil sammenligne kvinner og menns inntekt, sykefravær eller treningsmengde • Statsviteren som vil sammenligne overskuddet i rødt styrte eller blått styrte kommuner • Økonomen som vil sammenligne overskuddet i bedrifter med høy eller lav grad av innovasjon • Samfunnsmedisineren som vil sammenligne helsetilstanden for gravide og ikke-gravide kvinner • Ernæringsfysiologen som vil sammenligne vektnedgangen for to grupper som har fulgt hver sin diett • Idrettsforskeren som vil sammenligne effektene av to ulike treningsprogram • Markedsføreren som vil sammenligne salgseffektene av to ulike måter å behandle kunder på 20
forskning, kvantitativ metode og statistisk analyse
1.4 Hvorfor lære kvantitativ metode? Hvorfor trenger du å lære kvantitativ metode / statistisk analyse? Dette spørsmålet har flere svar, og her er fire av dem: 1. Du er i dine studier innom flere fag, og kanskje noen av de som er nevnt ovenfor. Her drives det forskning, og mye av denne er kvantitativt orientert. For å kunne stille deg kritisk til resultatene fra denne forskningen må du forstå hvordan dens konklusjoner er brakt frem. Da trenger du å vite hvordan en studies design legger føringer på hva slags konklusjoner det er mulig å trekke (mer om dette i kapittel 1.5 og 6), og hvordan resultatene fra statistiske analyser kan og bør tolkes (kapittel 3, 4, 5 og 6). 2. Du skal som student trolig skrive en prosjektoppgave eller noe lignende, som innebærer både design av en kvantitativ studie og påfølgende bruk av statistiske analyseteknikker. For å klare å gjennomføre dette på en skikkelig måte trenger du på samme måte som i punkt 1 kunnskap om kvantitativ metode. 3. Du møter svært ofte oppslag som «Forskning viser at …» med råd om hva det er lurt å gjøre mer eller mindre av, enten det er snakk om trening og alternative treningsformer, spising (varianter av kosthold og dietter), drikking (alkohol, kaffe, brus, light-brus), snusing, uttøying, yoga og annen meditasjon etc. Mye av denne forskningen er basert på svake design og tvilsom bruk av statistisk analyse. Med kunnskap om kvantitativ metode vil du i større grad kunne skille klinten fra hveten blant disse studiene. Et alvorlig eksempel. Fra medisinsk forskning ser vi stadig overskrifter som «Spis gulrøtter og reduser faren for tarmkreft med 50 %». Wow! Man må imidlertid lete lenge etter grunnlagstallene i slike artikler, som at 0,2 % av de som spiste gulrøtter fikk kreft, mens det tilsvarende tallet for de som ikke spiste gulerøtter var 0,3 %. Problemet er altså ikke overskriften; de som spiser gulrøtter har da en 50 % større kreftrisiko (0,3 – 0,2 = 0,1; 0,1/0,2 = 0,5 eller 50 %). Problemet er at studien ikke nevner at det i utgangspunktet er en svært liten sjanse for å få denne type kreft, og at det trolig er mange andre risikofaktorer enn gulrotspisning som bidrar (mer) til at noen få får kreft, mens de aller fleste ikke gjør det. Derfor er det neppe en reelt kreftfarereduserende strategi å hive innpå gulrøtter. Og så mener jeg ikke å bagatellisere en svært alvorlig sykdom for de som faktisk rammes! Noe mindre alvorlig. Basert på en rekke menneskers svar på et spørreskjema har en forsker funnet at medlemmer av treningssentre trener tre timer mer totalt 21
kapittel 1
per uke enn ikke-medlemmer av slike sentre. (Eksempelet er statistisk sett helt parallelt til Trines.) På nettet presenteres forskningen som: «Meld deg inn på treningssenter og bli mer fysisk aktiv!» Problemet her er et ikke-samsvar mellom studiens funn og dens implikasjoner, og teknisk at studiens design ikke godtgjør implikasjonen som trekkes. Trolig er de som melder seg inn på treningssentre litt mer treningsinteresserte folk, mens de ikke så treningsinteresserte oftere lar være. I så fall vill en innmelding på et treningssenter ikke føre til økt treningsmengde, men eventuelt bare flytte (noe av) treningen til et annet sted. Var dette tyngre, så ikke fortvil; vi kommer mer tilbake til det i kapittel 4. 4. I ditt kommende arbeidsliv vil du bli / blir du utsatt for utredningsarbeid og konsulentrapporter som konkluderer med at «sånn og slik» bør man gjøre. Mange av disse er baserte på kvantitativ metode. Med de forannevnte begrunnelsene er disse konklusjonene ikke verd papiret de er skrevet på hvis metodebruken er tvilsom eller feilaktig. Men for å finne ut om dette er tilfellet eller ei, må du altså forstå deg på kvantitativ metode.
1.5 Faser innen kvantitativ samfunnsforskning Et kvantitativt forskningsprosjekt innen samfunnsfag, dvs. en studie som støtter seg tungt på bruk av statistisk analyse, har gjerne flere faser med flytende overganger. Disse er: Fase 1: Fase 2: Fase 3: Fase 4: Fase 5:
Innledning Forskningsdesign Datainnsamling Dataanalyse Konkludering og rapportering (skriving)
Innledning. Denne fasen kretser omkring det vi lurer på, dvs. problemstillingen og spørsmålene rundt denne. Fasen kan starte med en observasjon, som hos Trine. Men i praksis er den vanligste starten en faglig interesse og/eller et oppdrag fra noen som finansierer forskning. I en akademisk kontekst vil man uansett i starten lese og skrive om andre forskeres teorier, hypoteser og funn på feltet man er opptatt av, dvs. redegjøre for tidligere forskning. (Mer om dette i kapittel 2.5.) Ofte vil man fra dette utlede en hypotese, som Trine gjorde fra sine observasjoner, men man kan også ende opp med en spørrende problemstilling – som for eksempel om det er en forskjell på gjennomsnittene for to grupper. 22
forskning, kvantitativ metode og statistisk analyse
En spørrende problemstilling er en typisk konsekvens av at forskningen på et felt ikke er så entydig at en klar hypotese lar seg utlede. Forskningsdesign. Valg av forskningsdesign er en viktig del av alle studier, noe vi ser mer på i kapittel 6. Nå nøyer vi oss med å si at designvalg handler om hva slags type overordnet rammeverk vi velger for å besvare vår problemstilling. Underforstått: Noen design er mer egnede enn andre for å besvare bestemte typer problemstillinger. Trine valgte å benytte et spørreskjema som design. Dette designet (også kalt surveyen) er et av flere kvantitative design, og det er mye benyttet i samfunnsfag. Et annet design, typisk for psykologi og senere for økonomi, er eksperimentet. Men i mange tilfeller har man i samfunnsfagene reelt sett sagt fra seg muligheten til å velge design, jf. fase 3 om datainnsamling (se under). Datainnsamling. Via spørreskjema samlet Trine informasjonen hun trengte for å utføre sine analyser. Denne informasjonen kalles data. Trines data besto altså av svarene på spørreskjemaer fra sytten studenter. Mens Trine gjorde en egen innsamling av data, er det innen samfunnsfagene minst like vanlig å analysere foreliggende data; dvs. data andre har samlet inn muligens for andre formål.5 Slik er beslutningen om man skal samle egne data, eller bruke foreliggende data, et viktig valg i mange prosjekt. Fordelen med å samle data selv er skreddersøm til problemstillingen; ulempen er at det er kostbart. Motsatt er foreliggende data i mange tilfeller gratis; ulempen er at de kanskje ikke treffer problemstillingen 100 %. Benyttes foreliggende data, sier man fra seg muligheten til å velge et mest mulig egnet design (fase 2), siden dette valget da nødvendigvis er gjort. Dataanalyse. Trines statistiske analyse besto i å sammenligne gjennomsnittene i to grupper, fordi det direkte besvarte hennes problemstilling. I praksis finnes det mange andre og beslektede statistiske analyseteknikker, som er tilpasset litt andre typer problemstillinger. I store deler av denne boken er primæroppgaven å guide deg gjennom disse. Derfor sier vi ikke mer om det nå. Konkludering og rapportering (skriving). En akademisk studie er ikke komplett før man har et skriftlig produkt som rapporterer forløpet og inneholder en konklusjon. Dette kan være en bacheloroppgave, en masteroppgave eller en forskningsartikkel. Konklusjonen på prosjektet forteller om hypotesen man hadde fikk støtte eller ikke. Hadde man en spørrende problemstilling, vil konklusjonen diskutere (hold deg fast!) hvorfor man tror man fant akkurat det man fant, og ikke noe annet ... 23