
1 minute read
1.4 Bruk av dataverktøy
32
1 innledning
Tilsvarende velger 65 kvinner bokmål og 20 nynorsk. Tabellen gir oss en systematisk og grei oversikt over forholdet mellom kjønn og målform.
Når man skal arbeide med statistiske data, er bruk av dataverktøy uunnværlig. Dataprogrammer brukes til beskrivende statistikk som for eksempel beregning av gjennomsnitt og standardavvik og ikke minst til ulike grafiske framstillinger, og dataprogrammer brukes til statistisk analyse som for eksempel estimering, hypotesetesting og regresjonsanalyse.
Jeg har valgt å ikke ta med statistisk programvare av noe slag i denne boken. Det er to grunner til det.
For det første er dette en lærebok i et grunnkurs i statistikk der målet er å gi studentene forståelse av viktige begreper innen sannsynlighetsregning, stokastiske variabler og statistiske metoder. Eksempler på slike begreper kan være hva en betinget sannsynlighet uttrykker, hva et konfidensintervall er og hva kan vi slutte av en P-verdi. Dette er temaer som behandles og forstås helt uavhengig av programvare. Det er denne typen spørsmål som studentene møter i eksamensoppgavene.
For det andre er det etter hvert blitt svært mange dataverktøy å velge mellom til forskjellige behov. De klassiske statstikkpakkene Minitab og SPSS, som tidligere dominerte både på universiteter og høgskoler og i forskermiljøer, er blitt utfordret og til dels utkonkurrert av nye programmer som STATA, SYSTAT, S-Plus og mange andre, men også av Excel. Excel er et program som mange velger å bruke til statistisk analyse fordi det er tilgjengelig for alle, og fordi det er kjent for mange fra andre bruksområder. Dessuten har forskere som arbeider med mer avanserte statistiske analyser, ofte basert på store datamengder, tatt i bruk programmeringsspråk som R og Python. Særlig er R blitt populær fordi dette er fri programvare som kan lastes ned gratis. Men brukerterskelen for R og Python er såpass høy at de egner seg bedre for forskere enn for studenter i et grunnkurs i statistikk.