Page 1

TYYPPIARVO Tyyppiarvo 1/00

1

Moodin virallinen 채채nenkannattaja

1/2000


2

Tyyppiarvo 1/00

Pääkirjoitus Näet edessäsi uuden vuosituhannen sähkönjakelu tai itänaapurimme hyvin ensimmäisen Typykän, tai vanhan huolletut ja turvallisiksi todetut vuosituhannen viimeisen vuoden energialaitokset selviytyvät vuosiluvun ensimmäisen Typykän, kukin laskekoot muutoksesta. Ne ovat kuitenkin asioita tavallaan. Oli miten oli tähän maagiseen joista joku muu huolehtii ja kantaa vuoteen 2000, jota parhaillaan elämme, vastuun, vaikkakin olisi oletettavaa, että liittyy paljon odotuksia, kauhukuvia ja jos jotain katastrofaalista olisi tapahtunut, mystiikkaakin. Jännittävimmät het- olisivat seuraukset vaikuttaneet jokaiseen kemme elimme odottaessamme kuinka meistä, riippumatta kenen vastuulla hyvin kehittynyt teknologiamme reagoi mikäkin on. Ihminenkö itsekäs eläin? Ei vuosilukuun, jossa on nollia nollan kai, mitä nyt pääasia on, että elämä oman perään, muttei enää sentään sen viimeisen navan ympärillä pyörii mukavasti. jälkeen yhtään.?..? Mitäpä jos Kaikista uhkakuvista huolimatta tammikuun ensimmäisenä päivänä olemme yhä vain hengissä ja armon vuotta 2000 kännykkä maapallo pyörii samaa rataa olisikin sanonut käyttökuin tähänkin asti. Elämä ei sopimuksensa irti tai videoiden siis tästä kohutusta ohjelmointi olisi hyljeksynyt milleneumista muuttunut showview koodeja joita sinne sen ihmeellisemmäksi, antaumuksella näpyttelen? samat ongelmat rassaa Voi sitä surua ja murhetta 2 P ä ä k i r j o i t u s ahdistunutta opiskelijaa jota olisimme tunteneet jos 3 Puheenjohtaja v u o s i l u v u s t a , jokapäiväiset ylellisyys- 4 Alueellista analyysia? v u o s i k y m m e n e s t ä , vempaimemme olisi- 7 Moodi Toimii vuosisadasta tai vuosivatkin osoittautuneet 7 Laitoksella tapahtuu tuhanesta viis. Jo vain vuosi 2000 ei niin sitten 9 Hallitus 2000 saa riittää tämä höpötys millään yhteen- 10 Purasen sivuja! Milleniumista, lupaan sopiviksi. Toisaalta 12 Tyyppiarvo 12 vuotta sitten palata aiheeseen olisi kai kuitenkin 13 Lääkemaistajaiset aikaisintaan noin pitänyt huolestua 14 Tilastotieteen historia tuhannen vuoden enemmin siitä, 16 Vuosikatsaus 1999 kuluttua. m i t e n esimerkiksi Tiina Sévon TYYPPIARVO 1/00 - http//www.helsinki.fi/jarj/moodi/tyyppi.html Moodin virallinen äänenkannattaja - 16. vuosikerta - 44. numero Päätoimittaja: Tiina Sévon Toimittajat: Heikki Hyhkö Kasimir Kaliva Perttu Muurimäki Aki Niemi Reijo Sund + joukko satunnaisia avustajia Taittaja: Heikki Hyhkö - Tekninen sihteeri: Reijo Sund - Painopaikka: Limes - Painos: 150 kpl TYYPPIARVO - Heuristista tiedonvälitystä ainejärjestötyyppisessä viitekehyksessä


Tyyppiarvo 1/00

3

Puheenjohtajan palsta Hyväää päivää Teille arvoisa tilastokansa.

Moodi vietti 32-vuotissyntymäpäiväänsä ravintolaillan merkeissä. Tilaisuus sujui rauhallisesti ja arvokkaasti. Tarkoituksenani on tämän vuoden aikana lisätä Moodin opintotoimntaa. Moodi järjestääkin kevään lopuksi tilastoohjelmistokurssin, jonka tarkoituksena on antaa opiskelijoillemme valmiudet pitää itsenäisesti ohjelmistokursseja. Jos tiedekunnan ja laitoksemme suunnalta löytyy kiinnostusta, niin Moodi onkin valmis järjestämään syksyllä t i l a s t o ohjelmistokursseja tiedekuntamme opiskelijoille. Ohjelmistoksi on kaavailtu SPSS:ää, koska sillä tuntuu olevan muualla tiedekunnassamme suurin kysyntä. Aikomuksena on myös uusia viimekeväinen opettajatapaaminen, jonka pääasiallisena tarkoituksena on ylläpitää ja edelleen kehittää opiskelijoiden ja laitoshenkilökunnan jo ennestään hyviä suhteita. Syksyn tulle aiomme myös järjestää Statistikan kanssa yhteistyössä seminaarin “tilastoteoriasta todellisuudeksi”, johon kutsutaan opiskelijoiden

piirissä arvostusta nauttivia henkilöitä tekemään selkoa siitä, miten kursseilla opetetut varsin teoreettiset ja abstraktit asiat kääntyvät käytännön tilastotieteeksi. Jos Sinua kiinnostaa joku yllämainituista tapahtumista tai haluat muuten vaan tietää mitä moodissa tapahtuu ja olet liian laiska lukemaan uutisryhmää, niin liity postilistallemme <Tyyppiarvo@valt.helsinki.fi>. Nyt kun hallitukseen jälleen valittiin ekskuvastaava onkin aikomuksenamme lisätä vierailukäyntejä yrityksiin. Ekskursio McKinseylle onkin jo valmisteluvaiheessa. Toukokuussa järjestämme TDK-bileet järjestämme yhdessä VOO:n kanssa. Lähtenemme hakemaan juomaa Tallinnasta kyseisiin bileisiin. Minun mielestäni voisimme tehdä hankitamatkan yhdessä VOO:n kanssa! Oletteko Te samaa mieltä? Toivoisin meidän myös lisäävän yhteyksiä muihin tiedekuntamme ainejärjestöihin. Statuksen ja VOO:n kanssa yhteistyötä taitaa tulla joka tapauksessa, mutta olisi varmaan varsin luonnollista tehdä jotain myös KTTO:n kanssa.

Hyvää kevättä kaikille Meille! Hessu


4

Tyyppiarvo 1/00

Kohti alueellista analyysia? 80 vuotta täyttänyt Suomen Tilastoseura järjesti helmikuun puolivälissä juhlatilastopäivät, joiden teemana oli ‘Spatial Statistics and GIS’. Mukana oli sen verran ulkomaalaisia, että konferenssin käyttökielenä toimi kaiken aikaa englanti. Itse asiassa suomenkielistä materiaalia ei päätynyt lainkaan käsiini, joten teeman virallista suomennosta voi vain arvailla. Ilmeisesti aihepiirin suomenkielinen sanasto on vielä niin vakiintumatonta, ettei kunnollista käännöstä ole edes mahdollista tuottaa. Tilanne vaikuttaa huolestuttavalta, sillä vastaani on tullut lähinnä todellisia käännöshirviöitä. Onneksi minun ei tarvitse alistua puhumaan ‘spatiaalisesta autokorrelaatiosta’, jos tarkoitan alueellista korrelaatiota tai ‘datasta’, jos tarkoitan aineistoa. Yleensä en jaksa urputtaa pienistä häiriötekijöistä, mutta ‘spatiaalisuudesta’ saan näppylöitä. Jos joku on onnellisen tietämätön kuinka ‘spatial’ ääntyy englannissa, niin suosittelen asian tarkistamista. Parhaassa tapauksessa ymmärtäminen on elämys. Alueellisuudesta kvantitatiivisessa viitekehyksessä Alueellisuus on viime aikoina kiehtonut minua muutaman projektin verran (Nouko-Juvonen & Sund 1999a, 1999b; Sund & Nouko-Juvonen 2000), vaikka päätinkin rajata alueellisuuden pois gradustani ainakin tässä vaiheessa. Joka tapauksessa odotukseni tilastopäivistä olivat varsin korkealla, koska esitelmät vaikuttivat otsikoiden perusteella varsin kiinnostavilta. Ensimmäinen päivä oli suunniteltu menetelmäpainotteiseksi ja esitelmöitsijöinä oli pääasiassa ulkomaalaisia, joista mainittakoon prof. Robert Haining. Luennointia jaksoi kyllä kuunnella, mutta se pysyi varsin yleistajuisella tasolla eli uutta asiaa tuli esille hyvin vähän. Itse olisin toivonut saavuttavani suuren valaistuksen, mutta ehkä sen aika ei vielä ollut. Pelkkä raportinomainen tapahtumien luetteleminen tuskin kiinnostaa ketään, joten ehkä onkin tarkoituksenmukaisempaa, että peilailen tilastopäivien innoittamana omia näkemyksiäni alueellisuudesta ja siihen liittyvistä käsitteistä sekä ongelmista.

Yleisesti ottaen kvantitatiivisessa viitekehyksessä on tarkoituksenmukaista puhua alueellisuudesta silloin, kun käsiteltävän aineiston havainnot ovat alueellisesti sijoittuneita. Alueellisesti sijoittuneina havaintoina voidaan pitää esimerkiksi koko Suomea, Suomen maakuntia, kuntia, postinumeroalueita, 250m x 250m ruutuja ja edelleen aina vain pienempiä alueita kuvaavia tietoja. Varsinaisena paikkatietona (kohdetta kuvaavan sijainti- ja ominaisuustiedon muodostama kokonaisuus) havaintoa kuitenkin pidetään vain, jos on mahdollista olettaa se riippumattomaksi hallinnollisista rajoista (kuten kuntarajoista). Käytännössä kaikki eri tavoin kerätyt alueelliset aineistot on talletettu erilaisiin rekistereihin ja tietokantoihin, joten niiden hallinnan ja esittämisen yhteydessä joudutaan välttämättä tekemisiin erilaisten (maantieteellisten) informaatiojärjestelmien (GIS) kanssa. Tilastopäivien esitelmässään prof. Haining luokittelee järjestelmien tehtävät kolmeen päätyyppiin: 1) karttojen näyttö- ja talletusjärjestelmiin, 2) alueellisiin tietokantajärjestelmiin sekä 3) alueellisiin analyysin ja mallinnuksen työskentelyympäristöihin (Haining 2000). Tilastotieteilijän kannalta kaikkein kiinnostavin on tietysti kolmas vaihtoehto. Kannattaa kuitenkin pitää mielessä, että varsinaisesta alueellisesta analyysista (spatial data analysis) on kyse vain, jos aineiston alueellisuus otetaan huomioon analyyseissa ja niiden tulkinnassa (Bailey & Gatrell 1995, 7-11; Fotheringham et al. 1996). Järjestävän seuran edustajat Sami ja Harri


Tyyppiarvo 1/00 Omat kokemukseni rajoittuvat lähinnä aineistoihin, joiden aluejakona on käytetty Suomen kuntajakoa: jokainen havainto kuvaa epäsäännöllisen muotoista ja kokoista alueyksikköä, yhtä kuntaa. Tämä jakoperuste on niin hallinnollisten rajojen kuin aineiston saatavuudenkin kannalta hyötysuhteeltaan varsin tyydyttävä, vaikkei kaikkien kuvattavien ilmiöiden ’rajoja’ voidakaan olettaa yhteneviksi kuntarajojen kanssa. Käytännössä tämä tarkoittaa sitä, että joissakin ilmiöissä saattaa esiintyä vaihtelua myös yhden kunnan sisällä. Periaatteessa monia ilmiöitä koskevia tarkasteluja voitaisiin suorittaa karkeammallakin jaolla, mutta rajoituttaessa karkeampiin jakoihin saatetaan hukata oleellista informaatiota. Lisäksi havaintojen määrä jää tilastollisia analyyseja silmälläpitäen helposti liian vähäiseksi. Käytettäessä kuntaa alueyksikkönä muuttujien arvot vaihtelevat vain eri kuntien välillä. Kuntien sisäistä vaihtelua ei toisin sanoen saada esitettyä, joten muuttujien kuvaamia ilmiöitä ei voi pitää ainakaan tilastoanalyysien näkökulmasta jatkuvina. Tilastolliselta kannalta on myös merkillepantavaa, että kuntakohtainen poikkileikkausaineisto esittää vain yhden mahdollisen muuttujien arvojen ilmentymän jokaiselle alueyksikölle. Muuttujat kuvaavat usein kertaluonteisia ilmiöitä, joita ei voi tulkita toistokokeiksi, joten muuttujien arvoja tuottavien satunnaisprosessien ominaisuudet jäävät tuntemattomiksi. Erilaiset mittausvirheet sekä poikkeavat havainnot ovat varsin yleisiä, ja lisäksi lähellä toisiaan olevat alueet ovat usein enemmän samankaltaisia kuin alueet, jotka ovat kaukana toisistaan. Suomen kuntia kuvaavien tietojen ei voida olettaa olevan toisistaan riippumattomia eikä välttämättä myöskään keskenään vertailukelpoisia. Yksinkertainen vertailun mahdollistava vakiointimenetelmä on jakaa absoluuttinen arvo kokoa kuvaavan muuttujan arvolla. Tämä saattaa kuitenkin aiheuttaa vakioituihin arvoihin systemaattista harhaa, sillä suuremmissa kunnissa em. vakioinnilla saatu alueellinen keskiarvo on laskettu useammista havainnoista, toisin sanoen sen varianssi on kääntäen verrannollinen kokoa kuvaavaan muuttujaan. Monissa tapauksissa kannattaakin

5

Aputyövoima puuhastelee omiaan. käyttää erikoistuneempia menetelmiä kiinnostuksen kohteena olevan ilmiön vertailukelpoisen vaihtelun esiin saamiseksi (Haining 1990, 49; Knorr-Held 2000, 3). Myös havaintojen välisen läheisyyden (proximity) määrittäminen ja mittaaminen on välttämätöntä monissa alueellisissa tarkasteluissa. Läheisyyttä kuvaavia indikaattoreita on kuitenkin lukemattomia, joten sopivimman valinta on varsin mielivaltaista sekä pitkälti tilanteesta ja ilmiöstä riippuvaa (Haining 1990, 69-74; Bailey & Gatrell 1995, 261-262). Esimerkiksi Suomen kuntien läheisyyksiä voidaan mitata niiden keskipisteiden välisinä linnuntietä mitattuina etäisyyksinä tai vaihtoehtoisesti vaikkapa maanteitä pitkin kuljettuina etäisyyksinä. Kumpikaan edellä mainituista mitoista ei kuitenkaan ota huomioon sitä, että Pohjois-Suomen kunnat ovat pintaalaltaan huomattavasti Etelä-Suomen kuntia suurempia. ’Läheisimmiksi’ kunniksi voisikin siten olla tarkoituksenmukaisempaa määrittää ne kunnat, joiden kanssa tarkasteltavalla kunnalla on yhteistä rajaa. Joissakin tapauksissa ’läheisimmät naapurit’ saattaisi olla järkevää määrittää myös muiden alueellisten vuorovaikutusten, esimerkiksi asukkaiden työssäkäyntikuntien, perusteella. Kaikki edellä mainitut seikat asettavat suoritettaville analyyseille lisävaatimuksia ja hankaloittavat siten ollen perinteisten tilastomenetelmien soveltamista (Haining 1990, 12-61; Bailey & Gatrell 1995, 247-260; Bivand 1998). Ongelmat ovat harvoin ylitsepääsemättömiä, mutta ne korostavat tavallistakin enemmän aineiston tuntemuksen ja menetelmien ymmärtämisen tärkeyttä.


6

Tyyppiarvo 1/00

Tilastopäivien esitelmissä nousi vahvasti esille alueyksikön koon vaikutus saatujen estimaattien tarkkuuteen: mitä pienempi alue (esim. väestömäärän mielessä), sitä epävarmempi estimaatti. Ongelmaan tarjottiin perusvakiointien lisäksi erilaisia bayes-malleja. Esimerkiksi empiirisessä bayes-estimoinnissa korjataan pienillä alueilla havaittuja epävarmoja osuuksia isommalta alueelta lasketun keskimääräisen osuuden suuntaan (Marshall 1991). Askelta monimutkaisempina vaihtoehtoina tarjottiin ‘piilomarkov’-malleja sekä useamman muuttujan samanaikaista hyväksikäyttöä (Penttinen 2000; Knorr-Held 2000). Omasta mielestäni varsinainen alueellisten erojen huomioiminen mallintamisessa sai tilastopäivillä liian vähän huomiota. Periaatteessa saattaa nimittäin olla virheellistä olettaa, että koko (alueellista) aineistoa käyttäen saadut tulokset pätisivät yhtenevästi jokaisella aineiston osa-alueella. Pelkän ‘keskiarvon’ sijaan onkin siis kiinnostavampaa tarkastella myös tulosten vaihtelua eri osa-alueilla. Alueellisessa analyysissa aineiston havainnot liittyvät alueyksiköihin, joita käyttäen voidaan esimerkiksi regressioanalyysia soveltaen estimoida yksittäinen, globaali regressiomalli, mikäli regressiokertoimien oletetaan olevan yhteneviä joka alueella. Tämän seurauksena alueellisesti vaihtelevia riippuvuuksia ei saada mallinnettua erityisen hyvin ja globaali malli saattaa olla paikallisesti hyvinkin harhaanjohtava. Tämä tarkoittaa, että analyysissa kannattaa keskittyä myös lokaalisiin, paikallisiin eroavaisuuksiin pelkkien globaalien säännönmukaisuuksien etsimisen sijaan (Fotheringham 1997). Esimerkiksi lokaaliseen regressioanalyysiin voidaan käyttää maantieteellisesti painotettua regressiota (Geographically Weighted Regression; GWR), joka on periaatteessa varsin yksinkertainen regressiomallin yleistys (Brunsdon et al. 1996). Menetelmät, substanssit, tilastotuotanto ja etiikka? On mielenkiintoista seurata millä tavalla monimutkaisiin menetelmiin ihastuneet tutkijat voivat tuhlata energiaansa substanssimielessä

epäoleellisiin tai jopa mahdottomiin kysymyksenasetteluihin. Yhtä kiinnostavaa on havaita tilastotuotannon kapeakatseisuus ja yksinkertainen suoraviivaisuus. Valitettavasti hyvää kompromissia ei taida olla olemassa, sillä kenelläkään ei ole resursseja osata kaikkea. Kun mukaan sotketaan vielä etiikka näennäisen tietosuojan varjolla, alkaa soppa hiljalleen valmistua. Kuinka tuottaa eettisesti ja halvalla substanssin kannalta oleellista sekä joustavasti eri menetelmiin soveltuvaa informaatiota? Puuttumatta epäoleellisuuksiin voisin antaa pienen motivaatiovinkin eettiseen analyysiin, mutta en todellakaan uskalla väittää käytännön toimivuudesta yhtään mitään. Kauniit ajatukset tyrmätään tai ne tukehtuvat viimeistään pakkopullaan. Joka tapauksessa ratkaistava ongelma kannattaa tunnustaa ja tehdä sen kanssa riittävästi tuttavuutta. Tilastotieteilijä varmasti taikoo jostain aineiston ja keksii käyttää ongelman ratkaisuvälineenä sopivia tilastomenetelmiä. Ensimmäinen ja ainoa motivaatioehto on kunnioittaa aineistoa, menetelmiä ja ongelmaa. Aineistolle ei ikinä, ikinä tehdä ‘tilastoajoja’ vaan sitä analysoidaan. Aineiston tietoja ei saa ajatella numeroina, määrinä tai totuuksina. Jokaista tietoa on kohdeltava kuten siihen liittyvää yksilöä tai aluetta, jolloin jokainen luku saa kasvot, inhimillisyyden. Tämän jälkeen on yleensä helppoa päättää mitä sanoo ääneen ja mitä ei. Tilastopäivien muuta satoa Alueellisuuden lisäksi päivillä kerrottiin Helsingin kaupungin ja yliopiston yhteistyöstä kaupunkitutkimuksen saralla. Ulkopuolinen rahoitus tekee varmasti hyvää myös yliopistolle, kunhan yritysmaailmalle ei anneta liian suurta valtaa. Eikös joku ole joskus puhunut sivistysyliopistosta? Tilastopäivien ohjelmaan kuului myös vuoden 1999 parhaan gradun palkitseminen. Tällä kertaa kunnia meni Tampereen yliopistolle. Työn aiheena oli jalkapallo-otteluiden maalimäärien ennustaminen. Työn hyvinä puolina mainittiin selkeä ongelmanasettelu sekä tekijän innostunut asenne.


Tyyppiarvo 1/00 Tilastotieteen laitoksemme professorit Seppo Mustonen ja Anders Ekholm saivat kumpikin päivien yhteydessä Suomen tilastoseuran kunniajäsenyyden. Lämpimät onnittelut heille minunkin puolestani. Reijo Sund

7

Laitoksella tapahtuu Tai oikeastaan ei tapahdu, sillä laitoksemme pysyy paikallaan, vaikka vahvoja huhuja liikekannalle panosta olikin liikkeellä.

Odotamme myös mielenkiinnolla Laitoksemme esimiehen lupaamaa tiedotus-/ keskustelutilaisuutta laitoksemme tulevaisuudesta. Sille oli jo sovittu päivämääräkin, mutta ikävän sairastapauksen vuoksi sitä jouduttiin siirtämään.

Moodi Toimi Kirjallisuus: Bailey, Trevor C. & Gatrell, Anthony C. (1995): Interactive spatial data analysis. Addison Wesley Longman Limited, Essex. Bivand, Roger (1998): A review of spatial statistical techniques for location studies. Geografi i Bergen Series A 1998 / 3. Department of Geography, Norwegian School of Economics and University of Bergen, Bergen. http:// www.nhh.no/geo/gib/ Brunsdon, Chris F. & Fotheringham, A. Stewart & Charlton, Martin E. (1996): Geographically Weighted Regression: A Method for Exploring Spatial Nonstationarity. Geographical Analysis 28:4, 281-298. Fotheringham, A. Stewart (1997): Trends in quantitative methods I: stressing the local. Progress in Human Geography 21:1, 88-96. Fotheringham, A. Stewart & Charlton, Martin E. & Brunsdon, Chris F. (1996): The geography of parameter space: an investigation of spatial non-stationarity. International Journal of Geographical Information Systems 10:5, 605-627. Haining, Robert P. (1990): Spatial data analysis in the social and environmental sciences. Cambridge University Press, Cambridge. Haining, Robert P. (2000): Spatial Statistics and GIS. Invited lecture at The 80 Years Anniversary Conference of the Finnish Statistical Society, February 2000, Helsinki. Knorr-Held, Leonhard (2000): Joint Disease Mapping. Invited lecture at The 80 Years Anniversary Conference of the Finnish Statistical Society, February 2000, Helsinki. Marshall, Roger J. (1991): Mapping Disease and Mortality Rates using Empirical Bayes Estimators. Applied Statistics 40:2, 283-294. Nouko-Juvonen, Susanna & Sund, Reijo (1999a): Keskuslaitosten ja asumispalvelujen käyttö - palvelujen tarjonnan ja tarpeen vaikutus. Sosiaalilääketieteellinen Aikakauslehti 36:4, 247-254. Nouko-Juvonen, Susanna & Sund, Reijo (1999b): Kehitysvammapalvelujen alueelliset kustannukset – Rekisterien käyttökelpoisuus kustannusten analyysissa. Teoksessa: Mikkola & Hedvall (toim.): Terveystaloustiede 2000. Stakes, Aiheita 45/1999, Helsinki. Penttinen, Antti (2000): Small-area statistics in mapping of georeferenced data. Invited lecture at The 80 Years Anniversary Conference of the Finnish Statistical Society, February 2000, Helsinki. Sund, Reijo & Nouko-Juvonen, Susanna (2000): Kehitysvammapalvelujen käyttö ja kustannukset alueellisina ilmiöinä: taustaa ja tutkimusmahdollisuuksia. Teoksessa: Loikkanen & Saari (toim.): Sosiaalipolitiikka lokalisoituvassa maailmassa. (ilmestynee piakkoin)

Kummi-setä lupaa järjestää Mopin lähitulevaisuudessa seuratkaa ilmoittelua listalla ja uutisryhmässä.

Kuvassa joukko moodilaisia viettää Moodin 32vuotissyntymäpäivää ravintola Acapulcossa sunnuntaina 13.2.. Tilaisuus sujui rauhallisen arvokkaasti ja lähes kaikki paikalla olleet olivat tietääkseni tyytyväisiä. Saimme jopa lahjan, kun Statistikan edustajan toiminut Marja Siltala lahjoitti meille SPSS:n ysiversion käyttöohjeen.


8

Tyyppiarvo 1/00 Taloudenhoitaja: Leena Kaarina Kalliovirta Olen kotoisin Padasjoelta, Päijät-Hämeestä. Helsingissä olen asunut jo monta vuotta ja ilmeisesti hämäläisyyteni vuoksi joudun asumaan vielä muutamia vuosia. Opinnot: Matemaattis-luonnontieteellisestä tdk:sta siirryin kaksi vuotta sitten tilastotieteen pääaineopiskelijaksi. Työ: Äidin tilitoimistossa riittää tekemistä aina, kun opinnoilta ehtii. Harrastukset: Kirjanpito, sähly, laskettelu, murtomaahiihto, kotityöt, käsityöt ja klassinen musiikki. Tavoitteet: Saada Moodin tilinpäätös valmiiksi ensivuoden alkupuolella ja tietenkin saada opinnot valmiiksi kohtuullisen ajan kuluttua. Viereinen kuva on viime kesän satoa.

Kulttuurisihteeri: Sami Moisio Syntynyt Iisalmessa 1974, horoskooppi leijona, murrr. Kotikaupunkini on Kokkola, Helsingissä olen asunut jo syksystä -93. Harrastuksia: elokuvat (vanhat ja uudet) sekä musiikin kuunteleminen (Jazz & muut) tällä hetkellä parasta: kent. Motituksen sähly ja salibandy peleissä mukana toisinaan. Opiskellut tilastotiedettä vuodesta -97 sivuaineet matematiikka ja tkt. Suuria vaikuttajia: Mauri Kunnas & Jacques Tati.

Virkitysvastaava: Pekka Luukkainen

Lemma on päässyt hukkumaan!

Toisen vuoden rauhalliseen tahtiin edistyvä tilastotieteen opiskelija. Toista vuotta myös Moodin hallituksessa. Kunnostautunut varsinkin omalla vastuualueellaan virkistysvastaavana. Pyrkii asettamaan taiteelliset arvot ja inhimillisyyden tehokkuuden ja kaupallisuuden pyrkimysten edelle. Huhuja myös mahdollisista yhteyksistä idän tiedustelupalveluun. Näkee usein punaista ...

Puheenjohtaja: Heikki Hyhkö Harrastukseni ovat jotakuinkin ennallaan, mutta kerrottakoon nyt niille, jotka eivät ole lukeneet kahden edellisen vuoden hallitusesittelyitä, että keräilen äänilevyjä aina, kun henkilökohtainen taloustilanteeni sen sallii (joskus myös silloin, kun se ei sitä salli, mutta eihän sitä joka päivä tarvitse syödä). Toinen harrasteeni on huumori lähes kaikissa mahdollisissa muodoissa. Huumoritasapainoa pidänkin yllä siten, että kuulen paljon hyviä vitsejä ja kerron vielä enemmän huonoja. Tapaani hoitaa yleisiä ja yksityisiä asioita sekä menetlmääni fyysisen kuntoni ylläpitämisessä kuvaa hyvin yksi termi: sählääminen. Toimin tällä hetkellä tuon otsikossa mainitun tehtävän lisäksi Moodin tiedotus- ja suhdevastavana, Motituksen kapteenina, Mopin kummisetänä, Tyyppiarvon taittajana ja toimittajana, Moodin hovikuvaajana sekä postilistamme ylläpitäjänä ja pahoin pelkään, että tutoriuskin kaatuu vielä minun niskaani (ai niin, sain muuten viime viikolla viimein tiedon siitäkin, että olen tätä nykyä myös kotisivujen ylin hallitsija). Olen siis oman käsitykseni mukaan heikkotahtoinen hölmö, joka tekee mitä tahansa muiden puolesta, mutta itseäni viisaammat sarkastiset ystäväni muotoilevat saman asian käyttämäälä termiä vastuuntuntoinen hölmö. Viime vuodesta lähtien olen myös liittänyt harrasteisiin tiedekuntatason opiskelijatoimintaan osallistumisen, joka tuo mukavaa vaihtelua Moodin toimintaan (susittelen lämpimästi) Pidän myös data-ykkösen harkkoja, yritän käynnistellä opintoja ja etsiä elämälle tarkoitusta. Mottoni olkoon siis: Kun ei ole elämää, niin ehtii osallistua opiskelijaelämään.


Tyyppiarvo 1/00

Hallitus 2000

9 Opinto- & Ekskursiovastaava: Juha Johansson

Urheiluvastaava: Petteri Lahti Tarinan päähenkilö on Petteri Lahti, Moodin v. 2000 hallituksen urheiluvastaava, mies jota monetkaan Tyyppiarvon lukijoista eivät tunne. Mutta älkää huoliko, ei hänkään tunne suurta osaa teistä, ainakaan vielä. Ajattelin antaa lukijoille hieman taustatietoa tunnistamisen helpottamiseksi. Herra X on 25vuotias ensimmäisen vuoden tilastotieteilijä, takanaan tosin sekalainen joukko opintoviikkoja muutaman vuoden ajalta. Kotoisin hän on Porista, mutta ei seuraa jääkiekkoa, joten Ässien taloussotkuja ja huonoa menestystä koskevat ivat on suutareita jo syntyessään. Olette saattaneet hyvinkin törmätä tähän mieheen, hän on juuri se silmälasipäinen tyyppi, jota olet paheksuvasti katsonut hänen tullessa opetustilaan kesken luennon tai laskareiden. Sama mies on ollut myös kyseessä, kun valtsikan ruokalassa olet joutunut väistämään mailapussin ja urheilukassin kanssa heiluvaa tyyppiä. Moodin urheiluvastaavaksi hänet saatiin oikeastaan kahdestakin syystä. Ensinnäkin muiden moodilaisten toimeenpanema hillitty painostus mursi rakkaan kertojanne näennäisen vastarinnan perin helposti. Toisena syynä oli se, että hän on aiemmin toiminut kohtuullisen aktiivisesti Satakuntalaisessa Osakunnassa, joten hän katsoi tarpeelliseksi tutustuamyös oikeaan ainejärjestö toimintaan. Tähän tarkoitukseen urheilugurun pesti oli vähintäänkin omiaan, sillä tämä toimeen valitsemanne henkilö käyttää suuren osan vapaa-ajastaan juuri urheiluun. Hänen intohimonsa kohteita urheilumaailmassa ovat muiden muassa jalkapallo, salibandy, lumilautailu, lenkkeily, punttisali... listaa voisi jatkaa vielä pitkään. Lähitulevaisuudessa hänen pyrkimyksensä on järjestää jotain pientä liikunnallista toimintaa moodilaisille, kaikenlaiset ideat otetaan huomioon.

Olen tilastophuksie mutta jo vanha opiskelija muualla. Diplomityön tietotekniikasta aloitan parin vuoden päästä, joten optimoin vielä jonkin aikaa minimoidakseni turhat liikkumiset ylipaston ja TKK:n välillä. Henkistä, poikkitieteellistä liikettä tietenkään ei saa rajoittaa. Mereily, Keravan puolustaminen, älykäs ja tyhmä huumori sekä tiede & taide käyvät kaikki hyvästä ajanvietosta. Ruumiinkulttuurina palloilen, paitsi korista ja tennistä; niiden lisäksi inhoan (vaatteiden) silittämistä ja ahdasmielisyyden kohtaamista. Nämä voisi vaihtaa vaikka unituokioihin tai lukematta oleviin metreihin kirjahyllyssä.

Kerhokoordinaattori: Sonja Lumme - 6. vuosi yliopistossa - 3. vuosi Moodissa - 26. vuosi menossa - Pitäjänmäki - Kuntosali - Punaviini - Ruoka - Koti - TV

Varapuheenjohtaja ja Tyyppiarvon päätoimittaja: Tiina Sévon Olen aina kokenut olevani enemmänkin oppositio ainesta, mutta nyt huomaan joutuneeni lähes vahingossa hallitukseen. Yritän kovasti pää(ttömästi)toimittaa Tyyppiarvoa ja varapuheenjohtaa Moodia. Harrastin aiemmin hyvinkin aktiivisesti miinaharavaa, mutta uuden puhelimen myötä olen siirtynyt mato- ja muistipelin ihmeelliseen maailmaan. Muina harrastuksina mainittakoot sohvalla makoilu ja telkkarin tuijottelu, Salatut elämät määrää melko pitkälti meitsin päivärytmin...


10

Tyyppiarvo 1/00

Purasen Mitä Mitä Mitä Lehtori Juha Purasen kotisivut (http:// noppa5.pc.helsinki.fi) ovat usein käytetty referenssimateriaalin lähde laitoksellamme. Useimmiten kuitenkin haemme sieltä jotain tiettyä informaatiota jonkin tietyn kurssin aihepiiristä. Mutta mitä kaikkea muuta Lehtori Purasen kotisivut sisältävätkään onkin aivan eri juttu. Pyrin nyt kartoittamaan tämän "saitin" fysiologiaa tarkemmin. Simuloidessani nyt satunnaista surffaajaa, saavun Purasen sivuille tilastotieteen laitoksen kautta. Ensimmäiseksi huomio kiinnittyy linkkiin "Uusi Noppa5:ssä oleva kotisivuni (yleensä paremmin ajan tasalla)", joka suorastaan vaatii klikkausta. Tästä eteenpäin viitatessani Purasen kotisivuihin tarkoitan juuri näitä Noppa5:ssä olevia sivuja. Noppa5 itsessään on se Purasen pöydällä oleva kone. Käyttöjärjestelmänä on linux (Red Hat 6.0) ja web-serverinä apache (kuten noin 50-60%:ssa maailman verkkopalvelimista). Nämä seikat eivät ole täysin merkityksettömiä, sillä "Some teaching material - Some experimental wwwpages"-linkkien takaa löytyy osia, jotka toimivat ainoastaan Netscape 4+ -ohjelmilla. Internet Explorer, vanhemmat Netscapet ja lynx ovat siis hyödyttömiä näitten tosi coolien sivujen katselussa. Yleisiä huomioita Noppa5:n etusivulla huomio kiinnittyy jakoon suomenkieliseen ja englanninkieliseen osuuteen. Suomenkielinen osio koostuu linkeistä Purasen pitämille kursseille (kuluvalla taikka jollain muulla lukukaudella). Lisäksi on todella hyödyllinen linkki "Tilastollisia termejä", jonka takaa paljastuu n. 65 suomenkielistä hakusanaa, jotka koskettavat aiheita Beta-jakaumasta Harhan kautta Mediaaniin ja variaatiokertoimeen.

Kurssilinkeissä on tilastotieteen johdantokurssi, data-analyysi I, data-analyysi II ja otanta. Keväiden -97 ja -99 jäljiltä on linkki S/R-sivuille, jotka liittyivät data-analyysi III:een. Näistä lempparini on S/R-sivusto, josta löytyy kanssaopiskelijoittemme hengentuotteita esimerkiksi ystävämme Sami Nevala ja Annukka Valkeapää ovat suorittaneet data-analyysi III:n harjoitustöillä, jotka ovat kaikenkansan luettavissa ps-muodossa yhdellä hiiren kaksoisnapsautuksella. Muut data-analyysi-sivut ovat tavanomaisempia; harjoituksia, taustatietolinkkejä, suoritusvinkkejä ja sen suuntaista. Ajankohtaisin sivusto liittyy otantaan, sillä se on ilmeisesti tuorein ja Puranen myös luennoi sitä tänä keväänä. Sivulla on runsaasti linkkejä erilaisiin java-script-sovelmiin (tytöille ja pojille on omansa!), jotka tosin ottavat oman aikansa latautua. Lisäksi sieltä löytyy linkkejä muihin kursseihin, kirjoihin ja muitten yliopistojen vastaaviin sivustoihin. Teaching Material Kiinnostavimmillaan Puranen on "Teaching material" -linkin takana. Sieltä löytyy elävää kuvaa data-analyysin havainnollistamiseksi ja erityisesti tuo jo edellä mainittu "Some experimental www-pages". Sieltä löytyy Purasen omia ajatuksia ("WWW and teaching statistics - a teachers point of view") ja hänen aivan älyttömän laaja linkkilistansa. Tämä linkkilista kuuluu jokaisen tilastotieteilijän tietää; jos jokin mättää, Purasen linkkilistalta apu löytyy todennäköisesti 2-3:n hiiren napsauksen päästä. Hiljaiset illat saa mukavasti kulumaan surffaamalla Purasen "Visualisation" -otsakkeen alta löytyvien kilkkeitten parissa. Itsekin hämmästyin, kuinka paljon leikkimahdollisuuksia on mahdollista verkossa toteuttaa. Siellä on noppa- ja kolikkosimulaattoreita (nähkää


Tyyppiarvo 1/00

11

sivuja! kolikon pyörivän!) ja . Voit harjoitella arvioimaan korrelaatiokertoimia taikka kertoa koneelle millaisia korrelaatiokertoimia haluaisit nähdä luonnossa taikka peräti katsella elävää kuvaa korrelaatiokertoimen muutoksesta. Jos et koskaan oikein ymmärtänyt mitä Venndiagrammit olivat ja kuinka se joukko-oppi nyt menikään, ei muuta kuin painat nappia kohdassa "Venn diagrams". Uusinta uutta on "DHTML-pages" (joka vaatii Netscape 4+:n) alta löytyvät animaatiot. Sieltä löytyy mm. havainnollistuksia 'palloja kulhossa' -ongelmaan, muuttujien reaalisaatioiden muuttamisen vaikuksista tunnuslukuihin ja outliereitten vaikuksista korrelaatiokertoimiin. Kaikki nämä demot ovat interaktiivisia. Ota hiiri, siirrä vihrää palloa ja hämmästy, kuinka se vaikuttaa keskiarvon suuruuteen. Miksi ihmeessä??? "Hyvänen aika, minähän valmistun kohta. Miksi katselisin varianssin muutosta, sillä kyllähän minä sen tiedän..." Niinpä niin. Kyllähän me olemme oppineet laskemaan yhtä ja toista, johtamaan yhtä ja toista ja päättelemään yhtä ja toista - paperilla ja paperia avuksi käyttäen. Purasen interaktiivisten animaatioiden idea onkin muistuttaa meitä reaalimaailmasta, todellisten mittausten maailmasta, jotta näkisimme miten oppimamme teoreettinen aines manifestoituu reaalimaailmassa. Tilastotieteilijöinä me olemme rajankävijöitä - kääntäjiä - joitten on ymmärrettävä sekä lähdekieltä, että kieltä, johon näkemäämme käännämme. Näin ollen animaatioiden kanssa leikkiminen on sormiharjoittelua, aivojumppaa ja jalkojen maahan laittamista - kaikki asioita joita tarvitsemme.

Puranen on nähnyt tavattomasti vaivaa sivuja rakentaessaan. Muutaman kerran olen löytänyt (hakupalveluilla!) mielestäni jotain jännää verkosta vain huomatakseni, että Puranen ehtikin ensin ja että kyseinen dokumentti olisi ollut hänen linkkilistallaan. Yhdessä kohdin olisin kuitenkin toiminut toisin: Puranen kertoessaan tilastotieteen opettamisesta: "My experience is that, presently at least, the students do not read textbooks in the net. They print it first on paper. Is this sensible?" Mielestäni se ei ole ainoastaan järkevää vaan myös suotavaa! Tästä syystä on ärsyttävää havaita, että useitten linkkilistalla "Statistical TEXTS" - otsakkeen alta löytyvien kirjojen olevan ns. verkkokirjoja; niissä on freimit ja ne on pilkottu hyperlinkeillä eri tiedostoihin. Missään ei ole book.txt taikka - vielä parempi book.ps tiedostoja, joista saisi koko kauniin teoksen a4:lle printattuna nojatuolissa taikka sängyssä luettavaksi! Tämä ei tietenkään ole puute Purasen kotisivuilla vaan puute niitten muitten kotisivuilla... Olen kuitenkin huomaavinani tässä selvän pedagogisen painotuksen, josta en ole samaa mieltä. Lopuksi on todettava, että Purasen kotisivut ovat paras suomenkielinen esitys tilastotieteen perusasioihin verkossa. Se on huomattavan laaja ja hyödyllinen myös globaalissa mittakaavassa. Jos et ole koskaan käynyt Purasen kotisivuilla niin hetimiten koneen ääreen! Perttu


12

Tyyppiarvo 1/00

Tyyppiarvo 12 vuotta sitten Tyyppiarvo 1/88 ilmestyi 12-sivuisena. Kannessa on jokin epämääräisesti elefanttia muistuttava ilmestys, jonka on jälleen ppirtänyt kansitaiteilija Soile Koskinen. Lehdestä löytyy myös kolme valokuvaa sekä useita piirroksia ja valkopoita saksalaisesta tilastokirjasta. Takakannessa on sarjakuva, mutta se häviää kyllä kovinkin selvästi myöhempien Tyyppiarvojen legendaarisille Kovis-stripeille. Lehden päätoimittajana toimi Kimmo Kohtamäki ja hänen apunaan heilui viisi muuta toimittajaa. Lehden kuuluisin toimittaja näyttäisi olevan Etiopian Keisari. Sisältö on pääosin hyvinkin aika riippuvaista, vaikka lehdessä käsitellän myös ikuisuusongelmaamme opiskelijoiden vähyyttä.

Isolaation tiellä ?

Sisällys:

Pyry-Matti Vasama lausui Tutkaimen haastattelussa loppusanoiksi, että “yhä enemmän pitäisisaada alan opetus tilastotieteen laitoksen haltuun”. Tällä hetkellä kehitys on menossa päinvastaiseen suuntaan. .... (Kimmo Kohtamäki)

Pääkirjoitus - Isolaation tiellä? Kouluoppikirjat puntarissa Harjoittelijana Tilastokeskuksessa Markkinointiongelmia Hajonnat elämään Oodi Moodi Moodi Moodi - Sihteeri jatkaa vielä Tarvitaanko meitä lisää? Staffan Statistiker

Hajonnat elämään

Kouluoppikirjat puntarissa

Minä Olen vasta saanut hajasäteitä valaisttuksen hehkusta. Olen kokenut pieniä annoksia ymmärryksen hetkiä mutta vieläkin odotan hetkeä, jolloin tiedon salaiset portit aukeavat ja suomukset putoavat silmistäni. Uni, tule taksisin!

(Haile Selassie)

Aseenne tilastotieteeseen selittynee osin maamme matemaattisen tradition kautta . Meille on perinteisesti ollut vahva funktioteoreettinen koulukunta ja suuntautuminen on näkynyt koulutuksessa paitsi yliopistossa myös kouluissa. (Virve Rouhiainen)


Tyyppiarvo 1/00

13

Lääkemaistajaiset Piskuinen lauma tilastotieteen opiskelijoita vaelsi torstaiaamuna 17.2. läntiseen Pasilaan etsimään lääke- ja lääkeainevalmistaja Leirasta. Eksku oli viimeinen syksyllä alkaneen kurssin Tilastotiede käytännön tutkimuksessa puitteissa järjestetty, mutta tällä kertaa prof. Hannu Niemi oli äkillisesti estynyt esiintymästä esiliinanamme. Liekö järkytys verottanut osallistujamäärää, mutta yhteensä vain kolme fuksia ja kolme vanhempaa tieteenharjoittajaa pakkautui Maistraatinportilla hissiin noustakseen Leiraksen markkinointiyksikköön eikä kliinisen puolen tiloihin niin kuin alun perin oli sovittu. Perillä pääsimme heti kahville ja pullalle, jota isäntäväki olikin varannut yli tarpeen mielessään moodilaisten edellinen ryntäys muutamaa vuotta aiemmin. Aluksi emäntämme Tiina Hakonen kertoili Leiraksesta yleensä ja sen kansainvälisestä emokonsernista Scheringistä. Nykyisestä saksalaisperäisestä omistajasta huolimatta henkilöstö on edelleen varsin suomalaista, ja firman nimi tulee -legendan mukaanLEIvontaRASvasta! Miljardin liikevaihtoa takoo Suomessa noin tuhat työntekijää, joista kolmisensataa työskentelee tutkimuksessa ja tuotekehityksessä. Tähän joukkoon mahtuu monta tilastotiedettä opiskellutta, mutta Helsingissä ei muistettu ahertaneen kuin vaivaiset kaksi moodilais-pioneeria. Liekö syynä se, että valtaosa leiraslaisista työskentelee Turkkuses tai se, ettei meidän laitoksella säännöllisesti opeteteta vaadittavia erikoiskursseja. Sitä paitsi Leiraksella ei puhuta tilastotieteestä vaan biostatistiikasta. Jos pitää itseään biostatistikkona, on syytä kyetä lisäksi tiimityöskentelyyn ja oppia SASsia, jos töihin tutkimushommiin halajaa. Jaakko Nevalainen kuvasi seuraavaksi tyypillisen kliinisen tutkimustiimin työnjakoa ja statistikon tehtävää. Biostatistikon työ tapahtuu tiimissä, ja hän on tavallisesti ainoa tilasto-osaamisekspertti noin kymmenpäisestä joukkiosta. Usein tavoitteena on osoittaa jonkin uuden lääkeaineen

vaikuttavuus: tehoaako se, tehoaako se paremmin tai yhtä hyvin kuin olemassaolevat lääkkeet, ovatko sivuvaikutukset siedettävät. Analyysisuunnitelma tehdään tiimissä yhdessä, ennen kuin dataa ruvetaan keräämään kentällä. Statistikko osallistuu mm. kyselyiden laatimiseen, vaikuttavuusmittareiden ja testityypin (sokko-, kaksoissokko jne.) valintaan. Otoskoon päättäminen ei ole helppo tehtävä saati se, miten erottaa tuloksia analysoitaessa tilastollinen ja kliininen merkitsevyys. Tutkimushypoteesiin pitää pystyä vastaamaan riittävällä varmuudella, mutta pitää samalla koekustannukset kurissa. Lääketiedettä ei tosin kuulemma tarvitse hirviästi oppia: Nevalaisen mukaan statistikot eivät välttämättä paljonkaan ymmärrä (tiimiä johtavan) tutkimuslääkärin asettamasta hypoteesista ja muusta medikaalislangista. Kunhan hallitsee luvut hyvin, voi jättäytyä enemmän statistiksi muilla aloilla. Oikeilla ihmisillä (koe-eläimistä emme kuulleet mainintaa) lääkkeitä ja lääkeaineita testattaessa joutuu suunnittelussa eettisten valintojen eteen: moniko syöpää sairastava potilas verrokkiryhmissä saa plaseboa eli lumelääkettä ja miten hankalille sivuvaikutuksilla vaikutuksille koehenkilöt voidaan tietoisesti altistaa. Jos tutkimuksessa on mukana tuhansia koehenkilöitä, voi testaamisella olettaa joskus olevan "merkitsevää" vaikutusta ihmiselämiin. Oli potilaana sitten vakavasti sairas tai uuden ehkäisyvalmisteen testaaja. Juha Kenraali kertoi lopuksi, miksi kaikki on niin SAS ja onko muilla tilasto-ohjelmilla elämää. SASsia käytetään lääketeollisuudessa kuulemma erittäin paljon ja eräs syy ovat ne vaatimukset, joita markkina-alueiden tiukin viranomainen lääkkeiden testaukselle asettaa. Tällöin samojen tutkimutulosten pitäisi kerralla kelvata kaikille. Eli koska amerikkalaiset käyttävät sitä, käpytellään Leiraksellakin joka päivä SASsilla. Tiettyjä tehtäviä tehdään säännöllisesti muillakin

jatkuu >>>


14

Tyyppiarvo 1/00

Tilastotieteen historia Tämä aihe on ollut mielessäni jo vuoden 1998 joulusta, jolloin sain joulupukilta toivomani pehmeäkantisen paketin, eli Boyerin kirjat matematiikan historiasta. Valitettavasti en ole joulun jälkeen millään löytänyt riittävästi aikaa artikkelisarjan aloittamiseen. Ei minulla nytkään ole tähän tarvittavaa aikaa, mutta en anna sen häiritä, vaan aloitan kuitenkin. Tätä artikkelisarjaa tullaan jatkamaan! Teen sitä itse kykyjeni mukaan ja minun lisäksi muutama muukin henkilö on alustavasti kertonut olevansa valmis kirjoitustöihin. Näin laajan aiheen kyseessä ollessa ei kirjoittajia koskaan ole liikaa, joten ilmoitta minulle, jos sinulla on kiinnostusta kirjoitustöihin. Tarkoituksenani on, että artikkelisarja etensi kronologisesti, joten seuraavan artikkelin aiheena on Bernoullien kausi. Siitä eteenpäin alkaakin sitten tilastotieteen historiaan vaikuttaneiden henkilöiden määrä kasvaa merkittävästi, joten todennäköiseti joudumme hidastamaan etenemistahtia. Oma lähetymistapani tulee olemaan henkilöhistoriallinen, mutta jos joltakulta löytyy toisenlainen lähestymistapa, niin eiköhän sekin saada mukaan sovitettua. Minun pääasialliset lähteeni ovat nuo lopussa mainittavat kirjat ja verkkosivut, mutta jos tiedätte mistä löytyisi lisää tietoa, niin ilmoittakaa ihmeessä. Toivon, että luette tätä artikkelia kuin piru raamattua ja huomautatte kaikista virheistä ja puutteista minulle, jotta ne saadaan oikaistua jatkossa. Kaikenlaista palautetta odotellaan mielenkiinnolla osoitteessa <hyhko@cc.helsinki.fi>. PS. on niin tautinen kiire, että tästä artikkelista ei ole yhtään mihinkään. Lupaan, että seuraava on huomattavasti parempi.

välineillä, joiden nimet valitettavan huonosti vielä tarttuivat kirjoittajan fuksinpäähän. Kovin etäisesti olivat myös tuttuja termit parametriton mallintaminen, luottamusväli- ja otoskokolaskut, mutta yhteistä niille oli muidenkin työkalujen kuin SASsin käyttö. Eräitä iskusanoja Scheringissä on itse tuotettujen ohjelmien laatuun pyrkiminen ja standardisointi, jotta yhdessä tutkimuksessa tehtyjä ohjelmia voitaisiin useammin käyttää yhä uudestaan. Tietenkin kaikki tarvitsevat virallisten raporttien tekoon myös Wordia, jonka 97-versio kuulemma jaksaa jo joten kuten käsitellä tuhatsivuisiakin (sic) tilastolistauksia. Globaalin dokumenttien hallinnan ansiosta sähköisiä julkaisuja pystytään Schering-konsernissa jakamaan muiden tutkimusryhmien kanssa kaukomaille saakka. Kaiken kaikkiaan isäntäväki kuvasi omaa työtään varsin tietokonepainotteiseksi. "Hyville SAS-ohjelmoijille löytyy aina töitä", sanottiin, mutta korostettiin samaan hengenvetoon, että kukaan heistä kolmesta ei taloon tullessaan käytännössä osannut SASsia. Kyvykkäillä opiskelijoilla on mahdollisuus päästä tekemään tuntitöitä opintojensa ohella iltaisin, ja jos muita töitä kaipaa, hakee Leiras lääketutkimuksiinsa myös sopivia koehenkilöitä. Rahapalkan lisäksi joskus voi saada aamiaisenkin pillerin painikkeeksi. Juha Johansson


Tyyppiarvo 1/00

15

Osa 1 - Todennäköisyylaskentaa ja kuolinsyitä

Blaise Pascal 19.6.1623-19.9.1662

Pierre de Fermat 17.5.1601-12.1.1665

Christiaan Huygens 14.4.1629-8.8.1695

Todennäköisyyslaskennan historiallisena syntymähetkenä, pidetään kirjettä, jonka Blaise Pascal lähetti Pierre de Fermat´lle vuonna 1654. Ammattipeluri Chevalier de Mére esitti Pascalille seuraavanlaisia ongelmia: Pelaaja yrittää kahdeksalla nopan heitolla saada yhden ykkösen, mutta kolmen epäonnistuneen heiton jälkeen peli keskeytyy (eri lähdeteoksissa peli kuvataan hieman eri muodoissa). Miten hänen panoksensa tulisi hyvittää? Pascal kirjoitti ongelmasta Fermat’lle ja heidän viidestä kirjeestä koostunut kirjeenvaihtonsa loi perustan todennäköisyyslakennalle. He ratkaisvat annetun ongelman kahden pelaajan tapuksessa, mutta eivät laajentaneet sitä useammille pelaajille. Giorlamo Cardano oli käsitellyt samantapaisia ongelmia jo sata vuotta aiemmin, mutta ne olivat siinä vaiheessa jääneet huomiotta. Myös Luca Pacioli ja Niccolo Tartaglia olivat käsitelleet samoihin aikoihin saman tapaisia ongelmia. Pascal kehitti myös mielenkiintoisen teorian, jonka mukaan on rationaalista uskoa jumalaan. Alla vapaa käännökseni kyseisetä kohdasta aiheesta Pascalin kirjasta Pensees. Jos Jumala ei ole olemassa, ihiminen ei menetä mitään uskomalla häneen, mutta jos Jumala onkin olemassa, niin ihminen menttää kaiken, jos ei usko. Ensimmäisen varsinaisen teoksen todennäköisyyslaskennasta (De Ratiociniis in Ludo Aleae) julkaisi kuitenkin alankomaalainen matemaatikko Christiaan Huygens vuonna 1657. Tämän jälkeen astuukin sitten kuvioihin Bernoullien suku ja monet muutkin merkittävät matemaatikot ja tähän aiheeseen pureudummekin seuraavassa numerossa. Mutta sitä ennen vielä pieni hyppäys varsin toisenlaiseen aiheeseen, jolla on kuitenkin jonkinmoinen merkitys tilastotieteen historian kannalta. Kauppamies nimeltään John Graunt loi pohjan demometrialle kirjoittamalla teoksen Natural and Political Observations Made Upon the Bills of Mortality (1662). Toinen merkittävä mies oli John Grauntin toveri Sir William Petty, joka julkaisi kaupallisia tutkielmia, joista tärkein on nimeltään Political Arithmetic (1690), jota voitaneen pitää jonkinmoisena tilastotieteen etiäisenä.

Lähteet: www-groups.dcds.st-and.ac.uk/~history Carl Boyer: Tieteiden Kuningatar - Matematiikan historia osat: I & II E.T. Bell: Matematiikan Miehiä Stigler: The History Of Statistics Hessu


16

Tyyppiarvo 1/00

Vuosikatsaus 1999 21.1. Moodin vuosikokous 29.1. Ekskursio Turkuun 1.2. Kokkisodan pilottijakso 27.1. Kannun sählyturnaus 11.3. Tyyppiarvo 1 20.3. Moodin & Politicuksen tedarit 24.3. Viiniä ja Tilastotiedettä eli Opettajatapaaminen 1.-2.4. Forssan salibandyspektaakkeli & Loimaan kapakkakierros 7.4. MoPPI 1 ?.4. Annie Leibovitz & Yoko Ono 21.4. Moodin Progeilta 27.4. Kannun pesäpalloturnaus 29.4. Tuoppiarvo 30.4.-1.5. Vappuilua 6.5. Tilastografiikan teemaseminaari 6.5. Akateeminen Wartti 20.5. Kybällä 4.7. Heptathlon 12.7. Piknik Pihlajasaareen 10.-18.8. ISI 16.8. Kansalliset Tilastobileet 3.9. Fuksitapaaminen 9.9. Fuksiaiset Statuksen kanssa Idalla

7.10. MoPPI 2 18.10. Improvisaatioteatteri Stella Polaris 19.10 Moodin Millennium 14.10. Tyyppiarvo 3 6.-7.11. Nuuksio 12.11. Drinkki-ilta 20.-21.11. Teraintegraatio 23.11. Räiskintää MegaZonessa 30.11. Teemana Tilastotiede 1.12. Ekskursio Tilastokeskukseen 1.12. MoKoMa & Huovuta, älä luovuta 5.12. Moodin pikkujoulu 13.2. Laitoksen käytäväkahvit 15.12. Tyyppiarvo 4 16.12. Valokuvanäyttely

Tyyppiarvo 1 / 2000