
Jiří Neubauer, Marek Sedlačík, Oldřich Kříž
![]()

Jiří Neubauer, Marek Sedlačík, Oldřich Kříž
Aplikace v technických
a ekonomických oborech
3., rozšířené vydání
Grada Publishing
Upozornění pro čtenáře a uživatele této knihy Všechna práva vyhrazena. Žádná část této tištěné či elektronické knihy nesmí být reprodukována a šířena v papírové, elektronické či jiné podobě bez předchozího písemného souhlasu nakladatele. Neoprávněné užití této knihy bude trestně stíháno.
Jiří Neubauer, Marek Sedlačík, Oldřich Kříž
Aplikace v technických a ekonomických oborech
3., rozšířené vydání
Vydala Grada Publishing, a.s.
U Průhonu 22, Praha 7 obchod@grada.cz, www.grada.cz tel.: +420 234 264 401 jako svou 8204. publikaci
Lektoroval: doc. RNDr. Jaroslav Michálek, CSc.
Recenzovali: prof. RNDr. Petr Ponížil, Ph.D., doc. Mgr. Zuzana Hübnerová, Ph.D.
Odpovědná redaktorka: Věra Slavíková
Počet stran 296 Třetí vydání, Praha 2021 Vytiskla TISKÁRNA V RÁJI, s.r.o., Pardubice
Vydání odborné knihy schválila Vědecká redakce nakladatelství Grada Publishing, a.s.
© Grada Publishing, a.s., 2021
Cover Design © Grada Publishing, a. s., 2021
Cover Photo © Depositphotos/zphoto
Názvy produktů, firem apod. použité v knize mohou být ochrannými známkami nebo registrovanými ochrannými známkami příslušných vlastníků.
ISBN 978–80–271–4484–6 (pdf)
ISBN 978–80–271–3421–2 (print)
3.5Geometrickádefinicepravděpodobnosti
3.6Podmíněnápravděpodobnost
3.7Pravidloonásobenípravděpodobností
3.9ÚplnápravděpodobnostaBayesůvvzorec
4Náhodnáveličina
4.4Spojitánáhodnáveličina
4.5Charakteristikypolohy
4.6Charakteristikyvariability
4.7Charakteristikykoncentrace
5Modelyrozdělenípravděpodobnostíprodiskrétnínáhodnéveličiny
5.1Poissonovorozdělení ................................................
5.2Alternativnírozdělení ...............................................
5.3Binomickérozdělení
5.4Hypergeometrickérozdělení
6Modelyrozdělenípravděpodobnostíprospojiténáhodnéveličiny
6.1Rovnoměrnérozdělení
6.5Logaritmicko-normálnírozdělení
6.6Rozděleníněkterýchfunkcínáhodnýchveličin
7Teoretickézákladystatistiky
7.2Součetnezávislýchnáhodnýchveličin
8.1Druhyvýběrovéhošetření
8.4Populace,výběrastatistickéusuzování
9Odhadycharakteristikzákladníhosouboru
9.1Bodovéodhadyparametrů
9.3Intervalovéodhadyparametrůnormálníhorozdělení
9.4Intervalovýodhadstředníhodnotyprovýběryvelkéhorozsahu
9.5Intervalovýodhadparametrualternativníhorozdělení
10.1Pojemhypotézyapodstatatestováníhypotéz
10.2Jednovýběrovétestyhypotéz .........................................
10.2.1Testyparametrůnormálníhorozdělení N(µ , σ 2)
10.2.2Teststředníhodnotyprovelkývýběr
10.2.3Testparametrualternativníhorozděleníprovelkývýběr
10.2.4JednovýběrovétestyvaplikaciSTAT1
10.3Dvouvýběrovétestyhypotéz
10.3.1Testypronezávislévýběryzedvounormálníchrozdělení
10.3.2Testshodydvoustředníchhodnotprovelkénezávislévýběry
10.3.3Testshodydvoustředníchhodnotprozávislévýběry(párovýtest)
10.3.4Testshodydvouparametrůalternativníhorozděleníprovelké nezávislévýběry
10.3.5DvouvýběrovétestyvaplikaciSTAT1
10.4.1Grafickémetody
10.4.2Testnulovéšikmostianulovéšpičatostináhodnéveličiny
10.4.3Testnormálníhorozdělení–C-test
χ 2-testdobréshody ..........................................
11.3.1Diskrétnínáhodnývektor
11.3.2Spojitýnáhodnývektor .......................................
11.3.3Podmíněnérozděleníanezávislost
11.3.4Charakteristikynáhodnéhovektoru
11.4Dvourozměrnénormálnírozdělení
11.4.1Testvýznamnostikorelačníhokoeficientu
11.5Testnezávislostivkontingenčnítabulce
11.6Regresníanalýza
11.6.1Lineárníregresnímodel .......................................
11.6.2Odhadyatestyvlineárnímregresnímmodelu
11.6.3Regresnípřímka
11.6.4Regresnípřímkaprocházejícípočátkem
11.6.5Regresnílogaritmickákřivka
11.6.6Regresníhyperbolickákřivka
11.6.7Regresníparabolickákřivka
11.7Analýzarozptylu
doc.Mgr.JiříNeubauer,Ph.D.(∗1975)
VystudovalPřírodovědeckoufakultuMasarykovyuniverzityvBrně.Dizertačníprácivdoktorskémstudijnímoboruaplikovanámatematikaobhájilvroce2006naPřírodovědeckéfakultě OstravskéuniverzityvOstravě.Odroku2008absolvovalodbornéstážepostupněnaInstitute ofStatistics,GrazUniversityofTechnology,Graz,Rakousko,naDepartmentofStatistics, FacultyofScience,UniversityofMalta,Malta,naUniversityofMaribor,Maribor,Slovinsko anaWesternConnecticutStateUniversity,Danbury,Spojenéstátyamerické.Vsoučasnédobě pracujenaUniverzitěobranyjakozástupcevedoucíhoKatedrykvantitativníchmetod.Věnuje seproblematiceanalýzyčasovýchřadsezaměřenímnavícerozměrnémodelyadetekcizměn vnáhodnýchprocesech.Vpedagogickéoblastisevěnujevýucezákladníchstatistickýchmetod.Podílísenařešenívýzkumnýchprojektůvrámcisvéspecializace.Publikujevdomácích izahraničníchčasopisech.
doc.RNDr.MarekSedlačík,Ph.D.(∗1975)
VystudovalPřírodovědeckoufakultuMasarykovyuniverzityvBrně.DizertačníprácivestudijnímoboruObecnéotázkymatematikyobhájilroce2006naPřírodovědeckéfakultěMasarykovyuniverzityvBrně,rovněžrigorózníprácivoboruStatistikaaanalýzadatobhájilna MUvBrně.Odroku2008absolvovalodbornéstážepostupněnaInstituteofStatistics,Graz UniversityofTechnology,Graz,Rakousko,naDepartmentofStatistics,FacultyofScience, UniversityofMalta,Malta,naNationalUniversityofPublicService,Budapest,Maďarsko anaLaureaUniversityofAppliedSciences,Helsinky,Finsko.Vsoučasnédoběpracujena UniverzitěobranyjakovedoucíKatedrykvantitativníchmetod.Věnujeseproblematicemnohorozměrnýchstatistickýchmetodsezaměřenímnaklasifikačnítechniky.Garantujeavede výukuvrámciakreditovanéhostudia.Podílísenařešenívědeckýchprojektůvrámcisvé specializace.Publikujevdomácíchizahraničníchčasopisech.
RNDr.OldřichKříž(∗1945)
VystudovalPřírodovědeckoufakultuPalackéhouniverzityvOlomouci.Vroce1993absolvovalspecializovanéstudiumstatistikynaFakultěinformatikyastatistikyVysokéškoly
ekonomickévPrazeavroce1997absolvovallicenčnístudiumPočítačovézpracovánídatpři kontroleařízeníjakostinaFakultěchemicko-technologickéPardubickéuniverzity.Odroku 2004působilnakatedřeekonometrieFakultyekonomikyamanagementuUniverzityobrany vBrně.Vevýzkumnéoblastiřešilúkolyvsouvislostisdistančnímvzdělávánímstatistiky apodílelsenařešeníprojektůvoblastisenzorickéanalýzypotravin.Publikovalvdomácích izahraničníchčasopisech.Jeautoremaspoluautoremřadydidaktickýchtitulů.Vsoučasné doběspolupracujesKatedroukvantitativníchmetodexterně.
ZájemcůmostatistikusedostávádorukouužtřetívydánístatistickéučebniceZákladystatistikyspodtitulemAplikacevtechnickýchaekonomickýchoborech.Poprvnímvydánívroce 2012následovalovroce2016druhévydání,rozšířenéo11.kapitoluobsahujícíproblematiku analýzyzávislostí,zejménavyužitíkontingenčníchtabulekaregresníanalýzu.Nyníautoři knihuopětupraviliarozšířilivnovém,třetímvydání.
Výpočetnítechnikasňalazezájemcůostatistikupotřebuúmornéhopočítáníarůzné statisticképrogramyumožňujísnadnoarychledatazpracovat.Natrhuexistujevelkémnožství statistickýchprogramů.Bohuželpřevážněkomerčních,kterénutízájemceostatistikudo poměrněvelkýchpočátečníchinvestic.Zestatistickýchnástrojů,kteréjsouzdarma,vyniká zejménaprogramovacíjazykR,kterýjenajednéstraněvelmikomplexní,alenadruhéstraně prozačátečníkaobtížnězvládnutelný.VtétosituaciautořiZákladůstatistikyzvolilijako prostředíprostatistickouanalýzudattabulkovýprocesorMSExcel.Tennajednustranutrpí problémy,jakojenedodržovánístandardů,chaosvovládání,nakteréjsmeuprogramůtéto firmyzvyklí,aleačnenízdarma,jevelmirozšířený.IkdyžExcelneníprimárněurčenpro statistickézpracovánídat,obsahujedostatečnémnožstvístatistickýchfunkcípoužitelnýchpro aplikacizákladníchstatistickýchmetod.ZačátečníktedymůžezačítpracovatvMSExcel ateprveažzjistí,žeužnenízačátečníkemainvesticedokomerčníhobalíkusemuvyplatí, protoženarazilnalimityExcelu,můžezačítuvažovatopoužitíspecializovanéhostatistického software.ProusnadněnívytvořiliautořiExcelovouaplikaciSTAT1,vekteréjsouzákladní statistickémetodypřipravenytak,abybylysnadnopoužitelnéiprozačátečníky.Výhodou knihyjevelkémnožstvípodrobněřešenýchpříkladů,nakterýchsičtenářmůžeověřit,že vysvětlenémetodydobřepochopiladokážepomocínichdatasprávnězpracovat.
Vetřetímvydáníbyladoplněna11.kapitolaočástvěnovanouanalýzerozptylu.Současná podobaučebnicetakpokrýváobvyklouproblematikuvyučovanouvzákladníchkurzechstatistikynavětšiněuniverzitvčetněproblematikyanalýzyzávislostí.Tímbylydoknihydoplněny kapitoly,kteréjirozšířilytak,ženynípokrývácelýrozsahmetodběžněpoužívanýchpřianalýzestatistickýchdat.Mohutedyknihudoporučitvšemzájemcům,kteřípotřebujízpracovat aanalyzovatsvéměřeníaexaktněotestovat,jestlijejichvýsledkymohoubýtdílemnáhody nebozanimijsounějakéskrytésouvislosti.
prof.RNDr.PetrPonížil,Ph.D. Ústavfyzikyamateriálovéhoinženýrství,Fakultatechnologická,UniverzitaTomášeBati veZlíně
Váženýmčtenářůmsedorukydostáváknihavěnovanázákladůmmatematickéstatistiky trojiceautorůNeubauer,Sedlačík,Kříž.Záměremknihybylopodatvýkladstatistikyjednoduchýmzpůsobem,kterýbyakcentovalzákladystatisticképráceausuzování,přitomvšak respektovalteoretickézákladytétovědnídisciplíny.Jdejižotřetívydání,cožpotvrzuje úspěšnosttakovéhopočinu.
Trpělivýčtenářpopřečtenítétomonografiebudemítvhleddohistorickéhovývojestatistikyzprvníkapitoly,buderozumětzákladnímpojmůmavztahůmvteoriipravděpodobnosti uvedenýchvkapitole3,budeschopnýrozlišovatmeziempirickýmicharakteristikamidatovéhosouboruateoretickýmicharakteristikamináhodnýchveličinnebovektorůzkapitol 2,4a11,budeznátzákladnítypyrozdělenípravděpodobnostizkapitol5a6.Navíc,díky prostudováníkapitol8,9,10a11čtenářzvládneodhadovatparametryvybranýchrozdělení jakbodovětakintervalově,dálepronějbudesnadnéověřovathypotézyoparametrecharozděleníchnáhodnýchveličinavektorůnazákladěnáhodnéhovýběruzjejichrozdělení.Oproti předchozímuvydáníjsouvkapitole11věnovanéanalýzezávislostízahrnujícítématajakoje korelační,regresníanalýzaakontingenčnítabulkynověpřidánodstavecoanalýzerozptylu (ANOVA).
Úspěšnémunabytíslibovanýchdovednostívycházívstřícstrukturaceléhotextu.Potřebná teoriejevyloženapostupně,pečlivěasrozumitelně.Namístodůkazů,kteréproněkteréčtenáře nemusíbýtpřínosem,ječastoteorieaplikovánavřaděukázkovýchpříkladůsřešením.Škála oborůtěchtopříkladůjednoznačnědokládášířiužitíuvedenýchstatistickýchmetod.Každá kapitolajenavícdoplněnasouborempříkladůkprocvičenísvýsledky.Tímtojemožnéihned siověřitzískanévědomosti.Čteníknihyjetakézpříjemněnonázornýmiobrázkyagrafy.
Neoddělitelnousoučástístatistickéhozpracovánídatovéhosouborujevsoučasnostipráce svhodnýmsoftwarem.Otovícesicenímpečlivéhovysvětlenípostupůstatistickéhotestování aodhadovánívMSExcelu.Používanépojmyvčeskéverzitohotoběžnědostupnéhosoftwaru nejsouvsoučasnostiúplněvsouladusužívanoustatistickouterminologií.Navíclzevučebnici naléztvněkterýchpasážíchisrovnánípostupůzvícestatistickýchsoftwarůjakojeStatistica, MatlabaMSExcel.ProvýpočtynaPCbylaautoryvytvořenavolněstažitelnáaplikaceSTAT1, vekteréjsoupřipravenyukázkypostupůtak,abypřesněodpovídalyuvedenýmpostupům vknize.Věřím,žeknihaZákladystatistikypřineseradostsvýmčtenářůmpřiobjevování kouzlastatistickéhousuzováníašířijehouplatnění.
doc.Mgr.ZuzanaHübnerová,Ph.D.
Ústavmatematiky,Fakultastrojníhoinženýrství,VysokétechnickéučenívBrně
Autořiknihy,kterouprávědržítevruce,sevýucestatistikynavysokéškolevěnujíjižřadulet. Vesnazepředatsvojezkušenostistudentům,aleidalšímuživatelůmstatistiky,vytvořilipředloženýtext.Hlavnímcílempřijehopřípravěbylasnahapodatvýkladstatistikyjednoduchým způsobem,kterýbyakcentovalzákladystatisticképráceausuzování,přitomvšakpřiměřeně respektovalexaktnípozadítétovědnídisciplíny.Skutečnost,žeautořinabízejí3.vydánípublikace,jesnadzprávouotom,žesetentozáměrpodařil.Protojeknihavhodnápředevšímpro studiumzákladůstatistikyzejménanafakultáchsekonomickýmnebotechnickýmzaměřením.
Statistikajevědnídisciplína,kterájevybudovanánatřechpilířích:popisnéstatistice, teoriipravděpodobnostiateoriináhodnéveličiny.Abychomdobřeporozumělismyslustatistikyajejímupraktickémuuplatnění,musímepochopitpodstatupravděpodobnosti,neboť všechnyzávěry,kekterýmstatistikasvýmimetodamiaprostředkydojde,neplatísexaktní matematickoupřesností,alemajívždyplatnostpouzesjistoupravděpodobností–hovoříse ospolehlivosti.Slovo„pouze“nepředurčujestatisticevýznammenšínežmatematice,alejiný nežmatematice.Statistikajetotiždisciplínavelmipraktickáazabývásevšemitakovými reálnýmisituacemi,vekterýchsepotřebujemeopřítoneznáméinformace.Tyjsouzjednodušeněřečenozatímskrytévtzv.teoretickýchmodelech,popisujícíchtzv.náhodnéveličiny. Odkrýváníneznámýchinformacívnejrůznějšíchreálnýchsituacíchnámumožnípopisnástatistika,kterápracujesnaměřenýminebozjištěnýmidatyainformaceonichshrnedotzv. empirickéhomodelu.
Naprvnípohledjezřejmé,ževyjmenovanépilířetu„pravou“statistikuještěnetvoří. Vztahmeziteoretickýmaempirickýmmodelempřímosouvisísfilozofiístatistiky.Taková statistikamátotižinduktivnícharakterazabývásetím,jakodhadnouttyvlastnostiteoretického modelu,kterénászajímajíapřitomjeneznáme,pomocímodeluempirického.Výkladcelé problematikyvtétoučebnicijeprotozaložennavybudovánízákladníchpojmůavztahů, srozumitelnémpopisuzákladníchmetodajeprotkánřadouřešenýchpříkladů.Teoretické základystatistikyseopírajízejménaovlastnostinormálníhorozdělení,centrálnílimitnívětu azávislostmezijevy.
Potřebazpracovávatpozorováníčiměření,shrnoutdataapostihnout,coříkají,zanedbat nepodstatnédetailyaodhalitspolečnévlastnostijepřítomnávmnohavědníchoborech. Protonacházímetodymatematickéstatistikypraktickéuplatněnívširokéřaděoblastí,při
řešenínepřebernéhomnožstvípraktickýchproblémů.Neustáleseprotoivtextuzdůrazňuje nejdůležitějšíatributstatistiky,atímjepraktickáareálnápodobařešenýchproblémů.
Problematikazákladůstatistikyjevpředloženépublikaciprezentovanáv11kapitolách. Vprvníkapitolejsoupojednoduchémhistorickémpřehleduzavedenézákladnípojmyužívanévcelémtitulu.Obsahemdruhékapitolyjepopisnástatistika,kterátvoříjedenpilíř statistikyjakovědnídisciplíny.VtétočástisečtenářužprvněsetkáváspočítačovoupodporouprostřednictvímaplikaceSTAT1,kterásloužíkpopisuempirickýchdatavytvoření empirickéhomodelu.Třetíkapitolasezabývápravděpodobnostnímizákladystatistiky,tedy druhýmpilířemstatistikyjakovědnídisciplíny.Třetípilířjevybudovánapopsánvečtvrté, pátéašestékapitole,kdejezavedenpojemnáhodnéveličinyapopsanéjsouzdenejdůležitější teoretickémodelynáhodnéveličiny.Vsedméaosmékapitolejsouvybudovanéteoretické základystatistikyatakéjezdepopsanéstatistickéusuzovánísvyužitímpraktickéhopropojenívšechtřechpilířů.Velmipraktickouastěžejníčásttitulutvořídevátáadesátákapitola, kdejevybudovánaparátprobodovéaintervalovéodhadyparametrůnejčastějipoužívaných teoretickýchmodelů,resp.protestovánínejčastějšíchstatistickýchhypotéz.Vedruhémvydánípřibylavjedenáctékapitolerovněžvelmipraktickáčástoanalýzezávislostí,zejména oměřenízávislostívkontingenčnítabulce,resp.omodelováníaužitíregresníchmodelů.Ve vydání,kterémátevruce,jenověpřidánaanalýzarozptylu(ANOVA),cožjedalšínástrojpro zkoumánívztahumezivysvětlovanýmiavysvětlujícímiproměnnými.
Součástídnešníhomoderníhosvětajeužitívýpočetnítechnikyvevšechsféráchživota. Statistikaje,právěsohledemnaprácisdatovýmimnožinami,přímopředurčenakvyužití počítačů.Natutoskutečnostreagujeipřístuppedagogůkvýucestatistikynamnohafakultách. Výkladařešenípraktickýchúlohjevtétoučebnicipřímopodporovánelektronickouaplikací STAT1,kterápracujevexcelovskémprostředíaumožňujekaždémustudentoviinteraktivně vnímatpopsanéstatistickémetody.Uvybranýchpříkladůjepoužitítétoaplikacepodrobně popsané.Aplikacijemožnépoužítinaanalýzyvlastníchdat.AplikaciSTAT1spoluse statistickýmitabulkaminajdetenaadrese http://k101.unob.cz/stat1/.
Rádibychompoděkovalikolegovidoc.RNDr.JaroslavuMichálkovi,CSc.zUniverzity obranyvBrně,kterýseujalúlohylektora,knihupozorněpřečetladoporučilněkolikúprav.Dík patřítéžrecenzentůmprof.RNDr.PetruPonížilovi,Ph.D.zFakultytechnologickéUniverzity TomášeBativeZlíněadoc.Mgr.ZuzaněHübnerové,Ph.D.zFakultystrojníhoinženýrství VysokéhotechnickéhoučenívBrnězajejichpodnětnénápadyapřipomínky.
VBrně20.6.2021Autoři
Prvníkapitolutétoknihyvěnujemeúvodnímuseznámenísestatistikou.Představímesistatistikujakovědnídisciplínu,kterásevyvinulazpůvodníchstarověkýchsčítáníobyvatel amajetkuažksoučasnosti.Dozvímese,cosivlastněmámepředstavitpodpojmem statistika ajakourolihrajestatistikavmoderníspolečnosti.Začnemesibudovatodbornýslovník azavedemesizákladnípojmy,abychomsevodbornémprostředídomluviliatakérozuměli tomu,cosekdeve„statistickémjazyku“píšečimluví.
Slovostatistikapocházízitalského stato,původněsvýznamem stav,odkoncestředověkutaké státníúzemí,resp. stát.JakoprvníjejpatrněpoužilGirolamoGhilini(1589–1669)vpráci Ristrettodellacivile,politica,statisticaemilitarescienza (Shrnutícivilní,politické,statistické avojenskévědy),vekteréshromáždilrůznéznalostitédobyostátu,ojehoobyvatelích,životě, právu,obchoduivýrobě,náboženstvíiarmádě.Předevšímvtomtosmyslusepotomslovo stato rozšířiloidojinýchjazyků,např.vetvaru state,Staat,état,estato
Podnětyprovznikstatistiky
Prvníhistorickézmínkyočinnostech,kterézdnešníhopohledupřipomínajístatistiku,pocházejíužzestarověku.Záznamyo sčítáníobyvatelamajetku můžemenajítužvpísemnostech starýchBabyloňanůzobdobípředrokem3800př.n.l.Historickynejstaršímsměremovlivňujícímtakévznikstatistikybylaexistenceprvníchměstskýchstátův3.a2.tisíciletípř.n.l.ve starověkýchcivilizacích,jakýmibylyEgypt,Čína,Mezopotámie,Palestina,ŘeckoneboŘím. Sevznikemměstskýchstátůvznikátaképotřebajejichsprávy,sekteroujsouspojenénemalé náklady,protosezvyšujevýběrdaní.Kurčeníjejichvýšejealenezbytnémítčíselnéúdaje oúzemí,obyvatelstvu,zemědělství,obchodu,řemeslechapod.Tytoinformacesezískávají zejménanazákladěsoupisuobyvatelstvaadalšíchšetření,kterámajízdnešníhopohledu charakterstatistickýchšetření.
JednuzprvníchzmínekostatistickémšetřenínaleznemetakévBibli,kdejeveStarém zákoněve4.knizeMojžíšověinformaceosčítáníprovedenémMojžíšempoodchoduizraelskéhonárodazEgyptaaobsahujekonkrétnípočtybojovníků,oddílůavelitelů.Pozdějitaké nařídilsčítánílidumotivovanévojenskykrálDavid.
1.1Historickýpřehled
VelkésčítáníliduzavedlitakévestarověkémŘíměv5.stoletípř.n.l.Sčítánímělinastarosti vysocíúředníci,nazývaní cenzoři.Sčítání(cenzy)sekonalakaždýchpětletazjišťovalyse nejenpočtyobyvatelajejichmajetek,aletakénapř.početotroků.
Podobnéprůzkumysepostupněrozšiřovalyinadalšíevropskézeměaždoobdobístředověku.Od16.stoletíbylyzřizoványcírkevnímatriky,kterésenadlouhoudobustalyzákladním zdrojeminformacíoobyvatelstvu.
Třikořenystatistiky
Vlastnítermín statistika sezačalpoužívatažv18.stoletívNěmeckuprooznačení nauky ostátu.Tatovědeckádisciplínasezačalarozvíjetv16.stoletínauniverzitáchvItáliiapozději taképrávěvNěmecku,protosejíříká univerzitnístatistika.Tehdejšístatistickéstudieobsahovalypředevšímúdajeoevropskýchstátech–geografické,politické,ekonomickéadalší. Narozdíloddnešnístatistikyneobsahovalymnohočísel,většinazaznamenanýchúdajůměla charakterslovní.
Jednozprvníchstátovědnýchděl Ovláděasprávěvrůznýchkrálovstvícharepublikách vyšlovroce1562vBenátkáchanapsaljeFrancescoSansovina.Přesněostoletpozději uveřejnilLudwigvonSeckendorffsvoustátovědnouknihu Německýknížecístát.Najejich prácenavazujenejvýznamnějšíteoretikstatistikyvněmeckéjazykovéoblastiGottfriedAchenwall(1719–1772).BylprofesoremstatistikynauniverzitěvGöttingenuaautorempopulární učebnicestatistiky,kterábylapředepsánapropřednáškystatistikyinaKarlověuniverzitě vPraze.
VAngliimezitímvzniklzcelajinýokruhstatistiky,atotakzvaná politickáaritmetika, kterávycházelazúdajůonarozeníchaúmrtích,anatomtozákladěsepokoušelapozorovat asrovnávatinformaceoobyvatelstvuzadelšíčasovéúseky.Tytoprůzkumyvycházelyzúdajů tehdejšíchcírkevníchmatrikanajejichzákladěsesnažilyodvoditněkteréobecněplatné zákonitosti(např.žeserodíobecněvícechlapcůnežděvčat).
JejínejvýznamnějšípředstaviteléjsouWilliamPetty(1623–1687)aJohnGraunt(1620až 1674).Pettyjepovažovánzapředchůdcemodernístatistikyiklasicképolitickéekonomie.Jeho nejvýznamnějšídílo Pětesejíopolitickéaritmetice bylovydánoposmrtně(1960).Grauntbyl obchodníkazabývalsepředevšímdemografií.Napsalprvníucelenoudemografickoustudii sponěkudpochmurnýmnázvem Přirozenáapolitickápozorovánízaloženánaseznamech zemřelých (1662).
V18.stoletísetotozaměřenístatistikyzačaloprosazovativNěmeckuaoběstatistické školysezačalyvzájemněovlivňovatapostupněsbližovat.Statistikazačalavevětšímíře používatčíslaapřestalasezabývatpouzepopisemstátníchpozoruhodností.Postupnězačala pronikatidojinýchvědeckýchdisciplín,abysenakonecprosadilajakosamostatnávěda.
Nezávislenastatisticeseod17.stoletízačalarozvíjetještějináteoretickádisciplína, kterávzniklajakosoučástmatematiky– teoriepravděpodobnosti.Zatímcostatistikazkoumá hromadnéjevy,teoriepravděpodobnostisenaopakzabývájevyindividuálními,jedinečnými. Pravděpodobnostjechápánajakočíselnéohodnoceníšance–naděje,žesledovanýkonkrétní jevnastane.Veskutečnostivšakstatistikaateoriepravděpodobnostipředstavujídvapohledy nastejnýproblém.Každýhromadnýjevjetotižtvořenjednotlivýmijevyindividuálními, anaopakopakovánímindividuálníhojevuzískámejevhromadný.Vsoučasnédoběnelze
teoriipravděpodobnostiastatistikuodsebeoddělit–teoriepravděpodobnostijepovažována zateoretickýzákladstatistiky.
Rozvojteoriepravděpodobnostibylzpočátkuinspirovánhlavněhazardnímihrami.Zajejí počáteksepovažujeslavnávýměnadopisůmezimatematikyBlaisemPascalem(1623–1662) aPierremdeFermatem(1601–1665)zahájenároku1654.Šlojimtehdyootázku,jakspravedlivěrozdělitbankmezihráče,jestližesériehazardníchhermuselabýtpředčasněpřerušena. Tehdyrozvíjenéteoriipravděpodobnostidnesříkáme klasickápravděpodobnost.Mezidalší osobnosti,kterésevěnovalyteoriipravděpodobnosti,patříšvýcarštímatematici(bratři)Jacob Bernoulli(1656–1705)aJohannBernoulli(1667–1748),francouzštímatematiciAbraham deMoivre(1667–1754),PierreSimonLaplace(1749–1827)atakéSiméonDenisPoisson (1781–1840),sekterýmsesetkámev5.kapitole–viz Poissonovorozdělenípravděpodobnosti,kteréjevhodnépropopisjevůsnízkoupravděpodobnostíjevupřiznačnémrozsahu výběrovéhosouboru.Významnýpříspěvekkteoriichybpředložiltakévynikajícíněmecký matematikCarlFriedrichGauss(1777–1855),kterýpřispělkformulovánítzv. normálního rozdělenípravděpodobnosti –viz 6.kapitola.
Postupnýmsplývánímnaukyostátu,politickéaritmetikyateoriepravděpodobnostivznikla v18.a19.stoletístatistikajakosamostatnávědnídisciplína,kterápopisovalahromadné jevyvnověvznikajícíchvědách–přírodních,technickýchiekonomických.Statistikatohoto obdobísezabývalapředevšímpopisemzkoumanýchhromadnýchjevů,protosetakénazývá popisná–deskriptivnístatistika.Metodoustatistickýchprůzkumůbylavyčerpávajícíšetření prováděnápodlezásady:čímvíceúdajůzískáme,tímpřesnějšíbudouzávěry.Totopravidlo vestatisticepřevládaloaždokonce19.století.
VýznamnouosobnostínovéstatistikybylbelgickýmatematikAdolpheJacquesQuételet (1796–1874),kterýjezakladatelemprvníhonárodníhostatistickéhoúřadu(1841)vEvropě. Mimojinésevěnovalrozsáhlémusběrudatolidsképopulaciaprezentovalsvůjpojem „průměrnéhočlověka“jakocentrálníhodnoty,kolemkteréseměřenétělesnémíryshlukují podleGaussovykřivky–viz 6.kapitola.Vtésouvislostizavedltaképojemindextělesné hmotnostipoužívanýdodnesprostanovenímíryobezityaznámýpodzkratkouBMI(body massindex).Naznačiltakbudoucísměřovánístatistikyknormálnímurozdělení,střední hodnotěarozptylu.Pomohlrovněžzavéststatistickétechnikydokriminalistiky,pomocí statistickéanalýzyporozumělQuételetvztahumezizločinemaostatnímisociologickými faktory.
Napřelomu19.a20.stoletívšakdocházívevývojistatistikykzásadnízměně.Začala éra matematické–induktivnístatistiky,kteránazákladěteoriepravděpodobnostiumožňuje získatkvalifikovanézávěry–odhadyosledovanémjevuizmaléhodostupnéhovzorku údajů.Novéstatisticképostupyotevřelymožnostipronejrůznějšítypyprůzkumů,vekterých sezvlastnostíčástiusuzujenachovánícelku.Nabáziinduktivnístatistikyvzniklytaké extrapolační–prognostickémetody,kterénazákladěznalostidatzminulostiumožnívytvořit kvalifikovanýodhadchovánívbudoucnosti.
Těžištěrozvojeinduktivnístatistikysedoznačnémírypřesunulodoanglo-americkéoblastiajespojenopředevšímsejménemanglickéhostatistikasiraRonaldaAylmeraFishera (1890–1962),kterýstáluvznikumnohadnesobvyklýchmetodstatistickéanalýzy.Jepova-
1.1Historickýpřehled
žovánzazakladateleteorieplánováníexperimentůvbiologickémazemědělskémvýzkumu. VýznamnýchvýsledkůdosáhlidalšíanglickýstatistikWilliamSealyGosset(1876–1937), kterýpracovaljakochemikvirskémpivovaruGuinnessatamvymyslelpostup,kterýumožnil provádětzmalýchvýběrůpoužitelnézávěry,přinejmenšímvšakpoznat,jakposuzovatvypovídacíhodnotutakovýchvýběrů.Gossetsepodsváprůkopnickádílapodepisovalpseudonymem „Student“,protožejehofirmamupublikovánívýsledkůpodvlastnímjménemzakázala.
DalšívýznamnípředstaviteléanglickéstatistickéškolybyliFrancisGalton(1822–1911) aCharlesPearson(1857–1936),kteřípoložilizákladyzkoumánízávislostímezihromadnými jevy.Krozvojimatematickéstatistikypřispělitakéruštímatematici:PafnutijLvovičČebyšev (1821–1894),AndrejAndrejevičMarkov(1856–1922)aAndrejNikolajevičKolmogorov (1903–1987),kterýjepovažovánzazakladatelemoderníteoriepravděpodobnosti.
Unásdosáhlypozoruhodnýchvýsledkůdvěosobnosti.PrvnímbylprofesorJaroslavJanko (1893–1965).Svouceloživotníčinnostívelmivýznamněpřispělkrozvojimatematickostatistickýchmetod,kjejichnanejvýšužitečnémuuplatněnívevýzkumuapraxi,azapsal setakdohistoriematematickéstatistikyunás.Známájsoujehodíla Jakvytvářístatistika obrazysvětaaživota,ZákladystatistickéindukceaStatistickétabulky. Druhýmbylprofesor JaroslavHájek(1926–1974),kteréholzepovažovatzanejvýznamnějšíhočeskéhostatistika vhistoriičeskématematiky.Jehoodbornéaktivitybylyzaměřenénaneparametrickéstatistické metody.
Statistikadnespředstavujevědnídisciplínuseširokýmpraktickýmuplatněním.Používáse zejménajakodůležitýnástrojzískáváníinformacíveveřejnýchsféráchnašehoživota,ale ijakodůležitýnástrojřešenínejrůznějšíchodbornýchproblémů,zejménatechnických,přírodovědných,ekonomických,vojenských,sociálních.Jetomutakproto,žemodernístatistika využívávšechpostupůametod,kteréběhemsvéhodlouhéhovývojevytvořilanebosiosvojila.Používájakprvkyklasicképopisnéstatistiky,založenénaanalýzehromadnýchdat,tak iprvkymodernímatematickéstatistiky,postavenénateoriipravděpodobnosti.Protostatistiku vnímámenejenjakonástrojpoznání(velkýnepřehlednýsoubordatdokáženahraditněkolika výstižnýmicharakteristikami),aletakéjakonástrojrozhodovánívneurčitosti(nazákladě vlastnostivzorkuusuzujenavlastnosticeléhosouboru,popř.zinformacíominulostipředvídá vývojvbudoucnosti).
Velkývýznamprorozvojavyužitístatistickýchmetodmělnástupvýpočetníchtechnologií, zejménaosobníchpočítačů.Počítačvítězínadčlověkempředevšímvtěchúkonech,kteréjsou pročlověkatradičněnejzdlouhavější–třídění,vyhledáváníavýpočtysvelkýmmnožstvím dat.Počítačůmjsouvlastnítakémožnostitabulkovéhozpracováníagrafickéhovyjadřování. Mezinejznámějšíprofesionálnístatisticképrogramyseširokýmportfoliemmetodatechnik patříStatistica,SPSS,SAS,Statgraphics,Minitabadalší,zčeskýchproduktůQCExpert. PropotřebuvýukystatistikyvyužívářadaškolitabulkovýkalkulátorMSExcel,kterýpatří kzákladnívýbavěosobníhopočítače.Našeučebnicebudepodporovanájednoduchouaplikací STAT1,vytvořenouprávěvexcelovskémprostředí.
Statistikabylazpočátkuvyužívánaspíševevědáchpřírodních(fyzika,chemie)atechnických,vposledníchletechvšakzaznamenáváúspěchtakévdisciplínáchhumanitníhocharakteru,napříkladvpsychologii,sociologii,pedagogice,aletakévekonomii,kterápůvodně
vzniklajakovědasociální,běhemčasusesvýmimetodamipřiblížilaspíševědámpřírodním. Kvýraznějšímurozvojistatistickýchmetoddošlonapřelomu19.a20.století,atozejména díkynovýmobjevůmvestatistice(zejménanástupumetodmatematickéstatistiky).Tovedlo kdalšímupřibližovánístatistikyreálnémuživotuaprudkémurozvojiaplikacístatistikyvnejrůznějšíchoborechlidskéčinnosti.Vznikalytakpostupněspeciálnístatistickémetody,které tvořilyzákladspeciálníchvědníchdisciplín.Podnázvem biostatistika,resp. biometrika se např.rozumíaplikacestatistikynabiologicképroblémy,zatímcoproanalýzuchemickýchdat sespíšeužívátermín chemometrie.Hlavnímcílemaplikacístatistickýchmetodv biomedicínskémvýzkumu jezajistitsprávnostaodbornoststatistickéhovyhodnocovánídatainterpretace získanýchvýsledků.Používánípočítačůktěmtoúčelůmjevdnešnídoběsamozřejmé.
Aplikacístatistickýchmetodnaekonomickáasociálně-ekonomickádatavzniklasamostatnástatistickádisciplína, ekonomickástatistika.Předmětemekonomickéstatistikyjeanalýzastavuavývojejevůvhospodářskéoblastijakovýchodiskakhospodářskémurozhodováníčistanoveníhospodářsképolitiky.Navyužitístatistickýchmetodjezaloženýprůzkum trhu,plánovánívýroby,prognostika,kontrolakvalityvýroby,personálnípolitika,výroční zprávy(určenéakcionářům).Ještěkvyššíkvalitěekonomickéanalýzyvededisciplínaoznačovanájako ekonometrie.Tapředstavujesyntézuekonomickéteorie,informatiky,matematiky astatistiky.Tatosyntézanenívšakmechanickýmspojenímekonomickéanalýzysaparátem matematikyastatistiky,resp.elektronickýmiprostředky,alejdeopropojenívzájemněse podmiňujícíchvědníchdisciplín.
Statistikajeshistoriínašehoúzemíspjatajižodnepaměti.Důvodyjsouzcelapraktické azřejmé.Každývládcechtělmítpřehled,jakýmámajetek,kolikmákdispozicimužůdo vojskačiodkolikapoddanýchmůževymáhatdaně.Aledůvodyprostatistickézjišťováníbyly mnohdyizcelajiného,humánnějšíhorázu.NapříkladzavládycísařeRudolfaII.vroce1583 vypuklavčeskýchzemíchepidemiemoru.Vjejímdůsledkubylozahájenošetřenío„zdraví populace“,kterémělozmapovatvznikarozvojzhoubnýchepidemiíaumožnitpřijímání včasnýchprotiopatření.
Jakovýznamnýmezníklzeoznačitdatum13.října1753,kdybylvydán patentcísařovny MarieTerezie okaždoročnímsčítánílidu.ZdokonaleníevidenceobyvatelsouviselosrozsáhloureformníčinnostíMarieTerezie(1717–1780),neboťkprovedeníčetnýchreforembylo nutnézískatobjektivníinformaceoobyvatelstvu.ZavládyMarieTereziedošlotakékreforměevidencenarozenýchazemřelých.Vtétosouvislostibylazavedenaiprvníjednoduchá statistickáklasifikacepříčinúmrtí.
Jakužvíme,prvnístatistickýúřadvEvropěbylzaloženvroce1841vBelgii.Řada evropskýchzemíQuételetůvúřadnásledovala.Vroce1897bylzřízen Zemskýstatistickýúřad Královstvíčeského,kterýsestalprvnímskutečněstatistickýmúřademnaúzemídnešníČeské republiky.Poprvébylasoustředěnanajednommístěvšechnastatistickápracoviště,kteráaž dotédobypůsobilavrámcirůznýchministerstevadalšíchinstitucí.
BrzypovznikusamostatnéhoČeskoslovenska,užvroce1919,bylzaložen Státníúřad statistický (SÚS)jakonovýorgánpověřenýcelostátnímistatistickýmišetřeními,meziněž patřilojakojednoznejdůležitějšíchisčítánílidu.Úřadsevobdobímezisvětovýmiválkami rozvíjel,zdokonalovalarozšiřovalsvojičinnost.Ktomupřispěloiúzkésepětísestatistickou
20 1.1Historickýpřehled
teorií.Ve20.a30.letech20.stoletíbylatéměřpolovinakapacitystatistickéhoúřaduvěnována vědeckéateoretickéčinnosti.
Vobdobí2.světovéválkysečinnoststatistikyvČecháchanaMoravěomezilaaodpovídalaválečnýmpodmínkámipostavenínašehoúzemí.Perzekuovánabylařadapracovníků
SÚS,někteříznichbylipopraveni(např.předsedaúřaduDr.JanAuerhanbyl6.6.1942zatčen gestapema9.6.1942zastřelen),jinízemřelivnacistickýchvěznicíchakoncentračníchtáborech.Bezprostředněposkončení2.světovéválkybylačinnostStátníhoúřadustatistického obnovena,scílemvrátitjejnapředválečnouúroveň.Poroce1948sečeskoslovenskástatistika (zejménavekonomickéoblasti)zaměřovalazejménanaúkolynárodohospodářskéevidence akontroluplněníplánu.
Popádukomunistickéhorežimuvroce1989seobnovilypředpokladyprobudováníobjektivní,nestrannéanestranickéstátnístatistickéslužby.K1.1.1993,sevznikemČR,převzal Českýstatistickýúřad (ČSÚ)všechnykompetencenárodníhostatistickéhoúřadu.Jehoúkoly apostavení,stejnějakozásadyaúkolyfungovánístátnístatistickéslužbyvČR,upravilzákon č.89/1995Sb.,ostátnístatistickéslužbě,kterýbylještěnovelizovánk1.1.2001.Jehohlavnímúkolemjeshromažďovatazveřejňovatstatistickéinformaceosociálnímaekonomickém rozvojiČeskérepublikyaobstarávatstatistickéinformacepropotřebydalšíchorgánůstátní správyaúzemnísamosprávy.VedlecentrálníhopracovištěČSÚvPrazeexistujíkrajskéreprezentacevevšech14krajskýchměstech.PrvnímpředsedouČSÚbylčechokanaďanEdvard Outrata(*1936).Mimooficiálnísoustavustátnístatistikystojířadaspecializovanýchkomerčníchagentur,kterésepředevšímzabývajístatistickýmiprůzkumy(např.marketingovými)pro podnikatelskésubjekty,alejsoutaképověřoványúkolyprostátnístatistiku.
VsoučasnostiexistujíorgánystatistickéslužbypraktickyvevšechzemíchEvropy.Jejich konkrétnípodobaastrukturasevšakmůžestátodstátulišit,ikdyžvposlednídobědochází kekoordinacistátníchstatistikvrámcivšechčlenskýchipřidruženýchzemíEU.CentrálnímstatistickýmorgánemEvropskéuniejeEUROSTAT,kterýmásídlovLucemburku,jeho současnýmgenerálnímředitelemjeWalterRadermacher(*1952).Shromažďujestatistické informaceočlenskýchzemíchEvropskéunie,aletakéodalšíchevropskýchzemích.Šest středoevropskýchzemí(ČR,Maďarsko,Polsko,Rumunsko,SlovinskoaSlovensko)spolupracujenavýměněstatistickýchinformacítaképrostřednictvímspolečnénadnárodníinstituce CESTAT.
1. ZjistětenastránkáchČSÚ(www.czso.cz),jakýje vČRaktuálnípočetobyvatel.
2. JakáinstitucezabezpečujevČRsčítánílidu?
3. KdybylzaloženýZemskýstatistickýúřadKrálovstvíčeského?
4. Jemožnésouhlasitsnásledujícímivýroky?
a) Začátkystatistikyspadajído18.století.
b) Zaprvopočátkystatistikylzepovažovatzáznamyosčítáníliduamajetkuvestarověku. c) Pravděpodobnostdnespředstavujeneoddělitelnousoučáststatistiky.
d) Označenídeskriptivníainduktivnístatistika představujezpraktickéhopohledutotéž.
e) Stavavývojvekonomickéoblastisledujedisciplínaoznačovanájakoekonometrie.
f) VrcholnýstatistickýúřadEUjeEurostat.
5. Vyjmenujteněkteréhistorickékořenystatistiky. Řešení.
2. Českýstatistickýúřad;
3. 1897; 4. a)ne;b)ano;c)ano;d)ne;e)ne;f)ano;
5. německástátověda,anglickápolitickáaritmetika ateoriepravděpodobnosti.
Vsoučasnédoběsepojem statistika používávrůznýchvýznamech,vrůznýchsouvislostech atakésohledemnarůznépraktickésituace.Vpraktickémživotěsemůžemesetkatsečtyřmi různýmivýznamy,kteréspolusouvisí.Statistikouserozumí:
a) vědnídisciplína,kterásezabývásběrem,zpracovánímavyhodnocovánímstatistických údajů,
b) číselnéinečíselnéúdajenebosouhrnúdajůohromadnýchjevech,
c) praktickáčinnost,kterávedekzískáníinformací–údajůozkoumanýchjevech, d) instituce,kteráprovádípraktickoustatistickoučinnostnebotutočinnostřídí.
Abychomsiudělalikorektníobrázekotom,cobudemepodpojmemstatistikarozumět avjakýchsouvislostechčisituacíchbudemetentopojempoužívat,podívejmesenanásledující odstavce.
Přistudiustatistikybudemevycházet,jakužbylozmíněno,zteoriepravděpodobnosti,kterou siblížepopíšemeve3.kapitole.Základnímpojmempravděpodobnostijsoutzv. náhodné pokusy,tj.takovépokusy,jejichžvýsledkynelzepředemstanovit.Provýsledkyjednotlivých náhodnýchpokusůzavedemeoznačení náhodnéjevy.Pro statisticképozorování –někdy setakéhovořío statistickémšetření –jsoutypickéhromadnéjevy.Přívlastkem hromadný zdůrazňujeme,žesestatistikazabývápouzetakovýmináhodnýmijevy,kterésevprostoru ačasemohoumnohokrátopakovatnebosevyskytujívevelkémpočtupřípadů.Totedy znamená,žejevyjedinečné(neopakovatelné)statistikadosvéhozkoumánínezahrnuje. Hromadnéjevyjsoutedyvýsledkyhromadnýchpozorování,kteráseuskutečňujívpodstatě dvěmazpůsoby:
a) jako výsledkyopakovanýchpokusů –tj.zastálýchpodmínekopakujemenáhodnýpokus apokaždémpokusuzaznamenámejehovýsledek;např. 35× opakovaněměřímekoncentraciurčitélátkyvroztoku, 60× opakovaněměřímehodnotuelektrickéhoprouduvobvodu, 14× opakovaněměřímevzdálenostdvoubodůvterénuapod.,
b) jako výsledkypozorovanénavelkémpočtujednotek –tj.navšech(mnoha)jednotkách, kterémámekdispozici,provedememěřenínebozjištěníhodnotyavšechnytaktozískané hodnotysipoznamenáme;např.změřímedobureakcenajistýpodnětu15řidičů,změříme výkon23atletůveskokudodálkyzmísta,zjistímeměsíčnípříjemu80zaměstnanců, zjistímenázor150vysokoškolákůnabulvárnídeníkapod. Pokudjdeovyjadřovánívýsledkůpokusů,hovořímečastoo obměnách(variantách).Pro statistikujeobvyklédvojívyjadřováníobměn– číselnéaslovní.Např.přiváženírohlíkuvyjádřímevýsledek,tj.hmotnostrohlíku,vetvaru47,8g(vyjádřeníčíselné:47,8),přizjišťování výsledkuzkouškyzekonomievyjádřímevýsledekvetvaru„C“(vyjádřeníslovní:dobře).Způsobůmvyjadřovánívýsledkůnáhodnýchpokusůsealebudemeještědálevěnovatpodrobněji (vizpodkapitola 1.4).
Připopisuvýsledkůhromadnýchpozorovánístojízapovšimnutídvějejichformy– měření a zjišťování.Přiměřenízpravidlazískávámevýsledkyvčíselnépodobějakohodnotyzměřicíhopřístroje.Hodnotyjsouvyjádřenévurčitýchjednotkách–fyzikálních,chemickýchči jiných.Vsouladusmatematickýmiaodbornýmipravidlyjelzetakévzájemněpřevádět. Např.přiměřenírychlostiautadostaneme83,7km/hod.,přiměřenívýškypostavynovoro-
1.2Významapojetímodernístatistiky zencedostaneme49cm,přiměřenítvrdostivodydostaneme1,8mmol/l,přiměřenívelikosti proududostaneme12,5mA,přiměřeníobsahutukuvmlékudostaneme1,48g/l,atd.Vlastní zpracovánícelýchmnožintakovýchtočíselnýchinformací–dat–užprovádímebezjednotek (vizkapitola 2 –Popisnástatistika).
Při zjišťování získávámevýsledkyvčíselnéneboslovnípodobějakohodnotyzískané zpředemdefinovanémnožinyobměn.Někdytakéhovořímeo popisu sledovanýchobjektů. Např.připrůzkumuvobchoduzjistímepočetzákazníkůujednépokladny:6,připrověřováníškolníchvýsledkůzjistímepočetbodůzpísemnéhotestuujednohostudenta:28,při průzkumukvalitypracíhopráškuzjistímenázorjednézákaznice:velmidobrý,připředvolebnímprůzkumuzjistímepreferencijednohovoliče:stranaB,atd.
Přiřešeníkonkrétníhoproblémureálnéhosvětasesetkámečastospotřebouprovéststatistické šetření,jehožvýsledkemjsoustatistickádata.Podletypukonkrétníhoproblémubudezdrojem takovýchdatexperiment,dotazování,výkaznictví,pozorováníčitzv.sekundárnídata.
Experimentem budemerozumětcíleněprováděnoučinnostzpravidlazaúčelemověření vlivuurčitéhofaktorunazkoumanýukazatel.Např.budemeexperimentemověřovatvlivnové technologievýrobynajistouvlastnostvýrobku,vlivpoužitéhohnojivanaobjemrostlinné produkce,můžemetestovatvýrobeknanovépodmínkyužití,vrámciexperimentumůžeme sledovatchovánízkoumanýchosobvrůznýchmodelovýchsituacíchapod.
Dotazování jejednoduchýzpůsobzískávánístatistickýchdat,kterýseprovádípísemně (dotazníky,internetovédotazníky)neboústně(osobně,telefonicky,veskupinách).Takto jemožnézískatinformacehromadnéhocharakteruodtzv. respondentů,tj.osobnáhodně určenýchkdotazování.Např.vedenístředníškolymůžeprostřednictvímdotazníkuzískat informaceonázorechnavýukutohočionohopředmětu,vedenípodnikumůžezískatinformaceojazykovýchschopnostechsvýchpracovníkůapod.Vněkterýchpřípadechbýváúčelné dotazováníorganizovatanonymně.Naprincipudotazováníjsouzaloženétakétzv. ankety, kterévšaknelzepovažovatzareprezentativníšetření.Vyplněníanketníhodotazníkujetotiž naprostodobrovolné,protozískanýobrazořešenémproblémumůžebýtpouzeorientační. Např.vydavatelčasopisůsetaktobudezajímatozájemčtenářůojednotlivérubriky,výrobce nápojůsitaktomůžezjistitnázorynakvalitujeholimonádapod.
Výkaznictví jemožnévnímatjakospecifickouformudotazování.Výkazysloužíkesledováníekonomickéčinnostirůznýchsubjektů.JejichodevzdáváníavyhodnocovánířídíČSÚna základězákonač.89/1995Sb.,podlekteréhomajíekonomickésubjektytzv. zpravodajskou povinnost.Natétoforměstatistickéhošetřenísepodílítakéjednotliváministerstvaajejich odbornéorgány.
Při pozorování seobvyklesledujechovánílidskýchsubjektůvrůznýchsituacíchprostřednictvímsmyslů–sledování,ochutnávání,poslouchání,čicháníapod.Výsledekpozorováníje zpravidlasubjektivníazávisínaosoběpozorovateleanaokamžiku,kdyjepozorováníprováděno.Např.seformoupozorováníprovádítzv. senzorickéanalýzy,kdyseprostřednictvím ochutnávekhodnotínápojeapotraviny.Podobnělzetaktohodnotitvůnisledovanéhoparfému.
Všechnyvýšeuvedenéformystatistickéhošetřenívyužívalytzv. primárnídata.Vněkterých případechjemožnévyužíti sekundárnídata,tj.data,kterábylazískánazajinýmúčelem vminulosti(napříkladvrámcijinéhoprůzkumu).Sekundárnídatalzezískatzrůzných
tištěnýchielektronickýchmateriálů(statistickéročenky,firemnímateriály,novinovézdroje, počítačovédatabáze,datovénosiče,apod.).
Ještějednousevraťmekpravděpodobnosti.Ikdyžpočátkypravděpodobnostijsouspojené sřešenímčastozajímavýchproblémůzoblastihazardníchher,vsoučasnédoběnejčastější aplikacepočtupravděpodobnostisměřujídooblastistatistiky.Okolonásexistujemnohověcí, jevů,událostí,kterénelzepředvídat–jsoudůsledkemnáhody.Otázkamináhodyanáhodných dějůsezabývajídvěmatematickédisciplíny:teoriepravděpodobnostiamatematickástatistika. Teoriepravděpodobnosti jematematickádisciplína,jejímžvýchodiskemjezkoumánínáhodnýchpokusů.Přináhodnémpokusunenívýsledekjednoznačněurčenjehopočátečními podmínkami.Náhodnosturčitéhopokusujeteoretickyspojenasnedostatečnouznalostítěchto počátečníchpodmínek.Náhodavšakneznamenásubjektivnínevědomost,nastoupeníkaždého náhodnéhojevulzeprostřednictvímmatematickéhoaparátu1 číselně„ocenit“,tedypřiřadit mupravděpodobnost.Teoriepravděpodobnostijetedytoučástímatematiky,kterápřinášído životamatematickýaparátpropočítánísnáhodnýmiudálostmi.Jetakteoretickýmzákladem prodalšídisciplíny,kterésnáhodoupracují,jakojeteorienáhodnýchveličinamatematickástatistika.Protojsouužitečnétakémodelyrůznýchrozdělenípravděpodobností(např. binomický,normální,exponenciálníatd.–vizkapitoly 5 a 6).
Matematickástatistika jenaprotitomuvěda,kterázahrnujestudiumdatvykazujících náhodnákolísání,aťužjdeodatazískanápečlivěpřipravenýmpokusemprovedenýmpod stáloukontrolouexperimentálníchpodmínekvlaboratoři,čiodatapocházejícípřímozterénu. Statistikasetedyzabývázískáváníminformacízempirickýchdat,jejímprincipemjeučinit nazákladěvzorkuzávěrocelku.Předpokládá,žedataobsahujínepřesnostianejistoty,které jsouzpůsobenynáhodnýmivlivy.Matematickoustatistikutvořísoubormetodprozpracování hromadnýchdat,vnichžsezávěryvyvozujínazákladěteoriepravděpodobnosti.Právětěmto úkolůmstatistiky(atakévtěchtosouvislostech)sebudemevěnovatvdalšíchčástechtéto učebnice–vizkapitoly 7, 8, 9 a 10.
Jakjsmeužnaznačili,vrámcihromadnýchpozorováníprovádímeměřenínebozjišťovánísledovanéveličinyuvelkéhopočtujistýchobjektů.Výsledkempozorováníjsoupotom hromadná empirickádata,kterávsobězahrnují(spíšeskrývají)řaduinformacíosledovanéveličině. Tytoinformacevšak„naprvnípohled“nejsouzřejmé,datatotižpředstavujíneuspořádanou, ažchaotickou„horu“údajůanelzeznichpraktickyžádnéinformacevyčíst.Protojetřebadata nejprvezpracovatainformacevnichobsaženézískat.Zpracovánímempirickýchdatsezabývá popisnástatistika (vizdálekapitola2).Využíváktomurůzné tabulky a grafy,kterépomáhají objevitvýznamnévlastnostisledovanéveličiny.Hovořímečastootabulkovémčigrafickém vyjádřenírozděleníčetností.Některétabulkyposkytujízdrojovádataprotvorbugrafů.Dalším prostředkempopisuhromadnýchempirickýchdatjsoutzv. číselnécharakteristiky,kterévyjadřujíurčitévlastnostisledovanéveličinyjedinýmčíslem.Kurčenítakovýchčíselpoužijeme
1 Axiomatickáteoriepravděpodobnostipublikovanávroce1933A.N.Kolmogorovemjezaloženánateoriimíry, alternativníbayesovskáteoriepublikovanávroce1955E.T.Jaynesemjezaloženánaklasickélogicepropřípad výroků,jejichžpravdivostníhodnotaneníjen0nebo1,aleležímezitěmitohodnotami.
1.2Významapojetímodernístatistiky jenelementárnímatematickéoperace.Cílempopisnéstatistikyjetedyzpřehledněníinformací obsaženýchvdatovémsouboru.
Dalšísoučástímatematickéstatistikyjakožtovědníhooborujetzv. matematickástatistika vužšímslovasmyslu,kterásesystematickyzabývá(zejménapomocíteoriepravděpodobnosti) matematickýmimetodamivhodnýmiproanalýzustatistickýchdat.Obecněmádeduktivnípovahu,předmětemnašehozájmujevždyurčitýcelek,tzv.základnísoubor(vizpodkapitola 1.3), alecesta,kterousekněmudostaneme,mánaopakvýhradněinduktivní2 charakter.Důležitými součástmimatematickéstatistikyjsou:
a) Teorieodhadu –zabýváseurčovánímodhadůneznámýchparametrůzákladníhosouboru pomocíhromadnýchempirickýchdatzískanýchnáhodnýmvýběrem(vizpodkapitola 8.1) astudujerůznépřístupykzískáníbodovýchaintervalovýchodhadů(vizpodkapitoly 9.1 a 9.2).
b) Testovánístatistickýchhypotéz –zabývásestatistickýmiproceduramiproověřováníhypotézozákladnímsouboruaosrovnávánívícesouborůzrůznýchhledisekpomocíhromadnýchdatzískanýchnáhodnýmvýběrem(vizkapitola 10 –Testovánístatistických hypotéz).
c) Statistickápredikce –zabývásestatistickykvalifikovanýmiodhadybudoucíhovývoje sledovanéveličinynazákladějejísoučasnédynamiky.
Nazávěrvýkladuovýznamuapojetímodernístatistikyještěpřipojmejednuzásadní myšlenku.Vminulostisestatistikačastoztotožňovalaspouhýmzjišťováním,sumarizací apublikovánímzjištěnýchúdajů.Vsoučasnédobělzepředpokládat,žemodernístatistikamá všechnyatributyvědnídisciplínyschopnévpodstatněvětšímměřítkurespektovatpotřeby kvalifikovanýchrozhodovacíchprocesů.Protonezapomeňme:statistikunelzeztotožňovat spouhýmelementárnímzpracovánímúdajů!Statistikumusímespojovatsohledemnajejí výrazněpraktickýcharaktersširokouškáloumetodatechnik,kteréumožňujíkvalifikované rozhodovánínabázikvantitativníchinformacíopraktickémproblému.
1. Rozhodněte,zdajemožnédefinovanéjevypovažovatzajevyhromadné:
a) hrubýměsíčnípříjemučitelůnastředníchškoláchvČR,
b) početdětívčeskýchrodinách, c) početnezaměstnanýchvJihomoravskémkraji vzáří2011, d) dennítržbavprodejně, e) početdosaženýchgólůkonkrétnímhráčemza zápasvhokejovélize2011/2012, f) rychlostpřipojeníkinternetuuvlastníhopočítače.
2. Posuďte,jakýmzpůsobemjemožnéupopsaného věcnéhoproblémuzískatstatistickádata: a) vlivpoužitéhokrmivanaživépřírůstkysledovanýchprasat, b) denníspotřebavodyvdomácnosti, c) měsíčnítržbavsoukromémobchodu, d) názornaúroveňzákladníchslužebmobilního operátora, e) hodnocenísvětléhovýčepníhopivazčeských pivovarů, f) vlivdruhubenzínunavýkonmotoru, g) porovnánícenovéhladinyvněkolikasupermarketech.
2 Přiinduktivnímzpůsobumyšlenínalézámepřizkoumáníjednoduššíchkonkrétníchpřípadůpomocíabstrakcejejich společnouobecnouzákonitost–vinduktivnístatisticetoprobíhátak,žezvlastnostívýběrovéhosouborubudeme usuzovatnavlastnostizákladníhosouboru.
1.3Statistickájednotkaastatistickýsoubor
3. Jeanketareprezentativnístatistickéšetření?
4. Vyjmenujteněkteréhromadnéjevy: a) zoblastivašíprofesníčinnosti, b) zoblastivašízájmovéčinnosti, c) zoblastiveřejnéhozájmu(zdroje:noviny,rozhlas,televize,internet).
Řešení.
1. a)ano;b)ano;c)ne;d)ano;e)ne;f)ano;
2. a)experiment;b)pozorování;c)výkaznictví; d)dotazování;e)pozorování;f)experiment; g)pozorování; 3. není.
Vpodkapitole 1.2 jsmeuvedli,žeúkolemstatistikyjeprováděthromadnápozorováníasledovathromadnénáhodnéjevy.Protožestatistikajevědavelmipraktická,budemehromadná pozorováníprovádětnareálnýchobjektechnebosubjektech,kteréjsouzurčitéhokonkrétníhodůvodupředmětemnašehozájmu.Pozornostprotobudemevěnovatnejprve statistickým jednotkám ajejichjednoznačnémuvymezení,potomsivysvětlímepojmy základnísoubor a výběrovýsoubor
Definice1.3.1 Jednotlivéobjektynebosubjekty,kteréjsoupřistatistickémzkoumánísledované,senazývají statistickéjednotky.Každástatistickájednotkamusíbýtjednoznačně vymezena,abynemohlodojítkdvojímunebojinakzkreslenémuvýkladuzjištěných údajů.Statistickéjednotkysevymezujízhlediska:
• věcného,
• prostorového,
• časového.
Příklad1.3.2 Statistickýmijednotkamimohoubýt:
– osoby,lépeřečenojistékategorieosob–novorozenci,žáci,voliči,zaměstnancipodniku, důchodci,pacienti...,
– věciapředměty–výrobky,stroje,budovy...,
– organizace–podniky,úřady,školy,obce...,
– zvířata–psi,ryby,sloni...,
– rostlinyneboplody–pšenice,růže,břízy,jablka...,
– události,jevy–sportovnívýkony,poruchy,meteorologickéjevy....
Příklad1.3.3 Proveďtevěcné,prostorovéačasovévymezenítěchtostatistickýchjednotek:
a) všechnaosobníautaprojíždějícívúterýmezi14.a16.hodinou110.kmdálniceD1 směremnaBrno;
b) všechnaděvčataze6.třídznojemskýchzákladníchškolvčervnuroku2012;
c) všichnikapřivjihočeskémrybníkuBezdrevvlistopadu2010;
d) všechny50gramovérohlíkyztýdenníprodukcepekařeJečmínkavtýdnuod12.do 17.3.2012;uvažujmedále,ževýrobatěchtorohlíkůbudezanezměněnýchpodmínek (stejnámouka,stejnávoda,stejnáteplotapecí,stejnásměna...)pokračovativdalším období;
e) všechnyhypotetickévýsledkyvýkonovéhotestuujednohovolejbalisty–výskoksdohmatemodrazemsnožmozrozběhu–vobdobíletnítréninkovépřípravy2011.
1.3Statistickájednotkaastatistickýsoubor
Řešení. Vymezenístatistickýchjednotekvjednotlivýchpřípadech:
a) věcné:osobnívozy,prostorové:110.kmdálniceD1směrBrno,časové:konkrétníúterý vdaném2hodinovémintervalu,
b) věcné:žákyně6.tříd,prostorové:ZŠveZnojmě,časové:červen2012,
c) věcné:kapři,prostorové:rybníkBezdrev,časové:listopad2010,
d) věcné:50gramovérohlíky,prostorové:pekařstvíJečmínek,časové:obdobítýdneod12.do 17.3.2012,resp.obdobíod19.3.2012dále,
e) věcné:výskoksdohmatemodrazemsnožmozrozběhu,prostorové:tréninkováhala, časové:léto2011.
Definice1.3.4 Množinastatistickýchjednotekstejnéhotypuashodnéhovymezenítvoří statistickýsoubor.Vrámcistatistickéhošetřeníbudemerozlišovatdvatypysouborů:
• základnísoubor(populace) –množinavšechshodněvymezenýchstatistickýchjednotek,
• výběrovýsoubor(výběr,vzorek) –podmnožinazákladníhosouboru,tedyvybranáčást populace.
Ozákladnímsouborusetakéhovoříjakoostatistickémsouboru,kterýjepředmětemnašeho zájmuaojehožvlastnostechsemajíčinitzávěry.Můžebýtbuď reálný,pokudvšechnyjeho statistickéjednotkyreálněexistují,nebo hypotetický,kterýjesiceobecnědefinován,alepři statistickémzkoumáníreálnějehostatistickéjednotkyneexistujínebojichexistujepouzečást –vizpříklad 1.3.5.Zcharakteruzákladníhosouborubezprostředněvyplývá,žemůžemít konečný rozsahnebomůžebýt nekonečný.
Připřípravěstatistickéhošetřeníjejednímznejdůležitějšíchpožadavkůnakvalitníanalýzu homogenita základníhosouboru.Tajezvalnéčástizabezpečenápomocíshodnéhovymezení všechjednotekvzákladnímsouboru.Jetřebamítnapaměti,žechybyvevymezenízákladního souborusepotompřenášínavýběrovýsoubor,sekterýmsedálepracuje.Tovšakvede knespolehlivýmažchybnýmzávěrům–vizpříklad 1.3.6
Početjednotekzákladníhosouborujevesměsvelký.Připomeňmesi,ževzačátcíchstatistikybylocílemvyčerpávajícíšetření,nebolicelýzákladnísoubor.Ažteprvematematická statistikapřineslamožnostprovádětpouzevýběrovášetřeníanamístocelépopulacepracovat sevzorkem.To,žesedávádnespřednostvýběrovémušetřenípředvyčerpávajícímšetřením, máhnedněkolikdůvodů:
• důvodyekonomické–výběrovéšetřeníšetříčasipeníze;zejménaurozsáhlýchsouborů byměřenínebozjišťovánínavšechstatistickýchjednotkáchnebyločasověmožnéneboby bylovelmidrahé(např.vážení85000kusůrohlíků),
• důvodytechnické–připrováděnémměřenísestatistickájednotkamůžeznehodnotit(např. přidegustacimasovékonzervysemusíkonzervaotevřít,čímžseznehodnotí),
• důvodypraktické–vsituacích,kdyjezákladnísouborzcelanebozčástihypotetický, jepotomměřenípraktickynemožné(např.sportovnívýkonynenímožnénekonečně mnohokrátopakovat).
Smetodamipořizovánívýběrovýchsouborůseseznámímepozději(vizpodkapitola 8.1).
Příklad1.3.5 Vpříkladu 1.3.3 jsmeprovedlivěcné,prostorovéačasovévymezenípopsaných statistickýchjednotek.Definujtevestejnýchsituacíchzákladníavýběrovýsoubor.
Řešení.
a) Základnísoubor:hypotetický–množinavšechosobníchvozů,kterédanýmmístemvdané doběprojíždí(jejichpočetvšakkonkrétněstanovitpředměřenímnelze,teoretickybudeme základnísouborpovažovatzanekonečný),výběrovýsoubor:např.80náhodněvybraných vozů;
b) základnísoubor:reálný–množinavšechžákyň6.třídnavšechZŠveZnojměvčervnu 2012(jejichpočetje345,základnísoubormátedyrozsahkonečný),výběrovýsoubor: např.25náhodněvybranýchžákyň;
c) základnísoubor:reálný–množinavšechkaprůvrybníkuBezdrevvlistopadu2010 (jejichpočetreálněstanovitnelze,zpraktickýchdůvodůlzevšakpředpokládat,žepočet jekonečný!),výběrovýsoubor:např.50náhodněvybranýchkaprů;
d) základnísoubor:reálnýihypotetický–množinavšechrohlíkůvyrobenýchvpekařství Ječmínekvtýdnuod12.do17.3.2012(85000kusů)amnožinadalšíchrohlíků,jejichž výrobabudedálepokračovat(základnísouborjetedynekonečný),výběrovýsoubor:např. 120náhodněvybranýchkusů;
e) základnísoubor:hypotetický–fiktivnímnožinavšechmožnýchvýskokůsdohmatem odrazemsnožmozrozběhu(jejichpočetjemožnésipouzeteoretickypředstavit,reálně neexistuje),výběrovýsoubor:např.10provedenýchvýskokůsdohmatemběhemjednoho tréninku.
Příklad1.3.6 Rozhodněte,zdakonstruovanézákladnísouboryjsousohledemnasledovanou veličinuhomogenníarozhodnutízdůvodněte:
a) všechnaosobníautaprojíždějící110.kmdálniceD1vúterýodpolednevesměrunaBrno inaPrahu–sledovatbudemerychlost,
b) všichnižáci6.třídznojemskýchzákladníchškolvčervnuroku2012–sledovatbudeme výsledkytestuzfyzikyavýkonyvběhuna60m,
c) všichnikapřivjihočeskémrybníkuBezdrevvlistopadu2010a2011–sledovatbudeme hmotnostkapra,
d) všechny50gramovérohlíkyzprodukcepekařeJečmínkavobdobíod12.do31.3.2012 –sledovatbudemehmotnostrohlíku.
Řešení.
a) Provoznadálnicivobousměrechjeobecněodlišný–zatohotopředpokladujeprostorové vymezeníchybné,základnísouborjetedynehomogenní,
b) přisledovánívědomostížákůZŠseuchlapcůaděvčatobecněneočekávajírůznévýsledky –zatohotopředpokladujevěcnévymezenísprávné,základnísouborjehomogenní;při sledovánísportovníchvýkonůuchlapcůaděvčat(obecněumužůažen)existujíbiochemické,anatomické,fyziologickéajinéodlišnostizdůvodňujícírůznésportovnívýkony–zatohotopředpokladujevěcnévymezeníchybné,základnísouborjenehomogenní, c) podmínkychovurybvedvourůznýchletechobecněshodnébýtnemohou–zatohoto předpokladuječasovévymezeníchybné,základnísouborjenehomogenní;reálnéasmysluplnéjevšakdefinovatdvarůznéhomogennízákladnísoubory,vkaždémrocejeden, scílemporovnáníhmotnostikaprůvobouletech, d) uvažujme,ževýrobaprobíhávcelémobdobízazcelashodnýchpodmínek–zatohoto předpokladuječasovévymezenísprávné,základnísouborjehomogenní.
1. Proveďtevěcné,prostorovéačasovévymezení následujícíchstatistickýchjednoteksesledovanouvlastnostíaposuďte,zdajezákladnísoubor homogenní:
a) rychlostautjedoucíchdenněpo15.hodině vBrně,uliceProvazníkova;
b) výškasmrkůvoblastiBřezníkNPŠumava vroce2010;
c) napětívelektrickésítivdomácnostechnasídlištiJižníSvahyveZlíněvzáří2011;
d) výkonvběhuna12minutabsolventůStřední policejníškolyvPrazevroce2012.
2. Prostatistickézjišťováníprováděnéprostřednictvímformulářeurčete,sjakýmistatistickýmijednotkamitotozjišťovánípracujeavymezteje věcně,prostorověačasově:
a) vpřípadědaňovéhopřiznání,
b) vpřípaděpovinnéhoručenímotorovéhovozidla.
3. Řeštenásledujícíúkoly:
a) Posuďte,zdajezpohledustatistikypředmětemnašehozájmuzákladnísoubornebovýběrovýsoubor.
b) Jakmusíbýtvymezenéstatistickéjednotky vzákladnímsouboru?
Řešení.
1. a) Všechnaautajedoucídanýmmístem,ProvazníkovauliceBrno,každýdenpo15.hodině,nehomogenní(protožehustotaprovozu seobecněkaždýdenliší);
b) všechnysmrkyvdanéoblasti,Březník,2010, homogenní;
c) všechnahypotetickáměřenívelektrickésíti, domácnostivdomechnasídlišti,září2011, homogenní(alezapředpokladushodnétechnologieměření);
d) všechnyhypotetickévýsledkyběhuna12minutabsolventůSPŠPraha,2012,homogenní.
2. a) Plátcedaně,vypočítanáčástkadaně,FÚOlomouc,duben2012;
b) majitelmotorovéhovozidla,výšepojistky, ČSOBpojišťovna,2012.
3. a) Základnísoubor;
b) věcně,prostorověačasověshodně.
Užbylořečeno,žestatistikubudemevyužívatpřiřešeníkonkrétníchapraktickýchproblémů zreálnéhoživota.Zformulaceproblémunámmusíbýtjasné,jakévýrobky,osoby,zvířata, rostliny,události,organizacejsoupředmětemnašehozájmu,aletakéojakéjejichvlastnosti sebudemezajímat.Vdalšíčástisetedyzaměřímeprávěnatytovlastnosti,tzv. statistické znaky,atojakzpohledujejichvyjádření,tzv. hodnot a obměn,taktakézpohledustatistických operacísnimi.
Definice1.4.1 Vlastnosti,kteréustatistickýchjednotekbudemevrámcistatistického šetřenísledovat,nazýváme statistickéznaky neboli statisticképroměnné.Různéhodnoty, kterýchmůžestatistickýznaknabývat,nazýváme obměny neboli varianty.Podlezpůsobu vyjádřeníhodnotdělímestatistickéznakyna:
• číselné – měřitelné,
• slovní – kategoriální. Podletypuvztahůmezihodnotamiaobměnamibudemerozlišovatstatistickéznaky:
• metrické – měřitelné,
• ordinální – pořadové,
• nominální – jmenovité.
Vrámcistatistickéhošetření(měření,pozorování)vyjádřímemírusledovanévlastnostiukaždé jednotkystatistickéhosouboruprostřednictvímtzv. hodnoty statistickéhoznaku.Aktuální–naměřenéhodnotyproměnnéjsou data.Početnaměřenýchhodnotodpovídározsahuvýběrovéhosouboru.Hodnotuznakuvesmysluvyjádřenírůznéhostupnědanévlastnostioznačíme jako obměnu–variantu statistickéhoznaku.Početobměnjezpravidlamenší,nejvýšeroven rozsahusouboru.Např.kotázcezavedeníškolnéhonaVŠsevyjádřilo73studentů1.ročníků ze2fakultjednéVŠ:souhlasím–25studentů,nesouhlasím–34studentůajemitojedno–14studentů;výsledkyprůzkumujsouvyjádřené3obměnami(souhlasím,nesouhlasím,jemi tojedno),celkovýpočetnaměřených(zjištěných)hodnotje73.
Statistickéznakylzeklasifikovatpodleněkolikahledisek.Předevšímsenabízíhledisko vyjádřeníhodnotznakučíselněneboslovně.Lze-lihodnotyznakuvyjádřitčíselně,rozumí setedy numericky,jdeoznak číselný (např.početžákůvetřídě,spotřebavodyvdomácnosti zarok).Pokudsehodnotyznakuvyjadřujíslovně,hovořímeoznaku slovním (např.barva očíčlověka,druhvlastnictvíbytu).Slovníproměnnésečastooznačujíjako kategoriální Takovéčleněnístatistickýchznakůnenísamoúčelné,protožepročíselnéaslovníznakybudou konkrétnístatisticképostupyametodyvesměsrozdílné.Přizpracovánídathrajerolitaké to,zdadatapředstavujíhodnotyznakunespojitého(diskrétního)nebospojitého. Nespojité znakynabývajípouzejednotlivéčíselnéneboslovníhodnoty(např.početdvojchybtenisty vzápase,početvadnýchvýrobkůvsérii,státnípříslušnoststudentaVŠ). Spojité statistické znakymohounabývatlibovolnýchhodnotvrámciurčitéhointervalu(např.dobačekánína obsluhuvrestauraci,obsahtukuvmléku,sladkostlimonády).Víceseovztahumezispojitými anespojitýmiznakydozvímepozději.
Natutozákladníklasifikacistatistickýchznaků(proměnných)úzcenavazujetříděnípodle typuvztahůmezihodnotamiaobměnamiznaků.Podletohotokritériadělímeproměnnéna metrické,ordinálníanominální.
Metrické neboli měřitelné proměnnéjsoutakovéproměnné,kterénabývajívýhradněčíselnýchhodnotavyjadřujítedyvelikostměřenévlastnosti.Jejichdalšíděleníseprovádípodle oborujejichhodnot.Pokudjsoutytohodnotyvyjádřenépouzekladnýmičísly(např.rychlost autanadálnici,výkonveskokudovýšky),proměnnouoznačímejako kardinální.Včeské literatuřesetaképoužívápojem poměrová proměnná.Jejíkaždédvěhodnotylzeporovnávat jakrozdílem,takipodílem.Jetedymožnéstanovit,okolikjednotekjejednahodnotavětší (event.menší)neždruhá,atakékolikrátjejednahodnotavětší(event.menší)neždruhá. Druhouskupinumetrickýchproměnnýchtvořítakovéproměnné,kterénabývajíkladnéinekladnéčíselnéhodnoty(např.teplotavzduchuve ◦C,početdětívrodině).Tytoproměnné jsounekardinální,zpravidlaseoznačujíjako intervalové.Utěchtoproměnnýchlzekaždédvě hodnotyporovnávatjenrozdílem,lzetedystanovit,okolikjednotekjejednahodnotavětší (event.menší)neždruhá.Porovnánípodílemnenímožnézpravidlaproto,žemnožinaobměn obsahujenulu.Vestatisticevšakrozdílmezipoměrovouaintervalovouproměnnounehraje velkouroli.Jetotižzřejmé,žekaždounekardinálnímetrickouproměnnoulzevhodnou(ajednoduchou)transformacípřevéstnaproměnnoukardinální.Tosepraktickyodrážívtom,že prooběkategoriemetrickýchproměnnýchsevesměspoužívajíshodnémetodystatistických analýz.Rozdílmezinimisetýkáažpraktickéinterpretacezískanýchvýsledků.
Přizpracovánímetrickýchdatpovažujemevětšinouodpovídajícíproměnnézaspojité,jako kdybymohlynabývatkterékolivhodnotyzčíselnéhointervalu,ikdyžpřipraktickémměření tomutaknení.Dokonceiuveličin,kteréprincipiálněspojitéjsou,jakorozměrnebočas,
1.4Statistickýznak
musímepřipraktickémměřenívolitkonečnoujednotkurozlišení,takžeitytoproměnnése chovajínavenekjakodiskrétní(nespojité).Přestopřistatistickémzpracováníbudemevětšinou užívatprometricképroměnnépostupymatematickyodvozenéproveličinyspojité.
Příklad1.4.2 Poměrovéznakyjsounapř.cenabenzinuNatural95,výškadospěléhomuže, obvodkmenejavoru,délkakapra,hmotnostjablkadanéodrůdy,početzaměstnancůpodniku, početčlenůdomácnostiatd.(Všimnětesi,žeuvšechuvedenýchznakůpředstavujeobor hodnotmnožinupouzekladnýchčísel!)
Příklad1.4.3 Intervalovéznakyjsounapř.početchybvdiktátu,chybapřizaokrouhleníceny nákupu(naceléKč),početprodanýchtelevizorůzaden,výšekapesnéhožáka4.třídyZŠ,rok narozeníapod.(Uvšechuvedenýchznakůobsahujemnožinahodnotznakunulu!)
Ordinální neboli pořadové proměnnéjsouslovní(kategoriální)proměnné,ujejichžobměn másmysljejichuspořádání,lzejetedyjednoznačněseřaditodvariantyvyjadřujícínejnižší úroveňsledovanévlastnostiaždovariantysúrovnínejvyšší,nebonaopak(např.dosažené vzdělání:základní,střední,vysoké).Tohosečastovyužíváktomu,žeslovněvyjádřeným obměnámordinálníproměnnésepodlejejichpořadípřiřazujípořadovánebojináčísla(stupně, body,procentaapod.),kterávyjadřujípořadíslovníchvariant(např.školníklasifikace:výborně –1,chvalitebně–2,dobře–3,dostatečně–4anedostatečně–5).Rozdíldvouhodnotordinální proměnnépotomvyjadřujerozdílvjejichpořadí!Protojedůležitépracovatspořadovými číslyjakosurčitouformoukvantifikacetěchtoobměnazohledňovatskutečnost,ženelze nikdystejnouhodnotuudvourůznýchstatistickýchjednotekpovažovatzazcelatotožnou (např.dvastudentibyliuzkouškyhodnocenistupněmdobře–ztohovšaknelzeusoudit,že obastudentimajízcelashodnévědomosti).Tojezásadnírozdílmezipořadovýmametrickým znakem,kterývyvolávápotřebuponěkudodlišnýchmetodzpracování.
Příklad1.4.4 Ordinálníznakysmožnýmoboremhodnot:
– rychlostchemickéreakce(+,++,+++),
– odpověďnakonkrétníotázkuvsociologickémprůzkumu(naprostosouhlasím,spíšesouhlasím,mámneutrálnípostoj,spíšenesouhlasím,naprostonesouhlasím),
– kategorievojenskýchhodnostívAČR(mužstvo,poddůstojníci,rotmistři,praporčíci,nižší důstojníci,vyššídůstojníci,generálové),
– pořadívsoutěživýcvikupsíchplemen(1.pořadí,2.pořadí,pracovní,nehodnocený),
– kategoriekuřáků(početvykouřenýchcigaretzaden:do5,do10,do20,nad20).
Nominální neboli jmenovité proměnnéjsouslovní(kategoriální)proměnné,kterénelze vzájemněporovnávat,tedyujejichžobměnnelzestanovitžádnépořadí.Lzepouzestanovit shoduneboneshoduvhodnotěznakuukaždýchdvoustatistickýchjednotek(např.druhymasa: vepřové,hovězí,telecí,kuřecí,jiné).Někdysehodnotynominálníhoznakumohouvyjádřit takéčísly,nemajívšakžádnýkvantitativnívýznam(např.číslatramvají:1,6,7a12).Data odpovídajícíhodnotámnominálníhoznakuvždyvyžadujízpracováníspecifickýmimetodami.
Příklad1.4.5 Nominálníznakysmožnýmoboremhodnot:
dominanceruky(pravák,levák),
barvavýrobku(červený,modrý,jiný),