Apostila - Estatísca Básica

Page 1

,

- -=---

__

,D

o

"1

"""---~

---~----------~

.. l

.~

COMPANHIA PARANA,ENSE DE ENERGIA ~.

COPEL

u O

u

O

, u. ,

'lO

I

'

O

,0

,o -v

O

O

, ç, L'

O ".. V

O

-.,-" -",,O (;-

Lr

O/'"' :-v,

O O O -..•

u

O "

.jJ

.0 ~ ,

l./

"-

"'V. -(.: ~ lo

.•.•..••.. -

(.,

!

••• J.~

"' 'li

V

, "•

~

I!

!I

_:~----~".

i~

.Il


'-'-~---------------------•... .

. I

!

,

,,-:-

..." .,.,;

~"!"~

"'"

.

•..1

"'" ,

"


?;:"

(,,;

ç,

c (;

e v

t.V C!

'" O \oi

tt

e'""

ti (;.)

C l,..;

"V

\,1

G

c

IC

'"

C C

e <.i

(.,

C

C ,..~

", '-""

", "

~

t.J

Q

Jorge Festa ESTATÍSTICA - UMA CIÊNCIA EM DESTAQUE Ao se falar em Estatística logo se lembra de apresentações numéricas, em tabelas ou em gráficos dos resultados da observação de fenômenos de massa, ou ainda, o elemento típico inferido dessa observação. Na verdade se trata de um .conjunto de processos que tem por objetivo a observação, classificação e análise de fenômenos coletívos bem como a indução das leis a que tais fenômenos globalmente obedeçam. A palavra estatistica significava, originalmente, uma coleção de informações de interesse para,o estado sobre população e economia. Essas informações são coletadas com o propósito de:' resumir conhecimentos e são indispensáveis para os governantes conhecerem a marcha de uma ,i nação e formularem programas de governo e de administração compatíveis. A mesma coisa pode-se' dizer de empresas e organismos como indústrias, hospitais, seguradoras, instituições de pesquisas agropecuárias, biológicas, etc, que necessitam estatisticas para controle e o planejamento de suas atividades. . Os métodos pelos quais a Estatística se utiliza são aplicáveis a todas as ciências. No entanto, alguns são mais utilizados em uma área do que em outra. Assim, por exemplo, os métodos de controle estatístico de qualidade são mais utilizados na industria. Sua utilização vai desde o recebimento da matéria-prima, passando por todas as etapas de transformação, na inspeção de qualidade do produto, na fase de acabamento e terminando na colocação do produto acabado no mercado consumidor. Pode-se dizer que a utilização de métodos estatísticOs de controle de qualidade é hoje a grande responsável pelo sucesso da indústria japonesa em todos os setores de atividades, dominando grande parcela do: mercado internacional. E claro que a utilização destes métodos não constituem nenhuma novidade mas o que deve-se ressaltar é o caráter sério e racional com que os japoneses os impuseram em seu programa industrial, com o emprego de profissionais capacitados. Os setores que necessitam do planejamento e da pesquisa, como é o caso da agropecuária, são os que mais se utilizam de modelos estocásticos e análises de comparações na determinação de espécies, tipos, etc, no sentido de melhorar, aumentar e prever safras e produções em geral, obtendo assim uma certa segurança em investimentos. Esses mesmos modelos e análises também são de elevada importãncia na industria, e são empregados com os mesmos objetivos. Na área econômica, alguns métodos se destacam devido a sua utilização mais frequente, e principalmente aos excelentes resultados que podem proporcionar. Dentre eles pode-se mencionar rapidamente o estudo de séries temporais e análise de ajuste de curvas. Todo setor relacionado com o levantamento de dados de populações humanas, sendo assim pesquisas de mercado, ou de opinião pública, ou ainda, de ordem demográfica, estão freqüentemente se utilizando de técnicas de amostragem, que proporcionam confiabilidade nos resultados pretendidos,' além de grande redução nos custos do empreendimento. Não se trata aqui de expor todas as aplicações da Estatística que é vastíssima, mas senão de exemplificar algumas delas. De uma modesta origem, esta ciência cresceu e se desenvolveu nos últimos anos, e sua vasta utilização se deve principalmente ao surgimento de métodos computacionais eletrônicos. Foi com o surgimento e rápido aperfeiçoamento dos computadores, que os métodos estatísticos puderam ser devidamente utilizados, Assim, alguns cursos superiores foram repensados, em função desse avanço, e tiveram seus currículos alterados, com a implantação de uma nova filosofia, em virtude do quadro que se apresenta. Enfim, apesar de nós brasileiros termos nos alertados um tanto tardiamente para a grande importãncia da Estatistica em todos os setores de atividades de um pais, esforços estão sendo envidados através de nossas escolas, no sentido de termos profissionais capacitados nessa área.

'U -I. c:.r

"cç

v

o

~

Obs.: Essa introdução abriu o 10 Encontro de Profissionais e Estudantes de Estatística, realizado na UNICAMP, Campinas, em março de 1985. Estai/sUes G8nJ1

PAgina nO

f

,~.


'""\

Jorge Festa Estatísticas Descritivas

O~

O

O ~

1. Média _ 1 n x=-Lx;

n

O Q

O J

i=1

0, 2. Mediana

°1 ;).

i = menor inteiro [~ + 1] ' j = maior inteiro [~ ]

.

Mediana = J 2 = Q2 =

(Xp) +X[j))" 2

6

1

'

:;1

..

' onde XI;) e X[i] e a estatístIca de ordem.

o'

o~ •

3. Moda A moda é a observação com maior freqüência ..

QI OI

O

4. Média Geométrica

x. =

)y. fIx;

O J~

n

(

ai

1=1

()

5. Variância 1 ~( s2 =--L.

o

_)2 Xi-X

J

n-l '=1

o J1

6. Desvio-padrão

°I :).

s = ..fs'

O:

7. Erro Padrão Sd

I

CJI

= Y-.h.

01

8. Minimo Min = X[1)' o mínimo é a menor observação (se os valores forem ordenados ascendentemente).

o: •

I

;). Q

9. Máximo Max = X[n)' o máximo é a maior observaçãó (se os valores forem ordenados ascendentemente).

J

8i

.JI

o;

lO.Amplitude R = Max - Min = X[n) - X[I)' a amplitude R é a diferença entre o Máximo e o Mínimo.

jl

OI Oi

OI

Oi J

o Eslallstica GenII

Páginan" 2

8 C)

:)

l}

_J


'r

'c

c-

ç (." (;i

Jorge Festa 11.Quartil Inferior . . [n"4 + IJ' , J = mator ... InteIro [nJ i = menor InteIro 4

\;)

t;.

c:.

"

~,,'

C:

(Xpl+X[j]) 2

J I = Q, =

12.Quartil Superior

4

e c;

4

.. [3 n + IJ' , J = maIOr '" InteIro [3 nJ I. = menor InteIro

~

t" ç;..

, , ... ' onde X[;j e Xiii e a estatlstlca de ordem.

J, = Q, =

(xP] +2 Xiii)

" . ' onde XP] e Xiii e a estattsttca de ordem.

13.Intervalo Inter Quartil IQR = J3 - JI = Q3 - QI

(,.;

o lo.-

C

o

I" '~

C C

14.Assimetria "Skewness" - (missing if s=O or n<3) n

nL:(xi

-

x)'

i=1

(n -IXn - 2)s' 15.Assimetria Padronizada "Standardized Skewness" - -N(O, 1) for n>I50 Skewness

C

C

c

eç !C

19 c

C:

16.Curtose (Kurtosis) (missing if s=O or n<4) n

n(n+I)L:(x,

-x)'

i=1

(n -IXn - 2)(n - 3)S4

3(n -1)' (n - 2)(n - 3)

.

~'

17.Curtose Padronizada (Standardized Kurtosis) kurtosis

••••

Ç:

"oce.

ti (..

"fi

18.Coeficiente de Variação CV = ~.100

x

Referencia: Snedecor, G.W. and Cochran, W.G. 1967. Statisticai Methods, sixth edition. Ames, Iowa: lowa State Univerty Press.

(;

c;:

Estai/sOca Genú

PAginanD

3

(;

o

c

,I


~-----------------~~

Jorge Festa

o o ()

Exemplo: Uma amostra de 26 observações referente a altura (em centímetros) dos alunos do curso de "Cálculo de Probabilidade Ir' foi realizada em determinado dia, onde forneceu os seguintes valores: (1) 173 (14) 162

(2)

177 (15) 182

(3) 180 (16)

175

(4)

(5)

(6)

(7)

(8)

(9)

(10)

(11)

(12)

179

188

196

180

175

165

165

174

176

(17)

(18)

(19)

(20)

(21)

(22)

(23)

(24)

(25)

178

167

174

156

165

185

170

156

157

o O'

o

O~

(13) 174 (26) 173

8

1

°I

'0 ' I 0 - ', c

As estatísticas fornecidas pela amostra são apresentadas abaixo: ':!) ('1!>~; Vl lU-""!~I s" \v-'''~õ;I1Y '7t~fi<-1i& '> Variable:

r"

O, Oi

alturas

I

Sample size Average

26. H3.1.53846

Median

H4.

Moda

165.

Geometria mean Varianoe Standard. deviation Standard error

~ 72. 890634.

O-

OI

O O

94.61.5385 9.727044 1.90763 1.56.

Mi.nímum Haxi= Range

,

°

O,

196.

40. Lower quartile 165. tpper quartíle 179. Interquartíle range 14. SJrewness 0.047659 Standardized skslmess 0.099209 0.1.53551 Kurtosis St:aDda.rcü.zedkurt:osis 0.1.59821 5.617573 Coeff. of variation 4502. ' Sum

0'

oi o Q 0,

°I

------------------------------------------------------:,-'--r-----,---€">tp l"Y'"a "",,"" J),4Hl frrJô Ii', yc, / 51-t<""'" ~ 1e:d.J to! ''<:;1> b 'I Stem-and":'leafcli.splay for alturas:/wút ~12 represents f1.2 c

0,

~

,:) 3 4 8 (6) 12 6 3

1.501667 16"12 16015557 17"1033444 1701556789 18"1002 180158

~

~9"1

~

1.9016

:J .:)

O J

O O _,

A distribuição de freqüência para os valores observados da amostra segue abaixo:

~~n~d~~J;;~~hJ:.1 Fr(o'\'lvoc'lI-';)~vI8hov, Lower Limit:

Class 1 2 3

155.000 160.000 165.000 170.000 175.000 180.000 1.85.000 190.000 195.000

4

5 6 7 8 9 Mean

=

~73.154.

tpper I..imi t 160.000 165.000 170.000 175.000 180.000 185.000 190.000 ~95.000 200.000

Relative Hi.dpoint

Frequenay

St:andard Deviatíon

.Frequenoy Frequenoy

3 1

1.57.500 162.500 167.500 172.500 177.500 182.500 1.87.500 1.92.500 1.97.500

6 6 3 2

o 1 9.72704.

3 4 8 14 20 23 25 25 26

0.11.54 0.0385 0.1.538 0.2308 0.2308 0.11.54 0.0769 0.0000 0.0385

4

=

.

Cumulatíve

Median

=

I

Vi

0! O' Q

Cum. ReI. Frequenoy

0.11.5 0.1.54 0.308 0.538 0.769 0.885 0.962 0.962 1..000

:)

::)

.:) b O ()

~74.

8 ()

Estatlslica Gemi

PAgina nD

4

O

a

Ó .)>


7t

"w

ç

Jorge Festa

'e" (;..,

..--~

(,;)

,"

------_._~.~-_. __ ._-- .. , ,

tJ

I

e õ

_._~--

""

.e c..

"

.,

*

IC

'" \;.i

C;. Q

".

~"'('

.

I

m

*

.-

lo' ",1-<>-,1),111 A,,~'i~1'> /~

4-_.

*

....

fio f

vJl.A\'", h"V

cvvcl

_c__.__.__ ..f __

__ m

.•....•.

--S-- __ . __ +

• __

--1

--

~

o,

~

\.,.

\..; {;;

I

""c c c

m

m

m

c

_.

__

an

~

c

"

c cC.

Lower

c

"

Q

C

C

c c

Upper Li.mit

Limít ar be~ow 1.67.000

H3.000 1.19.000

above Chísquare

~67.000 H3.000 H9.000

=

3.30634

with

~ d.£.

Sigo

Observed

EXpecêed

Frequency

Frequency

Chisqnare

8 3

6.0

O.~3 2. 489

9 6

6.0 7.~

~.448 0.~77

6.9

~eve~= 0.06901.3~

Pelos resultados apresentados, que conclusões você pode afirmar, com seus conhecimentos estatísticos a respeito da distribuição dos dados. Obdece uma distribuição Normal?

c c c e c:. c

o

o c

... _o.

Estatlstica GemI

Páginan" 5


o Jorge Festa

Teste de Normalidade para a amostra das alturas.

J O

O

o'

O O

Diagrama de Dispersoes

O

2.8

i!l

1.8

c

0.8

'" ~ 2

'" :. .,

:Ia---

-0.1

.,

--

.1.1

160

166

--

ÇJ

::J J 0,

-- -

~ u W

-:

O \)

01

0, 160

166

O 170

176

180

186

190

196

200

O' O

Amostra ordenada

Altura em ao. SaDp.le

Alt:ara.ll

E.co.re.e

Al.t:ara. 1.0000 ( 26) 0.0000 0.984.7 26) ( 0.0000

J C)

Correl.at:í.ozu

O O

B.sco.re1J

0.9847 ( 26) 0.0000

J

b

1.0000 ( 26) 0.0000

°I 0' 01

Valor tabelado:

J

O Q

O

oi

01

Regressão Linear Simples:

O. , O O O CJ

y =A+Bx B=

n.:LXY-~:X'LY Lxy-nxy -----n'Lx' -(Lx)' LX' - n(x') A =

LY - B.L x -

y _ Bx

I

n

b O O O

CJ Q' EstatfsUca GetaI

PáginanD

6

O O ~

,

a o;


Jorge Festa

Origem do Termo Regressão

o uso

••••

••••

••••

•••

do termo regressão deve-se a Francis Galton, por volta de 1885, quando investigava relações entre caracteristicas antropométricas de sucessivas gerações. Uma de suas constatações era de que "cada peculiaridade de um homem é transmitida aos seus descendentes, mas, em média, numa intensidade menor". Por exemplo: embora pais com baixa estatura tendam a ter filhos também com baixa estatura, estes tem uma altura média maior do que a altura média de seus pais. O mesmo ocorre, mas em direção contrária, para pais com estatura altà. Esta afirmação pode ser melhor compreendida observando os dados usados por Galton, e representados abaixo. Se as caracteristicas permanecessem as mesmas de geração para geração, esperar-se-ia que a reta de regressão tivesse seu coeficiente angular próximo de 1. Em sua análise, Galton encontrou o valor 0,516, mostrando que a reta tende para aquela paralela do eixo x e passando pela média (y = y). A este fenômeno da altura de os filhos moverem-se em direção da altura média de todos os homens, ele chamou de regressão, e às vezes de reversão, tendo aparecido num artigo em 1885, no Joumal ofthe Anthropological Institute, com o título "Regression Towards Mediocrity in Hereditary Strnture". - Regressão para a Mediocridade em Estaturas Hereditárias, mediocridade aqui referindo-se a médio .

•••• Media de alturas de filhos contra alturas composta dos pais

••••

'"

184

Observado estimado valor y =x

180

•••• ••••

176

•••••

••• ~

172

~

•••

168

•••• 164 ••••

160 160

164

168

172

176

180

184

altura dos pais

•••• •••• •••• ••••

Os dados abaixo referem-se a outro experimento de Galton, dentro de uma mesma investigação, procurando investigar a relação entre o diâmetro em centésimos de polegadas de ervilhas pais (x) e ervilhas filhas (y). Analise a reta de regressão para os dados e interprete os coeficientes .

•••

Diâmetros em 0,01 de polegadas de sementes de ervilhas Pais (x) 15,0 16,0 17,0 18,0 Filhos(y) 15,4 15,7 16,0 16,3

-

Bíbliografia: BUSSAB, W.O. Análise de Variância e de Regressão, Atual, 1988 .

•••• ••••

Estat/sties GemI

19,0 16,6

20,0 17,0

21,0 17,3

PdginanD

7


-------------------7~------------

~

o Jorge Festa PROBABILIDADE

J

O

O O

Introdução:

O Uma das ferramentas fundamentais da estatístíca é a probabilidade, que teve seu ínícío formal com a e!!COlhade jogos no século xvn. Escolha de jogos, como o nome índíca, ínclui ações como: rodar uma roleta, rolar um dado, lançar uma moeda, retirar uma carta, etc., apresentam resultados de incerteza. Antes de definirmos probabilidade vamos apresentar algUns enuncíados importantes que facilitarão o entendimento do assunto, tais como: .

01

°I O

O ÇJ

Experimento resultados.

é o processo de coletar dados relevantes para fenômenos que exibem variações em seus

O 8

Espaço Amostrai n é a coleção de todos os resultados distíntos possíveis de um experimento ç, e cada resultado distinto é chamado evento simples, um resultado elementar ou um elemento - ponto - do espaço amostral. Evento: Um evento A é um subconjunto do espaço amostral temos o evento aleatório.

n. Se atribuirmos

uma probabilidade a A

J O

CJ O O

o

Álgebra A: Uma álgebra A é uma classe de subconjuntos não vazia, do espaço amostrai n, que satisfaz aos seguintes axiomas e teoremas:

:J

à

8;

o' J b; I

i)nEA

ii) Se A EA, então A EA iii) Se A e B EA, então AuB EA

O: D J

desta forma também valem:

g,

Tt0EA T2. Se A e B EA, então AnB EA n

T3. Se A"A2,

••••

n

:]1

,An EA, então UA, EA e nA, EA i=l

0,

i=1

O: Sigma-Álgebra satisfazendo:

A: Uma sigma-álgebra Aé uma classe de todos os subconjuntos do espaço amostrai n,

OI O'

i)nEA ii) Se A

'O

E

A, então

O

A EA ro

iii) Se A"A2,

••••

J

ro

,AnAn+1.EA, então UA, EA e nA, EA i=1

J

i=1

desta forma uma sigma-álgebra é sempre uma álgebra, e portanto, também é fechada para a união, intercessão e complemento.

a o 0,

Espaço Amostrai de um Experimento Estatístico é o par (n, A), onde n é o conjunto de todos os possíveis resultados do experimento e A é a sigma-álgebra de subconjuntos do espaço amostrai.

o!

o.

O, I EstatlsUca Geral

PtJginano

8

o

o

6

o,


-.

----------------------------'c"

"" ti

Jorge Festa

Partição: Uma Partição de um espaço amostraI il, é uma coleção de subconjuntos mutuamente exclusivos do espaço amostrai il, cujas uniões são iguais ao espaço amostraI il. Medida de Probabilidade

~

Co

e e e

Definição Clássica: Se um experimento pode ocorrer com n eventos mutuamente exclusivos e igualmente prováveis e se nAdesses eventos ocorrem com um certo atributo A, então a probabilidade de A é a fração nA/nou P(A) = ~

~

e

c c..c c co o

= n° resultados

favoraveis a A n° resultados possiveis

n

Definição Frequentista ou de Freqüência Relativa: A probabilidade P(A) de um evento A é o limite . nA I' nOde ocorrencias de A P(A) = I1m -= Im -------n ...• ro

n

n ensaios

n ...• ro

Definição de Probabilidade Geométrica (Gnedenko):

~

P(A) = area A

c'

c" e c c c

area il

área, comprimento ou volume. Definição Axiomática: Uma função de probabilidade P[.] é um conjunto de funções com domiIÚoA (uma álgebra de eventos) e contradomínio o intervalo [O, 1], que satisfaz os seguintes axiomas e propriedades:

~

c

c c c C

c

C Q

(i) P(A) 2: O (ii) P(il)

=1

(iii) Se A" A2,

••• ,

é uma sequencia de eventos mutuamente exclusivos em 00

A, Osto é, Ai nAj

= 0,

i '" j; i, j

= 1,,2, ...

) e se UAi EA, então i=1

00

00

P[UAil

= LP[A']

i=1

i=1

c

, c O

C

c c c

c c õ

o

,~

EslatlsJica GemI

PAgina

nO

9


o Jorge Festa

J

O

Propriedades:

:) P1 P(0)

O

=O

O

P2. Se Al, A2 •...• An são eventos mutuamente exclusivos em A, então n

O,

n

PIUA,) = LPIAi) i=1

O

i=1

O

P3. Se A é um evento em A, então PIA) = 1- PIA)

Q

P4. Se Al e A2 EA então P[Ad = PIAfA2)+PIA~A2) e PIA, - A2) = PI~2) = PIA,)- PIAI,Y>.2) P5.Se A, e A2 EA entãoPIAl uAd = PIAd+PIA2)-PIAl P6.Se A, e A2 EAe Al c A2,entãoPIA1)$PIA2) n

O

a

"J' I

nA2)

.~

o

n

P7. Se A" A2, ... , An EA, então PIUAi) $ELPIAi) i=l

I

Q ,

i=1

Espaço de Probabilidade: Um espaço de probabilidade é a tripla (n, A, P[.]), onde n é o espaço amostrai, A é uma coleção de eventos e P[.] é uma função de probabilidade com donúnio em A. Probabilidade Condicional: Se A e B são eventos em A, para um dado espaço de probabilidade (n, A, P[.]), a probabilidade condicional de um evento A dado o evento B, indicado por P[AIB] é definido por:

PIÂS) PIAIS) = PIS) se PIS) ) O,desta fonna

o: o'

,

O' 0'

01 J'

o' , o O. ,... V.

PIAS] = P[S).P[AIS) = P[AJ.PISIA).

.

J como P[AIB] é uma probabilidade, valem para ela todas as propriedades de probabilidade. A prova de que a proporção P[AB]IP[B] é uma probabilidade vem da verificação dos axiomas:

I

I

Oi o 01

Q~ ~ 0,

(i) P(AIS) = PIAS)' PIS) ~ O (ii) P(QjS) = PlnSl' PIS) = PIS)' PIS) = 1 (iii) Se A A2, •••• é uma sequencia de eventos mutuamente .exclusivos em " ro A, ~sto é, Ai nAj = 0, i;t j; i.j = t,2, ... ) e se UAi EA, então

,

o, a' O

o

i=1 ro

PIUAiIS) i=1

ro

O

= LP[A;iS)

o

i=l

J

o b

o o

o Q Es/a/lstica Gmal

PAginan" tO

o D

6

o


.

Jorge Festa Propriedades:

P1C. P[0IB) = O P2C. Se A,. A2, ... , An são eventos mutuamente exclusivos em A, então n

n

P(UA;IB)= LP(A;IB) i==1

i=1

P3C. Se A é um evento em A, então P(AIB) = 1- P[AIB] P4C. Se A, e A2 EA então P(A,IB) = P[A,A2IB) +P(A,A2IB) P5C.Se A, e A2 EA entãoP(A, vA2IB)= P(A,IB)+ P(A2IB)- PIAI nA2IB) P6C. Se A, e A2 EA e A, cA2• entãoP(A,IB)~P(A2IBl n

n

P7C. Se A,. A2, ... , An EA, então P[UA;IBJ ~ i=1

L P[A;IB) i=1

Teorema da Probabilidade Total: Para um dado espaço de probabilidade (n, A, P(.]), se BI, B2, ... , Bn é uma coleção de eventos mutuamente disjuntos em A satisfazendo:

n=

n

UBj

e PIBjl)

O para j

= 1, 2,

... ,n então para todo:

j=I

n

A EA. PIA) = LP[AIB;J.P(Bj) j='

Fórmula de Bayes: Para Um dado espaço de probabilidade (n, A, PI.]), se BI, B2, ... , Bn é uma coleção de eventos mutuamente disjuntos em A satisfazendo: n

n = UBj

e PIBjl)

O para j

= 1, 2,

... ,n então para todo:

j=l

A E A, P(BkIA) = ~[AIBk ).P(Bk) LP(AIB;J.P(Bjl j=1

Regra da Multiplicação: Para um dado espaço de probabilidade (n, A, P(.]), se AI, A2, ... , Ao são eventos em A, para o qual PIA1.A2 .... An.-.] > O; então:

P(A,.A2 .....An) = P[A,).P(A2IA,).P(A3IA,A2) ..... P[AnIA,.A2 ...An-,1 'V (f>. (\ '0(\ CP'&) : ?(A ). ?("iJ\ h- ) 7 (C ( A (\'!l).

"Me)

7 ('"P IA Eventos Independentes: Para um dado espaço de probabilidade (n, A, PI.]), seja A e B dois eventos em A. Os eventos A e B são definidos ser independentes se e somente se, uma das condições forem satisfeitas: ~

(i)P(AB] = P[A).P(B) O~P(AlB) = PIA) se P[B) > O (iii) P(BIA)= P[B) se P[A) > O

Esf8/lsUca GemI

Página nO

11


----------------------------------,~

o Jorge Fesla

Propriedades:

O Q

O

n. O evento

aleatório A e A é independente de si mesmo se e somente se P[A) = O ou P[B) = 1. 12. Se A e B são eventos aleatórios pertencentes a A, então: A e BC, AC e B e AC e BC também são independentes. 13. Se A e B são eventos mutuamente exclusivos pertencentes a A, então A e B são independentes somente se P[A) = O ou P[B) = O.

O

"..U,

O, Ü

O J' O O

O

?j

o'

01 O

01

oi OI

oi. , o'

o'

O

a:

---I VI

:J.

O

o

o

o o o Q

'O

o o o o Q

o

a

()

o

o Esta/lstica GemI

Pdginan" 12

::)

C>

o

ô~


.•. JoryeFesta

VARIÁVEL ALEATÓRIA, FUNÇÃO DISTRIBUIÇÃO, FUNÇÃO DE PROBABILIDADE E FUNÇÃO DENSIDADE DE PROBABILIDADE" Variável Aleatória: Para um dado espaço (O, A, P[.]), uma variável aleatória indicada por. X é uma função com domínio O e contradomínio os números reais, ~ que o evento X-I(-00, x] = {w:X(w),.:;x} E A, 'v'x ER . Função Distribuição

(Acumulada):

A função distribuição da variável aleatória X indicada por Fx(x),

é uma função com domínio os números reais e contradomínio o intervalo [O, 1), que satisfaz: Fx(x)=P(X":; xl =p[{w:X(W)":;xH 'v'x ER. ~

'-c

Propriedades:

e

FI. Fx(x) é não decrescente, isto é, x,.:;y, Fx(x),.:;Fx(Y)

t c o

F2. Fx(x) é continua á direita, isto é, se x, ,j..x, Fx(x,),j.. Fx(x)

~

o

'"'

c Q e """

Ci r"' """

F3. Fx(-oo) = O' e Fx(oo)= 1, isto é, se x, ,j..-00, Fx(x,),j.. O e se x,

t 00, Fx(x,) t t

Variável Aleatória Discreta: A variável aleatória X é dita discreta se o seu domínio é um conjunto finito ou infinito enumerável, ou melhor, se existe um conjunto finito ou infinito enumerável de valores {Xl, X2,..., x", ... } cR, tal que X(W)E{X X2, •.. ,x" ...} 'v'WEO. AfunçãoP(X=x;), i= 1,.2, ..., n, ... é " chamada função de probabilidade da variável aleatória X. Variável Aleatória Contínua:

,

que Fx(x) = P(X,.:;xl =

A variável aleatória X é dita continua se existe uma funçãofx(x) ~ O, tal

J fx(t) dt,'v'x ER, e então f(x) é a função densidade de probabilidade

da variável

o

aleatória X.

C

Função de Probabilidade: A função de probabilidade da variável aleatória X discreta, representada por P[X=x;) é qualquer função tal que para X(w) E{Xl'x2, ..• ,x" ...} 'v'w EO, tem-se:

C

(,

(i) P(X

c o c c o c

i=-<X:J j,

Função Densidade de Probabilidade: A função densidade de probabilidade da variável aleatória X continua, representada por fx(x) é qualquer função tal que:

00

J

(ii) fx (x) dx = 1

c

"

c c c

j

(iQ:LP(X = x;! = 1

o

C ç

= x I~O

00

-00

Se X é uma variável aleatória continua, então Fx(x) pode ser obtida da fx(x) e vice versa.

J

.. I Fx()x = oof x (U)d U ou fx ()X = d dFx(x) x ,on d exe . d'" llerenClave. -w

c C

b

o

Estal/sUca GemI

Páginan' 13


.......,....

.

é)' Jorge Fesla

Determinação da distribuição da variável aleatória fica determinada por qualquer das seguintes funções: a) Função Distribuição Fx(x). b) Função de Probabilidade P[X = x] c) Função Densidade de Probabilidade fx(x) d)Função

X: A distribuição de uma variável aleatória X

J

'J O :)

J

O

ilx

Caracteristica 'I'x(t) = E[e

O

)

O

::J

ESPERANÇA E MOMENTOS:

01

oi

Um conceito extremamente usual envolvendo vw;iável aleatória ou distribuição é a esperança.

::J:

Média: Seja X uma variável aleatória. A média de X indicada por 11,oU.E[x], é definida por: i) E[X=x]=

LX,

oi O

si

P[X=x) seXédiscreta

~

ii) E[X = x] =

f x fx(x) dx se X é contínua ~

iii) E[X = x] =

O

O O'

o

fo [1- Fx(x)]dx - f Fx(x) dx, para uma arbitrária variável aleatória X. -00

Obs.: E[X = x] é o centro de gravidade (ou centróide) da unidade de massa que é determinada pela densidade. "Medida de Locação"

gl ;j"

I

Variância: Seja X uma variável aleatória, e seja 11,a E[X = x). A variância de X indicada por cr~ ou Var[X = x] é definida por: i) Var[X=x]

= L(X-llx)2p[X=x)

,

= f(X-llx)2fx(x)dx

iii) Var[X = x] =

sex é discreta.

O.

01

sexécontinua

f 2 x [1- Fx(x) + Fx(-x)) dx -

O

O O

ll~ para uma arbitrária variável aleatória X.

b

Obs.: A variância de uma variável aleatória X é uma medida de espalhamento ou dispersão de da densidade de X. "Medida de escala" Desvio-Padrão:

b!

'"" VI

~

ii) Var[X=x]

OI J'

Se X é uma variável aleatória, o desvio padrão de X, indicado por cr x' é definido

O Q.

O

a

Q

como + .JVar[X = x) .

o

o o

;:]

a ~

J

o EstaI/sUes GenJI

PAginan

Q

14

o

o

b

Ci

_

J

I


.•.-----------------------------~

"c C-

C e

c e Q c

o c C é ~

ç ~

c

c

9 o o c

Jorge Festa

VALOR ESPERADO

DE UMA FUNÇÃO DE UMA VARIÁVEL ALEATÓRIA

Expectância: Seja X uma variável aleatória e g(.) uma função com domínio e contradomínio os reais. A expectância ou valor esperado da função g(.) da variável aleatória X indicada por E[g(X = x)], é definida por: i) E[g(X = x)] =

L, g(x) P[X= x]se x é discreta ~

ii) E[g(X = x)] =

f g(X= x)f (x) dx se x é contínua x

-~

Obs.: Se g(X = x) = X, então E[g(X = x)]= E[X = x] a média de X. Se g(X = x) = (x - 1l,)2 , então E[g(X = x)] = Var[X = x] Propriedades: i) E[ c] = c, OIide c é uma constante ii) E[ c g(X = x)] = c E[g(X = x)], para uma constante c iii) E[ Cl gl(X = x) + C2g,(X = x)] = c] E[gI(X = x)] + C2E[g2(X = x)] iv) E[gl(X = x)] ::; E[g,(X = x)] se gl(X = x) ::;.g2(X = x) Obs. Se X é uma variável aleatória, Var[X = x] = E[X - E(X)]2 = E[X2] - (E[X])2 se E[X2] existe.

ó

e

v o

o

o c c

c ~

o

C

c c ê C

e c o c o

c c c

c o

Q

Estaflslica Gemi

PAginan" 15


C). Jorge Festa LISTA DE EXERCícIOS

O :)

O

I) Suponha que n consiste dos elementos a, b, c e d. Seja B uma classe de subconjuntos de n, que não é uma álgebra e consiste dos conjuntos {a} e {b}. Enumere os conjuntos que contém a menor álgebra contendo {a} e {b}. 3, 4, 5, 6}. Mostre que a classe F = {0, {1,4}, {1,2,5},

2) Considere o espaço amostral n={l,."2, {3,4,6}, n} não é uma álgebra.

3) Considere o experimento de jogar uma moeda honesta 2 vezes, onde o resultado h=cara e t=coroa. a) Qual o espaço amostral deste experimento? b) Se a e b são 2 números positivos tais que a+b=l, assumindo que Pr{hh}=a2, Pr{th}=Pr{ht}=ab e Pr{tt}=b2 Qual a probabilidade de ocorrer cara no 1° lançamento? Qual a probabilidade de ocorrer cara no 2° lançamento? c) Podemos afirmar pelo enunciado do item b, que o evento assegura uma função de probabilidade, isto é, Pr {n}= I? Porque? 4) Quatro candidatos AI, A2, A3 e A. disputam uma eleição ao governo de um detenninado estado. Uma prévia eleitoral mostra que suas chances de vencer são respectivamente 0,4; 0,3; 0,2 e 0,1. As probabilidades que eles venham a promover mudanças substanciais, nos problemas de saúde neste estado, caso eleitos são respectivamente 0,6; 0,5; 0,4 e 0,3. Qual a probabilidade de ocorrer mudanças substanciais, caso o candidato AI seja eleito? Caso o candidato A2 seja eleito? Caso o candidato A3 seja

O

à CJ O

O O O O O

b Q 'O

8

01 d, O:

01

eleito? Caso o candidato A. seja eleito? 5) Considere 4 caixas. A caixa I contém 2000 componentes dos quais 5% são defeituosos. A caixa 2 contém 500 componentes com 40% defeituosos. A caixa 3 contém 1500 componentes com 15% defeituosos e a caixa 4 contém 1000 componentes com 10% defeituosos. Selecionamos uma caixa ao acaso e dela retiramos um simples componente. a) Qual a probabilidade que o componente selecionado seja defeituoso? b) Se o componente for defeituoso qual a probabilidade de que ele foi selecionado da caixa I? Da caixa 2? Da caixa 3? Da caixa 4? 6) Em um hospital foi verificado a seguinte relação: 5 em 100 homens são daltônicos e 25 em 1000 mulheres são daltônicas. Se uma pessoa escolhida ao acaso é daltônica, qual a probabilidade que esta pessoa seja homem? ~

01 OI

()

°I O, O O

O O!

01

t,

7) Seja t a idade de uma pessoa quando ela morre. A probabilidade to é dada por: Pr{T::; to} =

J a(t)dt o

onde a(t)=3xI0-9t2(lOO-t)2, O::;t::;IOOé uma função detenninada de uma tábua de mortalidade. a) Qual a probabilidade desta pessoa morrer entre as idades de 60 e 70 anos? b) Qual a probabilidade desta pessoa morrer entre as idades de 60 e 70 anos, dado que ela viveu mais que 60 anos? 8) Uma substância radiativa é selecionada em t=O e o tempo t da emissão desta particula é observada. Este processo define um experimento cujos resultados são todos os pontos do eixo t positivo. Suponha que a função a(t) é dada por: a(t) = ce-ct, t>O. Qual a probabilidade que esta partícula seja emitida no

Ó

O O

O O

O Q

O

intervalo (O, tO)?

O O

9) Dado P[A]=O,5 e P[AuB]=O,6, encontre P[B] se: a) A e B são mutuamente exclusivos, b) A é B são independentes, c) P[AlB]=O,4.

O

lO) Mostre

que

a função,

I

f(x)=--I['.b](x);-ao<a,b<ao

b-a

-

é uma

função

densidade

de

-O

16

O :)

probabilidade. Estallslica Gemi

Página nO

()

O /'"

"-

O

O~


•.~--------------------------

-

Jorge Festa

••• ••••

••• •••

11) Uma companhia produz circuitos integrados em três fábricas, I, 11, 11. A fábrica I produz 40% dos circuitos, enquanto a 11 e a ill produzem 30% cada uma. As probabilidades de que um circuito integrado produzido por estas fábricas não funcione são 0,01, 0,04 e 0,03, respectivamente. Escollúdo um circuito da produção conjunta das três fábricas, qual a probabilidade de o mesmo não funcionar? 12) Considere a situação do problema anterior, mas suponha agora que um circuito é escollúdo ao acaso e seja defeituoso. Determinar qual a probabilidade de ele ter sido fabricado por I, por 11,por ill. 13) A urna I contém duas bolas pretas e três brancas, ao passo que a urna 11contém três bolas pretas e três brancas. Escolhemos uma urna ao acaso e dela extraímos uma bola, que tem cor branca. Se a bola é recolocada na urna, qual a probabilidade de se tirar novamente uma bola branca da mesma urna?

••• •••••

••••

•••

14) Um restaurante popular apresenta apenas dois tipos de refeições: salada completa ou um prato à base de carne. 20% dos fregueses do sexo masculino preferem salada; 30% das mulheres escolhem carne; 75% dos fregueses são homens. Considere os seguintes eventos: H: freguês é homem A: freguês prefere salada M: freguês é mulher B: freguês prefere carne . Calcular: a) P(H), P(AjH), P(BIM); b) P(AnH), P(AuH); c) P(MIA). 15) Uma companhia de seguros analisou a frequência com que 2.000 segurados (1.000 homens e 1.000 mulheres) usaram o hospital. Os resultados são apresentados na tabela:

Usaram o hospital Não usaram o hospital

-

Homens 100 900

Mulheres 150 850

a) Qual a probabilidade de que uma pessoa segurada use o hospital? b) O uso do hospital independe do sexo do segurado?

•••

•••••

•••• ••••

•••

16) Um empreiteiro apresentou orçamentos separados para a execução da parte elétrica e da parte de encanamento de um edificio. Ele acha que a probabilidade de ganhar a concorrência da parte elétrica é de 1/2. Caso ele ganhe a parte elétrica, a chance de ganhar a parte de encanamento é de 3/4; caso contrário, essa probabilidade é de 1/3. Qual a probabilidade de ele: a) ganhar os dois contratos; b) ganhar apenas um; c) não ganhar nada . 17) Em uma fabrica de parafusos, as máquinas A, B e C produzem 25, 35 e 40 por cento do total produzido, respectivamente. Da produção de cada máquina 5, 4 e 2 por cento, respectivamente, são parafusos defeituosos. Escolhe-se ao acaso um parafuso e verifica-se que é defeituoso. Qual a probabilidade de que o parafuso venha da máquina A? Da B? Da C?

•••

•••• •••• •••• ••••

Estatlstica Gelai

PtJgina nO

17


Jorge Festa

18) A empresa M & B tem 15.800 empregados, classificados de acordo com a tabela abaixo. Idade \ Sexo menor que 25 anos entre 25 a 40 anos maior ue 40 anos Total

Homens 2.000 4.500 1.800 8.300

Mulheres 800 2.500 4.200 7.500

Total 2.800 7.000 6.000 15.800

Se um empregado é selecionado ao acaso, calcular a probabilidade de ser ele: a) b) c) d)

um empregado com 40 anos de idade ou menos; um empregado com 40 anos de idade ou menos, e mulher; um empregado com mais de 40 anos de idade e que seja homem; uma mulher, dado que é um empregado com menos de 25 anos.

19) Obtenha uma fórmula para P(AuBuC) 20) Um sistema é composto de três componentes I, 2 e 3, com confiabilidade 0,9, 0,8 e 0,7, respectivamente. O componente I é indispensável ao funcionamento do sistema; se 2 ou 3 não funcionam, o sistema funciona, mas com um rendimento inferior. A falha simultânea de 2 e 3 implica o não funcionamento do sistema. Supondo que os componentes funcionem independentemente, calcular a confiabilidade do sistema. 21) a) Encontre o valor da constante k tal que a função seguinte seja uma função densidade de probabilidade (fd.p.). b) Faça o gráfico da fd.p. encontrada. 22) a) Mostre que as funções abaixo são funções densidade de probabilidade (fd.p.): f,(x) = e-xI(o.~)(x) fz(x) = 2e-zxI(o.~)(x) f(x) = (6+1)f,(x)-6 b) Prove ou disprove: "Se fi (x) e f2(x) são fd.p.'s

fz(x),

0<6<1

e se 61+62=1, para 0<61,82 <I, então 8Ifl(x)

+8

2f2(x) é uma f.d.p." 23) Dada a função, fx(x) = 2e-zxIIO.~)(x). a) Mostre que esta é uma função densidade de probabilidade. b) Calcule a probabilidade de que X>lO. c) Calcule a probabilidade de que X esteja entre os valores 5 e 15. 24) Uma v.a. X tem distribuição triangular no intervalo [O, I] se sua fd.p. é dada por: fx(x) = CxI[O.lIZ) (x) + C(I- x)I[lIz.IJ(x) a) Qual valor deve ter a constante C, de modo que fl:x) seja uma função densidade de probabilidade? b) Faça o gráfico da fl:x). c) Determine P{~l/2}, P{X>l/2} e P{l/4~/4}.

EstallsUca G8nI1

Página nO

16


-

-

Jorge Festa

•••

•••• ,. •••

25) A v.a. X é distribuida normalmente com media 1000 e desvio-padrão 50. a) Encontre a probabilidade que X esteja entre 900 e 1100. b) Encontre a probabilidade que X esteja entre 850 e 1150 . 26) Um experimento consiste em arremessar uma moeda Z vezes e registrar, a cada arremesso, a face que caiu para cima: h=(cara) ou t=(coroa). Seja X o número de caras obtidas. a) Descreva extensivamente o espaço amostrai O, correspondente a este experimento. ...'L,'. ~!-I ~ U ~ b) Seja P={AQ,A},AZ} onde AQ={tt}, AI={ht,th} e A2={hh}. Mostre que P é uma partição de O e .

f •.. ~.

•••

determine, termo a termo, a álgebra A, de subconjuntos de O gerada por P (a menor sigma álgebra de subconjuntos de O que contém P). c) Podem-se definir, arbitrariamente, infinitas funções de probabilidade no espaço (O, A). Contudo só uma destas funções terá perfeita coerência fisica com o experimento real, onde a moeda arremessada é balanceada, isto é, com chances iguais de se obter h ou t em cada arremesso. Determine o valor desta função para cada elemento de A. d) Seja P[.] a função determinada em c). Mostre que no espaço de probabilidade (O, A, P) X é uma variável aleatória. e) Determine a esperança e variãncia da variável aleatória X.

•••• ••••••

••• •••••

••• •••••

27) Considere uma amostra sem reposição de tamanho 2 retirada de uma urna contendo três bolas numeradas de 1, Z e 3. Seja X o menor dos dois números observados, e Y o maior destes números. a) Descreva extensivamente, o espaço amostral O, correspondente a este experimento . b) Quais os valores que as variáveis aleatórias X e Y assumem conjuntamente? c) Encontre a função densidade discreta conjunta de X e Y (tabela de probabilidade conjunta). d) Determine a E(X), E(Y), Var(X) e Var(Y). e) Determine a Covariãncia e o coeficiente de correlação das variáveis aleatórias X e Y . 28) A v.a. X tem densidade gama fx(x) = c2x(2-1)e- I(o.oo)(x) . OX

••• ••• '" .•••. ••• •••.

a) Encontre a função distribuição. b) Calcule a média desta distribuição . c) Calcule a variãncia . 29) Mostre que se X é uma v.a. tendo distribuição simétrica em torno de zero, e se P(X=O)=O, então a distribuição condicional de xZ dado que X>o é igual a própria distribuição de X2 Obs.: Dizemos que a distribuição de X é simétrica (em torno de zero) se P(X9c) = P(JQ-x), para todo xe\R, ainda, P(X=O) = O=> P(~O) = P(JQO) = 1/2. 30) Seja X e Y v.a. com [d.p. conjunta dada por: fxy(x,y) = I(-x,x)(y) 1(0,1)(x). a) Mostre que f(x,y) é densidade ([d.p.). b) Calcule a E(X), E(y), V(X), V(Y), COV(X, Y). c) Calcule a E(XIy) e E(YIx).

•••

31) Se X tem distribuição Rayleigh, f(x) =

••••

a) Calcule E(X) e V(X) .

1 anxn-le-~I(o.oo>(x). (n -I)!

32) Considere uma urna contendo 3 bolas vermelhas e 5 pretas. Retire 3 bolas, com reposição e defina uma v.a. X igual ao número de bolas pretas. Obtenha a distribuição de X. Faça o gráfico da distribuição de X, fx(x), e da função distribuição acumulada Fx(x). ••••

EstallsUca Geral

PAginan" 19


Jorge Fesla 33) Repita a questão anterior, mas considerando extrações sem reposição. 34) Uma urna contém 3 bolas vermelhas, 2 bolas brancas e I bola azul. Uma segunda urna contém I bola vermelha, 2 bolas brancas e 3 bolas azuis. a) Uma bola é selecionada de cada urna. (i) Descreva o espaço amostrai deste experimento. (ii) Encontre a probabilidade de que as bolas sejam da mesma cor. (üi) A probabilidade de que ambas as bolas serem vermelhas é maior do que a probabilidade de ambas serem brancas? b) As bolas das duas urnas são misturadas em uma simples uma, e uma amostra de 3 bolas é retirada. Qual a probabilidade das 3 cores (vermelha, branca e azul) serem representadas quando a amostragem é feita: (i) com reposição, (ii) sem reposição.

J

35) Suponha que uma moeda perfeita é lançada até que cara apareça pela primeira vez. Seja X o número de lançamentos até que isto aconteça. Obtenha a distribuição da v.a. X. (Observe que, neste problema, pelo menos teoricamente, X pode assumir um número infinito enumerável de valores). Faça o gráfico da distribuição de X, fx(x), e da função distribuição acumulada FX(x). 36) Uma moeda perfeita é lançada 4 vezes. Seja Y o número de caras obtidas. Obtenha a distribuição da v.a. Y.

-'

37) Repita a questão anterior, considerando agora que a moeda é viciada, sendo a probabilidade de cara dada por p, o<p<l, p;t1/2. Generalize para n lançamentos da moeda. 38) A v.a. contínua X tem função densidade de probabilidade, fx(x)= 3x2 1[-1,0)- Se b for um número que satisfaça a -I <b<0, calcule Pr[X>bIX <b/2]. 39) Se X tem função densidade de probabilidade fx(x), calcule a densidade Y=X2 Sugestão: encontre primeiramente

a função distribuição

acumulada Fy(y)

de Y e depois a função densidade

de

probabilidade fy(y)= F'y(y). 40) A demanda diária de arroz em um supermercado em centenas de quilos, é uma v.a. X com função densidade de probabilidade fx(x) = 2/3x I[O,I)(X) - xl3+! I[1,3](X). Qual a probabilidade de em um dia escolhido ao acaso, de se vender mais do que 150 kg? 41) Examinaram-se 2.000 ninhadas de 5 porcos cada uma, segundo o número de machos. Os dados estão representados na tabela abaixo. Número de Machos O I 2 3 4 5 Total

Número de Ninhadas 20 360 700 680 200 40 2000

~

a) Calcule a proporção média de machos. b) Calcule, para cada valor de X, o número de ninhadas que você deve esperar se X:b(5,p), onde p é a proporção média de machos calculada em a)

Estai/sUes GemI

PAginan" 20

..I


...--------------------------------------

-

c c ~

ü

c Õ Ô

c c "

o

G C C

G o C

c

8o c

o o

e(;t

e

c-,' o

c c' \I

o o o ç;

Jorge Festa 42) Na tabela abaixo, X significa número de filhos homens em famílias com 12 filhos, Calcule para cada valor da variável o número de familias que você deveria esperar se X:b(12;0,5). X

Número, Observado de Famílias

O

6

1 2 3 4 5 6 7 8 9 10 11 12 Total

29 160 521 1198 1921 2360 2033 1398 799 298 60 7 10690

Você acha que o modelo binomial é razoável para explicar o fenômeno? 43) Houve uma denuncia por parte dos operários de uma indústria de que, toda a vez que ocorria um acidente em uma seção da indústria, ocorriam outros em outras seções mais ou menos no mesmo horário. Em outras palavras, os acidentes não estavam ocorrendo ao acaso. Para verificar esta hipótese, foi feita uma contagem do número de dias (24 horas por dia). Os resultados da pesquisa estão abaixo. Número de Acidentes por Hora O 1

2 3 4 5 6 7 8

Número de Horas 200 152 60 30 13 9 7 5 4

a) Calcule o número médio de acidentes por hora nesta amostra. b) Se o número de acidentes por hora seguisse uma distribuição de Poisson, com média igual a que você calculou, qual seria'o número esperado de dias com O, 1,2, ... etc. c) Os dados revelam que a suspeita dos operários é verdadeira ?

(;

c c ç c c c ç

o

c o o 0, c

Estallslica GenJI

PtJgina nD

21


----------------------------------~ Jorge Festa

44) Uma certa região florestal foi dividida em 109 quadrados para estudar a distribuição de Primula Simenses Selvagem: A priori, supomos que este tipo distribua-se aleatoriamente na região. O quadro abaixo indica o número de quadrados com X Primula Simenses; o número médio de plantas por quadrado foi de 2,2. . ..... X Plantas por Quadrado O 1 2 3 4 5 6 7

O O O

5 4 1 O

a) Se as plantas realmente se distribuem aleatoriamente na região, qual a probabilidade de encontrarmos pelo menos 2 Primulas? b) Dê as frequências esperadas para os valores de X=O, X=I, X=2, ... etc. c) Apenas comparando os resultados de b) com as frequências observadas, qual a conclusão a que você chegaria? d) Quais as causas que você daria para a conclusão? 45) Os dados abaixo representam uma amostra de empresas de um determinado ramo de atividade de uma região. Foram observadas duas variáveis: faturamento e número de empregados.

o aIO 10 a 50 50 a 100 100 a 200 200 a 400 400 a 800 800 a 1600 1600 a 3200 3200 a 6400 mais 6400 Total Oa20

20 a 50 50 a 100 100 a 200 200 a 400 400 a 800 mais 800 Total

O

O

O

~.) ,

O :)

O',

26

gi

24

(1

20

N° de Empregados

O O O

O O:

N° de Empresas 18 52 30

-

o. d O O

14 11 4

Faturamento

O O

O

23

acima de 8

O

O

Número de Quadrados com X Plantas 26 21

8

8.

16 14 6 4 210

O

N° de Empresas 35 75 45 30 15 8 2 210

o

I

I

O

a o o O .J '"

Q

o Q

o

a

a) Calcular a média e a variância para cada variável. b) Supondo normalidade para cada uma destas variáveis com os parâmetros estimados pela amostra, calcule as frequências esperadas para cada classe.

o, O'

o

£stat/sdca Gen1/

PAgina nO

22

o o o

o

0-,


-w---------------

•••

••• ••• •••

•••

•••••

••• •••

••• •••• ••• ••••

Jorge Festa 46) Considere duas variáveis aleatórias X e Y tendo uma função densidade conjunta dada por: fxy(x,y) =e-(x+y)l(o,~)(x) l(o,~)(Y) a) Encontre as densidades marginais de X e Y. b) As variáveis X e Y são independentes? c) Encontre a esperança de X e a esperança de Y. 47) Muitos experimentos são tais que os resultados possíveis apresentam ou não uma detenninada caracteristica. Uma moeda é lançada: o resultado é "cara", ou não é; um dado é lançado: ou ocorre face 5, ou não (ocorrendo, então, uma das faces 1,2, 3, 4 ou 6); uma pessoa é escolhida, ao acaso, entre os moradores de uma cidade e pergunta-se se ela diz "sim" ou "não" a um projeto da prefeitura, Estes experimentos resultam numa variável aleatória de Bernoulli e também são chamados "ensaios Bernoulli". A função de probabilidade discreta que uma variável aleatória, digamos, X assume é dada pela função de probabilidade: f(x) = pXql-xI(o,I)(x), O:S p:S I, (q = 1- p) a) Encontre a E(X). b) Encontre a Var(X) c) Encontre a função geratriz de momentos, Mx(t), da variável aleatória X. d) Através da função geratriz de momentos, encontre a média e a variância da variável aleatória X. 48) A dístribuição de Poisson é largamente empregada quando se deseja contar o número de eventos de um certo tipo, que ocorrem em um intervalo de tempo, ou superncie, ou volume. Esta distribuição é chamada distribuição de eventos raros, tais como: número de chamadas telefônicas recebidas em uma central durante um intervalo de tempo pequeno, número de falhas de um computador em um dia de operação, número de acidentes ocorridos em um cruzamento, etc .. A sua função densidade discreta é dada por:

••••

fx(x) = ~e-ÀÀ.xI(o ~)(x)

xl

••••

•••

••••

••• •••

'

a) Encontre a média e variância da variável aleatória X. b) Encontre a função geratriz de momentos da variável aleatória X. c) Através da função geratriz de momentos, encontre a média e a variância da variável aleatória X. 49) A distribuição geométrica é a distribuição do tempo de espera até que ocorra o primeiro sucesso em uma sequência de ensaios Bernoulli com probabilidade p de sucesso. Suponha o lançamento de uma moeda, independentemente, não necessariamente honesta. Seja X o número de lançamentos até o da saida de cara, inclusive, Dizemos então, que a variável aleatória X tem distribuição geométrica com parãmetro p, e a sua função de probabilidade é dada por: fx(x) = p(l- P )(1-X)1(1,2 ...) (x) a) Mostre que é uma função de probabilidade discreta. b) Encontre a média e a variância da variável aleatória X. Dica: O limite da soma de uma progressão geométrica. ilimitada é dada pela expressão: lim S" II-n.

= ~, }-

q

onde q é a razão e aI é o primeiro termo.

•••

••• •••• ••••

EstallsUea Genú

Página

nO 23


51 Jorge Festa 50) Um experimento consiste em lançar dois tetraedros regulares, com faces numeradas de I a 4, e registrar os números das faces voltadas para baixo. Seja X o maior ou igual dos números observados e Y o menor ou igual dos números observados. a) Descreva extensivamente o espaço amostral correspondente a este experimento. b) Quais os valores que as variáveis aleatórias X e Y assumem conjuntamente? c) Construa a tabela de probabilidade conjunta de X e y'. d) Determine a E(X), E(Y), Var(X) e Var(Y), Cov(XY) e o coeficiente de correlação entre X e Y. 51) Se XI, X2, ..., Xn são variáveis aleatórias independentes, cada Xi com a mesma média 11 e mesma variância cr2 Calcule a E(x) e a Var(x), onde

x =~ n

i Xi i=1

O

3/20 1/20 4/20 8/20

O O

d O O

O

O OO O

O

52) Considere a distribuição conjunta X e Y dada pela tabela abaixo: Y\X 1 2 3 P(X=x)

O O

I 3/20 1/20 1/20 5120

2 2/20 2/20 3/20 7/20

O O

P(Y=y) 8/20 4/20 8/20 20/20

O O

O O

01

a) Determine a E(X), E(Y), Var(X) e Var(Y). b) Determine a Covariância entre X e Y. c) Qual o valor do coeficiente de correlação, p(x, Y). d) As variáveis X e Y são independentes? Porque?

O O

O O

53) As variáveis X e Y tem distribuição conjunta dada por: fxy (x,y) = (x + y)I(o.l)(x)I(o. I) (x)

O, OI

a) Mostre que a distribuição acima é uma função densidade de probabilidade. b) Encontre as distribuições marginais de X e de Y. c) Determine a esperança de X e a esperança de Y.

o.

gl

54) Defina Variável Aleatória, apresentando exemplos, no caso discreto e continuo.

oi

55) Um experimento consiste em arremessar uma moeda 3 vezes e registrar, a cada arremesso, a face que caiu para cima: h=(cara) ou t=(coroa). Seja X o número de caras obtidas antes de .ocorrer a primeira coroa, e Y o número de caras obtidas. a) Descreva extensivamente o espaço amostral n, correspondente a este experimento. b)Seja n={Ao,A},A2,A3} onde Ao={thh,tht,tth,ttt}, Al={hth,htt}, A2={hht}e A3={hhh}. Mostre que S é uma partição de n e determine, termo a termo, a álgebra A de subconjuntos de n gerada por S (a menor sigma álgebra de subconjuntos de n que contém S). c) Podem-se definir, arbitrariamente, irifinitas funções de probabilidade no espaço (n, A). Contudo só uma destas funções terá perfeita coerência fisica com o experimento real, onde a moeda arremessada é balanceada, isto é, com chances iguais de se obter h ou t em cada arremesso. Determine o valor desta função para cada elemento de A d) Seja P a função determinada em c). Mostre que no espaço de probabilidade (n, A, P), X é uma variável aleatória.

oi O O

O

:;

O O O

O O'

6

1

o. 01 O

Eslallstica GemI

Ptlginan" 24

°I o: O O,,)


• \)

C'

q,

o 9 c

Jorge Festa 56) a) Mostre que as funções abaixo são funções densidade de probabilidade (f.d.p.): fj(x) = e-xI(o.~)(x) f2(X) = 2e-2xI(0.~)(x) f(x)=(6+1)fj(x)-6f2(x),0<6<1

O ~

O

b) Prove ou disprove: "Se fl(x) e f2(x) são f.d.p.'s e se 61+62=1, para 0<61,62<1, 6lt(x)

então

+ 62fix) é uma f.d.p."

O

c'

é o

Q

9:

e \3

c. C o '-'

o o o é

Q ~

º

o

o

Q.

o o

"

\)

V

o c o o o o o o o c o o

º ,

Q

57) Um sistema é composto de três componentes 1,2 e 3, com confiabilidade C}, C2 e C3. O componente Cl é indispensável ao funcionamento do sistema; se C2 ou C3 não funcionam, o sistema funciona mas, com um rendimento inferior. A falha simultânea de 2 e 3 implica o não funcionamento do sistema. Supondo que os três componentes funcionem independentemente, com distribuição exponencial com parâmetro (média) igual a 1, calcular a confiabilidade do sistema. 58) Se X e Y tem distribuição conjunta dada por, fxy(x,y) = 21(0.y)(x)l(o. j)(Y)' a) Encontre a Cov [X, Y). b) Encontre a distribuição condicional de Y dado X=x. 59) Considere uma amostra de tamanho 2 retirada sem reposição de uma urna contendo três bolas, numeradas de 1,2 e 3. Seja X o número da primeira bola retirada e Y o maior dos dois números retirados. .. a) Encontre a função densidade conjunta de X e Y. b) Encontre a P[X=11 Y=3] c) Encontre a Cov[X, Y). 60) Considere uma amostra sem reposição de tamanho 2 retirada de uma urna contendo três bolas, numeradas de 1, 2 e 3. S~a X o menor dos dois números retirados e Y o maior. a) Encontre a função densidade conjunta de X e Y. b) Encontre a P[X=11 Y=l] c) Encontre a Cov[X, Y). 61) Considere duas variáveis aleatórias X e Y tendo a função densidade de probabilidade conjunta: fxy (x,y) =

1

"2 xy 1(0.x)(y) 1(0.2)(x).

a) Mostre que f xy(x, y) é uma densidade. b) Encontre as distribuições marginais de X e Y c) X e Y são independentes, porque? 62) Seja fxy (x, y) a) b) c) d)

= e-(x+y)I(o.~)(x)l(o.~)

(y).

Mostre que fXY(x,y) é uma densidade. Encontre as distribuições marginais de X e Y X e Y são independentes, porque? Encontre P[X> 1].

Estallstica Gtm11

Páginan" 25


Jorge Festa

63) Um experimento consiste em lançar uma moeda honesta três vezes. Seja X a variável aleatória que indica o número de caras que ocorrem no primeiro e segundo lançamento, e Y, a variável aleatória que indica o número de caras que ocorrem no segundo e terceiro lançamento. a) Encontre a distribuição conjunta de X e Y. b) Encontre a distribuição condicional de Y dado X=1. c) Encontre a Cov[X, Y]. 64) Considere o experimento de lançar 2 tetraedros (poliedros de 4 lados) regulares, com faces numeradas de 1 a 4, e observar as faces dos tetraedros voltadas para baixo. Seja X a v.a. indicando a face do primeiro tetraedro observado e a v.a. Y indicando o. maior ou igual número das faces observadas. a) Represente graficamente o espaço amostrai deste experimento. b) Quais os valores que as variáveis aleatórias X e Y assumem conjuntamente, associe a cada valor a sua respectiva probabilidade. c) Encontre a Fxy(x,y), para (x,y) = ( 3, 3). d) Encontre as marginais de X e Y. e) Determine a E(X), E(Y), Var(X) e Var(Y)

J ...I .;

..J

-,

65) Considere a função bivariada fxy(x,y) = (x+y) 1(0, 1) (x) 1(0, 1) (y) a) Mostre que esta função é uma densidade. b) Encontre a marginal de X e a marginal de Y. c) Calcule a média de X e a média de Y. d) Encontre a Var(x) e a Var(Y). 66) Sejam X e Y v.a.'s independentes, cada uma com distribuição exponencial de parâmetro 1. Provar que (X + Y) e X também são independentes e achar as suas distribuições.

y

67) As v.a.'s X e Y são independentes. X é distribuida exponencialmente

com parâmetro a e Y é

distribuída exponencialmente com parâmetro ll. a) Encontre a distribuição de Z = ~ . b) Encontre a

...•

distribuição de W = (X - Y). 68) Sejam X e Y v.a.'s i.i.d., cada uma com distribuição normal-padrão.

a) Qual a distribuição de

Z = X? b) Qual a distribuição de X2? c) Prove que se as v.a.'s X e Y são i.i.d., então as v.a.'s Y U

=

(X - Y) e V

.fi

=

(X + Y) também são v.a. 's i.i.d. com distribuíção normal-padrão .

.fi

EslatlsUca GemI

Página nO

26


---....----------------------------------,----Q

c,

c

0,

Jorge Festa

Distribuições Discretas

C C

O O /

O Ç7 C

C

C O

9

e \J ~~.

C C CJ

ç

o ç C

"ç. 'O

o c

.~'

c C

o o o c c.,;, o o c o c C

c

o

c

Ô

c

o b o

• Uniforme ou Retangular f(x)

1

= --1(, b-a

bJ(X); - 00

'

< a, b< 00

• Normal f(x) =

cr

~exP[-(x-Il)2

/2cr2]I(~,OO)(x),

f(x)

< Il < 00; cr > O

,

• Exponencial f(x) = 1£""1(0,00)(x); Â. > O • Gamma

-00

21t

()~

/'

= ~x'-'e-""I(o

;9,

~ 00)

r(r)

,

t

li,

(x); Â. > O; r > O

• Beta 1

_

f(x) = ---x' B(a,b)

'(1-

X)b-I

1(01) (x); a > O; b > O ,

• Cauchy f(x)

=

()

1

2 I(~ OO)(x);1t/3{1 + [ x - a 1/3]} ,

00

< a < 00; /3 > O

Estal/stica Gtm1I

PAg/nano 21

I I


-------------------------~~-......c_ J JorgeFesla • Lognormal 12,

f(x) =

~

v'27t exp[ -(logo 2x

x-

Jl)

2

/20

]1(0.00)

(lê); -

00

< Jl < 00; o > _

o

• Dupla-exponencial f(x) = 2~ exp( Jx ;al}(~.oo)(X);

-

00

o

:> o o o

o

o

< a < 00; Ib O

O •

• Weibull

o

f(x) = abxb-1 exp[-axb]l(o.oo)(x); a> O; b > O

o

• Logistica F(x) = [I + e -(x-aY~r! I(~.oo)(x); -

00

Q

< a < 00; 13 > O

o'

o o o o

• Pareto

ex. f(x) = x.+~ I(x•. 00) (x); Xo > O;

e>o

• Gumbel ou Valor extremo F(x) = exp( -e -(x-aY~)I(~;.

00)

(x); -

00

o

< a < 00; 13 > O

o

• Distribuição t - Student" s f(x)=1(k+I)/2] r(k / 2)

1

JkiC

o

I 1 (x), bO (1 +x2 / k)(k+1Y2(~.oo) ,

o

o

• Distribuição F r(m+n)/2] f(x) = r(m/2)r(n/2)

(m)m/2 x(m-2Y2 -; (1+(m/n)xt+n)/2

o

'._ I(o.oo)(x),m, n -I, 2, ...

o o

o o

• Distribuição Qui-quadrado

_ I ) (I) f(x) - ( -

'/2

r k/2

2

Yz-! e -(Yzl' 1(0 OO)(x), . k -I, _ x .

2, ...

.

O' ()

o O'

o

o o o oo o o o a o o

Estatlstica GetaI

Página nO

28


--~-----------------------------------;;, C C

C

c,

c o o

c é C-

c" Ó

o ~

9

e ~.

o

ç "0 ••

o o o c C Q o o

.;'

c O Q

c o o e O c o o o o o (, o o o o

"

o

c

~

Análise Exploratória de Dados • CapItula J - Resuma de Dadas .Introdução • Tipos de Variáveis • Distribuição de Freqüências .Representação Gráfica das Variáveis Quantitativas .Ramo-e- folhas

r:

. ~r :

!~


~

Cl Q ....•.

I",.:

C

C

o q c

INTRODUÇAO • o que

é ESTATÍSTICA? - É fundamental na análise de dadas provenientes de quaisquer processos onde exista VARIABIUDADE. - Uso de informações na: coleção, apresentação, análise e tomada de decisões, paro solucionar problemas.

Ô

c C' /

C

C

e

" "c o

5q

c'

~

,

9 e v (;I c

Estatística • lima estatística é uma quantidade que é calculada das dadas amastradas. Ela é usada para dar informações a respeito de valores desconhecidos da correspondente populaÇÍÍo. Por exemplo_ a.média dos dados amostrados é utilizada para dar informaÇÍÍes sobre toda a média da população da qual a amostra foi retirada~.j~

(;';

o

º

p

5"

c

-/fl\' fi

••

_'_

o

c

c o

o

GRANDES ÁREAS DA , ESTA TISTICA

o

• Amastrtlgem e planejamento de experimentos • coleção ou coleta de dados • Estatística descritivrz • organização, apresentação e sintetização de dados • Estatístico inferencial • métodos para tomada de decisões, nas situações onde existem incertezas e \)1 "r:: VARIAÇOES. sr; c'

c

o

Q

o o t

o o

9 C

O O

O O O

-:Z'f


~--------------------------------------------------••••

••• •••

-

••••

AMOSTRAGEM

••••

• É o processo de escolha da amostro. É a parte inicial de qualquer estudo estatístico . Consiste na escolha criteriosa dos elementos a serem submetidos ao estudo. - Ex. Pesquisas sobre tendências de votação . • escolha da amostro, redação do questionário, a entrevista, a codificação dos dados, a apuração dos resultados são ETAPAS FUNDAMENTAIS deste tipo de pesquisa~~',(.

••••

••• ••••

•••

.r', '.

'7

5"

••• •••• ••••

~STATÍSTICA

••••

DESCRITIVA

• É D ptIrte mais conhecida. Quem vi (1 noticiário, na televisão ou nos jornais, sabe quõo freqüente é ti uso de média, índices e gr;Jficos nas notícias.

- Exemplo: • O INPC, Índice Nacional de Preços ao Consumidar - Aumenfl>dos produfl>sda cesta básica.

••••

• Anuório EstatísticD Brasileiro - educaçQo, saúde, transporte, SI!

'ç

cultura etc.

••••

-

••••• ••••

6"

Estatística Inferencial .A estatística

Inferencial faz uso das informações retiradas da amostra para conclusões (inferências]. a respeito da população da qual a amostra foi retirada .

•••

••••

•••• ""'

-

•••••

••••

-

cp


\,)

c c o e o o c o o o. o o ~.

üi

POPULAÇAO E AMOSTRA

• o utudo

de t/UDlquer fenÔlnellD, sejo ele IIDfufY1l,

stJeía£ eCDnâmico ou biDlógico,

exige~tlcoleta

í1S'

7

9

e

onálise de dodos estatísticos. - PD(JtJloçiioé o coleção de todos os obsertlflÇÕt!$ sobre determinado fenÔlnellD. - AIIIDS1TYJ é o co'liunte de dodos efetivamente observados, ou extrrIfdos da papulaçiia. • Exemplo: Determinaçiio do consuma de álea diuel em 6nibus, avaliaçiia de um program", d"./ ensina, rendo média per capite em di •••rs~h •.;.. r: rgregi6es do pt1ís etc.

e Q

O C O C C

o

c ~

A

INFERENCIA • A temado de decisiies sobre a papulaçiio, cam base nas dados da amostra, canstifui o problema centrrll da INFERÊNCIA ESTATÍS77CA. • A tais decisões estão sempre DssociadtlS um grtlu de incerteza B. cDnseqüentemente, uma p1Y1babilidade de erro. - Exemplo: Tute sabre medicamentas,

o

experimentr1s CDnsumo

ç;

e o c o o

r

1

C

o

o o

"o ~-

c c o o o o

" ti

agrícolas, energia

antíJise financeif'Q,

etc.

fi

APRESENTAÇÃO DADOS

o er Ó

de

DE

• Técnicas que permitem detectar e carrigir erros e inconsistências ocorridos durante um prtH:esso de coleta de dados e determinar as principais características destes dados. - Grupamento de dados; - ConstruçQo de distribuições de freqüência; -Gráficos. -:.~I~ ,., sr:

'13

li\


-,..--------------------------------------------

IQ o c o c

o c c o v o• o e o ev

"

Tipos de Variáveis • Qualittltivrl ' - Nominal • Regiãa de Pracedência - Ordinal • Educaçãa, CltJSse Social • Quantittltivrl - Discreta • Número de Filhos

- Contínua r

C"• Peso

r

de Indivíduos,

Salários em R$

o

C Q

o ú o c (;) o ç, o

61

GRUPAMENTO DE DADOS

18\?

172

170

l\?I

189

In

184-

175

I\?2

177

178

179

170

1\?8

l\?g

170

18\?

188

189

l\?O

175

184-

1\?1

179

172

189

174-

171

I7\?

188

rI

o

li

C C

o

(;

~ONSr.qUÇAÕ DE l!{STRIBUIÇÕES DE FREQUENCIA Alturas em em. de 30

O

o o c ,-.,

'"' t; o

(I (.I

\)

o o o o

ti

Li.a.

ea. •• 1 :I .J

• .$

U>o1 ~

I'<>nt"

r

Zn:tooriot

~d

15:2.000 161.000 172.000 177.000 llU.(l(IO

15'7.000 172.000 ln.OOO 1&'.000 1i7.0llll

••

NW1"

atlefllS

7rwqiMnci.

,.~oj;..

lU . .5llO 16"9.500 174.500 179.5<'0 J'4.500

" , 11 " J

rr.qü ••.•"Lo

_tau... ".133 IJ.~ 11.261 IJ.zrJ(J 0.100

,,~.

J'Ewoqü"<1i<l. -.1.

"O.U.! 13 2J Z1 30

ADUlO

D•• .J.! 0.700 o.~ 1.000

_i1,-

~-=-~;;--~;;-;::~-:-~~;;;;-~-=-;;~-------\ jl ....•:

CP

a

'5

__

.•••...


'e"

IQ

o ç o ()

o o

GRÁFICOS

c o

': I.

'oº"

o ~ cp e. v

I

f

7

!_

•i

•l

.• '.

J ;-

z ;i-

1

• L_~__~ 1S7

112

~ ~~_~~ _~ " ~_~ ~-\_/187

1n

112

lU

111

Muru

c;o;

• "

C~

ç. c o

GRÁFICOS

o

o

o

,• '" ;o;

c

til

n n n

o

"••

lU

""",,

,'_

//

/ /

(I

{;

In

m

lI.tu•••

"~

o

o

172

,~ a'

o o

o c o o o

111

GRÁFICOS

Q

o

,u

fl

o

G C

~.

,,

(;t

o c o o o o o

-

" •,~

171

r

r

e"

,n

112

.

1'Z"

l/

"/:rf


5 o ç c o o ç c o

~

GRUPAMENTO DE DADOS NÚInttrtJd~ filhDs em 25 faml1ias observados

c

º

c o c

'"

sr;

o

I

2

g

4

5

1

I

2

2

2

g

g

2

2

g

4

5

I

2

2

g

2

g

2

!

, ,

C fO

,

e. o 9'

c, c

u

U"" .

CONSTRUÇAO DE DISTRIBUIÇÕES DE FREQÜÊNCIA

o c o o ~ o

"o G

Número de filhos em 25 fam/1ias observadas :Lime. C~

••

"J.• a.

Zntu .•"r

&\.!per.l"..

-o. soou

O.~llO 1.~"O 2.!J(l1Ul 3.5000 4.5000 .5 . .5000

O.SOOU

L!lOOO 2.5000 3.5000 ( .3000

$"

p".,t<>

r •.•qUlnct.

HIicU" .-r.qJ'n<>Je

, • ",•

,.~

,.~ 2.000

,.~

,

,.~ 4.000

•• !.oU... 0.0400 0.1600 0.4000 0.2400 0.0800 0,01100

S7?

"

o

e

,

o

GRAFICOS

(I

o

"

o

1

o

\.7

(,)

\i

o (,)

c c o o o o c

to!

C"

rnqU.6ncJ.. " ••••• l.odo

,, " "~ ~

, •.-.qUIno.l. "')."""'" 0,0400 O.:JOOO 0.6000 0,'400 0,':00 1.0000


'ó Q

ç C;

Ó

o o c Õ c.

GRÁFICOS

'-

Poligono

"•

/ /

.' CP

,

'.

---',

".

e??

e o. o ç

Análise Exploratória de Dados

" c o o

• Capítulo 2 - Algumas medidas associadas a variáveis Quantitativas .Medidas de Posição .Medidas de Dispersão .Outra Estratégia de Análise .Desenho Esquemático

o ú

o ~

\)

j' \

!

9 o

"c.(;t

do F........."au

cr'

'r

c

p

O & O

Estatísticas

OC O O

e

c ~ o C O O O O O

C

\;

foi

cu

Descritivas

Tamanho da Amostro

Amplitude

Midia

Mediana.

Quarfil Inferior Quarlil Superior

Moda

Interwllo Inter-quortil

Média Geométrica

Assimetria

Voriônc;o DeswD-padrão ErrD-padrão

Assimetria Padronizada

''$kewnwss''

Mínimo

CurlDse "KurtDSis" CurlDse Padronizada CDe'ficiOlte de Variaç6À..j/

Máximo

SD",tltório

-", 1'1$


Q

C

C

o o c

o..•. C-

o o 9

Estatística Clássica .5upDsições Probabilísticas das Variáveis En""Mdas .Declaroções sabre os Parâmetros ou Modelo Utilizado .Noções Assintáticas de - Consistência - VDriâncía - Eficiência

O

c e co o

"Grandes Amostros

N

"11SE A ESTATÍSTICA COMO O BÊBADO liSA ,OS POSTES - MAIS PELO APOIO QIIE PELA ~i/ , IWMINAÇAÕ"/'!:::é'"' st'

77'

••••••••"""iW'M_

Aná"r ' .•

o

ç Q

C

"oc

121

• Tukey J. W. (1977) - Técnicas Visuais Dados = Modelo + Resíduos Modelo = parte Suave Resíduos = parte Grosseira

C1

o

y=

ç \,)

Análise Exploratória de Dados

r

(

Xp + £

C 75

c

"

o

'eo"

121

e

• Ferramentas Principais -Ramo-e-folhas - ''Stem-andLeaf'" -Esquema de cinco números - ''5number summary" - Desenho Esquemático -

o

e c o

" e

"o ~

o

o

o

Análise Exploratória de , Dados

rI

cu


[; o

c c. o o ç. c c

Ramo-e- folhas • Apresentação RAMO - à esquerda da linha vertical FOLHAS - à direita da linha vertical • Vantagem sobre a Tabela de Freqüência: - Não perdemos informação - Número de linhas é equivalente ao \ / número de classes ~l~

o o o o

'"

o c~ o

.[.t,' __

Frra??

o

t:

Q C

CONSTRUÇAO DE >ISTRIBUIÇÕES DE FREQÜÊNCIA

o c

Alturt1$ em em. de 30 atletas

o" "o o

u..t.. C:a.-_ 1~ ••.J. •• ,"" 1 •• 3 • 5

lU.OOO 167,000 172.0"0 111.000 IU.o"a

.I.J.a.le. ""'... MioU..

~....

U7."""

114.500

4

I72.000

IU.SOI)

111.000 162.""" 187.000

J74.IJQO 17'.500 u •• ~o

• , 3

~:-:-;;;~;;;---;,::;:-;:~:-:-;:-;;;~;----;.:;::-:-;;;~;--

o

sl

U

Di-..it.l

2 4 lO

V~,.Jo.

foS'iV'

C

( .•.•Lyt.()13

~

Ij lJ~lor

~~cl,\:a..vo

~ ..,

O O

co:

••• _

16r1 /

...•-tc;iha.

0.".7 0,2"0 0.100

•••••••

"'l . 4

13

21 27 .!lo

.l_

0.133 0.• " 0.700 O.SIO., •. 000

.. ------------\..1

-"1..,;,.. (1S-

p•••

(()

~

.IL:nat&S;

utúdol'" •• 1

( £[))

o

;

.te--Úr:.... &C.."....,.

••••..•. '..v. ,-O

16Bln 16<>!8lIP.!t 17"10001 P"UlJ

~:::;'

11

n"ll!ll

6 3 I 1

111'1011 lft'ln 10"1 . 18"16

O

C

0.133 0.300

~

RAMO-E-FOLHAS

D-:.. C Il '-"

"'-Lo...

,..."... •••• ú

In

o c o o o

i'-'

~=U

rr..q;;""...... "'laU...

"v--

nC'AAAO

A

:lirZd~ ~

" v-.~ê";...,-o ,

en

'"

O O C O

,. O ~

1


,-•

\"I

C C ç

o o ~

c o c.

tbNSTRUÇAO DE '?{STRIBUIÇÕES DE FREQUENCIA NÚ1ÍI£fYJ de

4úút..

ClAoI_ U>t'.,dor

o

c c o

"

1 Z

,li • .5 "

f,'lhos

L.I..Iioit.. _... S<lperloz >MdJ ••

..0 •.500<1 0 •.500<1 l..5OD<! 2 •.500<1 3 •.5000 •• 5000

0.5000

0.000

L5IUID

1,_

Z.!KKJO 3 •.5000 ,.!j(/{J(I .5..50<:10

2.000 3.000 '.000 5._

em

25 fam/1;lls

'~ah.

n-p.-....J. 1 •

10 6 :I. Z

obserW1dos

~d.a

","utJ._

~"W

""""""-l..ta ,..1. ~

O.04C7<l 0.1600 0.(1)00 0.2.00 O.Ollll" 0.0800

1

O.O.DO

.5

0.2000 0."_ O.UOO 0.9::«> 1.0000

15 21 23 25

li

~:-:-;-:---~~:-;~;:-=-~-;.;;;;---=:;;:-:-;--------------------"S FI!

/!'\<~ __

eu

c o o

c o c o ú o o o o c c o

"

'"~ o o "c

RAMO-E-FOLHAS .5

(IIIJ 10

"

5[0[

o c o (j o o

c ç,

o

c

0

3100000C/

.100

8 17

Esquema ou Resumo de 5 Números

o

c o

11‫סס‬oo

210 __

Sugestão (Tukey) - 1977 (i) ti mediano (ii) os extre111DS (mini"", e mDximo) (il'i) os quartis ou juntos (inferior e superior)

A Mediana é uma Medida Resistente, não é afetada por valores extremos. .0 Média amostraI e (1 lJes.lio-padrão são afetados pDr •• IDres~mDS \ enãD temos idéia quanto li simetria da distribuição dOS...da'dDS~

1/

O"

cu

/f~ (\

J


~

o c o

"o Q

C

c o o o o o o o o o o

"

Desenho Esquemático

_~ir;~üJ_

'VM DESENHO ESQVEMÁTICO OV GRÁFICO DO ESQVEMA DE 5 NÚMEROS VALE MAIS QVE 1000 PALAVRAS" eYtlIDrQ eYtlIDrU

Jl =

r

I

10

E

r

1Jd.1 '\r "

Mi"

Ol/TLIERS

fp.t ff.t

abaixD da Jl - 3/2 dJ acima da J3 + 3/2 dJ, Dnde quarfil, J3 = 30 quartil e dJ = J3 - Jl

1??s[f'

.:1....f :

i t;:. "'''$ -=O;"\\íe<ç

I~,

~ 12. 1-\

61

e 7'

o

I

1r

S":l.

9~ clJ =

;r

Lo

(

i

Ib

1

1>0

10

l><n;i~t,

(,O ,":lo) "

O<>~I'er<;.

=

~z..

1\0

1~3 dJ = '2-

'11~((c2.ilí\; ( .\\~o,~"':li

O->t

hHt • I,;)

,"}<;

Exemplo

"

o o o o o o o o ~ o o

150

155

UI

o o o c c c

170

175

160

165

8"

cf

\,"\0

o' l:'

,i"'

."0 o'

, ) ':!Exemplo

Q Q

165

.llu,. de .luno ••••• em

o C

160

, ~

Desenho

".''0i -', .,

150

155

160

~.J•

Esquernlltieo

",.~~> ,~_.

p

(,

~

_

\

'f~

""'1.

~.-"'" 165 170 175 180 185 altunl de alunoa em em

190

195

(; (.)

o

c o u ~

1


'ó c ~

"c

o

c o c o c o o

c

C

üI

Análise Exploratória de Dados

• Capítulo 3 - Análise Bidimensianal • Variáveis Multidimensionais .Independência de Variáveis .Medidas de Dependência entre Duas Variáveis .Diagrama de Dispersão .Coeficiente de Correlação Cri

eu

Q

o Q C

o

üI

'"

o o c o o o o c

Variáveis Multidimensionais

• Em muitas situações observamos duas ou mais características simultaneamente, para analisar o seu comportamento. • A DISTRIBUIÇÃO CONJUNTA das freqüências será um poderoso instrumento na compreensão dos dados; ~~l~ "

,

trs-

3S

o

" e "oç; ú

LI ~

c o c c c c

(;

c

c

Distribuição conjunta..;'? ./..---

c c c Ó

-{-

/

lJistribuiçio. y

C"'CÍunfa

_'(LX Capital

l' Grau 2"Gra Suf!lJ!!.or 2 5 4 2 1 3 2 6 5 6 18 12

InterioÃ

~). c;o;

/

?

n

do 6rau

de Ins6vçQD

e RegiDO

"

.1


...

o c v

co o o o

c

o c o o o o o

"

!JI Independência

de Variáveis

• I/m dos principais objetivos de uma distribuição conjunta é descrever a ASSOCIABILIDADE existente ENTRE OI/AS VARIÁVEIS, isto é, que-.remos conhecer o GRAI/ DE DEPENDENCIAentre elas, de modo que possamos prever melhor o resultado de uma delas quando conhecemos a realização da outra. ~ll C1:'

--l-'Ir

S'9

o

o o u o

o o o o o Q o

!JI Independência ___

!lxl

Econonia Mninisflação Total

'

de Variáveis

Ma~ulifl(J__ ~etT1ÍnÍ!1Q

.7Jzf!1!..

.. _

85 (61%) 35 (58%) 120(60%) 55 (39%) 25 (42%) 80 (40%) 140 1OO%) 60 (100%) 200 (1OO~l -'",.::;ç"-

Cid

tIS'

C l'

(,)

'"

o o c

c o

o c

. fw>

U

li'

.ln ....•.. "....\~ J.:"I--,r.

- coeficiente de contingência

(J! ~1

cJ ••-

IV'

"'o" o

c c '-' c c

~

X

~

" •• c.

/e Kap/~PeorsDn

(t, -ej'

= L..---

tr'~')["-r.]' i=1

(;J

o

tv-~w-'

Medidas de Dependência . J <- ~. "-#__ ~y1~~I entre Duas Variáveis 0v,.p':.)e f H ,;J<\nt'"

• coeficientes de ossociação o..u'()'I''''~ correlação Jfl~'" O--

'1:7

ei

tfJ

tv

{'I'

vY

e"I

~_----

"-(f-I~~;J---------------

+- ..•.,J.-~

vJfi

(I,olkid. ~ (A./1

O;

_

-----------------

.

Cl,"}IJo.cl{ad.o,

~hJ,f" \ry"ko\Jo

1


J O O

Á-<'r0 kv ~c.: 1<..• ~ 'r-o l....,-e oJ k.. ~J-(v= : h 1 ?,

OCe ~ é..

~.

-,

ad..~ ~

~Q

A;"'~

â.

~

O

;t-cec.

O O

-r.-ú;;.a. _

~;

O O O

fi /..".

..J

O O

O O

;;:' ..r~<A;!o

O O O

O

o-

=

I

e;

i. 0, \ Z. _.' ,"'"

(

Oc

(~

. ,V\.

c.-L-~

In: k, e..f-<'

nJ.. .JO""OL

•••••.•

" \ ~-e..P..) 'hodé,1.

\~)

O

O O O O

3:

.e..-z&::0'

~L.c-i(o,-, loo

(t 4Ú;À

M~'oI"",-

n-C(ff

e.)

l. ~

/V-O/[A~-t.<

'de< c:ty

(J(d I~~)

~

€;

/L-vQ ~"""'''' )

(tolv"",<_J.)'" (t;~~5-1.)

O O O

O O O O

O O O O

O v t?r <h roti'

Oeu... ,-&-v 01,,-,< r-

C;.

korr-'

u-e.t"'V> 0--

•••-<.e>~,p.,

o-.

(/

O

71;t-r I

i..,../io:.i"", ?~e~

d~,-f." /'/""...,-.-

I'~,

O ..t:..•f""",

j?,a~~",~~~,(.,

.Me-b'

...v<,v'&"

~./.

t~-e.

~-t.

.JI'

/l-'~......(.

~~

~/O/¥e;; "'1.6 ....;..,.,;-_ "~

O O O O O ()

O O O O

O O

O


o

'e"

(,.,

c c

P/o,0"-0

"o

~ ~'v..L't

dú'''''

5~é>'1I VI- yJ-o 1-",. _

-----

II

o

o

I

Diagralflas de Dispersa0

""o o C,; v

/

{(/v«~M/)(-'f

Gol o ~.1 ..

.1.1 ..

_.-

-'._-

--'--

170

CP

C"

110

"

o

o o o o o o

V

Y= A + Bx

"Lxy- LXLY - "LX' -(Lx)'

B-~~~~~

o

A

Q

C

Ly-BLx

" "LxyLXLY r~ ~==~=~======== J["LX' -(LX)']["LY' -(LY)']

Q

o

Coeficiente de Correlação

CP

'('

o o Q o

"o (..J

u

o

o

ti

o

"o

(,J

o

v (,)

(J (..J

f.;

1


,-------------------------------------------.f, \ -lí.~) .. e:. '"' \ 'l"~""'ffi' e 6 /G / ,ira "" \ "-C. flt 1t/::,o,(,R l

"<5

,7(

)'L€lZ/

(;..,

"A

• O,9g<JJ

Probabilidades

'ç,e.,.,"

• Capítulo 4 - Probabilidades .Introdução .Algumas Propriedades .Probabilidade Condicional e Independência • Teorema de Bayes

e.,., C;.:

<.,;

"

Zó: o,9~'«\-

ft- ~V

(..; (.,;

Co.J C;.;

~

sr'

caso

Ire

~

t.I

ti C

Probabilidades

'-í

• Uma das principais ferramentas da estatística é a probabilidade, que teve seu início formal com a escolha de jogos no início do século XVlT. • Para seu entendimento necessitamos de alguns conhecimentos BÁSICOS que seguem:

ç C c,;.;

C;.;

e

(u"'ch: •..•.~ /;.,//;";',,/

~.

qt

O ,,1I',.()6f'

• -'

"'c;éJi

J; • }~d.p se./ 6'1¥t

• 17

<;

1, 3'1

c

~

"tJ c;;.;

o v

e (,;.;

t.i <...' l.: C,,;; C;.;

" V

t) t,)

t:: ~

.4

Experimento • É qualquer processo ou estudo de coletar dados re~eMntes, os quais exibem variações em seus resultados, resultados estes desconhecidos de ante mão. - Ex. Lançamento de um dado honesto e observar a cad.a arremesso a face \J~ :.r sv~/tada paro cima. -:[!f

;

~=4.r • ~ ~,.,

ti

o

'/d0t..

/.1tICA!

/

":;>;,I""j., "D;",;I,

X(~, =

~V\Ac..

fiJis/,r.

(Çtt'.tf,(;<t,:.

I

rplof.!/Á~ CJ-,"('1o.-b/<'

FV~Jc!/(Y;,};'"\ M,. fatio';. E1, 3C

Jt

ri.,ia ""f~

-Jd\LJeç

- Z,b+

h'Ç"bi dJ"

ft=S-

1,"1, f(-idr."

1


J

,?~

o J

o o ()

o

o

J"1

I

_ .;,l

_.~

~-,.'"'---'

).,_;.~~ ?"l

\l'",

()

S"p.

:J

1,~ ~

o

11._' 1 VI' cl,'O~

o

1

.-

-. '"~,~~ .I

fv"'c-. fv"~.

~------~b

-;."~~.,..

/a;!ic:&'

/..--p,-;!.

/-;«

o

va/ver;

;:)

!;'IIo !f'"lA.\

o

:J;.;

u o o

1}:Soo~1

.J"1- -::

:f., ,

'l, <f

l-

y"?e,

),)7)13

o r, '"t, Hqv\ '2. ;:) ]".,. J \ ::.- o ~1"'1'2-=- -t) ,:)

eis ~ J3' :Tv-{

r1

o0H;,( ) s,,('

~ 1\'

'l»'"

'Z-

oJ

. /'

iU

•.••..

r,} r" r-'Z. "I)'.

O,')X

o o

,

oi

-.

€t 9U?,k

o a

;:)

o o

'_'.~--O Ot0.~'(J =- L

érv"y'"" , ~ ~lÓ1'A"

~

3

;

i

o o o o o o C

o

I

(o;Ul'-'\Â)

a

o o

'- __ .0

o ()

o

o

o o

o


------------------------------------------------

IJI Espaço AmostraI

"Q"

• o espaço

amostraI ':O': é o conjunto de todos os resultados passíveis, elementares e indivisíveis do experimento, onde cada resultado é um evento simples. - Ex. Lançamento de um dado honesto

n = {fl,

f2, f3, f4, f5. f6}

\,j

"-:..' ...:-, .

•••• •••••

cr'

t, 5'

:'2

Evento

~s:(".,o ::h.,(h~"'" •

• Um evento, indicado pelas letn:Js A, B, .. é ql/Qlquer subctmjunto do espaço amostraI ''n~ - Exemplo 1: A ocorrência de face ímpar, no lançamento de um dado honesto.!., "• " • -' eventõ'A = {fI. f3. f5 - Exemplo 2: A ocorrência de face par, no lançamento de um dado honesto. evento B = {f2, f4. f6} \ .I

-l7

f

"1

••• ••••• ••••• ••••

r

J

sr'

"

Cel-~"'." ' ... ~f}.n.•~'2 .

/

I' ""

~

_

em

...•

U

.:,:'1

u-álgebra

'U" ••••

•••••

,~

--

I .t (;

D • Uma a-álgebra é uma classe de / " subçonjuntos .do. espaça. amostrat;-n, • satisfazendo os seguintes axiomas: .~.:' ,i"rr, ....".

I

. •

()

I•.

r-

,.., I, I

~::,L'.IN

i)QEA

.'

ü) Se A EA, então A EA üi) Se A e B EA, então AuB ,.

f

C

EA.;.~

Sf

-

••.

.I\.

C

'.;' " .

{J L/Bt {r~,; t ~

c,cI,e..

o , J

,.

l

•.. ;~

1

I fi'

._.;. '-,

,.

'~.\..'.'~"


f";"!*'

o o

I

I

(,)

V t.,;

rr

C

t.-

o

~efinição de Probabilidade

(,.;

.Definição .Definição .Definição .Definição

tJ

tJ Ó

e"Co)

o o

d

i1'

1 eX >~) o Q

í\)(?(>t,?L)

-

Clássicá Freqüentista Geométrica Axiomática

(7l

l' r

< 'li. ) =

t;)

E Q (,,:>4 )

1- ~ t,yi,:/t>,/ o c~4"'

'f.. >x >

-~'V ( "><:> +-

" ()(:>

.1 -

17

(li

Sob x.)

-.,')7 Cy,?-x.-) -p

r:p (-x

>1;)

''3

7'

f;) ~

ó (.i

ti.

o o u

o

üI (i) P(A) ~

o

(ii) P(O) = 1 (iii) Se A,,~,

A, (i.I"W é,

"".é

uma .w~qlle"cia

4 f"'I A} '" 0.

de el'etllO.I" nmll/amellle

i '"j; i, j= " .2, .. ) e

.I'e

~A,

exclll.~il'o.\' em

eA, enlão

P(ÜA,)=f'IA,)

/-,

~

ti t-

Definição Axiomática

7'

/-,

''7

~

o

~

()

G

o (;,

L,

.J-

;ft" Qfx;.{)

Ó

C t-

(;

t.-

e;,;

""u ()

(.;

O \,..

1


o O'

Oi

01 O:

O,

O!

01

OiI O •

I

01 -

I

o: Q!

("', i '-f "

o O

O' 01

O: 0,

O

Oi

-01


;;y-

I~

C (;.;

tJ C

t;,

~

(; Q

p(AB] P( AI B] = P(B] se P(B] ) 0, desta forma

ti

e, c..'

Probabilidade Condicional

. P(AB]

= p(B].p(AIB]=

P(A]'P(BIA]'

£,t

'"' c C

r:

'n

£>

~

\) (;,.;

~

Teorema da Probabilidade . Total

~

"

n

o

P[A]

(;

L P[AIBj]'P[Bj] j~1

(.l

"

=

£;

o

r:

._-

'56

C

c'

o c,..

c.J

Teorema de Bayes

6

'ti C.

P[AIBk ].P[Bk] P[BkIA]=-n-----

L P[AIBj ].P[Bj]

C.:

e

j~1

\;.I

t;

"G

r:

sn

Ct

e

o o

,tJ

u ,\,)

1


'ctr" t,., \;.;

o e

c

6'

Regra da Multiplicação

p(AnBnC)

(J

õ

=

P(A)

c.-

P(BIA)

"o

p(qAnB)

o'"

c f)

~

c.c;.:

Independência

~

(;

(;

t;

"

C ti (..;

(i) P[AB]

=

(ii) P[AIB] (iii) P[BIA] r:

S

P[A]' P[B] = =

P[A] se P[B] > O P[B] se P[A] > O

M

Q

ç

c c "

Variável Aleatória

~

G

• Uma variável aleatória, indicada por X. é uma funcãp com domínio o espaço amostrai e contradomínio o conjunto dos números Reais, tal que, o evento [ X !{ x J pertence a cr-álgebra para todos os valores de x que pertencem aos no.s \1/

t; C

" C

'-'

(, (;

reais. fd

e

fO

~;'T1't '~

o

(,

e c Ç.i (.;

c ~c-

2


------------------------------rQ ~

O

O J. 0' J O

fio U /J, , U A7- : .0-

:'~~}0Z~{}J{lk)v{H:~

~ft-

. J . /\A: ;.o

.lL

O

à

-Ao /'IA 1 ~ A.r\ A•••• A ~ f\ A1.:.12f

O

:J

Y

e'o

Me

d.f

o

{'e,M.""

O

~} ""'-

7'"'V:~S

r'

><

O Q O

Q O

o

º

O

()

o O


,..

..

•••• ••••

•• Função Distribuição

•••

•... ••••

••• •••

• Uma Função Distribuição, indicadapor F{x;' é uma função, com domínioos Reais e contradomínioo intervalo [O,l}, satisfazendo as seguintes propriedades: -F{x) é não decrescente; -F{x) é contínua à direita; -F(-ro} Cid

= O e F(ro} =

1

• "

•••• Função Distribuição Acumulada

•••

• Dada a variável aleatória )( chamaremos de função distribuição acumulada a função

F(x) = p(X <X), '\Ix EiR\./

-~..•.•

•••

,/

sr'

''7

".

t'\

•••• •••• ••••

-

•••••

•••

••• ••• ••• ••• •••

••••

üI

O Conceito de Variável Aleatória Discreta

• Uma variável aleatória)( é dita discreta, se ela assume um número finito ou infinito enumerável . .A função, indicada por p(xJ nós chamamos função de probabilidade da variável aleatória discreta X. \ I r:

'f?

•••

•••• •••• •••

•••

2


J /'

I

' Ot ..•....••..•• ~.Q

l',ttJt) =?

. A\-~

(10) :

""'\.

[x. U.) :

~ (~1"t? eX. (~

/~

~:"'c.~."t)

~!'"ll!-:...sl ~ ~

""'-:.........;o

.•...r)"\;o.o.

..••

r'?CA>c\.>).tJ = 3/.,

$ ',\" ] ~

"P[~ ~

x.-: 1:"

loj "

?Oo t?

\.),11\1

[.n.1 ::

-=

1.

3/..,

Co,~1

::)

-o o J

()

a o o

8

i

o! ••••••

I

v,

C)

a

0, ü -

i

,

O

o, ,..,

i

' .. i

i

O,

o

°I o J

a o o o o o ;:) o o O' Oi

o o o

o o o ç

o o o


Fun;ão de Probabilidade

i)p(x) > O ii) LP(x)

=

1

x r

f

C "

õI. O Aleatória Conceito

de Variável Cbntínua

• Uma variável aleatária, indicada por)(, é dita contínua, se existe uma função f(x). chamada função densidade de probabilidade, tal que:

Jf(x)dx < 00

Função Densidade de Probabilidade

i)f(x) > O 00

f

ii) f(x) dx= 1 -00

sr!

C

55

2

h

.


,.-.-.

v

-----------------------------------

Cc

c

ec

c e c c o c

U

Valor Esperado de uma Varióvel Aleatória

V'

• Daáa uma variável aleatória X chamamos valor méáia ou esperança matemática áe X ao valor

E(x) =

C

6

c

ÇJ

L

X

p(x),

{ f x f(x)

discreta

fi}

dx, continua

-'" r

r

,

\ll ~ilf

FI

c

c..~

'o" e"" Ct ~

"IC

U Valor Esperado de Uma

V'

Função de uma Variável Aleatória X "g(X)"

• Dada a variável aleatória )( chamamos esperança ou valor esperado da função g(x) ao valor:

C

e

"o

oco

~.[g(X)]

~.i~:;;~;;~~;,.~ .. ;~-.-----------------------

t..J

C

c

"

O e

Propriedades

(;

.Se g(x)

c

-Wr ,

c. o

.Se g(x) =[X -E[g(x)} = Vor(X)'--j) ~1AfY.

~

e

c c

= aX + b,

-E[g(x)} = E(aX + b) = o E(X) + b

5[0[

''2

f _~iL...--------------.,{.t

'Í'S

C t;

c £:0

() C .(;

2


Alguns Modelos Discretos • • • • • • • sr'

Distrib,uição Distribuição Distribuição Distribuição Distribuição Distribuição Distribuição

Llniforme Discreta Bernoulli Binomial Hipergeométrica Geométrica Binomial Negativa Poisson

c Z?

Alguns Modelos Contínuos • Uniforme Contínuo • Normol . • Exponerlciol .GaIn/1

.8eto • Couchy • Lognormal • Dupla-exponencial

• • • • •

Weibull Logística Parefr> Gumbel (Valor Extremo) t-Stuáent's

• F-SnedecDrs

• Qui-quaáraáo • Normal Sivariaáa

li\'

S zr

5'!

'!c/ .

--',''''-

Variáveis Aleatórias Multidimensionais • Capítula 7 - Variáveis Aleatórias Multiáimensionais - Distribuição Co'liunta - Distribuiçiies Marginais e Conáicionais - Funçiies áe Variáveis Aleatórias - Co"".,"!n~ia áe ?uas Variáveis Aleattfria.çj - VarlDvels CDntmUQs r

;

V

-"'''''''''''''''''''"

..-":";:~.~

.lh\ _

2


Distribuição Conjunta • Em muitos experimentos, Q um mesmo ponto amostraI (j), atrihuímos VO/Dre5 de duas DU mais Wlritiveis aleatórias.

- Ex. Suponha que queremos estudar a

V- -

. ~,.

CDl1JPt'siçDD de faml1ias com .3 crianÇlls, qupnto DD sexo. f;/' r>" = número de meninas:;',.J'J t' .~.

.x

- -"7;-'" -

•.

• Y = 1 (se far hamem) e O (se far mulher) .z = no. de vezes que hauve IItIriaçãada sixal ~~/

çh'

c:

üI

W = número de meninas

"[rf

Função Densidade Conjunta

i)f(x) > O 00

-00

CC'

C

Ir

00

f f(x, y)dx dy -00

-

=1 \/ ':-.;:1~,

--?r.~

"

L J

2


-----------------------...,..(j ~4

wt;:ú"t~ lÁ

qq

otUa..-.

<.oJ,P-,,/l6<-cf-o

,£(

/"Voft:>('dO

/1L~/Z'-..t

~) ..-<;:>.••••••

/V t?-- •...•. e.;..L4'~

.J!

J

81 Oi

01 O

O OI ()

O

a o o o o Oi OI ~-

I \

gl O'

o ,..•.

VI

gl o Q

Q

o

o

01

gl o o Ç)

o Q

o

o

Q

o o ,.., \J

o o

&


Distribuições Marginais

f(x)

=

L f(x,y)

~<O- ~'

.~

ff(x,y)

dy ..

~:1t

~f.~ SV'

1\

'7'

c

fj ~

o o o 9 c 9 e

V

f(x,y) f(xIY) = f(y)

ú

O::...'

Distribuições Condicionais

r:

'v

,""" ",,-

\i)

C-

o e

o

V

Distribuições Independentes

to)

O

o ê o C o C

o

o

f( X, y) == f( X )f(y)

<.

O

AI? .)?

)I:

o

f =y I .!-"~ I

'r?

O

o

o c

o c ~

..

2


Covariância de duas variáveis aleatórias Cov(XY) = E[(X - E(X)(Y - E(Y)]

(J Xy

,=

f....l Xy - f....l X f....l y

\1.£

r:

/fr

cn

1iI

Coeficiente de Correlação . deXe Y

(XY)= p,

-1< r,

Cov(X,Y) -JV ar(X) Var(Y)

PXY

a ec

Referências Bibliográficas Monlgomery, Douglas C. & Runger, George C. Applied stabstícs and probab/lity for engineers. New York, Wiley, 1994. Monlgomery, Douglas C., Introduction lo slalisfical qualilyconlrol. NewYOIk, Wiley, 1991. Bussab, Wilton 0" Eslallslica Básica. 4.ed. São Paulo, 1987

51"

e C;

2


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.