Estatistica Aplicada

Page 1

Unidade I

ESTATÍSTICA APLICADA

Prof. Luiz Felix


O termo estatística  Provém da palavra Estado e foi utilizado originalmente para denominar levantamentos de dados, cuja finalidade era orientar o Estado em suas decisões.  Foi utilizado em épocas remotas para determinar o valor dos impostos cobrados dos cidadãos e até mesmo para determinar a estratégia de uma nova batalha.


Definição  Estatística é um conjunto de técnicas e métodos que nos auxiliam no processo de tomada de decisão na presença de incerteza. Exemplos de aplicações:  caracterização de perfil sócio-econômico;  análise de intenção de votos;  levantamento de pessoas com nível universitário.


População e amostra  População  conjunto de todos os itens (pessoas, coisas, objetos) que interessam ao estudo de um fenômeno coletivo segundo alguma característica.  Amostra  qualquer subconjunto não vazio de uma população.


Estatística descritiva  Estatística descritiva  é a parte da Estatística que tem por objetivo descrever os dados observados.  Exemplo: Índice Nacional de Preço ao Consumidor (INPC), que envolve a sintetização dos aumentos dos produtos da cesta básica.


Estatística indutiva  Estatística indutiva  é a parte da Estatística que tem por objetivo obter e generalizar conclusões para a população a partir de uma amostra, através do cálculo de probabilidade. O cálculo de probabilidade é que viabiliza a inferência estatística.  Exemplo: análise do mercado financeiro visando explicar tendências das taxas de juros.


Principais fases do método estatístico  Definição do problema  Planejamento  Coleta de dados  Apuração dos dados  Apresentação dos dados  Análise e interpretação dos dados


Dados estatísticos  Quando se trabalha com a observação, a mensuração, a análise e a interpretação de números, esses números nos conduzem a índices inflacionários, índices de desemprego, probabilidade de determinado candidato ganhar as eleições etc.  Tais números serão chamados de dados estatísticos.


Dados brutos e rol  Dados brutos  uma sequência de valores numéricos não organizados, obtidos diretamente da observação de um fenômeno coletivo. Exemplo: idade dos meus professores: 49 63 49, 63, 34 34, 27 27.  Rol  uma sequência ordenada de dados brutos Exemplo: idade dos meus professores: 27, 34, 49, 63 ou 63, 49, 34, 27.


Variáveis Quantitativas  Contínuas – assumem qualquer valor em um intervalo. Ex.: idade.  Discretas – originam-se da contagem de itens. Ex.: quantidade de produtos produzidos por dia. Qualitativas  Nominais – definem categorias. Ex.: separação por sexo.  Por posto – dispõem os elementos em uma ordem de preferência. Ex.: primeiro, segundo...


Interatividade Qual das seguintes sĂŠries abaixo representa um rol? a) X: 1, 2, 3, 5, 4, 6 b) Y: 6, 5, 4, 7, 8, 9 c) Z: 1, 1 1, 1 3 3, 3 3, 5 d) K: 5, 1, 1, 3, 3 e) L: 2, 2, 7, 8, 9, 1


Notação por índices  O símbolo xi (lê-se “x índice i”) irá representar qualquer um dos n valores assumidos pela variável x. (x1, x2, ..., xn). “n” é denominado índice e poderá assumir qualquer dos números entre 1, 2 3, 2, 3 4 4..., n. n  NOTAÇÃO SIGMA (∑): A maioria dos processos estatísticos irá exigir o cálculo da soma de um conjunto de números. A letra maiúscula grega sigma (∑) é utilizada para representar essas somas.


Medidas de tendência central  Quando estamos diante de um conjunto de dados, seja ele pequeno ou grande, em geral, buscamos medidas que possam ser usadas para indicar um valor que tende a representar melhor aquele determinado conjunto de números. números As medidas mais usadas nesse sentido são as chamadas medidas de tendência central:  média;  mediana;  moda.


Média aritmética 

É um valor calculado para um grupo de dados, usado para descrevê-los. É o ponto de equilíbrio dos dados. x = ∑ xi n

xi : cada variável da amostra.

n: é o número total de observações.


Média aritmética – exemplo  Calcule a média aritmética do conjunto de dados: xi = 3, 5, 8, 12, 7, 25 x = ∑ x = 3 + 5 + 8 + 12 + 7 + 25 = 60 = 10 n

6

6

 Interpretação: O valor médio dos dados é 10,, ou seja, j , os valores deste conjunto j de dados concentram-se em torno do 10.


Média aritmética – exemplo  Calcule a média aritmética do conjunto de dados: xi = 1, 1, 3, 5 x = ∑ x = 1 + 1 + 3 + 5 = 10 = 2,5 n

4

4

 Interpretação: O valor médio dos dados é 2,5, , , ou seja, j , os valores deste conjunto j de dados concentram-se em torno do 2,5.


Média aritmética ponderada  A cada valor xi deverá ser atribuído um peso wi . xp = ∑ xi . wi ∑ wi  xi : cada variável da amostra.  wi : cada peso da amostra.


Média aritmética ponderada – exemplo 

Um aluno tirou as notas 7, 3, 6 e 5 em quatro avaliações que, respectivamente, tinham os pesos 2, 5, 1, 2. Calcule a média do aluno levando-se em conta os pesos das avaliações.

xp = ∑ xi . wi = 7.2 + 3.5 + 6.1 + 5.2 = 45 = 4,5 ∑ wi

2+5+1+2

10


Mediana 

É um valor que separa o rol em duas partes deixando à sua esquerda o mesmo número de elementos que estão à sua direita. É o ponto que ocupa a posição central em uma série.

Se o número de elementos do rol for ímpar, a mediana será o valor do meio.

Se o número de elementos do rol for par, a mediana será a média dos 2 valores do meio.

Podemos calcular a posição da mediana com a fórmula: posmed = (n + 1) 2


Mediana – exemplo  Determinar a mediana xi = 2, 20, 12, 23, 20, 8, 12 Solução: Rol xi: 2, 8, 12, 12, 20, 20, 23 n = 7, logo: posmed = (7 + 1) = 8 = 4ª posição 2

2

A mediana é o elemento que ocupa a 4ª posição: mediana = 12


Mediana – exemplo  Determinar a mediana xi = 7, 21, 13, 15, 10, 8, 9, 13 Solução: Rol xi: 7, 8, 9, 10, 13, 13, 15, 21 n = 8, logo: posmed = (8 + 1) = 9 = 4,5ª posição 2

2

Neste caso, deve-se tirar a média entre os 2 valores do meio para se obter a mediana mediana. md = 10 + 13 = 23 = 11,5 2

2


Moda 

É o valor de maior frequência em um conjunto de dados.

Se o conjunto de dados possui:  Uma moda  unimodal  Duas modas  bimodal  Três modas  trimodal  4 ou mais modas polimodal  Nenhuma moda  amodal


Moda – exemplos  Determinar a moda xi = 2, 8, 3, 5, 4, 5, 3, 5, 5, 1 Solução: Rol xi: 1, 2, 3, 3, 4, 5, 5, 5, 5, 8 moda = 5  unimodal  Determinar a moda xi = 5, 4, 3, 3, 5, 4 Solução: Rol xi: 3, 3, 4, 4, 5, 5 não existe moda  amodal


Interatividade Para o seguinte conjunto de dados xi = 5, 9, 7, 31, 21, 13, 13, 21, determinar a média aritmética simples, a mediana e a moda. a) Média = 15; mediana = 13; moda = 13 e 21 b) Média = 15; mediana = 26; moda = 13 e 21 c) Média = 14; mediana = 26; moda = 13 d) Média = 15; mediana = 13; moda = 21 e) Média = 14; mediana = 26; moda = 13 e 21


Medidas de dispersão  Indicam o quanto os dados estão dispersos em torno da região central.  Quanto maiores as medidas de dispersão, mais heterogêneos são os dados e, dados, e ao contrário, contrário quanto menores essas medidas, mais homogêneo o conjunto. Analisaremos as seguintes medidas de dispersão:  amplitude lit d total; t t l  desvio padrão;  variância.


Medidas de dispersão  Considere os seguintes conjuntos de valores das variáveis X, Y e Z: X: 70, 70, 70, 70, 70 Y: 68, 69, 70, 71, 72 Z: 5 5, 15 15, 50 50, 120 120, 160 Os 3 conjuntos apresentam a mesma média aritmética: 70. Notamos que o conjunto X é mais homogêneo que os conjuntos Y e Z.


Medidas de dispersão  Quando se deseja entender, analisar e descrever de forma adequada um determinado conjunto de dados, faz-se necessário dispor não apenas de informações relativas à média, mediana e moda. moda  É preciso que se disponha de informações relativas à variabilidade (dispersão) dos números que compõem o referido conjunto de dados.  Essas medidas de variabilidade ou dispersão indicam se os dados observados estão próximos ou separados uns dos outros.


Amplitude total  A amplitude total, ou intervalo, de um determinado conjunto de dados é obtido pela diferença entre o maior e o menor valor nesse conjunto de números.  Amplitude Total = Valor Máximo – Valor Mínimo  Sendo xi: 7, 8, 9, 10, 13, 20 Amplitude Total = 20 – 7 = 13


Desvio médio  A dispersão dos dados em relação à média de uma sequência pode ser avaliada através dos desvios de cada elemento da sequência em relação à média da sequência. DMédio = ∑ | xi  x | n Em que n é o número de observações. Exemplo de | x | |3| = 3 | 3| = 3


Desvio médio – exemplo Para o conjunto de dados xi = 2, 8, 4, 6, calcule o desvio médio. Solução:

DMédio = ∑ | xi  x | n

x = 2 + 8 + 4 + 6 = 20 = 5 4

4

DM = | 2  5 | + | 8  5 | + | 4  5 | + | 6  5 | 4 DM = | | 3| + | 3 | + | | 1| + | 1 | = 3 + 3 + 1 + 1 4 DM = 2

4


Variância e desvio padrão (população e amostra) POPULAÇÃO Variância: σ2 = ∑ (xi – x)2 n Desvio Padrão: σ = σ2 AMOSTRA Variância: S2 = ∑ (xi – x)2 n–1  Desvio Padrão: S = S2


Variância e desvio padrão (população) – exemplo  Para a população xi = 4, 5, 8, 5, calcule a variância e o desvio padrão.  Solução:

σ2 = ∑ (xi  x)2

e

σ = σ2

n x = 4 + 5 + 8 + 5 = 22 = 5,5 55 4

4

σ2 = (4 5,5)2 + (5 5,5)2 + (8  5,5)2 + (55,5)2 4 σ2 = (1,5) ( 1 5)2 + ((0,5) 0 5)2 + (2 (2,5) 5)2 + ((0,5) 0 5)2 = 2 2,25 25 4

Desvio padrão: σ = σ2 = 2,25 = 1,5


Variância e desvio padrão (amostra) – exemplo 

Para a amostra xi= 4, 5, 8, 5, calcule a variância e o desvio padrão. 

Solução:

S2 = ∑ (xi  x)2

e

S = S2

n–1 x = 4 + 5 + 8 + 5 = 22 = 5,5 55 4

4

S2 = (4 5,5)2 + (5 5,5)2 + (8  5,5)2 + (55,5)2 4–1 S2 = (1,5) ( 1 5)2 + (0,5) ( 0 5)2 + (2,5) (2 5)2 + (0,5) ( 0 5)2 = 9 = 3 3

Desvio padrão: S = S2 = 3 = 1,73

3


Interatividade Para a população xi = 1, 9, 3, 7, 5, calcule a variância e o desvio padrão. a) Variância = 7 e desvio padrão = 2,64 b) Variância = 8 e desvio padrão = 2,82 c) Variância = 9 e desvio padrão = 3 d) Variância = 10 e desvio padrão = 3,16 e) Variância = 11 e desvio padrão = 3,31


Distribuição de frequências  A distribuição de frequências é o modo de tratamento de dados utilizado quando é grande a quantidade de dados brutos, e passamos a agrupar os dados estatísticos em subconjuntos com características semelhantes semelhantes.  A distribuição de frequências é a organização de dados em classes ou intervalos, para determinar o número de observações ou a percentagem de observações de cada classe classe, chamada de frequência de classes.


Distribuição de frequências Classe: são intervalos que subdividem a amplitude total. Limites de classe: são os limites extremos de cada classe. Li  é o menor valor das classes consideradas. Ls  é o maior valor das classes consideradas. Amplitude de classe: é a diferença entre o limite Li e o Ls da classe e determina a amplitude das classes de uma distribuição de frequências. h = Ls – Li


Distribuição de frequências Nº de classes = 4

Li = 140

Amplitude da classe  h = 10

Ls = 150


Alguns conceitos de uma distribuição de frequência Frequência relativa %: é o quociente entre a frequência absoluta da i-ésima classe com o somatório das frequências, multiplicando esse resultado por 100: fri% = fi

. 100

n Frequência acumulada: é o somatório da frequência absoluta da i-ésima classe com a frequência absoluta das classes anteriores.


Distribuição de frequências – exemplo A observação das notas de 30 alunos em uma prova mostrou os valores: 3; 4; 2,5; 4; 4,5; 6; 5; 5,5; 6,5; 7; 7,4; 2; 3,5; 5; 5,5; 8; 8,5; 7,5; 9; 9,5; 5; 5 5,5; 5; 4 4,5; 5; 4; 7 7,5; 5; 6 6,5; 5; 5; 6; 6 6,5; 5; 6 6.


Distribuição de frequências – variável contínua Rol 2; 2,5; 3; 3,5; 4; 4; 4; 4,5; 4,5; 5; 5; 5; 5; 5,5; 5,5; 5,5; 6; 6; 6; 6,5; 6,5; 6,5; 7; 7,4; 7,5; 7,5; 8; 8,5; 9; 9,5 xi

fi

fri%

Fi

Fri%

2 |-- 4

4

13,33

4

13,33

4 |-- 6

12

40

16

53,33

6 |-| 8

10

33 34 33,34

26

86 67 86,67

8 |-- 10

4

13,33

30

100

30

100

---

---


Distribuição de frequências – exemplo xi

fi

fri%

Fi

Fri%

2 |-- 4

4

13,33

4

13,33

4 |-- 6

12

40

16

53,33

6 ||-- 8

10

33,34

26

86,67

8 |-- 10

4

13,33

30

100

30

100

---

---

Alunos com nota > = 4 e menor 6: 12 Alunos com nota menor que 6: 16 %Alunos com nota > = 4 e menor que 6: 40% %Alunos com nota < que 6: 53,33%


Interatividade A observação das notas de 30 alunos em uma prova mostrou os seguintes valores conforme mostrado na distribuição de frequências abaixo. Indique qual o percentual de alunos com nota menor que 8. a) 10%

Notas

fi

b) 33,34%

2 |-- 4

4

c) 26%

4 |-- 6

12

6 |-- 8

10

8 |-- 10

4

d) 86,67% e) 13,33%


ATÉ A PRÓXIMA!


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.