Issuu on Google+

Bi0ESTATÍSTICA BERNARD R0SNER

TRADUÇÃO DA 8 EDIÇÃO NORTE-AMERICANA a

BERNARD R0SNER

FUNDAMENT0S DE

gem, Ciências Biológicas, Fisioterapia, entre outras. MATERIAL DE APOIO ON-LINE PARA PROFESSORES E ALUNOS.

FUNDAMENT0S DE

Aplicações: livro-texto para as disciplinas básicas de bioestatística de cursos de graduação na área de saúde/biológicas, como Medicina, Farmácia, Enferma-

orelha Probabilidade e estatística para engenharia e ciências Tradução da 8ª edição norte-americana Jay L. Devore

Estatística aplicada à administração e economia

Bi0ESTATÍSTICA

Como diferencial, os inúmeros exemplos são baseados em artigos da literatura médica e em problemas reais de pesquisa clínica. Além disso, a solução computacional desses exemplos é apresentada utilizando diferentes softwares estatísticos, motivando o leitor a conhecer e aplicar os métodos abordados no texto.

Bi0ESTATÍSTICA BERNARD R0SNER

Rosner reuniu a experiência de 30 anos de trabalho na Universidade de Harvard para oferecer este texto aos estudantes da área médica e correlatas, apresentando os métodos estatísticos mais utilizados na literatura médica. Os métodos são apresentados em um nível intermediário com descrição intuitiva, minimizando a quantidade de formulações matemáticas, mas fornecendo explicações completas sobre todos os conceitos importantes. A linguagem simples e didática proporciona familiaridade com as técnicas sem que seja necessário lançar mão de textos estatísticos especializados.

FUNDAMENT0S DE

TRADUÇÃO DA 8a EDIÇÃO NORTE-AMERICANA

Probabilidade Tradução da 6ª edição norte-americana / e3ªestatística para edição brasileira engenharia Dennis J. Sweeney, Thomas A. Williams e e ciências David R. Anderson Tradução da 8ª edição norte-americana

JAY L. DEVORE Estatística para economistas

Estatística aplicada 4ª edição revista e ampliada à administração eRodolfo economia Hoffmann Tradução da 6ª edição norte-americana

DENNIS J. SWEENEY, Estatística THOMAS básica A. WILLIAMS E DAVID R. ANDERSON Sonia Vieira

Estatística para economistas 4ª edição revista e ampliada

RODOLFO HOFFMANN MATERIAL DE APOIO ON-LINE

Estatística básica SONIA VIEIRA ISBN 978-85-221-2553-1 ISBN 13 978‑85‑221‑2553‑1 ISBN 10 85‑221‑2553‑8

Para suas soluções de curso e aprendizado, visite www.cengage.com.br

FINAL_Fundamentos de Bioestatistica_CAPA.indd All Pages

9 788522 125531

10/31/16 16:20


Fundamentos de bioestatística T R A D U Ç Ã O D A 8 a E D I Ç Ã O N O R T E ­‑ A M E R I C A N A

BOOK_R_FundamentosBioestatistica.indb 1

10/19/16 9:57 AM


Dados Internacionais de Catalogação na Publicação (CIP) R822f  Rosner, Bernard. Fundamentos de bioestatística / Bernard Rosner ; tradução: Noveritis do Brasil ; revisão técnica: Magda Pires. – São Paulo, SP : Cengage Learning, 2016. 480 p. : il. ; 28 cm. Inclui índice e apêndice. Tradução de: Fundamentals of biostatistics (8. ed.). ISBN 978-85-221-2553-1 1. Bioestatística. 2. Biometria. I. Pires, Magda. II. Título.

CDU 57.087.1 CDD 570.15195 Índice para catálogo sistemático: 1. Bioestatística 57.087.1 (Bibliotecária responsável: Sabrina Leal Araujo – CRB 10/1507)

BOOK_R_FundamentosBioestatistica.indb 2

10/19/16 9:57 AM


Fundamentos de bioestatística T R A D U Ç Ã O D A 8 a E D I Ç Ã O N O R T E ­‑ A M E R I C A N A

Bernard Rosner Universidade de Harvard

Tradução

Noveritis do Brasil Revisão técnica

Magda Carvalho Pires Professora do Departamento de Estatística da Universidade Federal de Minas Gerais (UFMG) Bacharel, mestre e doutora em Estatística pela UFMG

Austrália  •   Brasil  •   Japão  •   Coreia  •   México  •   Cingapura  •   Espanha  •   Reino Unido  •   Estados Unidos

BOOK_R_FundamentosBioestatistica.indb 3

10/19/16 9:57 AM


Fundamentos de Bioestatística Tradução da 8ª edição norte­‑americana Bernard Rosner Gerente editorial: Noelma Brocanelli Editora de desenvolvimento: Salete Del Guerra Editora de aquisição: Guacira Simonelli Supervisora de produção gráfica: Fabiana Alencar Albuquerque Produtora gráfica: Raquel Braik Pedreira Especialista em direitos autorais: Jenis Oh

Título original: Fundamentals of bioestatistics, 8th edition ISBN­‑13: 978­‑1­‑305­‑26892­‑0 ISBN­‑10: 1­‑305­‑26892­‑X

Tradução: Noveritis do Brasil

© 2017 Cengage Learning Edições Ltda. © 2016, 2011, 2006 Cengage Learning. Todos os direitos reservados. Nenhuma parte deste livro poderá ser reproduzida, sejam quais forem os meios empregados, sem a permissão por escrito da Editora. Aos infratores aplicam­‑se as sanções previstas nos artigos 102, 104, 106, 107 da Lei no 9.610, de 19 de fevereiro de 1998. Esta editora empenhou­‑se em contatar os responsáveis pelos direitos autorais de todas as imagens e de outros materiais utilizados neste livro. Se porventura for constatada a omissão involuntária na identificação de algum deles, dispomo­‑nos a efetuar, futuramente, os possíveis acertos. A Editora não se responsabiliza pelo funcionamento dos links contidos neste livro que possam estar suspensos. Para informações sobre nossos produtos, entre em contato pelo telefone 0800 11 19 39 Para permissão de uso de material desta obra, envie pedido para direitosautorais@cengage.com

Revisão técnica: Magda Carvalho Pires Copidesque: Queni Winters Revisões: Vero Verbo e Denise Bolanho Diagramação: Crayon Editorial

© 2017 Cengage Learning. Todos os direitos reservados. ISBN 13: 978­‑85­‑221­‑2553­‑1 ISBN 10: 85­‑221­‑2553­‑8

Projeto de capa: Alberto Mateus Imagem da capa: fotomontagem Crayon Editorial

Cengage Learning Condomínio E­‑Business Park Rua Werner Siemens, 111 – Prédio 11 – Torre A – Conjunto 12 Lapa de Baixo – CEP 05069­‑900 – São Paulo – SP Tel.: (11) 3665­‑9900 Fax: 3665­‑9901 SAC: 0800 11 19 39 Para suas soluções de curso e aprendizado, visite www.cengage.com.br

Impresso no Brasil Printed in Brazil 123 18 17 16

BOOK_R_FundamentosBioestatistica.indb 4

10/19/16 9:57 AM


Este livro ĂŠ dedicado Ă  minha esposa, Cynthia, e aos meus filhos, Sarah, David e Laura.

BOOK_R_FundamentosBioestatistica.indb 5

10/19/16 9:57 AM


BOOK_R_FundamentosBioestatistica.indb 6

10/19/16 9:57 AM


PREFÁCIO

E

ste texto de bioestatística em nível introdutório é voltado para estudantes de gra‑ duação, pós­‑graduação em medicina ou outras áreas relacionadas à saúde. Não são ne‑ cessários conhecimentos em estatística e seu nível matemático presume apenas noções de álgebra. Fundamentos de bioestatística foi desenvolvido a partir de notas de aula que utilizei em um curso de bioestatística para alunos de graduação da Universidade de Harvard, Harvard Medical School e Harvard School of Public Health nos últimos 30 anos. Escrevi este livro para motivar os alunos a dominar os métodos estatísticos mais utilizados na literatura mé‑ dica. Do ponto de vista do estudante, é importante que os exemplos descritos para desen‑ volver esses métodos representem o que realmente existe na literatura. Portanto, os exemplos e os exercícios deste livro baseiam­‑se, em sua maioria, tanto em artigos reais da literatura médica como em problemas reais de pesquisa clínica que encontrei ao longo de minha experiência em consultoria na Harvard Medical School.

A Abordagem A maioria dos textos introdutórios de estatística utiliza uma abordagem não matemática ou desenvolve o material em uma estrutura matemática rigorosa e sofisticada. Neste livro, no entanto, adoto um curso intermediário, minimizando a quantidade de formulações mate‑ máticas, mas fornecendo explicações completas sobre todos os conceitos importantes. Cada novo conceito é desenvolvido de maneira sistemática por meio de exemplos comple‑ tamente trabalhados de problemas de pesquisa clínica atual. Além disso, apresento resulta‑ dos computacionais, quando apropriado, para ilustrar esses conceitos. Inicialmente, escrevi este texto para o curso introdutório de bioestatística. Contudo, esse campo mudou muito ao longo dos últimos 30 anos; em virtude do aumento da capa‑ cidade dos novos softwares estatísticos, podemos agora realizar análises de dados mais so‑ fisticadas do que nunca. Portanto, um segundo objetivo deste texto é apresentar essas novas técnicas em um nível introdutório para que os alunos possam se familiarizar com elas sem ter de percorrer textos estatísticos especializados (e, normalmente, mais avançados).

Aos Professores e Alunos Esta obra conta com mais de mil exercícios com dados e resultados de pesquisa clínica atualizados. Alguns deles, marcados com asterisco (*), têm soluções breves no final do livro. VII

BOOK_R_FundamentosBioestatistica.indb 7

10/19/16 9:57 AM


VIII       Prefácio As respostas de todos os problemas apresentados no final de cada capítulo estão disponí‑ veis, em inglês, apenas para os professores, no site da Cengage Learning (www.cengage. com.br), na página do livro. Também no site, alunos e professores podem encontrar os conjuntos de dados em um número amplo de formatos, incluindo Excel, Formatos Minitab®, SPSS, JMP, SAS, Stata, R e ASCII. Eles estão indicados pelo símbolo .

Método de Cálculo Todos os resultados intermediários são realizados com precisão total (mais de 10 dígitos significativos), mesmo que eles sejam apresentados com menos dígitos significativos (geral‑ mente 2 ou 3) no texto. Assim, em alguns casos, os resultados intermediários podem pare‑ cer inconsistentes com os resultados finais; no entanto, não é o que acontece.

Organização Esta edição de Fundamentos de bioestatística é organizada da seguinte forma: O Capítulo 1 é introdutório e contém o esboço do desenvolvimento de um estudo clí‑ nico real com o qual eu estava envolvido. Ele fornece a percepção única do papel da bioes‑ tatística na pesquisa clínica. O Capítulo 2 aborda a estatística descritiva e apresenta as principais ferramentas numé‑ ricas e gráficas utilizadas para a exibição de dados clínicos. Este capítulo é especialmente importante para consumidores e produtores de literatura médica porque muitas informa‑ ções costumam ser divulgadas por meio de material descritivo. Os Capítulos 3 a 5 discutem probabilidade. Desenvolvemos os princípios básicos de pro‑ babilidade e apresentamos as distribuições de probabilidades mais comuns, como a binomial e a normal. Essas distribuições são utilizadas extensivamente nos capítulos posteriores. Os conceitos de probabilidade a priori e probabilidade a posteriori também são apresentados. Os Capítulos 6 a 10 abrangem alguns dos métodos básicos de estatística inferencial. O Capítulo 6 apresenta o conceito de amostras aleatórias das populações. Desenvolve‑ mos a difícil noção de distribuição amostral e incluímos uma introdução para as distribui‑ ções amostrais mais comuns, como t e qui­‑quadrado. Apresentamos os métodos básicos de estimação, incluindo uma ampla discussão sobre intervalos de confiança. Além disso, discute­‑se o método bootstrap para obter os limites de confiança. Os Capítulos 7 e 8 contêm os princípios básicos de testes de hipóteses. Discutimos am‑ plamente os testes de hipóteses mais elementares para dados distribuídos normalmente, como o teste t, para resolver problemas de uma e duas amostras. O Capítulo 9 aborda os princípios básicos de estatística não paramétrica. Os pressupos‑ tos de normalidade são relaxados e testes análogos livres de distribuição são desenvolvidos para os testes dos Capítulos 7 e 8. O teste de permutação, amplamente utilizado em estudos genéticos, é apresentado. O Capítulo 10 contém os conceitos básicos de testes de hipóteses quando aplicados a dados categóricos, incluindo alguns dos procedimentos estatísticos mais utilizados, como o teste qui­‑quadrado e o teste exato de Fisher. Ao longo do texto, discuto os elementos do planejamento de estudo, incluindo os con‑ ceitos de pareamento, estudos de coorte, estudos de caso­‑controle, estudos retrospectivos, estudos prospectivos, bem como sensibilidade, especificidade e valor preditivo dos testes diagnósticos. Esses planos são apresentados no contexto de amostras reais. Além disso, os Capítulos 7, 8 e 10 contêm seções específicas sobre cálculo do tamanho da amostra para diferentes situações em estatística. A obtenção de fórmulas mais complexas é realizada após enunciar uma equação ou em seções separadas no final do capítulo, a fim de permitir que os alunos vejam os principais resultados nas equações de maneira mais imediata. Além disso, há inúmeras subseções in‑ tituladas “Utilização do computador para realizar um teste específico” para destacar mais clara‑ mente o uso do computador para implementar muitos dos métodos apresentados no texto.

BOOK_R_FundamentosBioestatistica.indb 8

10/19/16 9:57 AM


Prefácio       IX

Nos Capítulos 7, 8 e 10 são apresentados fluxogramas de métodos adequados de infe‑ rência estatística, como um guia de referência útil para os métodos desenvolvidos no livro, a fim de fornecer uma perspectiva de como os métodos discutidos em determinado capí‑ tulo se ajustam com os outros métodos apresentados neste livro.

Agradecimentos Tenho uma dívida de gratidão com Debra Sheldon, Marie Sheehan (in memoriam) e Harry Taplin, pela inestimável ajuda ao digitar o texto; Dale Rinkel, pela ajuda na digitação de soluções de problemas; e Marion McPhee, por ajudar a preparar os conjuntos de dados. Também sou grato a Roland Matsouaka, por atualizar soluções para os problemas. Além disso, gostaria de agradecer aos revisores de texto, entre eles Shouhao Zhou, Daniela Szatmari­‑Voicu, Jianying Gu, Raid Amin, Claus Wilke, Glen Johnson, Kara Zografos e Hui Zhao. Muito obrigado a Spencer Arritt e Jay Campbell, cujas participações foram fundamen‑ tais na prestação de consultoria editorial e na preparação do texto. Meus agradecimentos aos colegas do Laboratório Channing – especialmente Edward Kass (in memoriam), Frank Speizer, Charles Hennekens, Frank Polk (in memoriam), Ira Tager, Jerome Klein, James Taylor, Stephen Zinner, Scott Weiss, Frank Sacks, Walter Willett, Alvaro Munoz, Graham Colditz e Susan Hankinson – e aos meus outros colegas da Harvard Medical School, principalmente Frederick Mosteller (in memoriam), Eliot Berson, Robert Ackerman, Mark Abelson, Arthur Garvey, Leo Chylack, Eugene Braunwald e Arthur Dempster, que me inspiraram a escrever este livro. Expresso minha gratidão a John Hopper e Philip Landrigan por fornecerem os dados para os nossos estudos de caso. Por fim, gostaria de agradecer a Leslie Miller, Andrea Wagner, Itamar Jotkowitz, Loren Fishman e Frank Santopietro, cuja ajuda clínica tornou possível esta edição. Bernard Rosner

BOOK_R_FundamentosBioestatistica.indb 9

10/19/16 9:57 AM


BOOK_R_FundamentosBioestatistica.indb 10

10/19/16 9:57 AM


SOBRE O AUTOR

Bernard Rosner é professor de medicina (bioestatística) na Harvard Medical School e professor de bioestatística da Har‑ vard School of Public Health. Ele recebeu título de B.A. em matemática pela Universidade de Columbia em 1967, M.S. em estatística pela Universidade de Stanford em 1968 e Ph.D. em estatística pela Universidade de Harvard em 1971. Tem mais de 30 anos de experiência em consultoria de bioestatística com outros pesquisadores da Harvard Medi‑ cal School. As áreas especiais de interesse incluem doenças cardiovasculares, hipertensão, câncer de mama e oftalmo‑ logia. Muitos dos exemplos e dos exercícios utilizados no texto refletem os dados recolhidos de estudos reais em conjunto com a sua experiência em consultoria. Além disso, ele desenvolveu novos métodos bioestatísticos, principalmente nas áreas de análise de dados longitudi‑ nais, análise de dados agrupados (como dados coletados em famílias ou de sistemas orgânicos pareados na mesma pessoa), métodos para erros de medição e métodos de detecção de outlier. Você verá alguns desses métodos neste livro em um nível elementar. Casou-se em 1972 com Cynthia, com quem tem três filhos, Sarah, David e Laura, cada um dos quais teve uma parcela de contribuição para a concretização deste livro.

XI

BOOK_R_FundamentosBioestatistica.indb 11

10/19/16 9:57 AM


BOOK_R_FundamentosBioestatistica.indb 12

10/19/16 9:57 AM


SUMÁRIO

CAPÍTULO 1

Visão Geral / 1 CAPÍTULO 2

Estatística Descritiva / 5 2.1 Introdução / 5 2.2

Medidas de Localização  /  6

2.3

Algumas Propriedades da Média Aritmética / 13

2.4 Medidas de Dispersão  /  15

2.9

Estudo de Caso 1: Efeitos da Exposição ao Chumbo na Função Neurológica e Psicológica em Crianças  /  30

2.10 Estudo de Caso 2: Efeitos do Uso do Tabaco na Densidade Mineral Óssea em Mulheres de Meia­‑Idade  /  31

2.5

Algumas Propriedades de Variância e Desvio-Padrão / 19

2.11 Obtendo a Análise Descritiva no Computador / 33

2.6

Coeficiente de Variação  /  21

2.12 Resumo / 33

2.7 Dados Agrupados / 22

Problemas / 33

2.8 Métodos Gráficos / 25

C A P Í T U L O 3 

Probabilidade / 39 3.1 Introdução / 39 3.2

Definição de Probabilidade  /  40

3.3

Algumas Notações Probabilísticas Úteis  /  41

3.4

A Lei da Multiplicação da Probabilidade / 43

3.5

A Lei da Adição da Probabilidade  /  45

3.6 Probabilidade Condicional / 47

3.7

Teorema de Bayes e Testes de Triagem / 51

3.8 Inferência Bayesiana / 56 3.9 Curvas ROC / 57 3.10 Prevalência e Incidência  /  59 3.11 Resumo / 60 Problemas / 61 XIII

BOOK_R_FundamentosBioestatistica.indb 13

10/19/16 9:57 AM


XIV       Sumário

C A P Í T U L O 4 

Distribuições Discretas de Probabilidade  /  73 4.1 Introdução / 73

4.8

4.2 Variáveis Aleatórias / 74

4.9 Valor Esperado e Variância da Distribuição Binomial / 90

4.3

A Função Massa de Probabilidade para uma Variável Aleatória Discreta  /  74

4.4

O Valor Esperado de uma Variável Aleatória Discreta / 76

4.5

A Variância de uma Variável Aleatória Discreta / 78

4.6

A Função de Distribuição Acumulada de uma Variável Aleatória Discreta  /  79

4.7

Permutações e Combinações  /  81

A Distribuição Binomial  /  85

4.10 A Distribuição de Poisson  /  92 4.11 Cálculo de Probabilidades de Poisson  /  95 4.12 Valor Esperado e Variância da Distribuição de Poisson / 96 4.13 Aproximação de Poisson para a Distribuição Binomial / 98 4.14 Resumo / 100 Problemas / 101

C A P Í T U L O 5 

Distribuições Contínuas de Probabilidade  /  109 5.1 Introdução / 109

5.6

Combinações Lineares de Variáveis Aleatórias / 124

5.7

Aproximação Normal para a Distribuição Binomial / 126 Aproximação Normal para a Distribuição de Poisson / 131

5.2 Conceitos Gerais / 109 5.3

A Distribuição Normal  /  111

5.4

Propriedades da Distribuição Normal Padrão / 114

5.8

5.5

Conversão de uma Distribuição N ( μ,σ2) para uma Distribuição N (0,1) / 120

5.9 Resumo / 133 Problemas / 134

C A P Í T U L O 6 

Estimação / 147 6.1 Introdução / 147 6.2

A Relação entre População e Amostra / 148

6.3

Tabelas de Número Aleatório  /  150

6.4

Ensaios Clínicos Aleatorizados  /  153

6.5

Estimação da Média de uma Distribuição / 157

6.6

Estudo de Caso: Efeitos do Uso do Tabaco na Densidade Mineral Óssea (DMO) em Mulheres de Meia­‑Idade  /  171

BOOK_R_FundamentosBioestatistica.indb 14

6.7

Estimação da Variância de uma Distribuição / 172

6.8

Estimação para a Distribuição Binomial / 177

6.9

Estimação para a Distribuição de Poisson / 183

6.10 Intervalos de Confiança Unilateral  /  186 6.11 Bootstrap / 188 6.12 Resumo / 191 Problemas / 192

10/19/16 9:57 AM


Sumário       XV

C A P Í T U L O 7 

Testes de Hipóteses: Inferência para uma Amostra  /  201 7.1 Introdução / 201 7.2 Conceitos Gerais / 201 7.3

Teste para a Média de uma Distribuição Normal: Testes Unilaterais  /  204

7.4

Teste para a Média de uma Distribuição Normal: Testes Bilaterais  /  211

7.5

Relação entre os Testes de Hipóteses e os Intervalos de Confiança  /  217

7.6

Poder de um Teste  /  220

7.7

Determinação do Tamanho da Amostra / 226

7.8 Teste χ2 para a Variância de uma Distribuição Normal / 232 7.9

Inferência para a Distribuição Binomial com base em uma Amostra  /  235

7.10 Inferência para a Distribuição de Poisson com base em uma Amostra  /  244 7.11 Estudo de Caso: Efeitos do Uso do Tabaco na Densidade Mineral Óssea em Mulheres de Meia­‑Idade / 249 7.12 Obtenção de Fórmulas Selecionadas  /  250 7.13 Resumo / 251 Problemas / 252

C A P Í T U L O 8 

Teste de Hipóteses: Inferência baseada em Duas Amostras  /  263 8.1 Introdução / 263 8.2 Teste t Pareado / 265 8.3

Estimação por Intervalo para a Comparação de Médias de Duas Amostras Pareadas / 268

8.4 Teste t para Duas Amostras Independentes com Variâncias Iguais  /  270 8.5

8.6

Estimação por Intervalo para a Comparação das Médias de Duas Amostras Independentes (Caso das Variâncias Iguais) / 273 Testando a Igualdade de Duas Variâncias / 275

8.7 Teste t para Duas Amostras Independentes com Variâncias Diferentes  /  280 8.8

Estudo de Caso: Efeitos da Exposição ao Chumbo nas Funções Neurológicas e Psicológicas de Crianças  /  286

8.9

Determinação do Tamanho da Amostra e Poder para Comparação de Duas Médias / 288

8.10 O Tratamento de Outliers / 292 8.11 Obtenção da Equação 8.13  /  299 8.12 Resumo / 300 Problemas / 300

C A P Í T U L O 9 

Métodos Não Paramétricos  /  319 9.1 Introdução / 319 9.2

O Teste do Sinal  /  321

9.3

O Teste de Postos com Sinais de Wilcoxon / 326

9.4

Teste da Soma de Postos de Wilcoxon / 332

BOOK_R_FundamentosBioestatistica.indb 15

9.5

Estudo de Caso: Efeitos da Exposição ao Chumbo nas Funções Neurológicas e Psicológicas em Crianças  /  337

9.6

Testes de Permutação  /  339

9.7 Resumo / 343 Problemas / 344

10/19/16 9:57 AM


XVI       Sumário

C A P Í T U L O 1 0 

Teste de Hipóteses: Dados Categóricos  /  351 10.1 Introdução / 351

10.6

Tabelas de Contingência R × C / 388

10.2

Teste para Duas Proporções Binomiais / 352

10.7

Teste Qui­‑Quadrado de Qualidade do Ajuste / 399

10.3

Teste Exato de Fisher  /  364

10.8

A Estatística Kappa  /  404

10.4

Teste para Duas Proporções Binomiais para Dados Pareados (Teste de McNemar)  /  371

10.9

Obtenção de Fórmulas Selecionadas  /  409

10.5

Determinação do Tamanho da Amostra e Poder para Comparar Duas Proporções Binomiais / 378

10.10 Resumo / 409 Problemas / 411

APÊNDICE

Tabelas / 429 1

Probabilidades binomiais Pr(X = k) =

2

Probabilidades de Poisson

3

Distribuição normal / 436

4

Tabela de 1.000 dígitos aleatórios  /  440

5

Percentis da distribuição t (td,u)a / 440

6

Percentis da distribuição qui­‑quadrado (χ2d,u)a / 441

7

Limites de confiança para a média de uma variável Poisson (µ) / 442

8

Percentis da distribuição F (Fd1,d 2,p ) / 443

9

Valores críticos para a estatística DSE (Desvio Studentizado Extremo) (DSEn,1–α , α = .05, .01)  /  445

10

Valores críticos para o teste de sinais de Wilcoxon bilateral  /  446

11

Valores bicaudais críticos para o teste de soma de pontos Wilcoxon  /  446

 pkqn–k / 429  / 433

Respostas para Problemas Selecionados  /  449 Índice do Software Estatístico  /  451 Índice remissivo / 455

BOOK_R_FundamentosBioestatistica.indb 16

10/19/16 9:57 AM


Visão geral

1

Estatística é a ciência por meio da qual se faz inferências sobre um fenômeno aleatório específico com base em uma amostra relativamente limitada. A área de estatística tem duas subáreas: estatística matemática e estatística aplicada. A estatística matemática preocupa­‑se com o desenvolvimento de novos métodos de inferência estatística e requer conhecimento detalhado de matemática complexa para a sua execução. A estatística apli‑ cada envolve a aplicação dos métodos de estatística matemática em assuntos específicos, como economia, psicologia e saúde pública. A bioestatística é uma ramificação da estatís‑ tica aplicada que utiliza métodos estatísticos para problemas biológicos e médicos. Evi‑ dentemente, essas áreas da estatística se sobrepõem de alguma maneira. Em alguns casos, por exemplo, em razão de uma aplicação da bioestatística, os métodos padrão não se aplicam e devem ser modificados. Nessas situações, os bioestatísticos empenham­‑se para desenvolver novos métodos. Uma boa maneira de aprender bioestatística e seu papel no processo de pesquisa é se‑ guir o fluxo de uma pesquisa desde o início do estágio de planejamento até a conclusão, momento em que geralmente a pesquisa com os resultados alcançados é publicada. Descre‑ verei como exemplo uma pesquisa da qual participei. Certa manhã, um amigo me ligou e, no decorrer da conversa, mencionou que havia recentemente utilizado um novo dispositivo de verificação de pressão sanguínea digital, do tipo que pode ser visto em bancos, hotéis e lojas de departamentos nos Estados Unidos. A leitura mais alta que o aparelho havia feito de sua pressão arterial foi de 130 mmHg e a média em várias ocasiões era de 115 mmHg. Fiquei preocupado porque, se essas leituras fossem exatas, meu amigo estaria em iminente perigo de ter um acidente vascular cerebral ou desenvolver alguma doença cardiovascular. Eu o encaminhei a um médico, colega meu, que, utilizando o aparelho de pressão arterial manual, verificou que sua pressão sanguínea era de 90 mmHg. O contraste entre as leituras despertou meu interesse e eu comecei a ano‑ tar as leituras do display digital todas as vezes que eu passava no meu banco, que dispunha do aparelho. Tive a impressão de que uma larga porcentagem de leituras registradas era de hipertensão. Embora se espere que pessoas hipertensas sejam mais propensas a utilizar esse tipo de aparelho com regularidade, eu ainda acreditava que as leituras da pressão sanguínea registradas pelo dispositivo podiam não ser comparáveis com as obtidas ao se utilizar os métodos padrão de mensuração de pressão sanguínea. Falei sobre minhas suspeitas com o dr. B. Frank Polk, médico da Harvard Medical School interessado em estudos sobre hiper‑ tensão, e consegui despertar seu interesse em avaliar, em uma pequena escala, esses apare‑ lhos. Decidimos então enviar vários desses aparelhos a um especialista em técnicas de mensuração de pressão arterial, que faria observações. Ele ofereceria uma quantia em di‑ nheiro aos participantes pela utilização dos aparelhos, se eles concordassem em preencher 1


2       C A P Í T U L O 1   Visão geral um pequeno questionário e permitissem a verificação da pressão arterial tanto pelo obser‑ vador quanto pelo aparelho. Nesse estágio, precisávamos tomar várias decisões importantes, cada uma das quais pro‑ vava ser vital para o sucesso do estudo. Essas decisões baseavam­‑se nas seguintes perguntas: (1) Quantos aparelhos deveríamos testar? (2) Quantos participantes deveríamos testar em cada aparelho? (3) Em qual ordem deveríamos considerar as medidas? Deveríamos considerar primeiro a do observador ou a do aparelho? Sob circunstâncias ideais, teríamos de considerar am‑ bas as leituras, do observador e do aparelho simultaneamente, mas isso era logica‑ mente impossível. (4) Que dados deveríamos coletar no questionário que poderiam influenciar a comparação entre os dois? (5) Como deveríamos registrar os dados para facilitar a digitalização posterior? (6) Como deveríamos verificar a acurácia dos dados digitalizados? Resolvemos essas questões da seguinte forma. (1) e (2) Como não tínhamos certeza de que todos os aparelhos de pressão arterial eram iguais em qualidade, decidimos testar quatro deles. No entanto, selecionamos amostras suficientes de pessoas utilizando cada aparelho a fim de obtermos uma comparação rigo‑ rosa dos métodos padrão e automatizado para cada máquina. Tentamos prever quão grande poderia ser a discrepância entre os dois métodos. Utilizando os métodos de deter‑ minação do tamanho da amostra discutidos neste livro, calculamos que precisaríamos de 100 participantes em cada local para fazer a comparação exata. (3) Então, tivemos que decidir em que ordem consideraríamos a mensuração de cada pessoa. De acordo com alguns relatos, um problema em obter mensurações de pressão san‑ guínea repetidas é que as pessoas ficam mais tensas durante a mensuração inicial, o que ocasiona leituras mais elevadas. Assim, nem sempre usaríamos o método manual ou o digi‑ tal primeiro, porque o efeito do método seria confundido com o efeito da ordem das medi‑ das. A técnica convencional que utilizamos foi aleatorizar a ordem na qual as mensurações eram realizadas, de modo que para qualquer pessoa fosse igualmente provável que o apare‑ lho ou o pesquisador realizasse a primeira medição. Esse padrão poderia ser definido no cara ou coroa, ou, mais provavelmente, por uma tabela de números aleatórios, similar à Tabela 4 do Apêndice Tabelas. (4) Acreditávamos que o principal fator externo que poderia influenciar os resultados seria o tamanho do corpo (poderíamos ter mais dificuldade em conseguir leituras precisas de pessoas com braços mais grossos do que com braços mais finos). Queríamos também ter uma ideia do tipo de pessoa que usa essas máquinas. Consideramos então a idade, o gênero e o histórico prévio de hipertensão. (5) Para registrar os dados, desenvolvemos uma forma de codificação que pudesse ser preenchida no local a partir do qual os dados seriam facilmente digitalizados para posterior análise. Atribuiu­‑se um número único de identificação (ID) para cada pessoa do estudo, por meio do qual o computador poderia identificá­‑la. Os dados da codificação foram então di‑ gitados e verificados, ou seja, a mesma forma de codificação foi digitada duas vezes e os dois registros foram comparados para garantir que eram os mesmos. Se os registros não correspondessem, a codificação era redigitada. (6) Checar cada item de cada codificação era impossível em razão da grande quantidade de dados envolvidos. Em vez disso, após a entrada dos dados, utilizávamos algum pro‑ grama de edição para assegurar que os dados eram precisos. Esses programas verificavam se os valores para as variáveis individuais caíam dentro dos intervalos específicos e mostra‑ vam valores discrepantes para a checagem manual. Por exemplo, determinamos que as leituras de pressão sanguínea seriam de, no mínimo, 50 mmHg e, no máximo, 300 mmHg, e imprimimos todas as leituras que estavam fora desse intervalo. Também utilizamos pro‑ gramas para detectar aspectos discrepantes que discutiremos mais adiante.


Visão geral       3

Depois de concluir as fases de coleta, entrada e edição de dados, estávamos prontos para analisar os resultados do estudo. O primeiro passo desse processo foi tirar uma impressão dos dados, resumindo as informações na forma de várias estatísticas descritivas. Esse mate‑ rial descritivo pode estar na forma numérica ou gráfica. Na forma numérica, pode ser al‑ gum resumo estatístico apresentado na forma tabular ou, como alternativa, sob a forma de distribuição de frequência, que lista cada valor dos dados e quão frequentemente este ocorre. Na forma gráfica, os dados são resumidos graficamente e podem ser apresentados por um ou mais números. O tipo apropriado de material descritivo a ser utilizado varia com o tipo de distribuição considerado. Se a distribuição for contínua – isto é, se houver essencialmente um número infinito de valores possíveis, como seria o caso da pressão san‑ guínea –, então médias e desvios­‑padrão poderão ser as estatísticas descritivas apropriadas. Entretanto, se a distribuição for discreta – isto é, se houver apenas alguns valores possíveis, como seria o caso do gênero –, as percentagens das pessoas consideradas para cada valor serão as medidas descritivas apropriadas. Em alguns casos, os dois tipos de estatística des‑ critiva são utilizados para distribuições contínuas, condensando a gama de possíveis valo‑ res para alguns grupos e dando o percentual de pessoas que caem em cada grupo (por exemplo, as porcentagens de pessoas que têm pressão arterial entre 120 e 129 mmHg, entre 130 e 139 mmHg, e assim por diante). Nesse estudo, decidimos primeiro analisar a pressão arterial média de cada método em cada um dos quatro locais. A Tabela 1.1 resume essas informações [1]. É possível notar nessa tabela, que não obtivemos dados significativos de todas as 100 pessoas entrevistadas em cada local, uma vez que não pudemos obter leituras válidas do aparelho para muitas pessoas. Esse problema de perda de dados é muito comum em bioes‑ tatística e deve ser considerado antecipadamente no estágio de planejamento, quando se determina o tamanho da amostra (o que não foi feito nesse estudo). TABELA 1.1

Pressão sanguínea média e diferenças entre o aparelho e as leituras do observador em quatro localizações Pressão sanguínea sistólica (mmHg) Aparelho

Observador

Diferença

Localização

Número de pessoas

Média

Desvio­ ‑padrão

Média

Desvio­ ‑padrão

Média

Desvio­ ‑padrão

A B C D

98 84 98 62

142,5 134,1 147,9 135,4

21,0 22,5 20,3 16,7

142,0 133,6 133,9 128,5

18,1 23,2 18,3 19,0

0,5 0,5 14,0 6,9

11,2 12,1 11,7 13,6

Fonte: Baseada na American Heart Association, Inc.

Nosso próximo passo nesse estudo era determinar se as diferenças aparentes na pressão sanguínea entre as medições do aparelho e as medições feitas por pessoas em duas localiza‑ ções (C, D) eram “reais” em algum sentido ou eram “decorrentes do acaso”. Esse tipo de questão se enquadra na área de estatística inferencial. Percebemos que, embora houvesse uma diferença de 14 mmHg na pressão sanguínea sistólica média entre os dois métodos para as 98 pessoas que entrevistamos no local C, essa diferença poderia não acontecer se entrevistássemos outras 98 pessoas nesse local em momentos diferentes, e queríamos ter ideia do erro na estimativa de 14 mmHg. Na linguagem estatística, esse grupo de 98 pes‑ soas representa uma amostra da população de todas as pessoas que podem usar o apare‑ lho. Estávamos interessados na população e queríamos utilizar a amostra para nos ajudar a saber algo sobre a população. Em particular, queríamos saber o quanto a diferença média estimada de 14 mmHg em nossa amostra podia ser proveniente da diferença média ver‑ dadeira na população de todas as pessoas que utilizaram esse dispositivo. Mais especifica‑ mente, queríamos saber se ainda era possível que não houvesse nenhuma diferença subjacente entre os dois métodos e os resultados decorrentes do acaso. A diferença de 14 mmHg em


4       C A P Í T U L O 1   Visão geral nosso grupo de 98 pessoas é chamada de estimativa da diferença média verdadeira (d) na população. O problema de inferir características da população com base em uma amostra é a preocupação central da estatística inferencial e constitui o tema principal deste texto. Para concluir esse objetivo, precisávamos desenvolver um modelo de probabilidade que nos diria quão provável seria obter uma diferença de 14 mmHg entre os dois métodos em uma amostra de 98 pessoas se não houvesse diferença real entre os dois métodos no total da população de usuários do dispositivo. Se essa probabilidade fosse suficientemente pe‑ quena, começaríamos a acreditar em uma diferença real existente entre os dois métodos. Nesse caso em particular, utilizando o modelo de probabilidade fundamentado na distri‑ buição t, concluímos que essa probabilidade foi de menos de 1 em 1.000 para cada um dos aparelhos nos locais C e D. Essa probabilidade foi suficientemente pequena para que con‑ cluíssemos que havia uma diferença real entre os métodos manual e digital de verificação da pressão arterial para dois dos quatro aparelhos testados. Utilizamos um pacote estatístico para executar a análise dos dados precedentes. Um pacote é uma série de programas de estatística que descreve os dados e executa vários testes estatísticos desses dados. No momento, os pacotes mais amplamente utilizados são SAS, SPSS, Stata, R, Minitab e Excel. A etapa final desse estudo, após concluir a análise de dados, foi compilar os resultados e publicar o manuscrito. Inevitavelmente, em razão das considerações de espaço, elimina‑ mos muito do material desenvolvido durante a fase de análise de dados e apresentamos apenas os itens essenciais para a publicação. Essa avaliação do nosso estudo da pressão arterial deve dar­‑lhe uma ideia do que é a pesquisa clínica e o papel da bioestatística nesse processo. O material deste texto equivale à descrição da fase de análise de dados do estudo. O Capítulo 2 resume os diferentes tipos de estatística descritiva. Os Capítulos 3 a 5 apresentam alguns princípios básicos de proba‑ bilidade e vários modelos de probabilidade para utilização em discussões posteriores sobre estatística inferencial. A partir do Capítulo 6, discutem­‑se os principais tópicos sobre esta‑ tística inferencial quando utilizada na prática biomédica. Questões de planejamento de estudo ou coleta de dados são abordadas apenas quando se relacionam com outros temas discutidos no texto.

REFERÊNCIAS [1] Polk, B. F.; Rosner, B.; Feudo, R.; Vandenburgh, M. An evaluation of the Vita­‑Stat automatic blood pressure mea‑ suring device. Hypertension, v. 2, n. 2, 1980, p. 221­‑227.


Bi0ESTATÍSTICA BERNARD R0SNER

TRADUÇÃO DA 8 EDIÇÃO NORTE-AMERICANA a

BERNARD R0SNER

FUNDAMENT0S DE

gem, Ciências Biológicas, Fisioterapia, entre outras. MATERIAL DE APOIO ON-LINE PARA PROFESSORES E ALUNOS.

FUNDAMENT0S DE

Aplicações: livro-texto para as disciplinas básicas de bioestatística de cursos de graduação na área de saúde/biológicas, como Medicina, Farmácia, Enferma-

orelha Probabilidade e estatística para engenharia e ciências Tradução da 8ª edição norte-americana Jay L. Devore

Estatística aplicada à administração e economia

Bi0ESTATÍSTICA

Como diferencial, os inúmeros exemplos são baseados em artigos da literatura médica e em problemas reais de pesquisa clínica. Além disso, a solução computacional desses exemplos é apresentada utilizando diferentes softwares estatísticos, motivando o leitor a conhecer e aplicar os métodos abordados no texto.

Bi0ESTATÍSTICA BERNARD R0SNER

Rosner reuniu a experiência de 30 anos de trabalho na Universidade de Harvard para oferecer este texto aos estudantes da área médica e correlatas, apresentando os métodos estatísticos mais utilizados na literatura médica. Os métodos são apresentados em um nível intermediário com descrição intuitiva, minimizando a quantidade de formulações matemáticas, mas fornecendo explicações completas sobre todos os conceitos importantes. A linguagem simples e didática proporciona familiaridade com as técnicas sem que seja necessário lançar mão de textos estatísticos especializados.

FUNDAMENT0S DE

TRADUÇÃO DA 8a EDIÇÃO NORTE-AMERICANA

Probabilidade Tradução da 6ª edição norte-americana / e3ªestatística para edição brasileira engenharia Dennis J. Sweeney, Thomas A. Williams e e ciências David R. Anderson Tradução da 8ª edição norte-americana

JAY L. DEVORE Estatística para economistas

Estatística aplicada 4ª edição revista e ampliada à administração eRodolfo economia Hoffmann Tradução da 6ª edição norte-americana

DENNIS J. SWEENEY, Estatística THOMAS básica A. WILLIAMS E DAVID R. ANDERSON Sonia Vieira

Estatística para economistas 4ª edição revista e ampliada

RODOLFO HOFFMANN MATERIAL DE APOIO ON-LINE

Estatística básica SONIA VIEIRA ISBN 978-85-221-2553-1 ISBN 13 978‑85‑221‑2553‑1 ISBN 10 85‑221‑2553‑8

Para suas soluções de curso e aprendizado, visite www.cengage.com.br

FINAL_Fundamentos de Bioestatistica_CAPA.indd All Pages

9 788522 125531

10/31/16 16:20


Fundamentos de Bioestatística