Testes Diagnósticos (texto)

Page 1

www.grupometa.med.br

PREVENTIVA - TEXTO

CONTEÚDO 1 CONCEITOS DE SENSIBILIDADE E ESPECIFICIDADE E INDICAÇÕES DOS TESTES............. 3 1.1 Sensibilidade........................................................................................................................... 4 1.1.1 Interpretação do resultado................................................................................................ 5 1.2 Especificidade ......................................................................................................................... 7 2 VALOR PREDITIVO POSITIVO E NEGATIVO .............................................................................. 9 2.1 O que pode influenciar os valores preditivo positivo e negativo ............................................. 10 2.1.1 Prevalência .................................................................................................................... 10 3 CURVA ROC ............................................................................................................................... 13 4 CONCEITOS RARAMENTE COBRADOS EM PROVAS DE CONCURSOS MÉDICOS .............. 16 4.1 Razão de verossimilhança positiva e negativa ...................................................................... 16 4.2 Confiabilidade ....................................................................................................................... 18 4.3 Outras definições .................................................................................................................. 20 5 RESUMO ..................................................................................................................................... 21 6 REFERÊNCIAS BIBLIOGRÁFICAS ............................................................................................. 22

Rua Rio Grande do Norte, 63 sala 41 – Bairro Santa Efigênia – 30.130-130 - BH/MG - Tel.(31) 3245-4025

1


PREVENTIVA – TEXTO

2

www.grupometa.med.br

Rua Rio Grande do Norte, 63 sala 41 – Bairro Santa Efigênia – 30.130-130 - BH/MG - Tel.(31) 3245-4025


PREVENTIVA - TEXTO

www.grupometa.med.br

1 CONCEITOS DE SENSIBILIDADE E ESPECIFICIDADE E INDICAÇÕES DOS TESTES Os conceitos de sensibilidade e especificidade serão apresentados considerando uma população hipotética de 200 pessoas, sendo 100 saudáveis e 100 diabéticas conforme apresentado na Tabela 1.

Tabela 1 – Diabéticos e saudáveis segundo valores da glicemia de jejum Glicemia jejum (mg/dL)

80-89

90-99

100-109

110-119

120-125

126-129

130

Diabéticos por valores de glicemia (total = 100)

0

0

5

10

15

20

50

Número de saudáveis (total = 100)

50

25

10

10

5

0

0

O cabeçalho da tabela (primeira linha) apresenta os valores da glicemia de jejum, entre 80 e 130 mg/dl. Na coluna identificada com os números 80-89 aparecem os pacientes com glicemia entre 80 e 89 e sucessivamente. Na segunda linha, temos um total de 100 pacientes diabéticos, distribuídos segundo os valores de glicemia. Por exemplo, observa-se que cinco pacientes tem valores de glicemia entre 100 e 109 mg/dL pois aparecem na coluna identificada como tal; outros 10 pacientes apresentam glicemia entre 110 e 119 mg/dL pois aparecem na respectiva coluna. Na terceira linha, temos um total de 100 pessoas saudáveis, sendo que 10 apresentam glicemia de jejum entre 100 e 109 e outras cinquenta pessoas apresentam glicemia de jejum entre 80 e 89. Suponhamos agora que seja estabelecido o ponto de corte de 110, ou seja, pacientes com glicemia igual ou superior a 110 serão identificados como positivos. Estes pacientes aparecem sombreados na Tabela 1A abaixo.

Tabela 1A - Representação para ponto de corte de 110 Glicemia jejum (mg/dL)

80-89

90-99

100-109

110-119

120-125

126-129

130

Diabéticos por valores de glicemia (total = 100)

0

0

5

10

15

20

50

Número de saudáveis (total = 100)

50

25

10

10

5

0

0

Resultados negativos

Resultados positivos

Rua Rio Grande do Norte, 63 sala 41 – Bairro Santa Efigênia – 30.130-130 - BH/MG - Tel.(31) 3245-4025

3


PREVENTIVA – TEXTO

www.grupometa.med.br

1.1 Sensibilidade Observa-se que dos 100 pacientes diabéticos 95 terão resultado positivo e outros cinco terão resultado negativo. Assim, a sensibilidade da glicemia de jejum neste ponto de corte de 110 será de 95% pois 95 em cada 100 doentes serão corretamente identificados como positivos. Os números da Tabela 1A podem então ser representados de outro formato (Tabela 2). Tabela 2 – valores de sensibilidade para ponto de corte de 110 mg/dL D +

95

-

5

TOTAL

100

S

Sensibilidade = verdadeiro positivo / total doentes

Caso fosse utilizado o ponto de corte de 100 para definir os pacientes com resultados positivos todos os doentes (segunda linha) seriam identificados como positivos. Na Tabela 1B (abaixo), podemos observar que temos cinco diabéticos que aparecem com sombreado mais escuro e que foram considerados positivos com o ponto de corte 100. Estes não eram considerados positivos o ponto de corte era de 110 (Tabela 1A). Estes cinco pacientes aparecem na segunda linha com a coluna identificada com 100-109. Tabela 1B - Representação para ponto de corte de 100 Glicemia jejum (mg/dL)

80-89

90-99

100-109

110-119

120-125

126-129

130

Diabéticos por valores de glicemia (total = 100)

0

0

5

10

15

20

50

Número de saudáveis (total = 100)

50

25

10

10

5

0

0

Resultados negativos

Resultados positivos

Os números da Tabela 1B podem então ser representados de outro formato (Tabela 3). Tabela 3 – valores de sensibilidade para ponto de corte de 100mg/dL D

4

+

100

-

Ø

TOTAL

100

S

Rua Rio Grande do Norte, 63 sala 41 – Bairro Santa Efigênia – 30.130-130 - BH/MG - Tel.(31) 3245-4025


PREVENTIVA - TEXTO

www.grupometa.med.br

Nesta tabela fica evidente que a Sensibilidade foi de 100%, ou seja, que todos os doentes foram identificados como positivos. Confira a definição de Sensibilidade: Sensibilidade = capacidade de detectar corretamente os doentes Sensibilidade = verdadeiro positivo / total doentes

1.1.1 Interpretação do resultado Agora que já entendemos o conceito de sensibilidade, vamos trabalhar com a interpretação dos resultados. Quando o ponto de corte foi modificado de 110 para 100 conseguimos que todos os doentes fossem identificados como positivos, porém ainda não explicamos como isso influencia o resultado do teste nos pacientes saudáveis. Na Tabela 1C, que tem o mesmo ponto de corte da Tabela 1A, ou seja, pacientes com resultado acima de 110 são considerados positivos, encontram-se 15 saudáveis (dez com glicemia entre 110 e 119 e outros cinco com glicemia entre 120 e 125 – identificados com elipse tracejada) são identificados como positivos, ou seja, falso-positivos.

Tabela 1C - Representação para ponto de corte de 110 Glicemia jejum (mg/dL)

80-89

90-99

100-109

110-119

120-125

126-129

130

Diabéticos por valores de glicemia (total = 100)

0

0

5

10

15

20

50

Número de saudáveis (total = 100)

50

25

10

5

0

0

10

Resultados negativos

Resultados positivos

Estes resultados da Tabela 1C podem ser apresentados com outro formato, como aparece na Tabela 4. Tabela 4 – Desempenho do teste para resultados entre os doentes e saudáveis considerando ponto de corte de 110 mg/dL D

S

+

95

15

-

5

85

TOTAL

100

100

Rua Rio Grande do Norte, 63 sala 41 – Bairro Santa Efigênia – 30.130-130 - BH/MG - Tel.(31) 3245-4025

5


PREVENTIVA – TEXTO

www.grupometa.med.br

Quando se utiliza o ponto de corte de 100 para identificar aqueles com resultados positivos observa-se que outros dez saudáveis, identificados na Tabela 1D com círculo foram identificados como positivos, o que corresponde a um total de 25 falso-positivos.

Tabela 1D - Representação para ponto de corte de 100 Glicemia jejum (mg/dL)

80-89

90-99

100-109

110-119

120-125

126-129

130

0

0

5

10

15

20

50

10

10

50

25

5

0

0

Diabéticos por valores de glicemia (total = 100) Número de saudáveis (total = 100) Resultados negativos

Resultados positivos

Os resultados desta Tabela 1D podem ser apresentados em outro formato, como na Tabela 5. Tabela 5 – Desempenho do teste para resultados entre os doentes e saudáveis considerando ponto de corte de 100 mg/dL D

S

+

100

25

-

0

75

TOTAL

100

100

Comparando-se a Tabela 4 com a Tabela 5 nota-se que ao aumentar a sensibilidade de 95% (Tabela 4) para 100% (Tabela 5) ocorre um aumento também no número de falso-positivos (de 15 na Tabela 4 para 25 na Tabela 5). Este aumento de falso-positivos com aumento da sensibilidade (e redução na especificidade que será explicada mais adiante) também pode ser visto na Figura 1 abaixo. Os diabéticos aparecem na curva da direita (curva tracejada), enquanto os saudáveis na curva da esquerda. Ao se definir um ponto de corte de 100 mg/dL, representado na figura com a linha vertical, todos os doentes ficam à direita desta curva e são identificados como positivos. Entretanto o “custo” desta sensibilidade máxima é que alguns saudáveis serão identificados como positivos (cor roxa na Figura 1). Assim, apesar da sensibilidade ser definida como a capacidade de identificar corretamente os doentes = Verdadeiro positivo / total doentes, não podemos confiar no resultado positivo de um teste sensível por causa do aumento de falso-positivos. Ao contrário, podemos confiar no resultado

6

Rua Rio Grande do Norte, 63 sala 41 – Bairro Santa Efigênia – 30.130-130 - BH/MG - Tel.(31) 3245-4025


PREVENTIVA - TEXTO

www.grupometa.med.br

negativo, pois com a sensibilidade máxima todos os indivíduos doentes serão identificados como positivos e nenhum como falso-negativo. Observe na Tabela 5, que apresenta sensibilidade de 100% que todas as pessoas que tem resultado negativo são saudáveis! Este mesmo resultado pode ser visto na Figura 1 (área verde do gráfico). Resumindo: na Tabela 4, com sensibilidade de 95%, pode ser observado que dentre as 90 pessoas com resultado negativo, cinco são falso-negativos (doentes com resultado negativo), e, onde se tem uma sensibilidade máxima, de 100%, como na Tabela 5, todos os resultados negativos serão de saudáveis. Assim, sensibilidade máxima implica em falso-positivos mas permite confiar nos resultados negativos. Por isso, os testes sensíveis são habitualmente indicados para triagem e os resultados negativos podem ser “descartados” enquanto os resultados positivos, pelo alto número de falsopositivos precisam ser confirmados com um teste específico.

Figura 1 – Gráfico indicando o ponto de sensibilidade máxima

1.2 Especificidade A definição de especificidade é a capacidade de detectar corretamente os saudáveis = Verdadeiro negativo / total saudáveis. Na Tabela 1E, que considera um ponto de corte de 100 mg/dL para resultados positivos, observamos que dos 100 saudáveis que aparecem na terceira linha, 75 serão corretamente identificados como negativos. Tabela 1E - Representação para ponto de corte de 100 Glicemia jejum (mg/dL)

80-89

90-99

100-109

110-119

120-125

126-129

130

Diabéticos por valores de glicemia (total = 100)

0

0

5

10

15

20

50

Número de saudáveis (total = 100)

50

25

10

10

5

0

0

Resultados negativos

Resultados positivos

Rua Rio Grande do Norte, 63 sala 41 – Bairro Santa Efigênia – 30.130-130 - BH/MG - Tel.(31) 3245-4025

7


PREVENTIVA – TEXTO

www.grupometa.med.br

Este resultado já foi apresentado na Tabela 5. Observe naquela tabela a coluna de saudáveis com 100 pacientes sendo 75 na linha de resultados negativos. Na Tabela 1F, que representa um ponto de corte de 126, critério para diagnóstico de Diabetes Mellitus vigente em 2013, pode ser observado que todos os saudáveis apresentam valores abaixo de 125. Tabela 1F - Representação para ponto de corte de 126 Glicemia jejum (mg/dL)

80-89

90-99

100-109

110-119

120-125

126-129

130

Diabéticos por valores de glicemia (total = 100)

0

0

5

10

15

20

50

Número de saudáveis (total = 100)

50

25

10

10

5

0

0

Resultados negativos

Resultados positivos

Estes resultados da Tabela 1F podem ser representados de outra forma (tabela 6). Dessa forma, teremos uma especificidade de 100% pois todos os saudáveis serão identificados corretamente como verdadeiro negativos. Tabela 6 – Desempenho do teste para resultados entre os doentes e saudáveis considerando ponto de corte de 126 mg/dL D

S

+

70

0

-

30

100

TOTAL

100

100

Assim, temos que, para especificidade de 100% a sensibilidade foi de 70% (Tabela 6) e já para uma sensibilidade de 100% temos uma especificidade de 75% (Tabela 5), ou seja, ao privilegiar um ponto de corte conseguimos maximizar um destes parâmetros em detrimento do outro. No Quadro 1 apresentamos um resumo dos conceitos apresentados. Quadro 1 – Conceitos de sensibilidade e especificidade (resumo) Conceito

Sensibilidade

Especificidade

Definição: capacidade de:

detectar uma doença quando ela está presente

detectar corretamente os saudáveis.

Fórmula

Verdadeiro positivo / total doentes

Verdadeiro negativo / total saudáveis

Indicação

Triagem (1º teste)

Confirmatório (2º teste)

Consequência

Muito falso-positivo

Muito falso-negativo

Resultado mais produtivo

Negativo

Positivo

8

Rua Rio Grande do Norte, 63 sala 41 – Bairro Santa Efigênia – 30.130-130 - BH/MG - Tel.(31) 3245-4025


www.grupometa.med.br

PREVENTIVA - TEXTO

Como os conceitos acima são antagônicos, decore somente um deles. Um teste sensível precisa ser escolhido quando as consequências de se deixar passar uma doença são consideráveis (pessoa com HIV doar sangue, por exemplo). Ou seja, um teste altamente sensível é muito útil para o clínico quando o resultado do teste é negativo (FLETCHER 2006 p. 62). Com o teste específico ocorre o contrário. Encerra-se aqui a parte 1. Recomenda-se ao leitor que resolva os exercícios da parte 1, para sedimentar os conceitos já apresentados, antes de prosseguir na leitura deste texto.

2 VALOR PREDITIVO POSITIVO E NEGATIVO Na prática médica, entretanto não se sabe, com certeza, quem são os doentes e os saudáveis. Assim, os resultados dos exames clínicos não produzem quatro grupos (doentes com resultado positivo; doentes com resultado negativo; saudáveis com resultado positivo; saudáveis com resultado negativo) como apresentado nas tabelas acima, mas apenas dois grupos sendo um de pessoas com teste positivo e que serão chamadas para exames adicionais e um grupo em que o teste foi negativo e provavelmente dispensadas. Na Tabela 7 apresentamos os totais de exames positivos (110) e de exames negativos (90) obtidos considerando um ponto de corte de 110mg/dL e já mostrado na Tabela 4.

Tabela 7 – Resultados de um determinado teste na prática clínica Doentes e Saudáveis Teste positivo

110

Teste negativo

90

Quando o médico assistente solicitar uma glicemia de jejum e o resultado vier positivo (valor acima do ponto de corte) ele apenas sabe que o resultado é positivo e precisa decidir se o resultado tem maiores chances de ser um verdadeiro positivo (doente) ou de ser um falso-positivo (saudável). Surge então a pergunta: dentre as pessoas com resultado positivo qual a probabilidade de uma delas ser doente? Para responder a esta pergunta devemos usar o conceito de valor preditivo também denominado probabilidade pós-teste.

Valor preditivo positivo = resultados verdadeiro positivos / total testes positivos

Podemos observar na Tabela 4, novamente transcrita abaixo, que 95 das 110 pessoas que tiveram um resultado positivo são realmente doentes.

Rua Rio Grande do Norte, 63 sala 41 – Bairro Santa Efigênia – 30.130-130 - BH/MG - Tel.(31) 3245-4025

9


PREVENTIVA – TEXTO

www.grupometa.med.br

Tabela 4 – desempenho do teste para resultados entre os doentes e saudáveis considerando ponto de corte de 110 mg/Dl D

S

+

95

15

-

5

85

TOTAL

100

100

Uma pergunta similar pode ser feita com relação aos resultados negativos. Dentre as pessoas com resultado negativo qual a probabilidade de uma delas ser saudável (verdadeiro negativo). Valor preditivo negativo = resultados verdadeiro negativos / total testes negativos

Podemos observar na Tabela 4 que 85 das 90 pessoas que tiveram um resultado negativo são realmente saudáveis. Na Tabela 8 apresenta-se um resumo destes conceitos. Tabela 8 – Conceitos de valor preditivo positivo e valor preditivo negativo (resumo) Conceito

Valor preditivo positivo

Valor preditivo negativo

Interpretação

A partir de um teste positivo qual a chance de uma pessoa ser doente

A partir de um resultado negativo qual a chance de uma pessoa ser saudável

Fórmula

Verdadeiro positivos / total positivos

Verdadeiro negativos / total negativos

Resultado na tabela 4

(95/110)

(85/90)

Os valores preditivos (positivo e negativo) são também chamados de probabilidade pósteste, pois representam a probabilidade de doença ou de sua ausência, após o resultado do teste ser conhecido. (FLETCHER, 2006; p. 67)

2.1 O que pode influenciar os valores preditivo positivo e negativo 2.1.1 Prevalência Na Tabela 9A e 9B são apresentados o desempenho de um mesmo teste com uma sensibilidade de 90% e uma especificidade de 50%. A única diferença entre estas duas tabelas é a prevalência, 10% na Tabela A e 90% na Tabela B (veja o total de doentes nas duas tabelas).

10

Rua Rio Grande do Norte, 63 sala 41 – Bairro Santa Efigênia – 30.130-130 - BH/MG - Tel.(31) 3245-4025


PREVENTIVA - TEXTO

www.grupometa.med.br

Tabela 9A

Tabela 9B

Resultados para prevalência de 10%

Resultados para prevalência de 90%

Doentes

Saudáveis

Positivo

90

450

540

Negativo

10

450

460

100

900

Doentes

Saudáveis

Positivo

810

50

860

Negativo

90

50

140

900

100

Estas tabelas foram preenchidas da seguinte maneira: 1- a prevalência define o total de doentes: 100 na Tabela 9A e 900 na Tabela 9B 2 - sensibilidade de 90% indica que dos 100 doentes na Tabela 9A 90 terão resultado positivo e dos 900 pacientes na Tabela 9B 810 terão resultado positivo. Restam então 10 doentes com resultado negativo na 9A e 90 na Tabela 9B. 3 – especificidade de 50% indica que dos 900 saudáveis na Tabela 9A 450 serão verdadeiro negativo e os outros 450 falso positivo. A mesma proporção é encontrada na Tabela 9B com 50 verdadeiro negativo e outros 50 falso-positivo. Como o Valor Preditivo Positivo (VPP) = verdadeiro positivo / total positivos temos que Na Tabela 9A VPP = 90/540 = 17% e na Tabela 9B = 810/860 = 94% Como o Valor Preditivo Negativo (VPN) = verdadeiro negativo / total negativos temos que Na Tabela 9A VPN = 450/460 = 98% e na Tabela 9B = 50 / 140 = 36% Podemos observar então que o aumento da prevalência na Tabela 9B foi acompanhada do aumento do Valor Preditivo Positivo, o que implica num raciocínio bem lógico: a quantidade de doentes na Tabela 9B é maior (prevalência) e por isso maior é a chance de um resultado positivo ser de um doente (valor preditivo positivo). Da mesma forma, observamos que o aumento da prevalência na Tabela 9B foi acompanhado da redução do Valor Preditivo Negativo, o que da mesma forma implica noutro raciocínio bem lógico: como a quantidade de doentes na Tabela 9B é maior (prevalência), maior é a chance de um resultado negativo ser de um doente (falso negativo) e menor a chance de um resultado negativo ser de um saudável (verdadeiro negativo), o que reduz o valor preditivo negativo. Assim, ↑ prevalência = ↑ valor preditivo positivo

(e ↓ valor preditivo negativo)

2.1.2 Sensibilidade Na Tabela 10A e 10B é apresentado o desempenho de um mesmo teste com a mesma prevalência de 10% (veja o total de doentes nas duas tabelas). Na Tabela A temos uma

Rua Rio Grande do Norte, 63 sala 41 – Bairro Santa Efigênia – 30.130-130 - BH/MG - Tel.(31) 3245-4025

11


PREVENTIVA – TEXTO

www.grupometa.med.br

sensibilidade mais baixa, de 50% enquanto na tabela B temos uma sensibilidade mais alta de 90%. Observe que o aumento da sensibilidade de A para B é acompanhado da redução da especificidade de A (90%) para B (50%). Tabela 10A

Tabela 10B

S = 50%; E=90%; P = 10%

S = 90%; E=50%; P = 10%

Doentes

Saudáveis

Positivo

50

90

140

Negativo

50

810

860

100

900

Doentes

Saudáveis

Positivo

90

450

540

Negativo

10

450

460

100

900

As tabelas foram preenchidas com os seguintes passos: 1- o total de doentes (prevalência) é o mesmo nas duas tabelas 2 – sensibilidade de 50% (Tabela 10A) indica que dos 100 doentes, 50 terão resultado positivo. Já na Tabela 10B com sensibilidade de 90%, dos 100 doentes, 90 terão resultado positivo. Restam então 50 doentes com resultado negativo na 10A e 10 na Tabela 10B. 3 – especificidade de 90% indica que dos 900 saudáveis na Tabela 10A 810 serão verdadeiro negativos e os outros 90 falso-positivos. Já na Tabela 10B, em que temos uma especificidade de 50% teremos 450 verdadeiro negativo e outros 450 falso-positivos. Como o Valor Preditivo Positivo (VPP) = verdadeiro positivo / total positivos temos que Na Tabela 10A VPP = 50/140 = 36% e na Tabela 10B = 90/540 = 17% Como o Valor Preditivo Negativo (VPN) = verdadeiro negativo / total negativos temos que Na Tabela 10A VPN = 810/860 = 94% e na Tabela 10B = 450 / 460 = 98% Podemos observar então que o aumento da sensibilidade na tabela 10B em relação a Tabela 10A foi acompanhada de uma redução no valor preditivo positivo o que implica num raciocínio bem lógico, pois com o aumento da sensibilidade aumenta-se muito o número de falsopositivos (conforme explicado na parte 1 deste texto) e, com isso, reduz a chance de um resultado positivo ser de um doente (valor preditivo positivo). Da mesma forma, fica fácil entender que com o aumento da sensibilidade, mais doentes serão identificados como resultado verdadeiro positivo, diminuindo o número de doentes com resultado falso negativo. Esta redução de falso-negativo aumenta a proporção de resultados verdadeiro negativo o que causa aumento do Valor Preditivo Negativo (VPN). Assim, ↑ sensibilidade = ↓ valor preditivo positivo

12

(e ↑ valor preditivo negativo)

Rua Rio Grande do Norte, 63 sala 41 – Bairro Santa Efigênia – 30.130-130 - BH/MG - Tel.(31) 3245-4025


PREVENTIVA - TEXTO

www.grupometa.med.br

2.1.3 Especificidade Como o conceito de especificidade apresenta comportamento inverso ao de sensibilidade cabe apenas citar que a influência no VPP e VPN será inversa. Assim, ↑ especificidade = ↑ valor preditivo positivo

(e ↓ valor preditivo negativo)

Concluímos que o valor preditivo (positivo e negativo) sofre influência da sensibilidade, especificidade e também da prevalência. A prevalência da doença deve ser interpretada como a probabilidade de o indivíduo ter a doença antes da realização do teste diagnóstico, por isso ela é também denominada probabilidade pré-teste. Teoricamente, a sensibilidade e a especificidade de um teste são independentes da prevalência de indivíduos doentes na amostra em que o teste está sendo avaliado (lembre-se do desempenho do teste ELISA anti-HIV na África, Europa e Brasil). (FLETCHER 2006 p. 65) Assim, o que muda em populações diferentes é a prevalência e esta acaba tendo uma influência significativa no valor preditivo positivo. Tabela 11 - Influência da sensibilidade, especificidade e prevalência no valor preditivo positivo (resumo) Aumento da

Influência no VPP

Explicação

Sensibilidade

Diminui

Especificidade

Aumenta

Maior será a segurança de um médico de que um resultado positivo confirma ou mantém o diagnóstico procurado

Prevalência

Aumenta

Se toda a população testada tiver a doença, quase todos os resultados positivos serão de doentes

Quanto mais sensível for um teste, pior será seu VPP porque aumenta muito o número de falso-positivos

Para os que gostam mais de decorar: ↑ prevalência = ↑ valor preditivo positivo ↑ sensibilidade = ↓ valor preditivo positivo Caso seja perguntado sobre o que mais influencia o valor preditivo (positivo ou negativo) pode-se afirmar que a variação na especificidade influencia mais que a variação na sensibilidade porque usualmente as doenças apresentam uma baixa prevalência. (GORDIS p. 75)

3 CURVA ROC É uma forma gráfica de apresentar conjuntamente os valores de sensibilidade e especificidade de um determinado teste. É construída por meio da representação gráfica da taxa de verdadeiro-positivos (sensibilidade) contra a taxa de falso-positivos (1-especificidade) ao longo de uma faixa de valores de possíveis pontos de corte. Os valores nos eixos vão de 0 a 1,0 (dito de

Rua Rio Grande do Norte, 63 sala 41 – Bairro Santa Efigênia – 30.130-130 - BH/MG - Tel.(31) 3245-4025

13


PREVENTIVA – TEXTO

www.grupometa.med.br

outra forma 0 a 100%.) A Figura 2 ilustra visualmente o contrabalanço entre sensibilidade e especificidade. Podemos observar na Tabela 13 que quando é utilizado o PSA de 1,0 a sensibilidade é de 100 e a especificidade é de 21, ou seja, em cada 100 doentes, 100 terão resultado positivo (verdadeiro positivo) e em cada 100 saudáveis, 79 terão resultado positivo (falso-positivo) e 21 terão resultado negativo (verdadeiro negativo) Tabela 12 – desempenho do teste para resultados entre os doentes e saudáveis considerando ponto de corte de 1,0 para PSA (segundo valores da tabela 14) D

S

+

100

79

-

0

21

TOTAL

100

100

Já quando se utiliza o valor de PSA com valor 7,0 encontra-se uma sensibilidade de 90 e uma especificidade de 83. Para visualizar o desempenho deste teste pode ser construído um gráfico conhecido como curva ROC (curva de característica de operação do receptor). Os valores de sensibilidade (às vezes chamada de taxa de verdadeiros-positivo) são colocados no eixo vertical (eixo y). Como apresentado anteriormente, com o aumento nos valores de sensibilidade, ocorre um decréscimo nos valores de especificidade. Dessa forma, pelo menos teoricamente, não teremos um teste com 100% de sensibilidade e 100% de especificidade, mas sim, valores muito altos de sensibilidade e valores baixos de especificidade. Para fins de reprodução gráfica convencionou-se utilizar os valores de 1-especificidade no eixo horizontal (eixo x). Por exemplo, para o ponto de corte com PSA de 1,0 temos uma especificidade de 21 e o valor de 1-especificidade de 79. Estes resultados são então apresentados em forma gráfica como na Figura 2. Nesta figura os pontos identificados com números 1 a 15 indicam a interseção dos valores de sensibilidade e 1especificidade para cada um dos pontos de corte apresentados na Tabela 13. O ponto 11 corresponde à interseção de uma sensibilidade de 47% identificada no eixo y e de um valor de 1-especificidade de 6% identificada no eixo x. Por sua vez, o ponto 15 corresponde à interseção de uma sensibilidade de 11% (eixo Y) e de um valor de 1-especificidade de 3% identificada no eixo X. Após identificar os 15 pontos eles são unidos com uma linha contínua e formam a curva ROC. A linha pontilhada diagonal representa uma referência de um teste sem valor diagnóstico, pois cada ponto desta linha representa a interseção de valores de sensibilidade iguais ao de 1especificidade. Assim, teoricamente esta linha diagonal identificaria um teste que ao apresentar

14

Rua Rio Grande do Norte, 63 sala 41 – Bairro Santa Efigênia – 30.130-130 - BH/MG - Tel.(31) 3245-4025


PREVENTIVA - TEXTO

www.grupometa.med.br

sensibilidade máxima (100%) teria especificidade mínima (0%) e vice-versa, ou seja, sem utilidade clínica. Um índice sumário do desempenho global do teste pode ser calculado como a área sob a curva ROC. Quanto maior a área, melhor o desempenho do teste. O maior valor possível para a área sob uma curva ROC é 1, equivalente a um teste perfeito. Em contrapartida, a área sob a linha pontilhada diagonal que corresponde a um teste que não distingue entre pessoas com e sem a doença de interesse, é 0,5. Tabela 13 – valores de Sensibilidade e Especificidade para diversos pontos de corte de PSA para detectar câncer de próstata em homens negros com idade entre 70 e 79 anos Nível de PSA (ng/mL) usado como ponto de corte

Sensibilidade

Especificidade

1-especificidade

1,0

100

21

79

2,0

100

48

52

3,0

100

60

40

4,0

99

73

27

5,0

96

76

24

6,0

94

79

21

7,0

90

83

17

8,0

90

88

12

9,0

68

90

10

10,0

54

93

7

11,0

47

94

6

12,0

30

95

5

13,0

23

96

4

14,0

17

97

3

15,0

11

97

3

Fonte: Flecther 2006 p. 62

Figura 2 - Curva ROC que apresenta os valores de sensibilidade e especificidade para diversos pontos de corte do antígeno prostático específico (PSA) no rastreamento do câncer de próstata

Rua Rio Grande do Norte, 63 sala 41 – Bairro Santa Efigênia – 30.130-130 - BH/MG - Tel.(31) 3245-4025

15


PREVENTIVA – TEXTO

www.grupometa.med.br

Este princípio da área sob a curva ROC também pode ser usado para comparar o desempenho de dois testes diagnósticos diferentes para uma doença específica. Suponhamos que um pesquisador precise de um teste para identificar pessoas com alcoolismo e quer escolher entre o questionário CAGE, (composto por quatro perguntas de fácil memorização) e o MAST (Michican Alcoholism Screening Test). Para comparar os valores de especificidade e sensibilidade destes dois testes pode ser construída uma curva ROC destes dois testes que é apresentada na Figura 3. Observa-se que os valores de sensibilidade (eixo vertical = y) do CAGE são maiores que os do MAST. Além disso, a área sob a curva do CAGE é maior que a do MAST indicando que ele apresenta maiores valores de sensibilidade e especificidade.

Figura 3 - Curvas ROC para os questionários CAGE e MAST em pacientes idosos com e sem alcoolismo. O teste CAGE é mais sensível e mais específico do que o MAST, resultando em área maior sob a curva

4 CONCEITOS RARAMENTE COBRADOS EM PROVAS DE CONCURSOS MÉDICOS 4.1 Razão de verossimilhança positiva e negativa Este conceito foi pouco cobrado nos concursos médicos e provas de residência médica e concursos na área de saúde mas vale a pena ser apresentado. Há uma forma melhor que a sensibilidade e a especificidade ou a curva ROC para resumir as informações sobre um teste diagnóstico com resultados contínuos ou ordinais. Razões de verossimilhança (ou razões de probabilidade diagnósticas – likelihood ratios) permitem que sejam aproveitadas todas as informações disponíveis de um teste. A razão de verossimilhança para um determinado resultado de um teste diagnóstico é definida como a probabilidade de tal resultado em pessoas com a doença dividido pela probabilidade do resultado em pessoas sem a doença. (FLETCHER 2006 p. 72)

16

Rua Rio Grande do Norte, 63 sala 41 – Bairro Santa Efigênia – 30.130-130 - BH/MG - Tel.(31) 3245-4025


PREVENTIVA - TEXTO

www.grupometa.med.br

Por exemplo, na Tabela 4 já apresentada e aqui repetida para facilitar o acompanhamento do leitor. Tabela 4 – desempenho do teste para resultados entre os doentes e saudáveis considerando ponto de corte de 110 mg/dL D

S

+

95

15

-

5

85

TOTAL

100

100

Observam-se os seguintes valores. Razão de verossimilhança positiva (RV+) = razão entre a proporção de doentes com resultado positivo (sensibilidade = 95/100) e a proporção de saudáveis com resultado positivo (1 – especificidade = 15/100) = 6,33. Valores de RV+ maiores do que 1 correspondem a situações nas quais as pessoas afetadas com a doença de interesse são mais propensas a ter testes positivos do que as não-afetadas. Quanto maior o valor da RV+ mais forte a associação entre ter um teste positivo e ter a doença de interesse. (GREENBERG 2005 p. 108) Já a razão de verossimilhança negativa (RV- ) = proporção de pessoas doentes com um resultado negativo (1 – sensibilidade = 5/100) dividida pela proporção de pessoas sem a doença com um resultado negativo (especificidade = 85/100) = 0,06. Quanto menor o valor da RV-, mais forte a associação entre ter um teste negativo e não ter a doença de interesse (GREENBERG 2005 p. 108) A ideia das razões de verossimilhança é a de que, a não ser que um teste seja perfeitamente acurado, saber o resultado do teste não nos diz se a pessoa testada tem ou não a doença. Portanto, é preciso olhar para o resultado e refletir. “em quanto aumenta a probabilidade de ocorrência do resultado em um indivíduo com a doença em relação a um indivíduo sem a doença?”. Se o resultado for comum em pacientes com a doença e raro em pacientes sem ela, o teste fornece informações suficientes para sugerir que o paciente tem a doença. Então, junta-se essa informação com o que já era conhecido antes do teste para possibilitar uma melhor estimativa sobre a probabilidade de o paciente ter a doença. (HULLEY 2006 p. 211) Quanto maior a razão de verossimilhança positiva, melhor o resultado do teste para aprovar um diagnóstico; uma razão de verossimilhança maior que 100 é muito alta (e muito rara entre os testes). Por outro lado, quanto menor a razão de verossimilhança negativa (quanto mais próxima ela for de 0), melhor o resultado do teste para eliminar a possibilidade de doença. Uma razão de verossimilhança (positiva ou negativa) de 1 não fornece nenhuma informação sobre a probabilidade da doença (HULLEY 2006 p. 211).

Rua Rio Grande do Norte, 63 sala 41 – Bairro Santa Efigênia – 30.130-130 - BH/MG - Tel.(31) 3245-4025

17


PREVENTIVA – TEXTO

www.grupometa.med.br

A interpretação das razões de verossimilhança não é tão simples, pois devem ser usadas com as chances e não com a probabilidade, o que implica em converter a probabilidade pré-teste (prevalência) em chances pré-teste.

Chances = probabilidade do evento / (1 – probabilidade do evento)

Esta chance pré-teste multiplicada pela razão de verossimilhança chega à chance pós-teste. As chances pós-teste podem, por sua vez, ser convertidas de volta a uma probabilidade, utilizando a fórmula:

Probabilidade = chances / (1 + chances)

Nessas relações, as chances pré-teste contêm as mesmas informações que a probabilidade anterior ou pré-teste (prevalência); as razões de verossimilhança, as mesmas que sensibilidade / especificidade; e as chances pós-teste, as mesmas que o valor preditivo positivo (probabilidade pós-teste). A principal vantagem das razões de verossimilhança é que em vez de se referir à capacidade de um só ponto de corte em identificar doentes como positivos (sensibilidade) e nãodoentes como negativos (especificidade), a razão de verossimilhança de cada resultado se refere à capacidade daquele resultado em distinguir doentes de não-doentes. (FLETCHER 2006) Uma das propriedades desejáveis da razão de verossimilhanças é que elas não variam como uma função da prevalência das doenças, ao contrário dos valores preditivos. (GREENBERG 2005 p. 108)

4.2 Confiabilidade Além dos conceitos citados nos itens anteriores, outros dois são importantes na aplicação de testes diagnósticos: Confiabilidade e Validade. Um bom exame complementar deve apresentar as duas características (como se fossem as duas asas de um avião). Estes NÃO são conceitos difíceis. A confusão em torno deles é causada pelo excesso de sinônimos utilizados para a mesma definição. Confiabilidade: na prática médica pode-se dizer que um exame é confiável quando alcança resultados semelhantes ao ser repetido por pessoas e instrumentos diferentes, ou seja, um fenômeno estável. Sinônimos: VARIAÇÃO, Reprodutibilidade e Precisão (Fletcher p. 33). A confiabilidade é reduzida pela variabilidade que tem duas subdivisões: variabilidade intraobservador que ocorre quando o mesmo profissional avalia um mesmo exame, radiografia, por exemplo, duas vezes podendo resultar em conclusões diferentes. Variabilidade inter-observador que ocorre quando dois profissionais diferentes avaliam o mesmo exame. Nem sempre

18

Rua Rio Grande do Norte, 63 sala 41 – Bairro Santa Efigênia – 30.130-130 - BH/MG - Tel.(31) 3245-4025


PREVENTIVA - TEXTO

www.grupometa.med.br

confiabilidade é sinônimo de diagnóstico correto, pois dois examinadores podem relatar as mesmas observações (confiabilidade), mas ambos podem estar errados. (Katz p. 46) Validade: é a correspondência do resultado do exame com o valor verdadeiro, ou seja, uma medida válida é uma medida correta enquanto uma medida não acurada é uma medida viciada (vide conceito de viés). Sinônimos: Exatidão (CURRENT p. 1670); ACURÁCIA (Fletcher p. 32) Na Figura 4 são apresentados os valores de glicemia por punção venosa (seta larga abaixo da linha horizontal) em diversos pacientes, considerado o padrão-ouro, ou correto, e os valores de glicemia por punção capilar (curva acima da linha horizontal). Estes valores também são apresentados como se fossem “tiros” em direção a um alvo. O centro deste alvo coincide com os valores corretos da glicemia venosa. Quanto mais distante do centro mais “errados” estarão os valores da glicemia capilar. Na Figura 4 (item a) podemos observar que, por exemplo, um determinado glicosímetro apresenta resultados confiáveis, pois os resultados variam pouco, cuja representação é vista na curva estreita e no fato dos pontos estarem concentrados em uma região do alvo. Apesar destes resultados serem confiáveis eles não são válidos uma vez que a curva está “distante” do ponto da seta e também por estarem distantes do ponto central do alvo indicando que eles não são corretos. Na figura 4 (item b) observamos que os resultados deste segundo glicosímetro permanecem confiáveis (faixa estreita, como no item a), mas agora são também válidos, pois estão próximos do valor correto representado pela seta. No gráfico do alvo os pontos estão todos próximos e perto do centro. Na figura 4 (item c) observamos resultados que não são confiáveis pois apresentam uma dispersão muito grande, ou seja, variam muito em torno de um mesmo valor pois a curva está bem larga e no do alvo eles estão dispersos. Estes mesmos resultados também não são válidos, pois não estão próximos do valor real, a curva está distante da seta larga e no alvo os pontos estão longe do centro. a) Confiável mas não válido

Resultados do glicosímetro

valor verdadeiro por punção venosa

Rua Rio Grande do Norte, 63 sala 41 – Bairro Santa Efigênia – 30.130-130 - BH/MG - Tel.(31) 3245-4025

19


PREVENTIVA – TEXTO

www.grupometa.med.br

b) Confiável e válido

c) Não confiável e não válido

Figura 4 – Exemplo de resultados com variação de confiabilidade e validade

4.3 Outras definições Acurácia: é um conceito muito útil. Corresponde à porcentagem de exames corretos. Acompanhe na tabela 4: 95 (doentes corretamente diagnosticados) + 85 (saudáveis corretamente diagnosticados) = 170 dividido pelo total de exames que é 200. Acurácia só pode ser medida quando existe um exame padrão-ouro, ou seja, quando existe um diagnóstico de certeza. Kappa: é um índice (estudiosos não concordam em falar que ele é um teste estatístico) que serve para avaliar a concordância ou confiabilidade entre dois profissionais porque neste caso não existe um padrão-ouro. Assim é tido como uma medida de confiabilidade, mas lembre-se que o Kappa é usado quando não se tem um padrão-ouro, ao contrário da acurácia. Ele compara a concordância encontrada com a concordância ao acaso. Quando são realizados múltiplos testes diferentes e todos são positivos ou todos são negativos, a interpretação é óbvia. Com bastante frequência, porém, alguns são positivos e outros são negativos. A interpretação é então, mais complicada. Esta seção discute os princípios segundo os quais os testes múltiplos são aplicados e interpretados. Testes diagnósticos em série: situação mais comum na prática clínica, na qual se solicita um teste sensível e caso o resultado seja positivo, solicita-se um teste específico. Os testes em série aumentam a segurança de que os resultados positivos representem a doença, mas em contrapartida aumentam o risco de que a doença passe despercebida. O resultado final (dos dois

20

Rua Rio Grande do Norte, 63 sala 41 – Bairro Santa Efigênia – 30.130-130 - BH/MG - Tel.(31) 3245-4025


PREVENTIVA - TEXTO

www.grupometa.med.br

testes) tem uma especificidade e um valor preditivo positivo maiores do que se eles fossem utilizados isoladamente. (FLETCHER, 2006; p.78) Em 2010 caiu uma questão no HC, último ano antes da prova Unificada. Perguntava-se a chance de uma mulher apresentar resultado falso-negativo em dois exames realizados em anos consecutivos considerando que a sensibilidade era 99/100. Solução: a chance de falso-negativo em cada um dos exames era 1/100 e nos dois testes era 1/10.000 (100 * 100). Testes diagnósticos em paralelo: ao contrário dos testes em série, quando se utiliza os testes em paralelo, ou seja, vários testes ao mesmo tempo, considerando que se pelo menos um deles for positivo, teremos um aumento na sensibilidade quando comparado ao uso isolado destes testes.

5 RESUMO Na Tabela 13 são apresentados resumidamente os conceitos apresentados ao longo deste capítulo. Os valores apresentados para cálculo são os apresentados na Tabela 4 aqui novamente transcrita.

Tabela 4 – Desempenho do teste para resultados entre os doentes e saudáveis considerando ponto de corte de 110 mg/dL D

S

+

95

15

-

5

85

TOTAL

100

100

V+ = verdadeiro positivo

V - = verdadeiro negativo

TABELA 8 – Resumo dos conceitos apresentados considerando os valores da Tabela 4 Conceito

Definição

Fórmula (confira no exemplo)

Uso

Sensibilidade

Capacidade do teste em detectar corretamente os doentes

V + / doentes (95/100)

Triagem- 1°teste

Especificidade

Capacidade de detectar corretamente os saudáveis

V- / saudáveis (85/100)

Confirmação (2° teste)

Acurácia

Proporção de acertos de um teste diagnóstico, proporção entre os verdadeiros positivos e negativos em relação a todos os resultados possíveis

V+ e V- / total exames (95 + 85 / 200)

Rua Rio Grande do Norte, 63 sala 41 – Bairro Santa Efigênia – 30.130-130 - BH/MG - Tel.(31) 3245-4025

Medir quantidade de acertos

21


PREVENTIVA – TEXTO

www.grupometa.med.br

TABELA 8 – Resumo dos conceitos apresentados considerando os valores da Tabela 4 (continuação) Definição

Fórmula (confira no exemplo)

Valor preditivo positivo (VPP)

Chance de um resultado positivo ser verdadeiramente positivo. Capacidade do teste em predizer a doença entre pessoas com resultado positivo

V + / testes + (95/110)

Valor preditivo negativo

Chance de um teste negativo ser realmente negativo

V- /testes(85/90)

Razão de verossimilhança +

Chance de um teste positivo ser de um doente

Razão de verossimilhança -

Chance do teste negativo ser de um saudável

Conceito

(95/100)/(15/100)

1− S (5/100)/(85/100) e

V+ = verdadeiro positivo

Uso

Aumenta com prevalência e especificidade e reduz com sensibilidade

Não depende de prevalência Não depende de prevalência

V - = verdadeiro negativo

Lembre-se: •

↑ Sensibilidade ↓ Especificidade

S e E não sofrem influência da prevalência

Sem prevalência não é possível calcular VPP e VPN

Influência no valor preditivo positivo o ↑ S ↓ VPP (pois aumenta falso-positivo) o ↑ P ↑ VPP

Testes em série: mais utilizado na prática clínica. ↑especificidade. Ex.: HIV 1°ELISA, se (+) → WB.

Testes em paralelo aumentam sensibilidade

Confiabilidade medida pelo índice Kappa e calculada quando não se tem padrão-ouro (mede reprodutibilidade)

6 REFERÊNCIAS BIBLIOGRÁFICAS FLETCHER, R. H.; FLETCHER SW. Epidemiologia Clínica: Elementos Essenciais. 4ª Ed. Porto Alegre: Artmed, 2006. GREENBERG, R.S, et. al. Epidemiologia Clínica. 3ª Ed. Porto Alegre: Artmed, 2005. HULLEY, S.B. et. al. Delineando a pesquisa clínica: uma abordagem epidemiológica. 2ª Ed. Porto Alegre: Artmed, 2003.

22

Rua Rio Grande do Norte, 63 sala 41 – Bairro Santa Efigênia – 30.130-130 - BH/MG - Tel.(31) 3245-4025


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.