Tester har ofte angitt tall for spesifisitet og sensitivitet. Disse sier noe om testens nøyaktiget – altså sjansen for at testresultatet er feil.
Denne posten er fritt etter et innlegg av Lars Reinertsen, på hans facebook. Innlegget var så bra, og jeg fikk lov å kopiere det. Sjekk også bloggen hans, primært om IT og matematikk. Og statistikk, som vi skal se.
La oss anta en infeksjonstest. Testens spesifisitet er testens evne til å korrekt diagnostisere de som faktisk ikke er smittet. Spesifisiteten angir såleds risikoen for falsk positiv – det vil si testen kommer tilbake positiv selv om pasienten egentlig ikke er smittet. Testens sensitivitet er testens evne til å korrekt diagnostisere de som faktisk er smittet. Testens sensitivitet angir risikoen for falsk negativ – det vil si testen kommer tilbake negativ, selv om pasienten egentlig er positiv.
Jeg har lært om testers sensitivitet “the hard way”. Eksempelvis parasitt tester. Disse er kronisk upålitelige. Jeg vet jeg har hatt, og fortsatt har, parasitter. Fordi jeg kan se de med det blåtte øyet når de kommer ut av meg i avføringen. Dette er dokumentert med bilder, endel av dem publisert på denne bloggen. Døm selv! Jeg har testet for parasitter hos Balderklinikken (en gang) og fastlegen (flere ganger). Og testen kommer negativ tilbake hver gang. Parasitt tester har derfor en lav prosentvis sensitivitet. Det er høy risiko for at en smittet person vil motta en negativ test. Noen parasitt tester analyseres ved at en lab medarbeider ser på en avføringsprøve i mikroskopet, på jakt etter parasitter eller egg. Når de ikke finner parasitter hos en smittet person, vil jeg anta de heller ikke finner det hos en frisk person, og at spesifisiteten derfor er høy. Risikoen for at en frisk person får en positiv test er sannsynligvis lav.
La oss ta et annet aktuelt tilfelle – en corona test. La oss anta at testens spesifisitet er 90%. Og at sensitiviteten også er 90%. Anta vi går ut på gaten og tester tilfeldige mennesker for infeksjon med coronaviruset covid-2.
Vi ønsker å anslå sannsynligheten for at en person som tester positivt, faktisk er smittet. Vi har følgende hendelser:
- A = er smittet med corona
- B = avgir positiv test
P(A) er sannsynligheten for at en person er smittet med corona. I den generelle befolkningen anslår vi P(A)=0,01. Vi anslår altså at 1 av 100 personer faktisk er smittet. Dermed, P(not A)=0,99.
P(B|A) er sannsynligheten for B, dersom vi vet at A er oppfylt. Altså sannsynligheten for positiv test dersom personen faktisk er smittet.
- P(B|A) = 0,90 (følger av testens sensitivtet)
- P(not B | not A) = 0,9 (følger av testens spesifisitet)
Fra dette følger det:
- P(B | not A) = 0,1
- P(not B | A) = 0,1
Vi ønsker å finne P(A|B). Sjansen for at en person faktisk er smittet dersom testen kommer tilbake positiv.
Man kan se fra tegningen ovenfor, arealbetraktning:
(1) P(B) = P(B|A)*P(A) + P(B|notA)*P(notA)
Bayes teorem: P(x|y) = P(y|x) * P(x) / P(y). Dette gir:
(2) P(A|B) = P(B|A) * P(A) / P(B)
Setter (1) inn i (2):
(3) P(A|B) = P(B|A) * P(A) / ( P(B|A)*P(A) + P(B|notA)*P(notA) )
Setter inn tall:
P(A|B) = 0,9 * 0,01 / (0,9 * 0,01 + 0,1 * 0,99) = 0,009 / (0,009 + 0,099) = 0,083333 = 8,3 %
Altså: dersom en tilfeldig person tester positivt for Corona er det bare 8,3% sannsynlighet for at vedkommende faktisk har viruset. Med andre ord stor sjanse for falsk positiv.
For de fleste er det ikke umiddelbart intuitivt at personen har så liten risiko for å være smittet når testen er positiv. Den fundamentale årsaken til dette er at i utvalget vi tester er det så få som har det, og så mange som ikke har det. Testens spesifisitet, altså evnen til å ikke gi falsk positiv, blir derfor veldig viktig. Hvis det ikke er bra spesifisitet vil det bli mange falske positiver rett og slett fordi det er så mange kandidater for dette.
En falsk negativ er når en smittet person tester negativt. Hvis du tester negativt i dette scenariet er det veldig liten sjanse for at resultatet er feil. For å få en falsk negativ må to ting skje: 1) Personen som testes må faktisk ha viruset. 2) Testen må være dårlig. Begge deler har lav sannsynlighet.
Mange land tester bare pasienter på sykehuset som har typiske corona symptomer. P(A) er annerledes og regnestykket endres. Tester man positivt da er det større sjanse enn 8,3% for at man er smittet.
Hvordan håndterer man denne testunøyaktigheten? Gjør gjentatte tester av de som tester positivt.
- Ha en gruppe tilfeldige mennesker (folk på gaten e.l.). Disse har 1% sjanse for å ha viruset. Test dem.
- Alle de positive går inn i et telt, telt1. Disse har 8,3% sjanse for å ha viruset (8,3% av dem har viruset). Test de igjen. Alle de positive går inn i telt2.
- Bruk likning (3), men nå er P(A)=0,083 (og ikke 0,01) og P(notA) er 0,916. Vi finner at i telt2 er det 45% sjanse for å ha viruset. Test de igjen. Alle de positive går inn i telt3.
- I telt3 er det 88% sjanse for å ha viruset. Hvis disse pålegges hjemmekarantene i 14 dager er det ikke så mange som må sitte hjemme uten at det var nødvendig.
Vi ser at i dette scenariet blir det bedre nøyaktighet når vi gjør gjentatte tester.
Bildet øverst i posten av Venn diagram av Bayes teorem er lovlig lånt fra https://upload.wikimedia.org/wikipedia/commons/5/5b/Venn_diagram_describing_Bayes%27_law.png
Oppdatering 26/8-2020. Om corona testing og sensitivitet. I Had COVID-19 But Tested Negative 5 Times. Here’s What You Should Know About Testing.
Oppdatering 4. januar 2022. Det problematiske oddsforholdet av Magne Thoresen. Han er professor ved Avdeling for biostatistikk, Oslo senter for biostatistikk og epidemiologi, Universitetet i Oslo. Oddsforholdet (OR) er et hyppig brukt mål på sammenheng mellom eksponering og sykdom i medisinske studier. Men hva betyr det egentlig? (…) Oddsforholdet forteller oss altså hvor mange flere syke vi treffer på per friske person når vi sammenligner den eksponerte og den ikke-eksponerte populasjonen. I dette tilfellet er det dobbelt så mange syke per friske person blant de eksponerte som blant de ikke-eksponerte.