Liječničke novine br. 192

Page 58

STATISTIKA

REGRESIJSKA ANALIZA TOČAKA PREGIBA (JOINPOINT REGRESIJA) r. sc. MARIO ŠEKERIJA, dr. med. d Hrvatski zavod za javno zdravstvo; Škola narodnog zdravlja „Andrija Štampar“, Medicinski fakultet Sveučilišta u Zagrebu

Regresijska analiza točaka pregiba (engl. joinpoint regression), prvi put opisana 2000. u članku Kima i suradnika (1), postala je jedna od često korištenih metoda u procjenama trendova pojedinih događaja ili stanja na razini populacije (do danas je navedeni članak prema Google Scholaru citiran preko 3100 puta). Indikatori koji se prate najčešće su klasične epidemiološke mjere poput incidencije, mortaliteta i prevalencije, uz kalendarsku godinu kao nezavisnu varijablu u regresijskom modelu. Softver za primjenu ove metode razvijen je u Odsjeku za kontrolu raka i populacijske znanosti američkog Nacionalnog instituta za rak te je besplatno dostupan na njihovim web stranicama na https:// surveillance.cancer.gov/joinpoint/ (potrebna je registracija e-mail adresom), s vrlo detaljnim uputama i opširnim dijelom s često postavljenim pitanjima. Posljednji dostupna verzija u trenutku pisanja ovog teksta je verzija 4.8.0.1 od 22. travnja 2020. Može se preuzeti kao samostalan program ili kao dodatak postojećem statističkom softveru poput SAS-a ili R-a. S obzirom na sve navedeno i na dugu tradiciju kvalitetnih populacijskih podataka iz registara za rak i sustava mortalitetne statistike, ne čudi da se većina analiza ovom metodom odnosi na podatke vezane uz epidemiološke pokazatelje raka, no mogu se, naravno, analizirati i drugi populacijski podaci poput trendova mortaliteta od drugih bolesti, trendova prevalencije pojedinih

58

LIJEČNIČKE NOVINE 192 - rujan 2020.

rizičnih čimbenika ili trendova u propisivanju pojedinih lijekova. Za samu analizu potrebno je pripremiti tekstualnu datoteku s kolonama u kojima su traženi podaci. Minimalan set podataka uključuje nezavisnu varijablu (u ovim primjerima to je kalendarska godina) i zavisnu varijablu (broj, postotak/udio, stopu na broj stanovnika ili dobno-standardiziranu stopu na broj stanovnika). Ako odaberemo dobno-standardiziranu stopu (najčešće korištenu u analitici populacijskih podataka) i ne pretpostavljamo konstantnu varijancu (homoscedasticitet) ili Poissonovu varijantu, bit će potrebna i kolona s vrijednostima standardne pogreške. Također, možemo postaviti i druge varijable po kojima ćemo razdvojiti same analize, poput spola, vrste raka, geografskih odrednica (npr. županije) te izabrati između modela s linearnim ili logaritamskim (prirodni logaritam) vrijednostima zavisne varijable. U posljednjem slučaju možemo dobiti godišnju postotnu promjenu (Annual Percent Change; APC) koja nam govori koliko se svake godine unutar pojedinih odsječaka pravca odvojenih točkama pregiba mijenja stopa incidencije ili smrtnosti od bolesti koju analiziramo. Uz navedenu mjeru prikazan je i pripadajući interval pouzdanosti kojim također možemo procijeniti je li promjena statistički značajna ili nije. Softver nam na temelju učitanih podataka kreira najjednostavniji regresijski model koji podaci dopuštaju, bez točaka pregiba – točki u kojima pravac trenda statistički značajno mijenja svoj smjer. Nakon toga testira hoće li dodavanje novih točki pregiba (do unaprijed definiranog maksimuma, ovisnog o broju godina s podacima) statistički značajno poboljšati model, koristeći Monte Carlo permutacijsku metodu. Ovakav pristup

omogućuje korisniku testiranje hipoteze o statističkoj značajnosti eventualnih promjena u trendovima, dok novije verzije programa omogućuju i kombiniranje više analiza na jednom grafu, kao i mogućnost vizualizacije modela sa svim mogućim brojevima točki pregiba, uz naznaku koji je statistički najprihvatljiviji. Minimalan i maksimalan broj dozvoljenih točaka pregiba trebamo unaprijed odrediti prije same analize te će se, za razliku od sličnih metoda poput piece-wise regresije, u kojoj je završni broj točaka pregiba a priori definiran, u ovom modelu statistički odrediti koji broj točaka pregiba daje najbolji opis podataka.

PRIMJER: RASTE LI SMRTNOST OD RAKA U HRVATSKOJ Sve navedeno možemo pokušati objasniti na nekom javnozdravstveno relevantnom primjeru. Na primjer, iznimno često se postavlja pitanje što se događa sa smrtnošću (mortalitetom) od raka u Hrvatskoj. Kao i s bilo kojim drugim dobrim pitanjem, najvažnije je jasno definirati indikator kojim pokušavamo na nj odgovoriti. Mogli bismo pratiti kretanje broja umrlih, broja umrlih podijeljenog s brojem stanovnika u toj godini (gruba stopa mortaliteta) izražene na 100.000 stanovnika ili kretanje dobno-standardizirane stope mortaliteta (stope koja bi podrazumijevala da je populacija cijelo vrijeme ista, standardne, dobne strukture – u ovom primjeru, recimo, dobne strukture prema popisu stanovništva 2011. godine). Pripremit ćemo set podataka koji sadrži stupac s kalendarskom godinom, brojem umrlih od raka (važno je definirati koje sve skupine uključujemo; u ovom je primjeru riječ o svim C dijagnozama prema MKB-10 klasifikaciji bolesti bez ne-melanomskog invazivnog raka kože (C44*) – radi usporedivosti sa setom


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.
Liječničke novine br. 192 by Hrvatska liječnička komora - Issuu