Page 1

Στατιστικά Θέματα στην Παρουσίαση των Δεδομένων Δημοσθένης Παναγιωτάκος Αναπληρωτής Καθηγητής Βιοστατιστικής & Επιδημιολογίας

Τμήμα Επιστήμης Διαιτολογίας – Διατροφής Χαροκόπειο Πανεπιστήμιο


Τι είναι η Στατιστική; • Εργαλείο αποκάλυψης της αλήθειας που υπάρχει στα δεδομένα; • Εργαλείο απόκρυψης της αλήθειας που υπάρχει στα δεδομένα; ▫ «Ψεύδεστε δια της Στατιστικής»

Πονοκέφαλος όσων την χρειάζονται αλλά δεν την γνωρίζουν;


Οι ερευνητικές υποθέσεις • Στην έρευνα ελέγχουμε υποθέσεις με βάση τα δεδομένα μας και με σκοπό τη γενίκευση αυτών στον πληθυσμό αναφοράς. ▫ π.χ. ο χρόνος εισόδου στο Νοσοκομείο από την έναρξη των συμπτωμάτων, συσχετίζεται με αυξημένο κίνδυνο θανάτου; διατροφή πλούσια σε υδατάνθρακες συσχετίζεται με μειωμένο σωματικό βάρος;


Οι ερευνητικές υποθέσεις αξιολογούνται με τα στατιστικά κριτήρια Άκυρη υπόθεση

Εναλλακτική υπόθεση

Η υπόθεση μας δεν ισχύει.

Η υπόθεση μας ισχύει.

Στατιστικό κριτήριο (π.χ. ttest, Χ2, F-test)


Στατιστική σημαντικότητα Στατιστική ισχύς • Δυο από τις πιο συχνά χρησιμοποιημένες (και παρεξηγημένες) έννοιες στην ιατρο-βιολογική έρευνα είναι ▫ η στατιστική σημαντικότητα, p-value ▫ η στατιστική ισχύς, γ = 1-β


Τι είναι η στατιστική σημαντικότητα; • Η πιθανότητα η παρατηρηθείς στο δείγμα διαφορά, ή ακόμα και μεγαλύτερη, να μην ισχύει στον πληθυσμό αναφοράς. ▫ Δηλαδή «μετρά» την πιθανότητα να κάνουμε σφάλμα (το σφάλμα τύπου-Ι). x Συνήθως θέλουμε να είναι <0,05 Η «αξία» του p-value • Η χρησιμότητα του p-value είναι στην ορθή λήψη αποφάσεων.


Σφάλματα στη λήψη απόφασης

Υπόθεση Ηο αληθής στον πληθυσμό

Αποδοχή υπόθεσης Ηο από το δείγμα

Απόρριψη υπόθεσης ΗO από το δείγμα

9

Σφάλμα τύπου Ι

Υπόθεση Ηο ψευδής στον Σφάλμα τύπου ΙΙ πληθυσμό

9 Στατιστική ισχύς


Σφάλμα του Εισαγγελέα Πρόταση εισαγγελέα: ΕΝΟΧΟΣ

Πρόταση εισαγγελέα : ΑΘΩΟΣ

Κατηγορούμενος: Διέπραξε το έγκλημα

9

Σφάλμα

Κατηγορούμενος: ΔΕΝ διέπραξε το έγκλημα

Σφάλμα

9


Έλεγχοι υποθέσεων Περιοχή απόρριψης Ηο Ηο αληθής στον Πληθυσμό

Σωστή απόφαση

Σφάλμα Τύπου-Ι

Ηο ψευδής στον Πληθυσμό

Σωστή απόφαση

Περιοχή μηαπόρριψης Ηο

Σφάλμα Τύπου-ΙΙ

Στατιστική Ισχύς

Τιμές στατιστικού κριτηρίου S


Τι δεν είναι το p-value • Το p-value δεν είναι η πιθανότητα να επαληθευθεί η μηδενική υπόθεση ▫ και αυτό γιατί οι υποθέσεις δεν εκφράζονται με πιθανότητες στην στατιστική.


Η πιθανότητα επανάληψης ενός ευρήματος με βάση το παρατηρηθέν p.


Τι δεν είναι το p-value • Το p-value δεν είναι η πιθανότητα να απορριφθεί λανθασμένα η μηδενική υπόθεση. ▫ Το να απορριφθεί λανθασμένα η μηδενική υπόθεση είναι το σφάλμα Τύπου Ι. x Αυτό το σφάλμα είναι μια εκδοχή της καλούμενης «σφάλμα του εισαγγελέα» (“prosecutor's fallacy”) όπου κρίνει αθώο τον κατηγορούμενο ενώ έχει διαπράξει το έγκλημα. x Το σφάλμα Τύπου Ι είναι στενά συνυφασμένο με το p-value, αφού απορρίπτουμε τη μηδενική υπόθεση όταν το p-value είναι μικρότερο από κάποιο προκαθορισμένο όριο α (επίπεδο σημαντικότητας) του σφάλματος τύπου-Ι.


Τι δεν είναι το p-value • Το p-value δεν δηλώνει το μέγεθος ή τη σημασία του παρατηρούμενου αποτελέσματος. ▫ Έτσι, ένα πολύ μικρό p-value, π.χ. 0,000…1 (συνήθως παρουσιάζεται ως <0,001) δε σημαίνει απαραίτητα μια πολύ ισχυρή συσχέτιση.


Το επίπεδο σημαντικότητας

Τι συμπέρασμα βγάζετε από το διπλανό Σχήμα;


Το επίπεδο σημαντικότητας Παρόλο που η συσχέτιση φαίνεται να είναι ισχυρή (p < 0,001) ο συντελεστής συσχέτισης είναι μικρός (r = -0,11), υποδηλώνοντας αδύναμη σχέση.


Πως μετριέται το μέγεθος της σχέσης; ▫ Ο καλύτερος τρόπος για να αποτιμηθεί μια συσχέτιση είναι η χρήση μέτρων που αποτυπώνουν το μέγεθος της ισχύος μιας σχέσης x δηλ. το effect size, όπως x ο τυποποιημένος συντελεστής Β στην γραμμική παλινδρόμηση x ο σχετικός λόγος συμπληρωματικών πιθανοτήτων, ή το κριτήριο του Wald στη λογιστική παλινδρόμηση x ο σχετικός κίνδυνος στην ανάλυση επιβίωσης, x ο συντελεστής συσχέτισης, x το d του Cohen x κ.τ.λ.


… οι τυποποιημένοι συντελεστές Β


… το κριτήριο του Wald


Τι είναι η στατιστική ισχύς; • Η πιθανότητα απόρριψης της Ηο με βάση τα δεδομένα της έρευνας, ενώ η Ηο είναι ψευδής. • Η πιθανότητα μη απόρριψης της Ηο με βάση τα δεδομένα της έρευνας, ενώ η Ηο είναι αληθής. ▫ Δηλ. απορρίπτεται ορθά η άκυρη Ηο υπόθεση.


Σφάλμα του Εισαγγελέα

Διέπραξε το έγκλημα

ΔΕΝ Διέπραξε το έγκλημα

Πρόταση εισαγγελέα: ΕΝΟΧΟΣ

Πρόταση εισαγγελέα : ΑΘΩΟΣ

9

Σφάλμα

Σφάλμα

9


p-value και το μέγεθος του δείγματος ▫ Το p επηρεάζεται από το μέγεθος του δείγματος.

Συγκεκριμένα • Υπάρχει αντίστροφη συσχέτιση μεταξύ του μεγέθους δείγματος και του p.


p-value και μέγεθος του δείγματος για μια δεδομένη συσχέτιση 0,16

0,14

0,12

p-value

0,1

0,08

0,06

0,04

0,02

0 0

100

200

300

400

500

600

Μέγεθος δείγματος σε κάθε ομάδα

700

800

900

1000


Παράδειγμα • Π.χ. Μια ερευνητική ομάδα πραγματοποίησε μια κλινική δοκιμή για την αποτελεσματικότητα ενός νέου φαρμάκου σε σύγκριση με το κλασσικό φάρμακο. Όλα τα άτομα ήταν καλά εξομοιωμένα. ▫ Μετά από 12 μήνες θεραπεία …


Χρησιμοποιήθηκαν 10 + 10 άτομα Ολική χοληστερόλη 190 170

152

150

Φάρμακο Α

Φάρμακο Β

150 130 110 90 70 50

Η στατιστική ανάλυση έδειξε ότι ΔΕΝ υπάρχει διαφορά μεταξύ των δύο ομάδων στις μέσες τιμές ολικής χοληστερόλης (p=0,91).


Χρησιμοποιήθηκαν 100 + 100 άτομα Ολική χοληστερόλη 190 170

152

150

Φάρμακο Α

Φάρμακο Β

150 130 110 90 70 50

Η στατιστική ανάλυση έδειξε ότι ΔΕΝ υπάρχει διαφορά μεταξύ των δύο ομάδων στις μέσες τιμές ολικής χοληστερόλης (p=0,72).


Χρησιμοποιήθηκαν 1000 + 1000 άτομα Ολική χοληστερόλη 190 170

152

150

Φάρμακο Α

Φάρμακο Β

150 130 110 90 70 50

Η στατιστική ανάλυση έδειξε ότι ΔΕΝ υπάρχει διαφορά μεταξύ των δύο ομάδων στις μέσες τιμές ολικής χοληστερόλης (p=0,26).


Χρησιμοποιήθηκαν 10000 + 10000 άτομα Ολική χοληστερόλη 190 170

152

150

Φάρμακο Α

Φάρμακο Β

150 130 110 90 70 50

Η στατιστική ανάλυση έδειξε ότι υπάρχει διαφορά μεταξύ των δύο ομάδων στις μέσες τιμές ολικής χοληστερόλης (p=0,0004).


Το μέγεθος του δείγματος • Το επαρκές μέγεθος του δείγματος είναι μεγίστης σημασίας για την αξιοπιστία της έρευνας.


Οι «αρχές» της δειγματοληψίας • Πρέπει όμως να ληφθεί υπόψη ότι σχετικά μεγάλο δείγμα συνεπάγεται και μεγάλο κόστος ▫ χωρίς αυτό να σημαίνει και απαραίτητα αξιόπιστα αποτελέσματα,

• ενώ πολύ μικρό δείγμα μπορεί να οδηγήσει σε συστηματικό σφάλμα και μεροληπτικές αποφάσεις για τον πληθυσμό.


Το μέγεθος του δείγματος καθορίζεται από: 1. το επίπεδο στατιστικής σημαντικότητας των ελέγχων, το οποίο συμβολίζεται με α και στο χώρο των επιστημών της Υγείας έχει καθοριστεί να είναι < 0,01 ή < 0,05 2. το μέγεθος της αναζητούμενης σχέσης, π.χ. πόσο μεγάλη θα πρέπει να είναι η διαφορά στα επίπεδα ολικής χοληστερόλης μεταξύ της θεραπευτικής προσέγγισης Α και της θεραπευτικής προσέγγισης Β έτσι ώστε να θεωρείται κλινικά αξιόλογη, 3. τη στατιστική ισχύ των ελέγχων, η οποία συμβολίζεται με γ και στο χώρο των επιστημών της Υγείας έχει καθοριστεί να είναι > 0,80 ή > 0,90 Επίσης, …

▫ το επίπεδο ακρίβειας στις μετρήσεις, το οποίο εξαρτάται και από την συνείδηση των ερευνητών που διεξάγουν την έρευνα ▫ το μέγεθος του πληθυσμού αναφοράς ▫ τη μεταβλητότητα στα χαρακτηριστικά του πληθυσμού, η οποία αν είναι μεγάλη συνεπάγεται και ανάλογη αύξηση του μεγέθους του δείγματος ▫ το διαθέσιμο χρηματικό ποσό για την έρευνα


Η στατιστική ισχύς είναι συνάρτηση του μεγέθους του δείγματος Επαρκές δείγμα

Αν-επαρκές

Υπέρ-επαρκές


Συμπεράσματα • Η στατιστική σημαντικότητα έχει ιδιαίτερη σημασία στην ασφαλή γενίκευση των συσχετίσεων της μελέτης μας στον πληθυσμό αναφοράς. Όμως, • δεν είναι μέτρο της σημαντικότητας ενός ευρήματος, • επηρεάζεται από το μέγεθος του δείγματος.


Συμπεράσματα • Η στατιστική ισχύς συμβάλει στην αξιολόγηση τόσο των συσχετίσεων, όσο και των μησυσχετίσεων της μελέτης μας στον πληθυσμό αναφοράς. Όμως, • πολλές φορές χρησιμοποιούνται μεγάλα δείγματα με το «πρόσχημα» της επίτευξης μεγάλης ισχύος, αλλά ουσιαστικά την «τεχνική» μείωση της στατιστικής σημαντικότητας.


PANAGIOTAKOS  

στηνΠαρουσίασητωνΔεδομένων ΤμήμαΕπιστήμηςΔιαιτολογίας–Διατροφής ΧαροκόπειοΠανεπιστήμιο ΔημοσθένηςΠαναγιωτάκος ΑναπληρωτήςΚαθηγητήςΒιοστατιστ...

Read more
Read more
Similar to
Popular now
Just for you