Issuu on Google+

Στατιστικά Θέματα στην Παρουσίαση των Δεδομένων Δημοσθένης Παναγιωτάκος Αναπληρωτής Καθηγητής Βιοστατιστικής & Επιδημιολογίας

Τμήμα Επιστήμης Διαιτολογίας – Διατροφής Χαροκόπειο Πανεπιστήμιο


Τι είναι η Στατιστική; • Εργαλείο αποκάλυψης της αλήθειας που υπάρχει στα δεδομένα; • Εργαλείο απόκρυψης της αλήθειας που υπάρχει στα δεδομένα; ▫ «Ψεύδεστε δια της Στατιστικής»

Πονοκέφαλος όσων την χρειάζονται αλλά δεν την γνωρίζουν;


Οι ερευνητικές υποθέσεις • Στην έρευνα ελέγχουμε υποθέσεις με βάση τα δεδομένα μας και με σκοπό τη γενίκευση αυτών στον πληθυσμό αναφοράς. ▫ π.χ. ο χρόνος εισόδου στο Νοσοκομείο από την έναρξη των συμπτωμάτων, συσχετίζεται με αυξημένο κίνδυνο θανάτου; διατροφή πλούσια σε υδατάνθρακες συσχετίζεται με μειωμένο σωματικό βάρος;


Οι ερευνητικές υποθέσεις αξιολογούνται με τα στατιστικά κριτήρια Άκυρη υπόθεση

Εναλλακτική υπόθεση

Η υπόθεση μας δεν ισχύει.

Η υπόθεση μας ισχύει.

Στατιστικό κριτήριο (π.χ. ttest, Χ2, F-test)


Στατιστική σημαντικότητα Στατιστική ισχύς • Δυο από τις πιο συχνά χρησιμοποιημένες (και παρεξηγημένες) έννοιες στην ιατρο-βιολογική έρευνα είναι ▫ η στατιστική σημαντικότητα, p-value ▫ η στατιστική ισχύς, γ = 1-β


Τι είναι η στατιστική σημαντικότητα; • Η πιθανότητα η παρατηρηθείς στο δείγμα διαφορά, ή ακόμα και μεγαλύτερη, να μην ισχύει στον πληθυσμό αναφοράς. ▫ Δηλαδή «μετρά» την πιθανότητα να κάνουμε σφάλμα (το σφάλμα τύπου-Ι). x Συνήθως θέλουμε να είναι <0,05 Η «αξία» του p-value • Η χρησιμότητα του p-value είναι στην ορθή λήψη αποφάσεων.


Σφάλματα στη λήψη απόφασης

Υπόθεση Ηο αληθής στον πληθυσμό

Αποδοχή υπόθεσης Ηο από το δείγμα

Απόρριψη υπόθεσης ΗO από το δείγμα

9

Σφάλμα τύπου Ι

Υπόθεση Ηο ψευδής στον Σφάλμα τύπου ΙΙ πληθυσμό

9 Στατιστική ισχύς


Σφάλμα του Εισαγγελέα Πρόταση εισαγγελέα: ΕΝΟΧΟΣ

Πρόταση εισαγγελέα : ΑΘΩΟΣ

Κατηγορούμενος: Διέπραξε το έγκλημα

9

Σφάλμα

Κατηγορούμενος: ΔΕΝ διέπραξε το έγκλημα

Σφάλμα

9


Έλεγχοι υποθέσεων Περιοχή απόρριψης Ηο Ηο αληθής στον Πληθυσμό

Σωστή απόφαση

Σφάλμα Τύπου-Ι

Ηο ψευδής στον Πληθυσμό

Σωστή απόφαση

Περιοχή μηαπόρριψης Ηο

Σφάλμα Τύπου-ΙΙ

Στατιστική Ισχύς

Τιμές στατιστικού κριτηρίου S


Τι δεν είναι το p-value • Το p-value δεν είναι η πιθανότητα να επαληθευθεί η μηδενική υπόθεση ▫ και αυτό γιατί οι υποθέσεις δεν εκφράζονται με πιθανότητες στην στατιστική.


Η πιθανότητα επανάληψης ενός ευρήματος με βάση το παρατηρηθέν p.


Τι δεν είναι το p-value • Το p-value δεν είναι η πιθανότητα να απορριφθεί λανθασμένα η μηδενική υπόθεση. ▫ Το να απορριφθεί λανθασμένα η μηδενική υπόθεση είναι το σφάλμα Τύπου Ι. x Αυτό το σφάλμα είναι μια εκδοχή της καλούμενης «σφάλμα του εισαγγελέα» (“prosecutor's fallacy”) όπου κρίνει αθώο τον κατηγορούμενο ενώ έχει διαπράξει το έγκλημα. x Το σφάλμα Τύπου Ι είναι στενά συνυφασμένο με το p-value, αφού απορρίπτουμε τη μηδενική υπόθεση όταν το p-value είναι μικρότερο από κάποιο προκαθορισμένο όριο α (επίπεδο σημαντικότητας) του σφάλματος τύπου-Ι.


Τι δεν είναι το p-value • Το p-value δεν δηλώνει το μέγεθος ή τη σημασία του παρατηρούμενου αποτελέσματος. ▫ Έτσι, ένα πολύ μικρό p-value, π.χ. 0,000…1 (συνήθως παρουσιάζεται ως <0,001) δε σημαίνει απαραίτητα μια πολύ ισχυρή συσχέτιση.


Το επίπεδο σημαντικότητας

Τι συμπέρασμα βγάζετε από το διπλανό Σχήμα;


Το επίπεδο σημαντικότητας Παρόλο που η συσχέτιση φαίνεται να είναι ισχυρή (p < 0,001) ο συντελεστής συσχέτισης είναι μικρός (r = -0,11), υποδηλώνοντας αδύναμη σχέση.


Πως μετριέται το μέγεθος της σχέσης; ▫ Ο καλύτερος τρόπος για να αποτιμηθεί μια συσχέτιση είναι η χρήση μέτρων που αποτυπώνουν το μέγεθος της ισχύος μιας σχέσης x δηλ. το effect size, όπως x ο τυποποιημένος συντελεστής Β στην γραμμική παλινδρόμηση x ο σχετικός λόγος συμπληρωματικών πιθανοτήτων, ή το κριτήριο του Wald στη λογιστική παλινδρόμηση x ο σχετικός κίνδυνος στην ανάλυση επιβίωσης, x ο συντελεστής συσχέτισης, x το d του Cohen x κ.τ.λ.


… οι τυποποιημένοι συντελεστές Β


… το κριτήριο του Wald


Τι είναι η στατιστική ισχύς; • Η πιθανότητα απόρριψης της Ηο με βάση τα δεδομένα της έρευνας, ενώ η Ηο είναι ψευδής. • Η πιθανότητα μη απόρριψης της Ηο με βάση τα δεδομένα της έρευνας, ενώ η Ηο είναι αληθής. ▫ Δηλ. απορρίπτεται ορθά η άκυρη Ηο υπόθεση.


Σφάλμα του Εισαγγελέα

Διέπραξε το έγκλημα

ΔΕΝ Διέπραξε το έγκλημα

Πρόταση εισαγγελέα: ΕΝΟΧΟΣ

Πρόταση εισαγγελέα : ΑΘΩΟΣ

9

Σφάλμα

Σφάλμα

9


p-value και το μέγεθος του δείγματος ▫ Το p επηρεάζεται από το μέγεθος του δείγματος.

Συγκεκριμένα • Υπάρχει αντίστροφη συσχέτιση μεταξύ του μεγέθους δείγματος και του p.


p-value και μέγεθος του δείγματος για μια δεδομένη συσχέτιση 0,16

0,14

0,12

p-value

0,1

0,08

0,06

0,04

0,02

0 0

100

200

300

400

500

600

Μέγεθος δείγματος σε κάθε ομάδα

700

800

900

1000


Παράδειγμα • Π.χ. Μια ερευνητική ομάδα πραγματοποίησε μια κλινική δοκιμή για την αποτελεσματικότητα ενός νέου φαρμάκου σε σύγκριση με το κλασσικό φάρμακο. Όλα τα άτομα ήταν καλά εξομοιωμένα. ▫ Μετά από 12 μήνες θεραπεία …


Χρησιμοποιήθηκαν 10 + 10 άτομα Ολική χοληστερόλη 190 170

152

150

Φάρμακο Α

Φάρμακο Β

150 130 110 90 70 50

Η στατιστική ανάλυση έδειξε ότι ΔΕΝ υπάρχει διαφορά μεταξύ των δύο ομάδων στις μέσες τιμές ολικής χοληστερόλης (p=0,91).


Χρησιμοποιήθηκαν 100 + 100 άτομα Ολική χοληστερόλη 190 170

152

150

Φάρμακο Α

Φάρμακο Β

150 130 110 90 70 50

Η στατιστική ανάλυση έδειξε ότι ΔΕΝ υπάρχει διαφορά μεταξύ των δύο ομάδων στις μέσες τιμές ολικής χοληστερόλης (p=0,72).


Χρησιμοποιήθηκαν 1000 + 1000 άτομα Ολική χοληστερόλη 190 170

152

150

Φάρμακο Α

Φάρμακο Β

150 130 110 90 70 50

Η στατιστική ανάλυση έδειξε ότι ΔΕΝ υπάρχει διαφορά μεταξύ των δύο ομάδων στις μέσες τιμές ολικής χοληστερόλης (p=0,26).


Χρησιμοποιήθηκαν 10000 + 10000 άτομα Ολική χοληστερόλη 190 170

152

150

Φάρμακο Α

Φάρμακο Β

150 130 110 90 70 50

Η στατιστική ανάλυση έδειξε ότι υπάρχει διαφορά μεταξύ των δύο ομάδων στις μέσες τιμές ολικής χοληστερόλης (p=0,0004).


Το μέγεθος του δείγματος • Το επαρκές μέγεθος του δείγματος είναι μεγίστης σημασίας για την αξιοπιστία της έρευνας.


Οι «αρχές» της δειγματοληψίας • Πρέπει όμως να ληφθεί υπόψη ότι σχετικά μεγάλο δείγμα συνεπάγεται και μεγάλο κόστος ▫ χωρίς αυτό να σημαίνει και απαραίτητα αξιόπιστα αποτελέσματα,

• ενώ πολύ μικρό δείγμα μπορεί να οδηγήσει σε συστηματικό σφάλμα και μεροληπτικές αποφάσεις για τον πληθυσμό.


Το μέγεθος του δείγματος καθορίζεται από: 1. το επίπεδο στατιστικής σημαντικότητας των ελέγχων, το οποίο συμβολίζεται με α και στο χώρο των επιστημών της Υγείας έχει καθοριστεί να είναι < 0,01 ή < 0,05 2. το μέγεθος της αναζητούμενης σχέσης, π.χ. πόσο μεγάλη θα πρέπει να είναι η διαφορά στα επίπεδα ολικής χοληστερόλης μεταξύ της θεραπευτικής προσέγγισης Α και της θεραπευτικής προσέγγισης Β έτσι ώστε να θεωρείται κλινικά αξιόλογη, 3. τη στατιστική ισχύ των ελέγχων, η οποία συμβολίζεται με γ και στο χώρο των επιστημών της Υγείας έχει καθοριστεί να είναι > 0,80 ή > 0,90 Επίσης, …

▫ το επίπεδο ακρίβειας στις μετρήσεις, το οποίο εξαρτάται και από την συνείδηση των ερευνητών που διεξάγουν την έρευνα ▫ το μέγεθος του πληθυσμού αναφοράς ▫ τη μεταβλητότητα στα χαρακτηριστικά του πληθυσμού, η οποία αν είναι μεγάλη συνεπάγεται και ανάλογη αύξηση του μεγέθους του δείγματος ▫ το διαθέσιμο χρηματικό ποσό για την έρευνα


Η στατιστική ισχύς είναι συνάρτηση του μεγέθους του δείγματος Επαρκές δείγμα

Αν-επαρκές

Υπέρ-επαρκές


Συμπεράσματα • Η στατιστική σημαντικότητα έχει ιδιαίτερη σημασία στην ασφαλή γενίκευση των συσχετίσεων της μελέτης μας στον πληθυσμό αναφοράς. Όμως, • δεν είναι μέτρο της σημαντικότητας ενός ευρήματος, • επηρεάζεται από το μέγεθος του δείγματος.


Συμπεράσματα • Η στατιστική ισχύς συμβάλει στην αξιολόγηση τόσο των συσχετίσεων, όσο και των μησυσχετίσεων της μελέτης μας στον πληθυσμό αναφοράς. Όμως, • πολλές φορές χρησιμοποιούνται μεγάλα δείγματα με το «πρόσχημα» της επίτευξης μεγάλης ισχύος, αλλά ουσιαστικά την «τεχνική» μείωση της στατιστικής σημαντικότητας.



PANAGIOTAKOS