Συσχέτιση, αιτιότητα, ανεξαρτησία…

Αυτό είναι ένα άρθρο για τα βασικά.Και αυτό, επειδή νομίζω πως πρέπει να γίνει λόγος για κάτι, που παρά την θεμελιώδη φύση του, δεν είναι ευρύτατα γνωστό.

Η συσχέτιση -στην πιο γνωστή της εκδοχή, χάρις στον Pearson-είναι ένα μέτρο του κατά πόσο δύο ποσότητες μπορούν να παρατηρηθούν να έχουν γραμμική εξάρτηση μεταξύ τους. Είναι μια πολύ συνηθισμένη ποσότητα για την έκθεση των αποτελεσμάτων επιστημονικών ερευνών, ειδικά, αλλά όχι αποκλειστικά, στις κοινωνικές επιστήμες. Οι ερευνητές προσπαθούν να αποδείξουν την ύπαρξη συσχέτισης μεταξύ δύο φαινομένων ως πρωταρχικό βήμα για την εξέταση μιας πιθανής αιτιακής σχέσης μεταξύ τους.

Δεν υπάρχει φυσικά τίποτα το λάθος στη μέτρηση της συσχέτισης. Το πρόβλημα έγκειται στην ερμηνεία των αποτελεσμάτων. Εάν δω μια στενή συσχέτιση μεταξύ της κατανάλωσης σοκολάτας ανά χώρα και του αριθμού των υποψηφίων της για βραβείο Νόμπελ, θα έπρεπε να συμπεράνω ότι η κατανάλωση σοκολάτας σε κάνει εξυπνότερο; Ή πως το να κερδίζεις βραβεία Νόμπελ σε κάνει να τρως περισσότερες σοκολάτες…;

Πέρα από τα λογοπαίγνια, λοιπόν, η διάκριση μεταξύ συσχέτισης και αιτιότητας θα πρέπει να είναι εμφανής στον καθένα που διαβάζει αυτό το blog. Για παράδειγμα, αυτοί που υποστηρίζουν ότι τα εμβόλια προκαλούν αυτισμό με βάση κάποιες ασαφείς μετρήσεις της συσχέτισής τους, θα έπρεπε να ρίξουν μια ματιά στο παραπάνω γράφημα  το οποίο θα τους έκανε να συμπεράνουν πως μάλλον τελικά τα βιολογικά τρόφιμα είναι η αιτία του αυτισμού! (Βέβαια άλλοι ίσως βγάλουν το συμπέρασμα πως οι γονείς των αυτιστικών παιδιών είναι αυτοί που αγοράζουν όλες τις βιολογικές τροφές…)

Σε κάθε περίπτωση, το θέμα ανάμεσα στην συσχέτιση και την αιτιότητα είναι σαφές. Αλλά υπάρχει και κάτι άλλο που δεν είναι πάντοτε ξεκάθαρο σε όλους. Η απουσία συσχέτισης μεταξύ δύο μεταβλητών είναι μία πολύ πιο ασθενής συνθήκη από την μεταξύ τους ανεξαρτησία. Συχνά χρησιμοποιούμε τον όρο «ασυσχέτιστα» ως συνώνυμο του «ανεξάρτητα», αλλά αυτό είναι απόλυτα λάθος από μαθηματικής απόψεως. Δύο ασυσχέτιστες μεταβλητές μπορούν να είναι πλήρως εξαρτημένες η μία από την άλλη!

Στην Wikipedia υπάρχει μια ωραία εικόνα που αποτυπώνει το παραπάνω θέμα.

Φαίνεται εδώ:

Όπως μπορεί να δει κανείς από τη παραπάνω συλλογή στην τελευταία σειρά, μπορείς να έχεις πολλά διαφορετικά πρότυπα αλληλεξάρτησης μεταξύ δύο μεταβλητών με μηδενικό συντελεστή συσχέτισης. Αλλά αυτό που δεν δείχνουν τα παραπάνω γραφήματα είναι ότι, επιπλέον, θα μπορούσε να υπάρχει μια ακριβής συναρτησιακή σχέση μεταξύ δύο μεταβλητών (π.χ. στην περίπτωση των βιολογικών και του αυτισμού, πως εάν μου έδινες τις πωλήσεις σε $ των βιολογικών τροφίμων, θα μπορούσα να σου πω επακριβώς πόσες περιπτώσεις αυτισμού διαγνώστηκαν εκείνον το χρόνο) και να έχω πάλι μηδενικό συντελεστή συσχέτισης!

Αυτή είναι για παράδειγμα η περίπτωση με την y=x^2, για x στο [-1,1]. Αυτή είναι μια τέλεια παραβολική σχέση, και συλλογές από τυχαία επιλεγμένα σημεία της γραφικής της παράστασης θα έχουν έναν συντελεστή συσχέτισης συμβατό με το 0 (εννοώντας πως θα βρεις x% από της συλλογές με μηδενική συσχέτιση σε επίπεδο εμπιστοσύνης x%).

Αυτό σημαίνει πως, ενώ θα πρέπει να είναι κανείς προσεκτικός προτού καταλήξει στο συμπέρασμα της ύπαρξης σχέσης αιτίου-αποτελέσματος μεταξύ δύο ποσοτήτων, κρίνοντας από την συσχέτιση τους, θα πρέπει να είναι ακόμη πιο προσεκτικός, όταν επιχειρεί να αποφανθεί υπέρ της ανεξαρτησίας των δύο, βασιζόμενος στην απουσία σημαντικής συσχέτισης μεταξύ τους!

Θυμηθείτε αυτό το γεγονός, που συχνά παραβλέπεται!

Αρχικό άρθρο:

http://www.science20.com/quantum_diaries_survivor/correlation_causation_independence-98944

13 Δεκεμβρίου 2012

About qdsgreek

Greek version of "A Quantum Diaries Survivor" blog
This entry was posted in Γενικά, Θεωρία. Bookmark the permalink.

1 Responses to Συσχέτιση, αιτιότητα, ανεξαρτησία…

  1. Ο/Η qdsgreek λέει:

    Ευχαριστώ για αυτή τη μετάφραση! Και πρέπει να πω οτι το ξαναδιάβαζμα των άρθρων που έγραψα στα Αγγληκά είναι χρείσημο και για να βελτιωθούν τα ελλινηκά μου …
    Σε λίγο θα βάλω ένα άλλο link στο Αγγλικό blog με μια λίστα των νέων άρθρων εδώ.
    Φιλικά,
    Τ.

    Μου αρέσει!

Σχολιάστε