Πέμπτη, 16 Σεπτεμβρίου 2010

Αποσπάσματα από το βιβλίο του Ίαν Άιρες “Οι Υπερ Αναλυτές”

Ένα από τα βιβλία που ολοκλήρωσα μέσα στο καλοκαίρι ήταν αυτό του Ian AyresSuper Crunchers”, που σε μετάφραση της Έφης Μαργέλη κυκλοφορεί από τις εκδόσεις Ενάλιος. “Γιατί το να σκεπτόμαστε με αριθμούς είναι ο νέος τρόπος για να λειτουργούμε έξυπνα” είναι ο ελληνικός υπότιτλος της ελληνικής έκδοσης, που μας δίνει μια ιδέα του περιεχομένου του βιβλίου। Παρότι σε κάποιες περιπτώσεις και σημεία βρήκα το βιβλίο δύσκολο, παράλληλα το βρήκα και ιδιαίτερα ενδιαφέρον, καθώς προσφέρει μια νέα οπτική των πραγμάτων. Αξίζει, πιστεύω, να το διαβάσετε. Ως “τυράκι” για να σας παγιδέψω και να το προμηθευτείτε, ένα χαρακτηριστικό απόσπασμα από την εισαγωγή του βιβλίου


«Τι είναι η Υπέρ Ανάλυση; Είναι η στατιστική ανάλυση που επηρεάζει τις αποφάσεις που λαμβάνονται στον πραγματικό κόσμο. Οι προβλέψεις της Υπέρ Ανάλυσης, συνήθως, παρουσιάζουν κάποιον συνδυασμό μεγέθους, ταχύτητας και κλίμακας. Τα μεγέθη των βάσεων δεδομένων είναι πραγματικά τεράστια - τόσο σε πλήθος παρατηρήσεων, όσο και σε πλήθος μεταβλητών. Η ταχύτητα της ανάλυσης αυξάνεται. Συχνά, γινόμαστε μάρτυρες της άμεσης ανάλυσης των αριθμών, τη στιγμή που τα στοιχεία εμφανίζονται στον τύπο. Και η κλίμακα της επίδρασης της είναι, ορισμένες φορές, πραγματικά τεράστια. Δεν πρόκειται για μια ομάδα διανοούμενοι ακαδημαϊκών που γράφουν προκλητικά άρθρα σε περιοδικά. Η Υπέρ Ανάλυση πραγματοποιείται από ή για υπευθύνους λήψεως αποφάσεων που αναζητούν έναν καλύτερο τρόπο για να επιτύχουν όσα θέλουν. Και όταν λέω ότι οι Υπέρ Αναλυτές χρησιμοποιούν τεράστιες βάσεις δεδομένων, εννοώ πραγματικά τεράστιες. Ολοένα και συχνότερα, οι βάσεις δεδομένων των επιχειρήσεων και των κυβερνήσεων δεν υπολογίζονται σε mega- ή gigabytes, αλλά σε tera-, ακόμη και petabytes (1.000 terabytes. Ένα terabyte ισοδυναμεί με 1.000 gigabytes). To πρόθεμα tera προέρχεται από την ελληνική λέξη «τέρας». Ένα terabyte είναι, πράγματι, μία τερατωδώς μεγάλη ποσότητα. Ολόκληρη η Βιβλιοθήκη του Κογκρέσου αποτελείται από περίπου είκοσι terabytes κειμένου. Μέρος του σκοπού του παρόντος βιβλίου είναι να αρχίσουμε να συνηθίζουμε αυτό το πρόθεμα. Η βάση δεδομένων των Wal-Mart, για παράδειγμα, αποτελείται από περισσότερα από 570 terabytes. To Google διαθέτει περίπου τέσσερα petabytes στοιχείων που αναλύει διαρκώς. Η εκμετάλλευση των tera δεν αποτελεί πλέον φαντασίωση του Μπακ Ρότζερς- λαμβάνει χώρα αυτήν τη στιγμή. Σε όλους τους τομείς, οι «διαισθητικοί» και οι παραδοσιακοί ειδικοί αντιμάχονται τους Υπέρ Αναλυτές. Στην ιατρική, η έντονη διαμάχη σε σχέση με τo τι αποτελεί «ιατρική βάσει δεδομένων» αφορά μόνο το ζήτημα του κατά πόσον οι αποφάσεις θεραπείας πρέπει να βασίζονται στη στατιστική ανάλυση ή όχι. Οι οπαδοί της διαίσθησης δεν υποχωρούν χωρίς μάχη. Ισχυρίζονται ότι μία βάση δεδομένων δεν θα μπορέσει ποτέ να αποκτήσει την κλινική εμπειρία που υπάρχει στην εμπειρία μιας ζωής, ότι ένας συντελεστής πρόβλεψης δεν θα μπορέσει ποτέ να είναι τόσο καλός όσο μία νοσοκόμα του θαλάμου επειγόντων περιστατικών με είκοσι χρόνια εμπειρίας, η οποία μπορεί να διακρίνει πότε ένα παιδί μοιάζει «νευρικό». Τείνουμε να πιστεύουμε ότι ο μεγάλος δάσκαλος του σκακιού Γκάρυ Κασπάρωφ έχασε από τον υπολογιστή Ντιπ Μπλου, λόγω του εξυπνότερου λογισμικού της IBM. To λογισμικό αυτό αποτελεί, στην πραγματικότητα, μία γιγαντιαία βάση δεδομένων που αξιολογεί τη δύναμη διαφόρων θέσεων. Η ταχύτητα του υπολογιστή είναι σημαντική, αλλά, κατά μεγάλο ποσοστό, ήταν η ικανότητα του υπολογιστή να έχει πρόσβαση σε μία βάση δεδομένων 700.000 παιχνιδιών αυτό που έπαιξε αποφασιστικό ρόλο στο παιχνίδι. Η διαίσθηση του Κασπάρωφ έχασε από τη λήψη αποφάσεων βάσει στοιχείων. Οι Υπέρ Αναλυτές όχι μόνο εισβάλλουν στον χώρο και εκτοπίζουν τους παραδοσιακούς ειδικούς, αλλά αλλάζουν τη ζωή μας. Δεν αλλάζουν απλώς τον τρόπο λήψεως αποφάσεων, αλλάζουν τις ίδιες τις αποφάσεις. Οι κυνηγοί ταλέντων του μπέιζμπολ χάνουν έδαφος έναντι των διανοούμενων όχι μόνο επειδή είναι φθηνότερη η ανάλυση των αριθμούν από τα ταξίδια των κυνηγών ταλέντων οπουδήποτε. Οι κυνηγοί χάνουν, επειδή κάνουν χειρότερες προβλέψεις. Οι Υπέρ Αναλυτές και ειδικοί, φυσικά, δεν διαφωνούν πάντα. Η ανάλυση των αριθμών, κάποιες φορές, επιβεβαιώνει την παραδοσιακή σοφία. Ο κόσμος δεν είναι τόσο παράλογος ώστε οι παραδοσιακοί ειδικοί να κάνουν πάντα λάθος ή να πετυχαίνουν από τύχη. Όμως, η ανάλυση των αριθμών καθοδηγεί τους υπευθύνους λήψεως αποφάσεων να κάνουν διαφορετικές και, γενικότερα, καλύτερες επιλογές. Η στατιστική ανάλυση σε κάθε τομέα αποκαλύπτει κρυφές σχέσεις μεταξύ εντελώς αποκομμένοι ειδών πληροφοριών. Αν είστε πολιτικός και θέλετε να μάθετε ποιος είναι πιθανότερο να συνεισφέρει στην εκστρατεία σας και ποια μορφή υποκίνησης θα ήταν επιτυχέστερη, δεν χρειάζεται να μαντέψετε, ακολουθήστε τους κανόνες ή εμπιστευθείτε τους γκριζομάλληδες παραδοσιακούς συμβούλους. Ολοένα και περισσότερο, είναι ευκολότερο να υπολογιστούν οι μετρήσιμες συνέπειες διαφορετικών χαρακτηριστικών, τα οποία μπορούν να σας πουν ποια είδη πειθούς είναι πιθανότερο να έχουν καλύτερα αποτελέσματα. Η αναζήτηση μέσα σε βάσεις δεδομένων μπορεί να αποκαλύψει υποβόσκουσες αιτίες που οι παραδοσιακοί ειδικοί δεν θα σκέφτονταν ποτέ. Η λήψη αποφάσεων βάσει στοιχείων κερδίζει έδαφος παντού γύρω μας» [σελ. 25 ως 28]


«Τα συνεργατικά φίλτρα αποτελούν παράδειγμα αυτού που ο Τζέιμς Σουροβίκι αποκάλεσε «Σοφία του Πλήθους». Σε ορισμένα πλαίσια, οι συνεργατικές προβλέψεις είναι πιο ακριβείς από την καλύτερη εκτίμηση που θα μπορούσε να κάνει ένα μέλος της ομάδας. Για παράδειγμα, φανταστείτε ότι προσφέρετε ένα βραβείο 100 δολαρίων σε μία τάξη κολεγίου, για τον φοιτητή που θα κάνει την καλύτερη πρόβλεψη για το πόσα νομίσματα περιέχονται σε ένα βάζο. Η σοφία της ομάδας μπορεί να υπολογιστεί βάσει της μέσης εκτίμησης. Έχει αποδειχθεί επανειλημμένως, ότι αυτή η μέση εκτίμηση είναι πιθανότερο να προσεγγίζει περισσότερο την αλήθεια από ό,τι οι μεμονωμένες εκτιμήσεις. Ορισμένοι δίνουν πολύ υψηλούς αριθμούς, άλλοι πολύ χαμηλούς- αλλά, συλλογικά, οι υψηλές και οι χαμηλές προβλέψεις τείνουν να μηδενίζονται. Οι ομάδες, συνήθους, μπορούν να κάνουν καλύτερες προβλέψεις από ό,τι τα άτομα. Στο τηλεπαιχνίδι Ποιος θέλει να γίνει εκατομμυριούχος, η «βοήθεια του κοινού» δίνει τη σωστή απάντηση κατά 90 τοις εκατό (ενώ το τηλεφώνημα σε κάποιον φίλο δίνει τη σωστή απάντηση δύο στις τρεις φορές που χρησιμοποιείται). Το συνεργατικό φιλτράρισμα αποτελεί ένα είδος προσαρμοσμένης δημοσκόπησης του κοινού. Οι άνθρωποι που σας μοιάζουν μπορούν να κάνουν σχετικά ακριβείς προβλέψεις για το είδος της μουσικής ή των ταινιών που προτιμάτε. Οι βάσεις δεδομένων προτιμήσεων αποτελούν ισχυρές μεθόδους για τη βελτίωση της ατομικής λήψεως αποφάσεων» [σελ. 39 παρ.2-3]


Δεν υπάρχουν σχόλια: