Τεχνολογία

ΑI: Η τεχνητή νοημοσύνη βοηθά ή βλάπτει την απόδοση των ακτινολόγων – Εξαρτάται από τον γιατρό

ΑI: Η τεχνητή νοημοσύνη βοηθά ή βλάπτει την απόδοση των ακτινολόγων – Εξαρτάται από τον γιατρό
. «Η έρευνά μας αποκαλύπτει τη λεπτή και πολύπλοκη φύση της αλληλεπίδρασης μηχανής-ανθρώπου», δήλωσε ο συν-πρωτεύων συγγραφέας της μελέτης Nikhil Agarwal, καθηγητής οικονομικών στο MIT.

AI: Μία από τις πιο διαφημισμένες υποσχέσεις των ιατρικών εργαλείων τεχνητής νοημοσύνης είναι η ικανότητά τους να αυξάνουν την απόδοση των κλινικών γιατρών βοηθώντας τους να ερμηνεύουν εικόνες όπως ακτινογραφίες και αξονικές τομογραφίες με μεγαλύτερη ακρίβεια για να κάνουν πιο ακριβείς διαγνώσεις. Ωστόσο, τα οφέλη από τη χρήση εργαλείων τεχνητής νοημοσύνης στην ερμηνεία εικόνας φαίνεται να διαφέρουν από κλινικό γιατρό σε κλινικό, σύμφωνα με νέα έρευνα με επικεφαλής ερευνητές της Ιατρικής Σχολής του Χάρβαρντ, σε συνεργασία με συναδέλφους στο MIT και στο Στάνφορντ.

Τα ευρήματα της μελέτης υποδηλώνουν ότι οι διαφορές μεμονωμένων κλινικών ιατρών διαμορφώνουν την αλληλεπίδραση μεταξύ ανθρώπου και μηχανής με κρίσιμους τρόπους που οι ερευνητές δεν κατανοούν ακόμη πλήρως. Η ανάλυση, που δημοσιεύτηκε στο Nature Medicine, βασίζεται σε δεδομένα από προηγούμενο έγγραφο εργασίας της ίδιας ερευνητικής ομάδας, που κυκλοφόρησε από το Εθνικό Γραφείο Οικονομικών Ερευνών. Σε ορισμένες περιπτώσεις, έδειξε η έρευνα, η χρήση της τεχνητής νοημοσύνης μπορεί να επηρεάσει την απόδοση ενός ακτινολόγου και να επηρεάσει την ακρίβεια της ερμηνείας του. «Διαπιστώνουμε ότι διαφορετικοί ακτινολόγοι, πράγματι, αντιδρούν διαφορετικά στη βοήθεια της τεχνητής νοημοσύνης – κάποιοι βοηθούνται ενώ άλλοι πληγώνονται από αυτήν», δήλωσε ο συν-ανώτερος συγγραφέας Pranav Rajpurkar, επίκουρος καθηγητής βιοϊατρικής πληροφορικής στο Ινστιτούτο Blavatnik στο HMS. «Αυτό σημαίνει ότι δεν πρέπει να βλέπουμε τους ακτινολόγους ως έναν ενιαίο πληθυσμό και να εξετάζουμε μόνο τη «μέση» επίδραση της τεχνητής νοημοσύνης στην απόδοσή τους», είπε. «Για να μεγιστοποιήσουμε τα οφέλη και να ελαχιστοποιήσουμε τη ζημιά, πρέπει να εξατομικεύσουμε τα βοηθητικά συστήματα AI». Τα ευρήματα υπογραμμίζουν τη σημασία της προσεκτικά βαθμονομημένης εφαρμογής της τεχνητής νοημοσύνης στην κλινική πράξη, αλλά δεν πρέπει σε καμία περίπτωση να αποθαρρύνουν την υιοθέτηση της τεχνητής νοημοσύνης στα γραφεία και τις κλινικές ακτινολόγων, δήλωσαν οι ερευνητές. Αντίθετα, τα αποτελέσματα θα πρέπει να σηματοδοτούν την ανάγκη να κατανοηθεί καλύτερα πώς αλληλεπιδρούν οι άνθρωποι και η τεχνητή νοημοσύνη και να σχεδιαστούν προσεκτικά βαθμονομημένες προσεγγίσεις που ενισχύουν την ανθρώπινη απόδοση αντί να την βλάπτουν. «Οι κλινικοί γιατροί έχουν διαφορετικά επίπεδα τεχνογνωσίας, εμπειρίας και στυλ λήψης αποφάσεων, επομένως η διασφάλιση ότι η τεχνητή νοημοσύνη αντικατοπτρίζει αυτή την ποικιλομορφία είναι κρίσιμης σημασίας για στοχευμένη εφαρμογή», δήλωσε ο Feiyang “Kathy” Yu, ο οποίος διεξήγαγε την εργασία ενώ βρισκόταν στο εργαστήριο Rajpurkar μαζί με τον πρώτο συγγραφέαα στην εργασία με τον Alex Moehring στο MIT Sloan School of Management. «Οι μεμονωμένοι παράγοντες και οι διαφοροποιήσεις θα ήταν βασικές για να διασφαλιστεί ότι η τεχνητή νοημοσύνη προχωρά αντί να παρεμβαίνει στην απόδοση και, τελικά, στη διάγνωση», είπε ο Yu. Τα εργαλεία τεχνητής νοημοσύνης επηρέασαν διαφορετικά διαφορετικούς ακτινολόγους. Ενώ η προηγούμενη έρευνα είχε δείξει ότι οι βοηθοί τεχνητής νοημοσύνης μπορούν πράγματι να ενισχύσουν τη διαγνωστική απόδοση των ακτινολόγων, αυτές οι μελέτες εξέτασαν τους ακτινολόγους στο σύνολό τους χωρίς να λάβουν υπόψη τη διακύμανση από ακτινολόγο σε ακτινολόγο. Αντίθετα, η νέα μελέτη εξετάζει τον τρόπο με τον οποίο μεμονωμένοι κλινικοί παράγοντες – τομέας ειδικότητας, χρόνια πρακτικής, προηγούμενη χρήση εργαλείων τεχνητής νοημοσύνης – παίζουν ρόλο στη συνεργασία ανθρώπου-AI. Οι ερευνητές εξέτασαν πώς τα εργαλεία τεχνητής νοημοσύνης επηρέασαν την απόδοση 140 ακτινολόγων σε 15 διαγνωστικές εργασίες με ακτίνες Χ – πόσο αξιόπιστα μπόρεσαν οι ακτινολόγοι να εντοπίσουν ενδεικτικά χαρακτηριστικά σε μια εικόνα και να κάνουν ακριβή διάγνωση. Η ανάλυση αφορούσε 324 περιπτώσεις ασθενών με 15 παθολογίες—μη φυσιολογικές καταστάσεις που καταγράφηκαν με ακτινογραφίες θώρακα. Για να προσδιορίσουν πώς η τεχνητή νοημοσύνη επηρέασε την ικανότητα των γιατρών να εντοπίζουν και να εντοπίζουν σωστά προβλήματα, οι ερευνητές χρησιμοποίησαν προηγμένες υπολογιστικές μεθόδους που κατέγραψαν το μέγεθος της αλλαγής στην απόδοση κατά τη χρήση της τεχνητής νοημοσύνης και όταν δεν τη χρησιμοποιούν. Το αποτέλεσμα της βοήθειας με τεχνητή νοημοσύνη ήταν ασυνεπές και διέφερε μεταξύ των ακτινολόγων, με την απόδοση ορισμένων ακτινολόγων να βελτιώνεται με την τεχνητή νοημοσύνη και να επιδεινώνεται σε άλλους. Τα εργαλεία AI επηρέασαν απρόβλεπτα την ανθρώπινη απόδοση Οι επιπτώσεις της τεχνητής νοημοσύνης στην απόδοση των ανθρώπινων ακτινολόγων διέφεραν με συχνά εκπληκτικούς τρόπους. Για παράδειγμα, σε αντίθεση με ό,τι περίμεναν οι ερευνητές, παράγοντες όπως το πόσα χρόνια εμπειρίας είχε ένας ακτινολόγος είτε ειδικεύονταν στην ακτινολογία θώρακα και αν είχαν χρησιμοποιήσει αναγνώστες τεχνητής νοημοσύνης στο παρελθόν, δεν προέβλεπε αξιόπιστα πώς ένα εργαλείο τεχνητής νοημοσύνης θα επηρέαζε την απόδοση ενός γιατρού. Ένα άλλο εύρημα που αμφισβήτησε την επικρατούσα σοφία: οι κλινικοί γιατροί που είχαν χαμηλή απόδοση κατά την έναρξη δεν επωφελήθηκαν σταθερά από τη βοήθεια της τεχνητής νοημοσύνης. Κάποιοι ωφελήθηκαν περισσότερο, άλλοι λιγότερο και άλλοι καθόλου. Συνολικά, ωστόσο, οι ακτινολόγοι με χαμηλότερες επιδόσεις κατά την έναρξη είχαν χαμηλότερη απόδοση με ή χωρίς ΑΙ. Το ίδιο ίσχυε μεταξύ των ακτινολόγων που είχαν καλύτερες επιδόσεις κατά την έναρξη. Είχαν σταθερά καλή απόδοση, συνολικά, με ή χωρίς AI. Στη συνέχεια ήρθε ένα όχι και τόσο εκπληκτικό εύρημα: Τα πιο ακριβή εργαλεία τεχνητής νοημοσύνης ενίσχυσαν την απόδοση των ακτινολόγων, ενώ τα εργαλεία τεχνητής νοημοσύνης με κακή απόδοση μείωσαν τη διαγνωστική ακρίβεια των κλινικών γιατρών.

Αν και η ανάλυση δεν έγινε με τρόπο που να επιτρέπει στους ερευνητές να προσδιορίσουν γιατί συνέβη αυτό, το εύρημα δείχνει τη σημασία της δοκιμής και της επικύρωσης της απόδοσης του εργαλείου AI πριν από την κλινική ανάπτυξη, είπαν οι ερευνητές. Τέτοιες προκαταρκτικές δοκιμές θα μπορούσαν να διασφαλίσουν ότι η κατώτερη τεχνητή νοημοσύνη δεν επηρεάζει την απόδοση των κλινικών ιατρών και, συνεπώς, τη φροντίδα των ασθενών. Τι σημαίνουν αυτά τα ευρήματα για το μέλλον της τεχνητής νοημοσύνης στην κλινική; Οι ερευνητές προειδοποίησαν ότι τα ευρήματά τους δεν παρέχουν μια εξήγηση για το γιατί και πώς τα εργαλεία τεχνητής νοημοσύνης φαίνεται να επηρεάζουν την απόδοση σε ανθρώπινους κλινικούς γιατρούς διαφορετικά, αλλά σημειώνουν ότι η κατανόησή του γιατί θα ήταν κρίσιμη για να διασφαλιστεί ότι τα εργαλεία ακτινολογίας τεχνητής νοημοσύνης αυξάνουν την ανθρώπινη απόδοση αντί να τη βλάπτουν. Για το σκοπό αυτό, σημείωσε η ομάδα, οι προγραμματιστές τεχνητής νοημοσύνης θα πρέπει να συνεργαστούν με γιατρούς που χρησιμοποιούν τα εργαλεία τους για να κατανοήσουν και να καθορίσουν τους ακριβείς παράγοντες που παίζουν ρόλο στην αλληλεπίδραση ανθρώπου-AI. Οι ερευνητές πρόσθεσαν ότι η αλληλεπίδραση ακτινολόγου-AI θα πρέπει να δοκιμαστεί σε πειραματικά περιβάλλοντα που μιμούνται τα σενάρια του πραγματικού κόσμου και αντικατοπτρίζουν τον πραγματικό πληθυσμό ασθενών για τον οποίο έχουν σχεδιαστεί τα εργαλεία. Εκτός από τη βελτίωση της ακρίβειας των εργαλείων τεχνητής νοημοσύνης, είναι επίσης σημαντικό να εκπαιδεύονται ακτινολόγοι για να ανιχνεύουν ανακριβείς προβλέψεις τεχνητής νοημοσύνης και να αμφισβητούν τη διαγνωστική κλήση ενός εργαλείου τεχνητής νοημοσύνης, είπε η ερευνητική ομάδα. Για να επιτευχθεί αυτό, οι προγραμματιστές τεχνητής νοημοσύνης θα πρέπει να διασφαλίσουν ότι σχεδιάζουν μοντέλα τεχνητής νοημοσύνης που μπορούν να «εξηγήσουν» τις αποφάσεις τους. «Η έρευνά μας αποκαλύπτει τη λεπτή και πολύπλοκη φύση της αλληλεπίδρασης μηχανής-ανθρώπου», δήλωσε ο συν-πρωτεύων συγγραφέας της μελέτης Nikhil Agarwal, καθηγητής οικονομικών στο MIT. «Υπογραμμίζει την ανάγκη κατανόησης του πλήθους παραγόντων που εμπλέκονται σε αυτή την αλληλεπίδραση και πώς επηρεάζουν την τελική διάγνωση και φροντίδα των ασθενών». Επιπλέον συγγραφείς περιλάμβαναν τον Oishi Banerjee στο HMS και τον Tobias Salz στο MIT, ο οποίος ήταν συν-ανώτερος συγγραφέας στην εργασία.