Η ιδέα ότι η φωνή μπορεί να κρύβει στοιχεία για την υγεία δεν είναι καινούργια: από την αρχαιότητα οι γιατροί άκουγαν τον βήχα, τον τόνο και την αναπνοή. Σήμερα όμως η τεχνητή νοημοσύνη ανεβάζει αυτή την ικανότητα σε νέα επίπεδα, αναλύοντας μικρές, μη αντιληπτές στο ανθρώπινο αυτί διακυμάνσεις της φωνής και υπόσχεται να ανιχνεύσει πρώιμα σημάδια καρκίνου, ιδίως του λάρυγγα.
Μια νέα μελέτη που δημοσιεύθηκε στο περιοδικό «Frontiers in Digital Health» δείχνει ότι συστήματα ΑΙ μπορούν να διακρίνουν τις φωνές ατόμων με βλάβες στις φωνητικές χορδές — είτε καλοήθεις είτε κακοήθεις — από τις φωνές υγιών ανθρώπων, ανοίγοντας τον δρόμο για μια μη επεμβατική, προσιτή και γρήγορη μέθοδο διάγνωσης.
Ο καρκίνος του λάρυγγα, που συχνά αναφέρεται ως «καρκίνος της φωνητικής θήκης», παραμένει σημαντική παγκόσμια πρόκληση: το 2021 περίπου 1,1 εκατομμύριο άνθρωποι διαγνώστηκαν με τη νόσο και περίπου 100.000 απώλεσαν τη ζωή τους.
Η νέα προσέγγιση στηρίζεται σε ένα σύνολο δεδομένων που ονομάζεται Bridge2AI-Voice, πρωτοβουλία του Εθνικού Ινστιτούτου Υγείας των ΗΠΑ (NIH) στο πλαίσιο του προγράμματος «Bridge to Artificial Intelligence». Το σύνολο περιλαμβάνει 12.523 ηχογραφήσεις φωνής από 306 συμμετέχοντες στη Βόρεια Αμερική, ανάμεσά τους άτομα με διαγνωσμένο καρκίνο λάρυγγα, καλοήθεις βλάβες φωνητικών χορδών, σπασμωδική δυσφωνία και μονόπλευρη παράλυση φωνητικής χορδής.
Η ομάδα που έκανε την ανάλυση, με επικεφαλής τον Δρ. Φίλιπ Τζένκινς του Πανεπιστημίου Υγείας και Επιστήμης του Όρεγκον, μελέτησε μετρήσιμα χαρακτηριστικά της ομιλίας: τη μέση θεμελιώδη συχνότητα (το ύψος της φωνής), το jitter (μικρές διακυμάνσεις στο ύψος), το shimmer (μεταβολές στο πλάτος) και —κυρίως— τον λόγο αρμονικού προς θόρυβο (Harmonic-to-Noise Ratio, HNR).
Ο λόγος αρμονικού προς θόρυβο συγκρίνει τον οργανωμένο ήχο με τον ακανόνιστο θόρυβο στο φωνητικό υπόβαθρο και μεταβάλλεται όταν οι φωνητικές χορδές δεν δονούνται ομαλά λόγω βλαβών. Η ανάλυση έδειξε σαφείς διαφορές στον HNR και στο ύψος της φωνής μεταξύ τριών ομάδων ανδρών —υγιών, με καλοήθεις βλάβες και με καρκίνο λάρυγγα—, κάτι που πρακτικά σημαίνει ότι η ΑΙ μπορεί να «αντιληφθεί» την παθολογία πριν αυτή φανεί σε μια απλή κλινική εξέταση.
Οι αλλαγές που ανιχνεύτηκαν ήταν λεπτές και μη αντιληπτές στο ανθρώπινο αυτί, αλλά στατιστικά σημαντικές για τις ανδρικές φωνές.
Στις γυναίκες, όμως, τα ίδια μοτίβα δεν εμφανίστηκαν με την ίδια σαφήνεια. Οι ερευνητές εξηγούν ότι αυτό πιθανόν οφείλεται στον μικρότερο αριθμό γυναικών στο δείγμα και στις φυσιολογικές διαφορές φωνής ανά φύλο. Επισημαίνουν ότι με μεγαλύτερα σύνολα δεδομένων είναι πιθανό να αναδειχθούν και για τις γυναίκες αντίστοιχοι βιοδείκτες.
Αξίζει να σημειωθεί ότι η φωνή ως βιοδείκτης δεν περιορίζεται στον λάρυγγα: ήδη εργαλεία ΑΙ δοκιμάζονται για την ανίχνευση της νόσου Πάρκινσον (μέσω λεπτών αλλαγών στην άρθρωση και στον τόνο), της κατάθλιψης (μέσω ρυθμού και έντασης) και ακόμη της καρδιακής ανεπάρκειας (μέσω μικροαλλαγών στην αναπνοή κατά την ομιλία). Η λογική είναι κοινή: κάθε νόσος που επηρεάζει τη νεύρωση, τον μυϊκό τόνο, την αναπνοή ή την κινητικότητα του λάρυγγα και του διαφράγματος αφήνει ένα χαρακτηριστικό «ακουστικό αποτύπωμα».
Η τεχνητή νοημοσύνη δεν αντικαθιστά τους γιατρούς, αλλά μπορεί να τους προσφέρει ένα νέο ισχυρό εργαλείο: έναν μη επεμβατικό, χαμηλού κόστους «ακουστικό βιοδείκτη» που ενδέχεται να συλλέγεται ακόμη και από το σπίτι μέσω εφαρμογής σε κινητό. Η φωνή μας, που μέχρι σήμερα εξυπηρετούσε κυρίως την επικοινωνία, μπορεί σύντομα να γίνει ο πιο προσωπικός και πρώιμος καθρέφτης της υγείας — και αυτή η δυνατότητα ήδη δοκιμάζεται.

