Search Icon
ΑΝΑΖΗΤΗΣΗ
Τεχνολογία

Αλγόριθμος γλώσσα: Το MIT αποκαλύπτει νέο αλγόριθμο που μαθαίνεις γλώσσες μόνο παρακολουθώντας βίντεο

Αλγόριθμος γλώσσα: Το MIT αποκαλύπτει νέο αλγόριθμο που μαθαίνεις γλώσσες μόνο παρακολουθώντας βίντεο

Αλγόριθμος γλώσσα: Το Τεχνολογικό Ινστιτούτο της Μασαχουσέτης (MIT) εισήγαγε έναν καινοτόμο αλγόριθμο που μπορεί να μάθει γλώσσα μόνο παρακολουθώντας βίντεο.

Το Τεχνολογικό Ινστιτούτο της Μασαχουσέτης (MIT) εισήγαγε έναν καινοτόμο αλγόριθμο που μπορεί να μάθει γλώσσα μόνο παρακολουθώντας βίντεο. Ο Mark Hamilton, διδακτορικός φοιτητής στην ηλεκτρολόγια μηχανική και την επιστήμη των υπολογιστών, ηγείται αυτού του έργου μαζί με τους συναδέλφους του στο Εργαστήριο Επιστήμης Υπολογιστών και Τεχνητής Νοημοσύνης του MIT (CSAIL). Στόχος τους είναι να χρησιμοποιήσουν μηχανές για την αποκωδικοποίηση της επικοινωνίας των ζώων, ξεκινώντας από την κατάκτηση της ανθρώπινης γλώσσας.

Η έμπνευση για αυτόν τον νέο αλγόριθμο προήλθε από μια απροσδόκητη πηγή: την ταινία “March of the Penguins”. Σε μια σκηνή, ένας πιγκουίνος πέφτει και εκπέμπει ένα βογγητό καθώς προσπαθεί να σηκωθεί. Ο Χάμιλτον παρατήρησε ότι αυτό το βογγητό φαινόταν να υπονοεί μια λέξη, πυροδοτώντας την ιδέα ότι ο ήχος και το βίντεο θα μπορούσαν να χρησιμοποιηθούν μαζί για να διδάξουν τη γλώσσα σε έναν αλγόριθμο. Αυτή η ιδέα οδήγησε στη δημιουργία του DenseAV, ενός μοντέλου που σχεδιάστηκε για να μαθαίνει γλώσσα προβλέποντας οπτικό περιεχόμενο από τον ήχο και αντίστροφα. Για παράδειγμα, το άκουσμα της φράσης «ψήσε το κέικ στους 350» θα ωθούσε το μοντέλο να περιμένει γραφικά ενός κέικ ή ενός φούρνου.

Αλλά για να καταστεί δυνατή η αντιστοίχιση ήχου-βίντεο σε εκατομμύρια βίντεο, το DenseAV πρέπει να μάθει το πλαίσιο του τι συζητούν οι άνθρωποι. Αφού εκπαίδευσε το DenseAV σε αυτήν την εργασία αντιστοίχισης, η ερευνητική ομάδα εξέτασε σε ποια pixel εστίασε το μοντέλο κατά την επεξεργασία ήχων. Όταν αναφέρθηκε η λέξη “σκύλος”, ο αλγόριθμος αναζήτησε εικόνες σκύλου στη ροή βίντεο, υποδεικνύοντας ότι κατανοεί τη σημασία της λέξης. Ομοίως, όταν άκουσε ένα σκυλί να γαβγίζει, αναζήτησε σκυλιά στο βίντεο. Η ομάδα ήταν περίεργη αν το DenseAV μπορούσε να κάνει διάκριση μεταξύ της λέξης “σκύλος” και του ήχου ενός σκύλου που γαβγίζει. Δίνοντας στο DenseAV μια προσέγγιση διπλού εγκεφάλου, ανακάλυψαν ότι η μία πλευρά επικεντρωνόταν φυσικά στη γλώσσα, όπως η λέξη “σκύλος”, ενώ η άλλη επικεντρώθηκε στους ήχους, όπως το γάβγισμα.

Η ομάδα αντιμετώπισε ένα δύσκολο έργο στην εκμάθηση μιας γλώσσας χωρίς εισαγωγή κειμένου, καθώς στόχευε να ανακαλύψει ξανά την ουσία της γλώσσας από την αρχή χωρίς τη χρήση προεκπαιδευμένων γλωσσικών μοντέλων. Αυτή η μέθοδος εμπνέεται από το πώς τα παιδιά μαθαίνουν τη γλώσσα παρατηρώντας και ακούγοντας το περιβάλλον τους. Μια πιθανή εφαρμογή αυτής της τεχνολογίας είναι η εκμάθηση από τον τεράστιο όγκο περιεχομένου βίντεο που ανεβάζεται καθημερινά στο διαδίκτυο. Ο Χάμιλτον και η ομάδα του στοχεύουν στη δημιουργία συστημάτων που μπορούν να μάθουν από εκπαιδευτικά βίντεο και άλλο διαδικτυακό περιεχόμενο.

Μια άλλη ενδιαφέρουσα εφαρμογή είναι η κατανόηση νέων γλωσσών, όπως η επικοινωνία με δελφίνια ή φάλαινες, που δεν έχουν γραπτή μορφή. Η ομάδα ελπίζει ότι το DenseAV μπορεί να βοηθήσει στη μετάφραση αυτών των γλωσσών, οι οποίες έχουν διαφύγει εδώ και πολύ καιρό από την ανθρώπινη κατανόηση.

“Ελπίζουμε ότι το DenseAV μπορεί να μας βοηθήσει να κατανοήσουμε αυτές τις γλώσσες που έχουν αποφύγει τις προσπάθειες ανθρώπινης μετάφρασης από την αρχή. Τέλος, ελπίζουμε ότι αυτή η μέθοδος μπορεί να χρησιμοποιηθεί για την ανακάλυψη μοτίβων μεταξύ άλλων ζευγών σημάτων, όπως οι σεισμικοί ήχοι που κάνει η γη και γεωλογία», είπε ο Χάμιλτον σε δήλωση.

Διαβάστε όλες τις τελευταίες Ειδήσεις για την υγεία από την Ελλάδα και τον Κόσμο
Ακολουθήστε το healthweb.gr στο Google News και μάθετε πρώτοι όλες τις ειδήσεις
Ακολουθήστε το healthweb.gr στο κανάλι μας στο YouTube

Διαβάστε Eπίσης:

Η τεχνητή νοημοσύνη βοηθά τους επαγγελματίες υγείας να διαβάζουν μπερδεμένα ΗΕΓ για να σώζουν ζωές

Η τεχνητή νοημοσύνη βελτιώνει την ακρίβεια διαγνώσεων καρκίνου του δέρματος

Αλγόριθμος μηχανικής μάθησης προσφέρει στους ουρολόγους σημαντικά οφέλη

Ποιοι επιστήμονες αναφέρονται περισσότερο στις ειδήσεις;

svg%3E svg%3E
svg%3E
svg%3E
Περισσότερα

Σιγκαπούρη: Νέα επένδυση στη δημόσια υγεία με γενετική τεχνητή νοημοσύνη

Σιγκαπούρη: Η Σιγκαπούρη ανακοίνωσε μια σημαντική επένδυση ύψους 150 εκατομμυρίων δολαρίων για την υιοθέτηση της γενετικής τεχνητής νοημοσύνης στον δημόσιο τομέα υγείας.

Χάρτης δέρματος: Πώς μπορεί να σώσει ζωές και να μειώσει τις ουλές;

Χάρτης δέρματος: Οι πρόσφατες εξελίξεις στη δερματολογική έρευνα έχουν οδηγήσει στην ανάπτυξη ενός λεπτομερούς χάρτη του ανθρώπινου δέρματος, ο οποίος προσφέρει μια «συνταγή» για την κατασκευή του.

Εφαρμογή υγείας: Ανίχνευση και πρόληψη ασθενειών κατά τη διάρκεια ταξιδιών

Εφαρμογή υγείας: Μια νέα καινοτόμος εφαρμογή έχει σχεδιαστεί για να παρακολουθεί ασθένειες που σχετίζονται με τα ταξίδια και αναδεικνύεται ως ένα κρίσιμο εργαλείο για τη βελτίωση της παγκόσμιας υγειονομικής παρακολούθησης.

Καρκίνος του δέρματος: Αξιοποιώντας την τεχνητή νοημοσύνη για την ανίχνευση και την πρόληψη του

Καρκίνος του δέρματος: Οι πρόσφατες εξελίξεις στην τεχνητή νοημοσύνη έχουν οδηγήσει στη δημιουργία μοντέλων που βοηθούν στην έγκαιρη ανίχνευση του καρκίνου του δέρματος.

Η νέα ενδορινική θεραπεία RNA δείχνει πολλά για την ενίσχυση της μνήμης και τη μείωση του άγχους 

Θεραπεία RNA: Η χρήση της ενδορινικής οδού για τη χορήγηση RNA είναι μια καινοτομία που δεν επιτρέπει μόνο την ταχεία απορρόφηση του θεραπευτικού παράγοντα, αλλά και την αποφυγή πιθανών παρενεργειών που σχετίζονται με άλλες μορφές χορήγησης.

Πρόβλεψη καταγμάτων ισχίου: Πώς το νέο μοντέλο βελτιώνει την πρόληψη και τη φροντίδα

Πρόβλεψη καταγμάτων ισχίου: Ένα νέο κλινικό μοντέλο πρόβλεψης καταγμάτων ισχίου έχει τη δυνατότητα να αλλάξει δραματικά τον τρόπο που προλαμβάνονται και διαχειρίζονται αυτά τα σοβαρά τραύματα, σώζοντας ζωές.

Close Icon