Search Icon
ΑΝΑΖΗΤΗΣΗ
Τεχνολογία

Αλγόριθμος γλώσσα: Το MIT αποκαλύπτει νέο αλγόριθμο που μαθαίνεις γλώσσες μόνο παρακολουθώντας βίντεο

Αλγόριθμος γλώσσα: Το MIT αποκαλύπτει νέο αλγόριθμο που μαθαίνεις γλώσσες μόνο παρακολουθώντας βίντεο

Αλγόριθμος γλώσσα: Το Τεχνολογικό Ινστιτούτο της Μασαχουσέτης (MIT) εισήγαγε έναν καινοτόμο αλγόριθμο που μπορεί να μάθει γλώσσα μόνο παρακολουθώντας βίντεο.

Το Τεχνολογικό Ινστιτούτο της Μασαχουσέτης (MIT) εισήγαγε έναν καινοτόμο αλγόριθμο που μπορεί να μάθει γλώσσα μόνο παρακολουθώντας βίντεο. Ο Mark Hamilton, διδακτορικός φοιτητής στην ηλεκτρολόγια μηχανική και την επιστήμη των υπολογιστών, ηγείται αυτού του έργου μαζί με τους συναδέλφους του στο Εργαστήριο Επιστήμης Υπολογιστών και Τεχνητής Νοημοσύνης του MIT (CSAIL). Στόχος τους είναι να χρησιμοποιήσουν μηχανές για την αποκωδικοποίηση της επικοινωνίας των ζώων, ξεκινώντας από την κατάκτηση της ανθρώπινης γλώσσας.

Η έμπνευση για αυτόν τον νέο αλγόριθμο προήλθε από μια απροσδόκητη πηγή: την ταινία “March of the Penguins”. Σε μια σκηνή, ένας πιγκουίνος πέφτει και εκπέμπει ένα βογγητό καθώς προσπαθεί να σηκωθεί. Ο Χάμιλτον παρατήρησε ότι αυτό το βογγητό φαινόταν να υπονοεί μια λέξη, πυροδοτώντας την ιδέα ότι ο ήχος και το βίντεο θα μπορούσαν να χρησιμοποιηθούν μαζί για να διδάξουν τη γλώσσα σε έναν αλγόριθμο. Αυτή η ιδέα οδήγησε στη δημιουργία του DenseAV, ενός μοντέλου που σχεδιάστηκε για να μαθαίνει γλώσσα προβλέποντας οπτικό περιεχόμενο από τον ήχο και αντίστροφα. Για παράδειγμα, το άκουσμα της φράσης «ψήσε το κέικ στους 350» θα ωθούσε το μοντέλο να περιμένει γραφικά ενός κέικ ή ενός φούρνου.

Αλλά για να καταστεί δυνατή η αντιστοίχιση ήχου-βίντεο σε εκατομμύρια βίντεο, το DenseAV πρέπει να μάθει το πλαίσιο του τι συζητούν οι άνθρωποι. Αφού εκπαίδευσε το DenseAV σε αυτήν την εργασία αντιστοίχισης, η ερευνητική ομάδα εξέτασε σε ποια pixel εστίασε το μοντέλο κατά την επεξεργασία ήχων. Όταν αναφέρθηκε η λέξη “σκύλος”, ο αλγόριθμος αναζήτησε εικόνες σκύλου στη ροή βίντεο, υποδεικνύοντας ότι κατανοεί τη σημασία της λέξης. Ομοίως, όταν άκουσε ένα σκυλί να γαβγίζει, αναζήτησε σκυλιά στο βίντεο. Η ομάδα ήταν περίεργη αν το DenseAV μπορούσε να κάνει διάκριση μεταξύ της λέξης “σκύλος” και του ήχου ενός σκύλου που γαβγίζει. Δίνοντας στο DenseAV μια προσέγγιση διπλού εγκεφάλου, ανακάλυψαν ότι η μία πλευρά επικεντρωνόταν φυσικά στη γλώσσα, όπως η λέξη “σκύλος”, ενώ η άλλη επικεντρώθηκε στους ήχους, όπως το γάβγισμα.

Η ομάδα αντιμετώπισε ένα δύσκολο έργο στην εκμάθηση μιας γλώσσας χωρίς εισαγωγή κειμένου, καθώς στόχευε να ανακαλύψει ξανά την ουσία της γλώσσας από την αρχή χωρίς τη χρήση προεκπαιδευμένων γλωσσικών μοντέλων. Αυτή η μέθοδος εμπνέεται από το πώς τα παιδιά μαθαίνουν τη γλώσσα παρατηρώντας και ακούγοντας το περιβάλλον τους. Μια πιθανή εφαρμογή αυτής της τεχνολογίας είναι η εκμάθηση από τον τεράστιο όγκο περιεχομένου βίντεο που ανεβάζεται καθημερινά στο διαδίκτυο. Ο Χάμιλτον και η ομάδα του στοχεύουν στη δημιουργία συστημάτων που μπορούν να μάθουν από εκπαιδευτικά βίντεο και άλλο διαδικτυακό περιεχόμενο.

Μια άλλη ενδιαφέρουσα εφαρμογή είναι η κατανόηση νέων γλωσσών, όπως η επικοινωνία με δελφίνια ή φάλαινες, που δεν έχουν γραπτή μορφή. Η ομάδα ελπίζει ότι το DenseAV μπορεί να βοηθήσει στη μετάφραση αυτών των γλωσσών, οι οποίες έχουν διαφύγει εδώ και πολύ καιρό από την ανθρώπινη κατανόηση.

“Ελπίζουμε ότι το DenseAV μπορεί να μας βοηθήσει να κατανοήσουμε αυτές τις γλώσσες που έχουν αποφύγει τις προσπάθειες ανθρώπινης μετάφρασης από την αρχή. Τέλος, ελπίζουμε ότι αυτή η μέθοδος μπορεί να χρησιμοποιηθεί για την ανακάλυψη μοτίβων μεταξύ άλλων ζευγών σημάτων, όπως οι σεισμικοί ήχοι που κάνει η γη και γεωλογία», είπε ο Χάμιλτον σε δήλωση.

Διαβάστε όλες τις τελευταίες Ειδήσεις για την υγεία από την Ελλάδα και τον Κόσμο
Ακολουθήστε το healthweb.gr στο Google News και μάθετε πρώτοι όλες τις ειδήσεις
Ακολουθήστε το healthweb.gr στο κανάλι μας στο YouTube

Διαβάστε Eπίσης:

Η τεχνητή νοημοσύνη βοηθά τους επαγγελματίες υγείας να διαβάζουν μπερδεμένα ΗΕΓ για να σώζουν ζωές

Η τεχνητή νοημοσύνη βελτιώνει την ακρίβεια διαγνώσεων καρκίνου του δέρματος

Αλγόριθμος μηχανικής μάθησης προσφέρει στους ουρολόγους σημαντικά οφέλη

Ποιοι επιστήμονες αναφέρονται περισσότερο στις ειδήσεις;

svg%3E svg%3E
svg%3E
svg%3E
Περισσότερα

Μελέτη αξιοποιεί την ΑΙ για την πρόβλεψη δολοφονικών κυμάτων με σημαντική ακρίβεια

ΑΙ κύματα: Το Πανεπιστήμιο του Μέριλαντ φέρεται να χρησιμοποιεί τεχνητή νοημοσύνη (AI) για να βοηθήσει τους ναυτικούς να ανιχνεύουν εκ των προτέρων δολοφονικά αδίστακτα κύματα της θάλασσας, τα οποία συνεχίζουν να απειλούν τις ζωές ανθρώπων και πλοίων.

Νέα εφαρμογή ανιχνεύει καρδιακή ανεπάρκεια με ενσωματωμένους αισθητήρες στο smartphone σας

Καρδιακή ανεπάρκεια: Μια νέα τεχνολογία που αναπτύχθηκε από το Πανεπιστήμιο του Turku και το CardioSignal χρησιμοποιεί τους ενσωματωμένους αισθητήρες ενός smartphone για να αναλύσει την κίνηση της καρδιάς και να ανιχνεύσει πιθανή καρδιακή ανεπάρκεια

Η πρώιμη δοκιμή στην επεξεργασία γονιδίων CRISPR μπορεί να βελτιώσει την όραση σε τυφλά παιδιά

Γονίδια CRISPR: Ένα κλινικό πείραμα πρώιμου σταδίου που δημοσιεύτηκε στο New England Journal of Medicine διαπίστωσε ότι η γονιδιακή θεραπεία μπορεί να βελτιώσει την κληρονομική τύφλωση.

Mη επεμβατική διεπαφή εγκεφάλου-υπολογιστή επιτρέπει τη χειραγώγηση αντικειμένων ελεγχόμενη από τη σκέψη

Brain-Computer: Μαζί με διάφορες άλλες εταιρείες στην τεχνολογία διεπαφής εγκεφάλου-υπολογιστή (BCI), η Neuralink του Elon Musk και η Synchron που υποστηρίζεται από τον Bill Gates πρωτοστατούν στην ανάπτυξη τσιπ εγκεφάλου.

Η τεχνητή νοημοσύνη μπορεί να προβλέψει τα επίπεδα άγχους χρησιμοποιώντας είδη εικόνων

ΑΙ εικόνες: Ερευνητές στο Πανεπιστήμιο του Σινσινάτι ανέπτυξαν ένα εργαλείο τεχνητής νοημοσύνης (AI) που χρησιμοποιεί είδη εικόνας για να προβλέψει τα επίπεδα άγχους.

Υιοθέτηση της αναδυόμενης τεχνολογίας AI στην υγειονομική περίθαλψη

Αναδυόμενη τεχνολογία: Η υιοθέτηση των αναδυόμενων τεχνολογιών AI στην υγειονομική περίθαλψη προσφέρει σημαντικές δυνατότητες για τη βελτίωση της διαγνωστικής διαδικασίας.

CrowdStrike: Ο πάροχος κυβερνοασφάλειας που ευθύνεται για την άνευ προηγουμένου κατάρρευση των Windows παγκοσμίως

«Καθώς τα τελικά σημεία των δικτύων έχουν καταρρεύσει εμφανίζοντας την μπλε οθόνη του θανάτου, δεν μπορούν να ενημερωθούν εξ αποστάσεως και αυτό το πρόβλημα πρέπει να λυθεί με μη αυτόματο τρόπο. Αυτή θα είναι μια διαδικασία που θα πάρει μέρες. Η επιστροφή στο Διαδίκτυο είναι απίθανο να είναι εύκολη», κατέληξε ο Γκρόσμαν.

Close Icon