Η Toshiba Corporation έχει αναπτύξει ένα AI με τρισδιάστατη αναγνώριση που μπορεί να μετρήσει την απόσταση με την ακρίβεια μιας στερεοφωνικής κάμερας, χρησιμοποιώντας την εικόνα που τραβήχτηκε με μια εμπορική κάμερα και αναλύοντας τη θόλωση της εικόνας που προκλήθηκε από τον φακό της κάμερας χρησιμοποιώντας βαθιά μάθηση. Αυτή η τεχνολογία θα εξαλείψει τη χρήση στερεοφωνικών καμερών, η οποία τελικά μειώνει το κόστος και το χώρο. Η Toshiba θα παρουσιάσει αυτό το επίτευγμα στο διεθνές συνέδριο για το computer vision (ICCV2019) που θα πραγματοποιηθεί στη Νότια Κορέα στις 30 Οκτωβρίου 2019, από τις 10 π.μ.
Η ανίχνευση εικόνας γίνεται πιο σημαντική και εφαρμογές όπως κινούμενα αντικείμενα ρομπότ, αυτόνομα μη επανδρωμένα οχήματα, τηλεχειριστήρια drone που επιθεωρούν υποδομή κ.λπ., απαιτούν κάτι περισσότερο από απλές εικόνες των θεμάτων, χρειάζονται μια μικρή συσκευή για την ανάλυση δεδομένων 3D για να συμπεριλάβουν σχήμα και απόσταση. Ως εκ τούτου, οι έρευνες έχουν αυξηθεί για την ανάπτυξη μιας τεχνολογίας μέτρησης με μονόφθαλμες κάμερες (είναι εύκολο να μικρογραφούν) χρησιμοποιώντας βαθιά μάθηση για καλύτερη εκμάθηση του σχήματος, του φόντου και άλλων δεδομένων τοπίου του απεικονιζόμενου αντικειμένου.
Αυτή η μέθοδος έχει ένα μειονέκτημα. Η ακρίβεια της απόστασης εκτιμάται με τη βοήθεια μιας μονοφωνικής κάμερας, ανάλογα με τα δεδομένα του τοπίου που έχουν μάθει και προκαλεί πτώση της ακρίβειας λόγω των λήψεων που τραβήχτηκαν σε διαφορετικά τοπία. Για να ξεπεραστεί αυτό το Toshiba έχει αναπτύξει μια φωτογραφία διαφράγματος με φίλτρο χρώματος στην οποία δύο φίλτρα χρώματος είναι προσαρτημένα στον φακό και το χρώμα και το μέγεθος της θαμπάδας εικόνας που προκύπτει αναλύονται ανάλογα με την απόσταση από το θέμα. Αν και αυτό επιλύει το ζήτημα της εξάρτησης δεδομένων, κοστίζει χρόνο και χρήμα για την τροποποίηση των υπαρχόντων φακών.
Η Toshiba έχει ξεπεράσει αυτό το πρόβλημα αναπτύσσοντας τεχνολογία AI με τεχνολογία αναγνώρισης 3D που χρησιμοποιεί βαθιά μάθηση για να αναλύσει πώς η εικόνα θολώνεται ανάλογα με τη θέση της στον φακό, προκειμένου να επιτευχθεί μέτρηση απόστασης με την ίδια υψηλή ακρίβεια με το σύστημα στερεοφωνικής κάμερας, με μια κανονική μονοφωνική κάμερα, αλλά χωρίς καμία ανάγκη για δεδομένα τοπίου. Μέχρι τώρα, θεωρήθηκε θεωρητικά αδύνατο να μετρηθεί η απόσταση με βάση το σχήμα του θαμπώματος, το οποίο είναι το ίδιο για αντικείμενα με απόσταση και τόσο μακριά όσο βρίσκονται σε απόσταση από το σημείο εστίασης. Όμως, τα αποτελέσματα της ανάλυσης έχουν δείξει μια σημαντική διαφορά μεταξύ των σχημάτων θόλωσης κοντά και μακριά αντικείμενα, ακόμη και σε απόσταση από το σημείο εστίασης. Με αυτό, η Toshiba ανέλυσε με επιτυχία τα δεδομένα θαμπώματος από εικόνες που τραβήχτηκαν από μια μονάδα βαθιάς μάθησης που εκπαιδεύτηκε με το μοντέλο του βαθύ νευρωνικού δικτύου.
Όταν το φως περνά μέσα από το φακό, το σχήμα της θαμπάδας που δημιουργείται είναι γνωστό ότι αλλάζει ανάλογα με το μήκος κύματος του φωτός και τη θέση του στο φακό. Στο ανεπτυγμένο δίκτυο, η θέση και το χρώμα υποβάλλονται σε επεξεργασία χωριστά για να αντιληφθούν σωστά τις αλλαγές στο σχήμα της θαμπάδας και, στη συνέχεια, αφού περάσουν από έναν σταθμισμένο μηχανισμό προσοχής, για να ελέγξουν πού βρίσκεται η κλίση φωτεινότητας για εστίαση προκειμένου να μετρηθεί σωστά η απόσταση. Μέσω της μάθησης, το δίκτυο στη συνέχεια ενημερώνεται για να μειώσει ένα σφάλμα μεταξύ της μετρηθείσας απόστασης και της πραγματικής απόστασης. Χρησιμοποιώντας αυτήν τη μονάδα AI, η Toshiba επιβεβαίωσε ότι μία μόνο εικόνα που τραβήχτηκε με μια εμπορικά διαθέσιμη κάμερα πραγματοποιεί την ίδια ακρίβεια μέτρησης απόστασης που εξασφαλίζεται με τις στερεοφωνικές κάμερες. Περισσότερες πληροφορίες μπορείτε να βρείτε σε αυτήν την επίσημη σελίδα της Toshiba.
Η Toshiba θα επιβεβαιώσει την ευελιξία του συστήματος με εμπορικά διαθέσιμες κάμερες και φακούς και θα επιταχύνει την επεξεργασία εικόνας, στοχεύοντας στη δημόσια εφαρμογή κατά το οικονομικό έτος 2020.