Στις 13 και 14 Οκτωβρίου πραγματοποιήθηκε στην Αθήνα, η εναρκτήρια συνάντηση του νέου έργου με συντονιστή τον όμιλο Maggioli.
Το VOXReality (Voice driven interaction in XR spaces) είναι ένα φιλόδοξο έργο του οποίου στόχος είναι η αξιοποίηση και σύγκλιση δύο σημαντικών τεχνολογιών, της επεξεργασίας φυσικής γλώσσας και της υπολογιστικής όρασης, παρέχοντας τη δυνατότητα φωνητικής αλληλεπίδρασης σε εφαρμογές εκτεταμένης πραγματικότητας XR.
Οι τεχνολογίες εκτεταμένης πραγματικότητας (XR) προβλέπεται να κυριαρχήσουν στο χώρο της αλληλεπίδρασης ανθρώπου-υπολογιστή (HCI), όπως αρχίζει να διακρίνεται και από την εφαρμογή του metaverse. Η επεξεργασία φυσικής γλώσσας (NLP) και η μηχανική όραση (CV) είναι αντίστοιχα σημαντικές τεχνολογίες, που παρουσιάζουν τελευταία βελτίωση στις επιδόσεις τους, λόγω της εμφάνισης της μηχανικής μάθησης (ML) και της τεχνητής νοημοσύνης (AI), αλλά δεν έχουν αξιοποιηθεί ακόμα στο μέγιστο.
Παρόλο που η εμφάνιση head-mounted-displays (HMDs) προωθεί την κατανάλωση τρισδιάστατου και σύνθετου περιεχομένου, όσον αφορά στη φυσικότητα, δεν μπορεί να ειπωθεί το ίδιο για την αλληλεπίδραση με το περιεχόμενο. Αν και έχει παρατηρηθεί αξιοσημείωτη πρόοδος, όσον αφορά τις αλληλεπιδράσεις με αναγνώριση χειρονομιών, στην τρέχουσα γενιά των AR/VR HMDs, οι λύσεις περιορίζονται συνήθως σε συγκεκριμένες συσκευές υψηλής τεχνολογίας και δεν περιλαμβάνουν τα πιο προσιτά και φιλικά προς τον χρήστη mobile-based περιβάλλοντα AR. Επιπλέον, οι χειρονομίες αποτελούν μέρος μόνο του «οπλοστασίου» της εμπνευσμένης από τη φύση διεπαφής ανθρώπου – υπολογιστή, με τη φυσική ομιλία να είναι μια άλλη διεπαφή, εξίσου πολύπλοκη αλλά λιγότερο αξιοποιημένη.

Το VOXReality φιλοδοξεί να συγχωνεύσει αυτά τα δύο παράλληλα πεδία, προκειμένου να σχεδιάσει και να αναπτύξει μοντέλα Τεχνητής Νοημοσύνης (ΑΙ) που θα ενσωματώνουν τη γλώσσα ως βασικό μέσο αλληλεπίδρασης, σε συνδυασμό με άλλα οπτικά μέσα κατανόησης, εστιάζοντας στην εμπλοκή της χωρικής και σημασιολογικής γνώσης των συστημάτων XR και επεξεργασίας φυσικής γλώσσας (NLP).
Ένα τέτοιο εγχείρημα θα μπορούσε να δώσει το έναυσμα για μια νέα εποχή εφαρμογών οι οποίες βασίζονται στην ολιστική κατανόηση των στόχων των χρηστών, πέρα από συσκευές και ελεγκτές. Η ενσωμάτωση μοντέλων ΤΝ (ΑΙ) που βασίζονται στη γλώσσα και την όραση, με μονόδρομες ή αμφίδρομες ανταλλαγές μεταξύ των δύο τρόπων, θα επιτρέψει την εξαγωγή συμπερασμάτων για αυτό το έργο και τον καθορισμό προ-εκπαιδευμένων μοντέλων εκτεταμένης πραγματικότητας XR επόμενης γενιάς.
Οι παραπάνω τεχνολογίες θα επαληθευτούν στην πράξη μέσω τριών περιπτώσεων χρήσης:
- Προσωπικοί βοηθοί, ένας αναδυόμενος τύπος ψηφιακής τεχνολογίας που επιδιώκει να υποστηρίξει τους ανθρώπους στις καθημερινές τους εργασίες, των οποίων οι βασικές λειτουργίες σχετίζονται με την αλληλεπίδραση ανθρώπου-μηχανής.
- Εικονικές διασκέψεις, οι οποίες φιλοξενούνται και διεξάγονται εξ ολοκλήρου online, συνήθως χρησιμοποιώντας μια πλατφόρμα εικονικών διασκέψεων που δημιουργεί κοινό εικονικό περιβάλλον, επιτρέποντας στους συμμετέχοντες να παρακολουθούν ή και να συμμετέχουν οπουδήποτε κι αν βρίσκονται στον κόσμο.
- Θέατρα όπου το VOX-reality θα συνδυάζει μετάφραση σε άλλες γλώσσες, audio-visual user associations και AR VFX (οπτικά εφέ) που θα ενεργοποιούνται σε συγκεκριμένα σημεία της ομιλίας.
Το έργο έχει λάβει χρηματοδότηση από το πρόγραμμα Horizon Europe της Ευρωπαϊκής Ένωσης στο πλαίσιο της υπ' αρ. 101070521 επιχορήγησης και έχει ως επικεφαλής τον όμιλο Maggioli, σε συνεργασία με το Κέντρο Έρευνας & Τεχνολογίας (ΕΚΕΤΑ) στη Θεσσαλονίκη, το Πανεπιστήμιο του Μάαστριχτ (Ολλανδία), την Ένωση Ολλανδικών Επιστημονικών & Ερευνητικών Ινστιτούτων (NWΟ-i), την εταιρία Synelixis (Ελλάδα), τη διεθνή έκθεση VRDays (Ολλανδία), το F6S NETWORK (Ιρλανδία), τις εταιρίες AdaptIT (Ελλάδα) και HOLO-LIGHT (Γερμανία) και το Φεστιβάλ Αθηνών (Ελλάδα).