Adobe Project Voco - Κατασκευάστε φράσεις με την φωνή άλλου

Adobe Project VoCo: Σύντομα μπορεί να είμαστε σε θέση να κάνουμε τους ανθρώπους να λένε πράγματα που δεν είπαν ποτέ. Πως; Η Adobe σχεδιάζει να κυκλοφορήσει ένα νέο λογισμικό φωνητικής επεξεργασίας.

Η εταιρεία παρουσίασε το Project VoCo χθες στην ετήσια της εκδήλωση MAX, αποκαλύπτοντας ένα εργαλείο που θα κάνει για τον ήχο ό, τι κάνει το Photoshop για την επεξεργασία εικόνων.

Το VOCO μπορεί να χρησιμοποιηθεί για την εισαγωγή νέων λέξεων που ο ομιλητής δεν είπε ποτέ και να δημιουργήσει εντελώς νέες, και φυσικές μεγαλόστομες φράσεις.Η τεχνολογία παρουσιάστηκε από τον ερευνητή Zeyu Jin, ο οποίος εντυπωσίασε τους παρευρισκόμενους στην εκδήλωση MAX με κορυφαία προϊόντα που είναι ακόμα υπό ανάπτυξη. Δεν γνωρίζουμε εάν τελικά το VOCO κυκλοφορήσει ως προϊόν. Προς το παρόν η ομάδα του Adobe Research συνεργάζεται με το Πανεπιστήμιο του Princeton για το project.


«Έχουμε αναπτύξει μια τεχνολογία που ονομάζεται Project VOCO με την οποία μπορείτε απλά να πληκτρολογήσετε τη λέξη ή τις λέξεις που θέλετε να αλλάξετε ή να εισάγετε στο VoiceOver. Ο αλγόριθμος θα κάνει τα υπόλοιπα και θα το κάνει να ακούγεται σαν να τα είπε ο αρχικός ομιλητής» ανέφερε η Adobe στο TheVerge.Το νέο λογισμικό έχει σαν στόχο να βοηθήσει τους δημιουργούς περιεχομένου στην επεξεργασία διαλόγου ή κάποιας αφήγησης, στην διόρθωση σφαλμάτων ή ακόμα και για να αλλάξουν μια ομιλία.

Παρά την προβλεπόμενη επιτυχία του αν τελικά κυκλοφορήσει, από εκείνο το σημείο και μετά θα είναι πολύ δύσκολο να εμπιστευτούμε ξανά την καταγραφή της ομιλίας κάποιου. Από την άλλη πλευρά, θα μπορούσε να ανοίξει ένα εντελώς νέο τρόπο διατήρησης της φωνής κάποιου ή για τη χρήση φωνών σε άλλες τεχνολογίες.

Η Adobe δήλωσε στο TechCrunch ότι το Project VOCO είναι ένα παράδειγμα «μετατροπής φωνής» αντί για την σύνθεση ομιλίας.

Ο Jin και ο ερευνητής του Princeton Adam Finkelstein που συνεργάστηκε με την ομάδα του Adobe Research αναφέρει:

«Ο στόχος του φωνητικού μετατροπέα (voice conversion ή VC) είναι να τροποποιήσει μια ηχογράφηση που περιέχει τη φωνή ενός ομιλητή, έτσι ώστε να ακούγεται σαν κάποιος άλλος ομιλητής, χωρίς να αλλοιωθεί το περιεχόμενο της ομιλίας.»

Να αναφέρουμε ότι τόσο η Google όσο και η Microsoft προσπαθούν να βελτιώσουν την τεχνολογία μετατροπής φωνής χρησιμοποιώντας άλλες τεχνικές.