Η ομιλία που δημιουργείται από υπολογιστή θα μπορεί σύντομα να ακούγεται πολύ πιο ανθρώπινη.
Ο κατασκευαστής εξαρτημάτων υπολογιστών NVIDIA παρουσίασε πρόσφατα λογισμικό που μπορεί να καταγράψει τον ήχο της φυσικής ομιλίας επιτρέποντάς στο λογισμικό να επεξεργαστή την ομιλία ώστε γίνει αναπαραγωγή της με τη φωνή σας! Το λογισμικό μπορεί επίσης να αποδώσει τα λόγια ενός ομιλητή χρησιμοποιώντας τη φωνή ενός άλλου ατόμου! Είναι μέρος μιας μελέτης ώστε η ομιλία και ο λόγος του υπολογιστή να γίνει πιο ρεαλιστικός.
Οι ψηφιακοί βοηθοί Alexa της Amazon και Siri της Apple ακούγονται πολύ καλύτερα σαν ομιλία από έναν υπολογιστή αλλά σίγουρα δεν μπορούν να εκληφθούν ως αυθεντικές ανθρώπινες φωνές.
Η ομάδα της nvidia προκειμένου να ακούγεται πιο φυσική η τεχνητή ομιλία ανέπτυξε ένα σύστημα λογισμικού που το ονόμασε RAD-TTS model. Το συγκεκριμένο σύστημα (TTS-text to speech) επιτρέπει στα άτομα να διαβάζουν κείμενο και το σύστημα καταγράφει την ανάγνωση της φωνής τους συμπεριλαμβανομένου του βηματισμού, της τονικότητας, της χροιάς και άλλων παραγόντων της ομιλίας.
Η εταιρεία χρησιμοποίησε το παραπάνω λογισμικό της για να δημιουργήσει τεχνητή φωνητική αφήγηση για τη σειρά βίντεο I Am AI.
“Με το παραπάνω σύστημα TTS θα μπορούσε κάποιος να καταγράψει τον εαυτό του διαβάζοντας ένα σενάριο και στη συνέχεια να χρησιμοποιήσει το λογισμικό-μοντέλο TTS για να μετατρέψει την ομιλία σε φωνή μιας γυναίκας αφηγήτριας. Χρησιμοποιώντας αυτή την αφήγηση σαν γραμμή βάσης μέσα από το λογισμικό ο δημιουργός θα μπορούσε να την επεξεργαστή ώστε η καταγεγραμμένη ομιλία να αποκτήσει αναπνοή σαν φωνή ηθοποιού και να τονίσει συγκεκριμένες λέξεις τροποποιώντας τον ρυθμό της αφήγησης προς την φυσική ανθρώπινη ομιλιά” , έγραψε η NVIDIA στην ιστοσελίδα της για το παραπάνω σύστημα.
Για να γίνει η ομιλία υπολογιστή ποιο κοντά στην ανθρώπινη ομιλία απαιτούνται εκατοντάδες ώρες ηχογράφησης και επεξεργασίας της ομιλίας μέσα από ειδικά προγράμματα.
Η προσθήκη πολλαπλών γλωσσών, οι περισσότερες πλατφόρμες φωνητικής τεχνητής νοημοσύνης καθιστά τους ψηφιακούς βοηθούς φωνής προσβάσιμους σε περισσότερες γεωγραφικές περιοχές και για περισσότερο κόσμο.
Έτσι τα προγράμματα φωνητικής νοημοσύνης όπως λέγονται συνεχώς εξελίσσονται. Η φωνητική τεχνητή νοημοσύνη έχει εισβάλει και στην αυτοκινητοβιομηχανία ως τρόπος ασφαλέστερων οχημάτων αλλά λειτουργώντας και σαν βοηθός στο οδηγό του οχήματος.
- Ασύρματοι συναγερμοί: γιατί η εγκατάσταση χωρίς καλώδια δεν είναι απλώς θέμα ευκολίας
- Μήπως παρακολουθούν το κινητό σου;
- Αυτό είναι το πιο συχνό λάθος σε ένα PC build
- Τι είναι το Cloud και πώς λειτουργεί
- Γιατί το κινητό μας κολλάει μετά από 1-2 χρόνια;
Όταν η Τεχνολογία σε Δυσκολεύει
Έχεις πρόβλημα με υπολογιστή, κινητό, κάποια εφαρμογή, πλατφόρμα η υπηρεσία; Επικοινώνησε μαζί μου για απλές, κατανοητές λύσεις σε καθημερινά τεχνολογικά προβλήματα.
Tip: σώσε το link στα αγαπημένα σου για γρήγορη βοήθεια.
