ΑΡΧΙΚΗ Tech News Πώς η τεχνητή νοημοσύνη θα μπορούσε να κάνει την ομιλία του υπολογιστή πιο φυσική.

Πώς η τεχνητή νοημοσύνη θα μπορούσε να κάνει την ομιλία του υπολογιστή πιο φυσική.

0
100
Facebooktwitterpinterestlinkedinmail

Η ομιλία που δημιουργείται από υπολογιστή θα μπορεί σύντομα να ακούγεται πολύ πιο ανθρώπινη.

Ο κατασκευαστής εξαρτημάτων υπολογιστών NVIDIA παρουσίασε πρόσφατα λογισμικό που μπορεί να καταγράψει τον ήχο της φυσικής ομιλίας επιτρέποντάς στο λογισμικό να επεξεργαστή την ομιλία ώστε γίνει αναπαραγωγή της με τη φωνή σας! Το λογισμικό μπορεί επίσης να αποδώσει τα λόγια ενός ομιλητή χρησιμοποιώντας τη φωνή ενός άλλου ατόμου! Είναι μέρος μιας μελέτης ώστε η ομιλία και ο λόγος του υπολογιστή να γίνει πιο ρεαλιστικός.

Οι ψηφιακοί βοηθοί Alexa της Amazon και Siri της Apple ακούγονται πολύ καλύτερα σαν ομιλία από έναν υπολογιστή αλλά σίγουρα δεν μπορούν να εκληφθούν ως αυθεντικές ανθρώπινες φωνές.

Η ομάδα της nvidia προκειμένου να ακούγεται πιο φυσική η τεχνητή ομιλία ανέπτυξε ένα σύστημα λογισμικού που το ονόμασε RAD-TTS model. Το συγκεκριμένο σύστημα (TTS-text to speech) επιτρέπει στα άτομα να διαβάζουν κείμενο και το σύστημα καταγράφει την ανάγνωση της φωνής τους συμπεριλαμβανομένου του βηματισμού, της τονικότητας, της χροιάς και άλλων παραγόντων της ομιλίας.

Η εταιρεία χρησιμοποίησε το παραπάνω λογισμικό της για να δημιουργήσει τεχνητή φωνητική αφήγηση για τη σειρά βίντεο I Am AI.

“Με το παραπάνω σύστημα TTS θα μπορούσε κάποιος να καταγράψει τον εαυτό του διαβάζοντας ένα σενάριο και στη συνέχεια να χρησιμοποιήσει το λογισμικό-μοντέλο TTS για να μετατρέψει την ομιλία σε φωνή μιας γυναίκας αφηγήτριας. Χρησιμοποιώντας αυτή την αφήγηση σαν γραμμή βάσης μέσα από το λογισμικό ο δημιουργός θα μπορούσε να την επεξεργαστή ώστε η καταγεγραμμένη ομιλία να αποκτήσει αναπνοή σαν φωνή ηθοποιού και να τονίσει συγκεκριμένες λέξεις τροποποιώντας τον ρυθμό της αφήγησης προς την φυσική ανθρώπινη ομιλιά” , έγραψε η NVIDIA στην ιστοσελίδα της για το παραπάνω σύστημα.

Για να γίνει η ομιλία υπολογιστή ποιο κοντά στην ανθρώπινη ομιλία απαιτούνται εκατοντάδες ώρες ηχογράφησης και επεξεργασίας της ομιλίας μέσα από ειδικά προγράμματα.

Η προσθήκη πολλαπλών γλωσσών, οι περισσότερες πλατφόρμες φωνητικής τεχνητής νοημοσύνης καθιστά τους ψηφιακούς βοηθούς φωνής προσβάσιμους σε περισσότερες γεωγραφικές περιοχές και για περισσότερο κόσμο.

Έτσι τα προγράμματα φωνητικής νοημοσύνης όπως λέγονται συνεχώς εξελίσσονται. Η φωνητική τεχνητή νοημοσύνη έχει εισβάλει και στην αυτοκινητοβιομηχανία ως τρόπος ασφαλέστερων οχημάτων αλλά λειτουργώντας και σαν βοηθός στο οδηγό του οχήματος.

Facebooktwitterpinterestlinkedinmail
ΠΕΡΙΣΣΟΤΕΡΑ THINKTECH NEWS
Διαβάστε περισσότερα άρθρα webmedia
Διαβάστε περισσότερα άρθρα Tech News

ΔΕΙΤΕ ΑΚΟΜΑ

Εμείς είμαστε οι διαφημίσεις μας.

Όλες οι διαφημίσεις προέρχονται από εμάς τους ίδιους. Η τεχνητή νοημοσύνη (AI) μπορεί να μ…