Πώς η τεχνητή νοημοσύνη θα μπορούσε να κάνει την ομιλία του υπολογιστή πιο φυσική.

Posted on 8 Σεπτεμβρίου 2021

1,933

Η ομιλία που δημιουργείται από υπολογιστή θα μπορεί σύντομα να ακούγεται πολύ πιο ανθρώπινη.

Ο κατασκευαστής εξαρτημάτων υπολογιστών NVIDIA παρουσίασε πρόσφατα λογισμικό που μπορεί να καταγράψει τον ήχο της φυσικής ομιλίας επιτρέποντάς στο λογισμικό να επεξεργαστή την ομιλία ώστε γίνει αναπαραγωγή της με τη φωνή σας! Το λογισμικό μπορεί επίσης να αποδώσει τα λόγια ενός ομιλητή χρησιμοποιώντας τη φωνή ενός άλλου ατόμου! Είναι μέρος μιας μελέτης ώστε η ομιλία και ο λόγος του υπολογιστή να γίνει πιο ρεαλιστικός.

Οι ψηφιακοί βοηθοί Alexa της Amazon και Siri της Apple ακούγονται πολύ καλύτερα σαν ομιλία από έναν υπολογιστή αλλά σίγουρα δεν μπορούν να εκληφθούν ως αυθεντικές ανθρώπινες φωνές.

Η ομάδα της nvidia προκειμένου να ακούγεται πιο φυσική η τεχνητή ομιλία ανέπτυξε ένα σύστημα λογισμικού που το ονόμασε RAD-TTS model. Το συγκεκριμένο σύστημα (TTS-text to speech) επιτρέπει στα άτομα να διαβάζουν κείμενο και το σύστημα καταγράφει την ανάγνωση της φωνής τους συμπεριλαμβανομένου του βηματισμού, της τονικότητας, της χροιάς και άλλων παραγόντων της ομιλίας.

Η εταιρεία χρησιμοποίησε το παραπάνω λογισμικό της για να δημιουργήσει τεχνητή φωνητική αφήγηση για τη σειρά βίντεο I Am AI.

“Με το παραπάνω σύστημα TTS θα μπορούσε κάποιος να καταγράψει τον εαυτό του διαβάζοντας ένα σενάριο και στη συνέχεια να χρησιμοποιήσει το λογισμικό-μοντέλο TTS για να μετατρέψει την ομιλία σε φωνή μιας γυναίκας αφηγήτριας. Χρησιμοποιώντας αυτή την αφήγηση σαν γραμμή βάσης μέσα από το λογισμικό ο δημιουργός θα μπορούσε να την επεξεργαστή ώστε η καταγεγραμμένη ομιλία να αποκτήσει αναπνοή σαν φωνή ηθοποιού και να τονίσει συγκεκριμένες λέξεις τροποποιώντας τον ρυθμό της αφήγησης προς την φυσική ανθρώπινη ομιλιά” , έγραψε η NVIDIA στην ιστοσελίδα της για το παραπάνω σύστημα.

Για να γίνει η ομιλία υπολογιστή ποιο κοντά στην ανθρώπινη ομιλία απαιτούνται εκατοντάδες ώρες ηχογράφησης και επεξεργασίας της ομιλίας μέσα από ειδικά προγράμματα.

Η προσθήκη πολλαπλών γλωσσών, οι περισσότερες πλατφόρμες φωνητικής τεχνητής νοημοσύνης καθιστά τους ψηφιακούς βοηθούς φωνής προσβάσιμους σε περισσότερες γεωγραφικές περιοχές και για περισσότερο κόσμο.

Έτσι τα προγράμματα φωνητικής νοημοσύνης όπως λέγονται συνεχώς εξελίσσονται. Η φωνητική τεχνητή νοημοσύνη έχει εισβάλει και στην αυτοκινητοβιομηχανία ως τρόπος ασφαλέστερων οχημάτων αλλά λειτουργώντας και σαν βοηθός στο οδηγό του οχήματος.

Tech Help By ThinkTech

Όταν η Τεχνολογία σε Δυσκολεύει

Έχεις πρόβλημα με υπολογιστή, κινητό, κάποια εφαρμογή, πλατφόρμα η υπηρεσία; Επικοινώνησε μαζί μου για απλές, κατανοητές λύσεις σε καθημερινά τεχνολογικά προβλήματα.

Δες εδώ

Tip: σώσε το link στα αγαπημένα σου για γρήγορη βοήθεια.

Θέμης Βασιλόπουλος

Μηχανικός Πληροφορικής / Tech Content Publisher

Ονομάζομαι Θέμης Βασιλόπουλος και μέσα από το blog ThinkTech.gr επικεντρώνομαι σε θέματα τεχνολογίας με σκοπό να είναι κατανοητή από όλους.

Ακολουθήστε με στα Social και εγγραφείτε στο newsletter για να ενημερώνεστε όταν δημοσιεύω νέο άρθρο.

“Η Τεχνολογία με απλά λόγια”

Ασύρματοι συναγερμοί: γιατί η εγκατάσταση χωρίς καλώδια δεν είναι απλώς θέμα ευκολίας

Μήπως παρακολουθούν το κινητό σου;

Αυτό είναι το πιο συχνό λάθος σε ένα PC build

Τι είναι το Cloud και πώς λειτουργεί

Γιατί το κινητό μας κολλάει μετά από 1-2 χρόνια;

Το κινητό μας ακούει τελικά; Η αλήθεια πίσω από τις «τυχαίες» διαφημίσεις

Κανόνες προστασίας στο διαδίκτυο…και τι δεν πρέπει να κάνουμε..

5 νέα κινητά του 2026 με μπαταρία από 7.000 mAh έως και 10.000 mAh

Πώς να χρησιμοποιήσεις το ChatGPT σωστά για δουλειά (30 έτοιμα prompts)

Πώς η τεχνητή νοημοσύνη θα μπορούσε να κάνει την ομιλία του υπολογιστή πιο φυσική.

Όταν η Τεχνολογία σε Δυσκολεύει

Θέμης Βασιλόπουλος

Μηχανικός Πληροφορικής / Tech Content Publisher

Πόσο γρήγορο και οικονομικό σταθερό Internet έχει η Ελλάδα σε σχέση με τις υπόλοιπες χώρες της Ευρώπης;

Δορυφορικό internet-Σύνδεση στο Internet με κεραία Starlink

Μας ακούει η Google από το κινητό μας;

Τα ηλεκτρικά αεροπορικά ταξί είναι καθ’ οδόν, επιβάτες ενδέχεται να πετούν μέχρι το 2025

Τα καλύτερα sites για εύρεση εργασίας

Ο πρώτος υπερυπολογιστής που προσομοιώνει τον ανθρώπινο εγκέφαλο

ΕΝΔΙΑΦΕΡΟΝ ΑΡΘΡΟ

Πόσο γρήγορο και οικονομικό σταθερό Internet έχει η Ελλάδα σε σχέση με τις υπόλοιπες χώρες της Ευρώπης;

Newsletter

Sponsored

Tech Help By Thinktech

Χρειάζεσαι βοήθεια;

ΕΧΕΙΣ ΓΡΗΓΟΡΟ INTERNET ;

Sponsored

ΟΔΗΓΟΙ ΤΕΧΝΟΛΟΓΙΑΣ

Πώς να έχεις Wi-Fi παντού στο σπίτι: πρακτικός οδηγός για σταθερό σήμα

Wi-Fi 6 vs Wi-Fi 7: τι διαφορά θα δεις στην πράξη;

Τι είναι 4K και 8K; Διαφορές, Οφέλη & Τι να Αγοράσω

Τι οθόνη να επιλέξω για το κινητό μου;

Πώς μπορώ να στείλω ένα ανώνυμο email;

Sponsored

Όταν η Τεχνολογία σε Δυσκολεύει

Θέμης Βασιλόπουλος

Μηχανικός Πληροφορικής / Tech Content Publisher

ΕΝΔΙΑΦΕΡΟΝ ΑΡΘΡΟ

Newsletter

Sponsored

ΘΕΜΑΤΟΛΟΓΙΑ

Tech Help By Thinktech

Χρειάζεσαι βοήθεια;

ΕΧΕΙΣ ΓΡΗΓΟΡΟ INTERNET ;

Sponsored

ΟΔΗΓΟΙ ΤΕΧΝΟΛΟΓΙΑΣ

Sponsored