Cum să faci o voce AI în 2023 (tutorial)
Publicat: 2023-09-08De când ChatGPT a apărut la sfârșitul anului 2022, noi programe generative AI (inteligență artificială) au apărut peste tot. Unul dintre cele mai unice tipuri de inteligență artificială este vocea AI, care vă permite să utilizați mesaje text pentru a crea clipuri vocale pentru marketing, formarea angajaților și multe altele. În această postare, vă vom arăta cum să creați o voce AI folosind un program popular, PlayHT. Să ne scufundăm.
- 1 Ce este AI?
- 2 Ce este AI Voice Generation?
- 2.1 Cum funcționează generatoarele de voce AI?
- 3 Cum să faci o voce AI
- 3.1 Pasul 1: Crearea unui cont
- 3.2 Pasul 2: Explorarea interfeței
- 3.3 Pasul 3: Generarea primei voci AI
- 3.4 Pasul 4: Clonarea vocii
- 3.5 Pasul 5: Exportarea unui proiect
- 4 Cele mai bune practici pentru generatoarele de voce AI
- 5 gânduri finale despre crearea unei voci AI
Ce este AI?
Inteligența artificială este o tehnologie expansivă care permite computerelor să îndeplinească sarcini extinse pe care oamenii le-ar face în mod normal. Cu toate acestea, aceste sarcini necesită o fracțiune din timp cu sistemele AI. Există mai multe tipuri de IA, cea mai comună fiind IA îngustă. Acest tip de IA este folosit pentru a crea imagini, voce, muzică și text dintr-un simplu mesaj text.
Ce este AI Voice Generation?
Vocile AI sunt voci generate de computer care imită sunetele, caracteristicile și tonurile vocilor umane. Ele încep fie ca text, fie prin înregistrarea propriei voci pentru a crea o voce unică cu sunet uman. Prin puterea tehnologiei text-to-speech a AI, creatorii pot dezvolta voci pentru podcasturi, voiceover-uri sau pot servi ca instrumente de asistență pentru persoanele cu deficiențe de vedere.
Cum funcționează generatoarele de voce AI?
Generatoarele de voce AI necesită un preprocesor de text, transcriere fonetică și sinteza vocii pentru a funcționa. Primul pas, preprocesarea textului, preia textul brut și îl face totul ordonat și organizat. Descompune cuvintele în părți mai mici numite jetoane, remediază artefacte ciudate precum contracțiile sau caracterele speciale și transformă numerele în cuvinte reale.
Apoi, în al doilea pas, acele jetoane sunt analizate și li se primesc etichete precum verbe, substantive sau adjective. Acest lucru ajută sistemul să înțeleagă cum ar trebui folosit fiecare cuvânt și ce înseamnă acesta în context.
Acum, iată unde se întâmplă magia. Textul trece printr-o analiză fonetică, ceea ce înseamnă că este convertit într-un tip special de scriere care surprinde modul în care ar trebui să sune cuvintele atunci când sunt rostite. Aceasta include stres, ton și ritm pentru a face vorbirea să sune natural.
În cele din urmă, în ultimul pas, toată munca grea dă roade. Trancrierile fonetice sunt transformate în vorbire reală folosind unde sonore. Datorită algoritmilor moderni de inteligență artificială, vorbirea generată în zilele noastre sună mult mai natural și mai asemănător uman decât motoarele text-to-speech din trecut.
Cum să faci o voce AI
Generatoarele de voce au parcurs un drum lung de când IBM a lansat Shoebox în 1962. Sistemele moderne, cum ar fi PlayHT, au o varietate de voci sintetice cu tonuri diferite, făcând posibilă crearea celor mai realiste voci. Alte instrumente, cum ar fi MurfAI, vă vor permite să reglați tonul, tonul și viteza. În acest tutorial, vom folosi PlayHT pentru a crea o voce AI.
Pasul 1: Crearea unui cont
Primul pas al procesului este să creați un cont PlayHT gratuit. Începeți prin a naviga la pagina de pornire, apoi faceți clic pe butonul Încercați gratuit din partea dreaptă sus a ecranului.
Vă puteți înscrie folosind un cont Google sau vă puteți introduce numele și adresa de e-mail. Folosiți metoda aleasă, apoi faceți clic pe înscriere pentru a continua.
În pasul următor, alegeți dacă intenționați să utilizați PlayHT ca persoană fizică sau într-o companie.
PlayHT va pune întrebări despre modul în care veți folosi software-ul în următoarele câteva ecrane.
Odată ce selecțiile dvs. sunt făcute și contul dvs. este creat, puteți începe să explorați interfața.
Pasul 2: Explorarea interfeței
Să ne familiarizăm cu interfața înainte de a genera prima noastră voce:
- Creați un fișier nou: aici veți crea primul proiect.
- Fișiere recente: o listă cu cele mai recente proiecte.
- Fișiere: unde se află toate fișierele dvs.
- Clonarea vocii: puteți încărca sunetul unei voci, apoi o puteți clona pentru a fi utilizată în software.
- Acces API: pentru integrarea PlayHT în alte aplicații
- Facturare: gestionați-vă contul.
- Selector de limbi: engleza este singura opțiune în acest moment, dar alte limbi sunt în lucru.
- Număr de cuvinte: vă permite să vedeți câte cuvinte rămase sunt disponibile.
- Generați toate paragrafele: Folosit pentru a genera o voce AI.
- Importați videoclip: adăugați voci la un videoclip încărcat.
- Solicitare text: introducere text pentru generarea vocii AI.
- Comenzi audio: reglați cronologia vocii și rearanjați clipurile.
- Exportați proiectul: Salvați proiectul după paragraf sau ca un fișier wav.
Pasul 3: Generarea primei voci AI
Generarea unei voci AI cu PlayHT este simplă. Puteți să vă creați propriul script sau să utilizați un chatbot AI pentru a vă ajuta. În acest tutorial, vom folosi ChatGPT pentru a genera textul pentru vocea noastră. Începeți prin a face clic pe butonul de creare a unui fișier nou pentru a crea un nou proiect pentru vocea noastră.
În continuare, vom alege o voce sintetică pentru proiect. Pentru a face acest lucru, faceți clic pe pictograma vocală direct deasupra solicitării text.
Va apărea o nouă fereastră pop-up, permițându-vă să încercați una dintre cele peste 130 de voci AI. Pentru a alege unul, faceți clic pe acesta (1), selectați viteza de redare (2), alegeți să aplicați vocea tuturor paragrafelor din proiectul dvs. (3), apoi confirmați modificările (4).
Vom alege Hudson pentru că sună cel mai realist și are o voce narativă bună pentru scenariul nostru.
Utilizați ChatGPT pentru a genera un script video
Acum că avem vocea selectată, va trebui să generăm ceva text. Vom cere ChatGPT să creeze un scurt script video care să ofere fapte interesante despre câini. Am folosit următorul prompt: Furnizați un scurt script video pentru a prezenta 5 fapte necunoscute despre câini .
Odată ce scriptul este generat, va trebui să introducem ceva text pentru proiectul nostru. Vom începe prin a lipi introducerea scenariului nostru în PlayHT: Bună, iubitori de câini! Astăzi, vom descoperi cinci fapte fascinante și mai puțin cunoscute despre cel mai bun prieten al omului, câinii! Așadar, ia un răsfăț, stai pe spate și hai să ne scufundăm!
Pentru a genera vocea, faceți clic pe pictograma de redare din stânga mesajului text.
PlayHT va genera textul folosind vocea lui Hudson. În funcție de cantitatea de text pe care o utilizați, procesul de generare poate dura până la câteva minute. Odată finalizat, veți putea previzualiza vocea făcând clic pe butonul de redare (1) din dreapta ecranului. Dacă nu sunteți mulțumit de rezultat, puteți face clic pe butonul de regenerare (2) pentru a încerca din nou.
Iată cum sună primul paragraf:
Deși sună destul de bine, ar putea fi nevoie de puțină ajustare. Pauzele de voce nu sună tocmai corect, așa că vom face câteva ajustări.
Regenerarea ieșirii
PlayHT vă permite să faceți modificări la introducerea textului, apoi să îl regenerați. Acest lucru este util atunci când rezultatul nu corespunde standardelor dvs. Un sfat bun este să adăugați liniuțe între propoziții pentru a crea o pauză naturală. Cu generatoarele de voce AI, există tendința de a grăbi textul, creând propoziții nenaturale. Așadar, pentru a corecta acest lucru, vom schimba solicitarea inițială în: Bună ziua iubitorilor de câini! – Astăzi, vom descoperi cinci fapte fascinante și mai puțin cunoscute despre cel mai bun prieten al omului – câinii! – Așa că, ia un răsfăț, stai pe spate și hai să ne scufundăm!
Iată rezultatele:
Pasul 4: Clonarea vocii
O altă caracteristică interesantă a PlayHT este capacitatea de a vă crea propriile voci AI. Funcționează prin încărcarea unui clip de 30 de secunde, apoi transformându-l într-o voce AI utilizabilă pentru proiectele dvs. Pentru a începe, faceți clic pe fila Clonarea vocii din interfața PlayHT.
Apoi, faceți clic pe butonul Creați o nouă clonă .
Deoarece folosim licența gratuită, singura noastră opțiune este să alegem opțiunea instant , care creează o voce AI dintr-un clip audio de 30 de secunde.
Apoi, dați-vă vocii un nume (1), alegeți un gen (2), încărcați un fișier audio (3), confirmați că aveți drepturile de utilizare a clipului (4) și faceți clic pe Creare (5).
Odată ce clona este creată, aceasta va apărea sub butonul Creați o nouă clonă (1). De acolo, îl puteți folosi (2), îl puteți partaja (3) sau îl puteți șterge (4).
Pentru a vedea cum sună, adăugați o solicitare text pentru a o previzualiza. Sincer să fiu, am fost destul de impresionați de rezultate:
Pasul 5: Exportarea unui proiect
Ultimul pas în procesul de creare este exportul fișierelor de sunet. Puteți face acest lucru în două moduri: exportând câte un paragraf sau toate paragrafele într-un singur fișier. Pentru majoritatea creatorilor, este logic să exportați fișierele separat. În acest fel, puteți adăuga scene tăiate și alte efecte între fiecare. Pentru a exporta fișierele, faceți clic pe butonul de export din partea stângă sus a ecranului.
Va apărea un meniu derulant cu două opțiuni: fiecare paragraf separat și ca un singur fișier audio .
Toate fișierele sunt exportate ca fișiere audio wav, care pot fi importate folosind orice software audio.
Cele mai bune practici pentru generatoarele de voce AI
Este important să înțelegeți câteva dintre cele mai bune practici atunci când creați clipuri pentru a profita la maximum de generatoarele de voce AI. Mai întâi, separați propozițiile adăugând o liniuță (-). Acest lucru îi permite algoritmului să știe că ar trebui să existe o pauză și, de obicei, va elimina propozițiile care se execută. În mod similar, virgulele și punctul și virgulă pot adăuga o pauză naturală între cuvinte. Pe de altă parte, evitați cratimele între cuvintele dintr-o propoziție. De exemplu, ați folosi fără ieșire la mare , mai degrabă decât fără ieșire la mare .
De asemenea, ar trebui să adăugați spații între acronime pentru a ajuta AI să înțeleagă că ar trebui să existe litere individuale rostite, mai degrabă decât cuvinte. De exemplu, în loc să utilizați AI , folosiți AI . De asemenea, puteți adăuga un punct între litere în acronime. Pentru a evita repetarea cuvintelor, reformulați textul pentru a include semne de punctuație, cum ar fi virgulă, punct și virgulă sau cratime. O altă modalitate de a remedia repetarea este de a împărți propozițiile în altele mai mici. Acest lucru împiedică AI să devină confuză, care de obicei se termină cu rezultate nedorite.
Gânduri finale despre crearea unei voci AI
Generatoarele de voce AI schimbă modul în care creatorii realizează audio. Prin intermediul software-ului de inteligență artificială precum PlayHT, puteți crea voci pentru podcasturi, videoclipuri YouTube, videoclipuri de marketing, materiale de instruire și multe altele. Pe măsură ce tehnologia AI avansează, viitorul generării vocii are un potențial extraordinar, deschizând ușile către experiențe mai imersive.
Pentru cei interesați să exploreze alte aplicații AI, blogul nostru are o mulțime de postări care vă vor ajuta să deveniți un superstar AI în cel mai scurt timp.
- Cum să faci artă AI în 2023 (tutorial detaliat)
- 31 de moduri în care poți folosi AI astăzi (Ghid 2023)
- Cum să utilizați Photoshop AI Generative Fill în 2023 (tutorial detaliat)
- Cum să utilizați Midjourney pentru a crea artă AI în 2023 (tutorial detaliat)
Imagine prezentată prin Pro_Vector / Shutterstock.com