Comment créer une voix IA en 2023 (Tutoriel)

Publié: 2023-09-08

Depuis que ChatGPT est entré en scène fin 2022, de nouveaux programmes d’IA générative (intelligence artificielle) sont apparus partout. L'un des types d'intelligence artificielle les plus uniques est la voix IA, qui vous permet d'utiliser des invites textuelles pour créer des clips vocaux à des fins de marketing, de formation des employés, etc. Dans cet article, nous allons vous montrer comment créer une voix IA à l'aide d'un programme populaire, PlayHT. Allons-y.

Table des matières
  • 1 Qu'est-ce que l'IA ?
  • 2 Qu'est-ce que la génération vocale AI ?
    • 2.1 Comment fonctionnent les générateurs de voix IA ?
  • 3 Comment créer une voix IA
    • 3.1 Étape 1 : Création d'un compte
    • 3.2 Étape 2 : Explorer l'interface
    • 3.3 Étape 3 : Générer votre première voix IA
    • 3.4 Étape 4 : Clonage vocal
    • 3.5 Étape 5 : Exporter un projet
  • 4 bonnes pratiques pour les générateurs de voix IA
  • 5 dernières réflexions sur la création d'une voix IA

Qu’est-ce que l’IA ?

qu'est-ce que l'IA

image créée avec Midjourney

L’intelligence artificielle est une technologie étendue qui permet aux ordinateurs d’effectuer des tâches étendues que les humains effectueraient normalement. Cependant, ces tâches prennent une fraction du temps nécessaire avec les systèmes d’IA. Il existe plusieurs types d’IA, la plus courante étant l’IA étroite. Ce type d'IA est utilisé pour créer des images, de la voix, de la musique et du texte à partir d'une simple invite de texte.

Qu’est-ce que la génération vocale AI ?

Générateur de voix IA

image créée avec Midjourney | Photoshop IA

Les voix de l'IA sont des voix générées par ordinateur qui imitent les sons, les caractéristiques et les tonalités des voix humaines. Ils commencent soit sous forme de texte, soit par enregistrement de votre propre voix pour créer une voix unique à consonance humaine. Grâce à la puissance de la technologie de synthèse vocale de l'IA, les créateurs peuvent développer des voix pour des podcasts, des voix off ou servir d'outils d'assistance aux malvoyants.

Comment fonctionnent les générateurs de voix IA ?

comment fonctionnent les générateurs de voix

image créée avec Leonardo | Photoshop IA

Les générateurs de voix IA nécessitent un préprocesseur de texte, une transcription phonétique et une synthèse vocale pour fonctionner. La première étape, le prétraitement du texte, prend le texte brut et le rend propre et organisé. Il décompose les mots en parties plus petites appelées jetons, corrige des artefacts étranges comme des contractions ou des caractères spéciaux et transforme les nombres en mots réels.

Ensuite, dans un deuxième temps, ces jetons sont analysés et attribués à des balises telles que des verbes, des noms ou des adjectifs. Cela aide le système à comprendre comment chaque mot doit être utilisé et ce qu'il signifie dans le contexte.

Maintenant, c'est ici que la magie opère. Le texte passe par une analyse phonétique, ce qui signifie qu'il est converti en un type d'écriture spécial qui capture la façon dont les mots devraient sonner lorsqu'ils sont prononcés. Cela inclut l’accent, le ton et le rythme pour rendre le discours naturel.

Finalement, dans la dernière étape, tout ce travail acharné porte ses fruits. Les transcriptions phonétiques sont transformées en parole réelle à l’aide d’ondes sonores. Grâce aux algorithmes d’IA modernes, la parole générée aujourd’hui semble bien plus naturelle et humaine que les moteurs de synthèse vocale du passé.

Comment créer une voix IA

Jouer.HT AI voix

Les générateurs de voix ont parcouru un long chemin depuis qu'IBM a lancé Shoebox en 1962. Les systèmes modernes, tels que PlayHT, disposent d'une variété de voix synthétiques avec des tonalités variées, permettant de créer les voix les plus réalistes. D'autres outils, tels que MurfAI, vous permettront d'ajuster la hauteur, la tonalité et la vitesse. Dans ce didacticiel, nous utiliserons PlayHT pour créer une voix IA.

Étape 1 : Création d'un compte

La première étape du processus consiste à créer un compte PlayHT gratuit. Commencez par accéder à la page d’accueil, puis cliquez sur le bouton Essayer gratuitement en haut à droite de l’écran.

créer un compte

Vous pouvez vous inscrire en utilisant un compte Google ou saisir votre nom et votre adresse e-mail. Utilisez la méthode que vous avez choisie, puis cliquez sur S'inscrire pour continuer.

inscrivez-vous Play.HT

À l'étape suivante, choisissez si vous envisagez d'utiliser PlayHT en tant que particulier ou en entreprise.

étapes de configuration

PlayHT vous posera des questions sur la façon dont vous utiliserez le logiciel dans les prochains écrans.

configurer la voix PlayHT AI

Une fois vos sélections effectuées et votre compte créé, vous pouvez commencer à explorer l'interface.

Étape 2 : Explorer l'interface

Familiarisons-nous avec l'interface avant de générer notre première voix :

  1. Créer un nouveau fichier : c'est ici que vous créerez votre premier projet.
  2. Fichiers récents : une liste de vos projets les plus récents.
  3. Fichiers : emplacement où se trouvent tous vos fichiers.
  4. Clonage vocal : vous pouvez télécharger l'audio d'une voix, puis le cloner pour l'utiliser dans le logiciel.
  5. Accès API : pour intégrer PlayHT dans d'autres applications
  6. Facturation : gérez votre compte.
  7. Sélecteur de langue : l'anglais est la seule option pour le moment, mais d'autres langues sont en préparation.
  8. Nombre de mots : vous permet de voir combien de mots restants sont disponibles.
  9. Générer tous les paragraphes : utilisé pour générer une voix IA.
  10. Importer une vidéo : ajoutez des voix off à une vidéo téléchargée.
  11. Invite de texte : saisie de texte pour la génération vocale AI.
  12. Commandes audio : ajustez la chronologie de votre voix et réorganisez les clips.
  13. Exporter le projet : enregistrez votre projet par paragraphe ou sous forme de fichier wav.

Interface PlayHT

Étape 3 : générer votre première voix IA

Générer une voix IA avec PlayHT est simple. Vous pouvez créer votre propre script ou utiliser un chatbot IA pour vous aider. Dans ce didacticiel, nous utiliserons ChatGPT pour générer le texte de notre voix. Commencez par cliquer sur le bouton Créer un nouveau fichier pour créer un nouveau projet pour notre voix.

créer un nouveau fichier

Ensuite, nous choisirons une voix synthétique pour le projet. Pour ce faire, cliquez sur l' icône vocale directement au-dessus de l'invite de texte.

sélectionnez la voix AI

Une nouvelle fenêtre contextuelle apparaîtra, vous permettant d'échantillonner l'une des plus de 130 voix d'IA. Pour en choisir un, cliquez simplement dessus (1), sélectionnez la vitesse de lecture (2), choisissez d'appliquer la voix à tous les paragraphes de votre projet (3), puis confirmez les modifications (4).

changer la voix de l'IA

Nous choisirons Hudson parce qu'il semble le plus réaliste et qu'il a une bonne voix narrative pour notre scénario.

Utilisez ChatGPT pour générer un script vidéo

Maintenant que notre voix est sélectionnée, nous devrons générer du texte. Nous demanderons à ChatGPT de créer un court script vidéo fournissant des faits intéressants sur les chiens. Nous avons utilisé l'invite suivante : Fournissez un bref script vidéo pour présenter 5 faits inconnus sur les chiens .

Script vidéo ChatGPT

Une fois le script généré, nous devrons saisir du texte pour notre projet. Nous allons commencer par coller l'intro de notre script dans PlayHT : Bonjour, amoureux des chiens ! Aujourd'hui, nous allons découvrir cinq faits fascinants et moins connus sur le meilleur ami de l'homme, le chien ! Alors, prenez une friandise, asseyez-vous et plongeons-nous !

premier paragraphe vocal de l'IA

Pour générer la voix, cliquez sur l' icône de lecture à gauche de l'invite de texte.

générer une voix IA

PlayHT générera le texte en utilisant la voix d'Hudson. Selon la quantité de texte que vous utilisez, le processus de génération peut prendre jusqu'à quelques minutes. Une fois terminé, vous pourrez prévisualiser la voix en cliquant sur le bouton de lecture (1) à droite de l'écran. Si vous n'êtes pas satisfait du résultat, vous pouvez cliquer sur le bouton Régénérer (2) pour réessayer.

régénérer la sortie

Voici à quoi ressemble le premier paragraphe :

Bien que cela semble plutôt bien, cela pourrait nécessiter un peu d’ajustement. Les cassures dans la voix ne semblent pas tout à fait correctes, nous allons donc procéder à quelques ajustements.

Sortie régénératrice

PlayHT vous permet d'apporter des modifications à la saisie de texte, puis de la régénérer. Ceci est utile lorsque le résultat n’est pas conforme à vos normes. Un bon conseil est d’ajouter des tirets entre les phrases pour créer une pause naturelle. Avec les générateurs de voix IA, il existe une tendance à précipiter le texte, créant ainsi des phrases répétées peu naturelles. Donc, pour corriger cela, nous allons modifier notre invite d'origine comme suit : Bonjour les amoureux des chiens ! – Aujourd'hui, nous allons découvrir cinq faits fascinants et moins connus sur le meilleur ami de l'homme : le chien ! – Alors, prenez une friandise, asseyez-vous et plongeons-nous !

Voici les résultats:

Étape 4 : Clonage vocal

Une autre fonctionnalité intéressante de PlayHT est la possibilité de créer vos propres voix IA. Il fonctionne en téléchargeant un clip de 30 secondes, puis en le transformant en une voix IA utilisable pour vos projets. Pour commencer, cliquez sur l'onglet de clonage vocal dans l'interface PlayHT.

Clonage vocal de l'IA

Ensuite, cliquez sur le bouton Créer un nouveau clone .

créer un nouveau clone

Puisque nous utilisons la licence gratuite, notre seule option est de choisir l' option instantanée , qui crée une voix IA à partir d'un extrait sonore de 30 secondes.

clonage instantané

Ensuite, donnez un nom à votre voix (1), choisissez un sexe (2), téléchargez un fichier audio (3), confirmez que vous avez les droits d'utilisation du clip (4) et cliquez sur créer (5).

Paramètres de clonage vocal IA

Une fois le clone créé, il apparaîtra sous le bouton Créer un nouveau clone (1). À partir de là, vous pouvez l'utiliser (2), le partager (3) ou le supprimer (4).

en utilisant le clone vocal AI

Pour voir à quoi cela ressemble, ajoutez une invite de texte pour en avoir un aperçu. Pour être honnête, nous avons été assez impressionnés par les résultats :

Étape 5 : Exporter un projet

La dernière étape du processus de création consiste à exporter vos fichiers audio. Vous pouvez procéder de deux manières : exporter un paragraphe à la fois ou tous les paragraphes dans un seul fichier. Pour la plupart des créateurs, il est logique d’exporter les fichiers séparément. De cette façon, vous pouvez ajouter des scènes coupées et d’autres effets entre chacune d’elles. Pour exporter vos fichiers, cliquez sur le bouton Exporter en haut à gauche de l'écran.

exporter la voix de l'IA

Un menu déroulant apparaîtra avec deux options : chaque paragraphe séparément et sous forme de fichier audio unique .

exporter des fichiers

Tous les fichiers sont exportés sous forme de fichiers audio wav, qui peuvent être importés à l'aide de n'importe quel logiciel audio.

Meilleures pratiques pour les générateurs de voix IA

Il est important de comprendre quelques bonnes pratiques lors de la création de clips pour tirer le meilleur parti des générateurs de voix IA. Tout d’abord, séparez les phrases en ajoutant un tiret (-). Cela permet à l'algorithme de savoir qu'il devrait y avoir une pause et éliminera généralement les phrases répétées. De même, les virgules et les points-virgules peuvent ajouter une pause naturelle entre les mots. En revanche, évitez les traits d’union entre les mots d’une phrase. Par exemple, vous utiliseriez landlocked plutôt que land-locked .

Vous devez également ajouter des espaces entre les acronymes pour aider l'IA à comprendre qu'il doit y avoir des lettres parlées individuelles plutôt que des mots. Par exemple, au lieu d'utiliser AI , utilisez AI . Vous pouvez également ajouter un point entre les lettres des acronymes. Pour éviter la répétition des mots, reformulez votre texte pour inclure des signes de ponctuation, tels que des virgules, des points-virgules ou des traits d'union. Une autre façon de remédier à la répétition consiste à diviser les phrases en phrases plus petites. Cela évite que l'IA ne soit confuse, ce qui aboutit généralement à des résultats indésirables.

Réflexions finales sur la création d'une voix IA

Les générateurs de voix IA changent la façon dont les créateurs créent de l'audio. Grâce à un logiciel d'intelligence artificielle comme PlayHT, vous pouvez créer des voix pour des podcasts, des vidéos YouTube, des vidéos marketing, du matériel de formation, etc. À mesure que la technologie de l’IA progresse, l’avenir de la génération vocale recèle un énorme potentiel, ouvrant la porte à des expériences plus immersives.

Pour ceux qui souhaitent explorer d’autres applications d’IA, notre blog propose de nombreux articles pour vous aider à devenir une superstar de l’IA en un rien de temps.

  • Comment créer de l'art IA en 2023 (tutoriel détaillé)
  • 31 façons d'utiliser l'IA aujourd'hui (Guide 2023)
  • Comment utiliser Photoshop AI Generative Fill en 2023 (Tutoriel détaillé)
  • Comment utiliser Midjourney pour créer de l'art IA en 2023 (tutoriel détaillé)

Image en vedette via Pro_Vector / Shutterstock.com