Cara Membuat Suara AI di Tahun 2023 (Tutorial)
Diterbitkan: 2023-09-08Sejak ChatGPT diluncurkan pada akhir tahun 2022, program AI generatif (kecerdasan buatan) baru telah bermunculan di mana-mana. Salah satu jenis kecerdasan buatan yang lebih unik adalah suara AI, yang memungkinkan Anda menggunakan perintah teks untuk membuat klip suara untuk pemasaran, pelatihan karyawan, dan banyak lagi. Dalam postingan kali ini, kami akan menunjukkan cara membuat suara AI menggunakan program populer, PlayHT. Mari selami.
- 1 Apa itu AI?
- 2 Apa itu AI Voice Generation?
- 2.1 Bagaimana Cara Kerja Generator Suara AI?
- 3 Cara Membuat Suara AI
- 3.1 Langkah 1: Membuat Akun
- 3.2 Langkah 2: Menjelajahi Antarmuka
- 3.3 Langkah 3: Menghasilkan Suara AI Pertama Anda
- 3.4 Langkah 4: Kloning Suara
- 3.5 Langkah 5: Mengekspor Proyek
- 4 Praktik Terbaik untuk AI Voice Generator
- 5 Pemikiran Terakhir tentang Menciptakan Suara AI
Apa itu AI?
Kecerdasan buatan adalah teknologi luas yang memungkinkan komputer melakukan tugas-tugas ekstensif yang biasanya dilakukan manusia. Namun, tugas-tugas tersebut memakan waktu lebih sedikit dengan sistem AI. Ada beberapa jenis AI, yang paling umum adalah AI sempit. Jenis AI ini digunakan untuk membuat gambar, suara, musik, dan teks dari perintah teks sederhana.
Apa itu AI Voice Generation?
Suara AI adalah suara yang dihasilkan komputer yang meniru suara, fitur, dan nada suara manusia. Mereka memulainya dengan teks atau dengan merekam suara Anda sendiri untuk menciptakan suara unik yang terdengar seperti manusia. Melalui kekuatan teknologi text-to-speech AI, pembuat konten dapat mengembangkan suara untuk podcast, sulih suara, atau berfungsi sebagai alat bantu bagi tunanetra.
Bagaimana Cara Kerja Generator Suara AI?
Generator suara AI memerlukan praprosesor teks, transkripsi fonetik, dan sintesis suara agar dapat berfungsi. Langkah pertama, pemrosesan awal teks, mengambil teks mentah dan membuat semuanya rapi dan terorganisir. Ini memecah kata-kata menjadi bagian-bagian kecil yang disebut token, memperbaiki artefak aneh seperti kontraksi atau karakter khusus, dan mengubah angka menjadi kata-kata sebenarnya.
Kemudian, pada langkah kedua, token tersebut dianalisis dan diberi tag seperti kata kerja, kata benda, atau kata sifat. Ini membantu sistem memahami bagaimana setiap kata harus digunakan dan apa artinya dalam konteksnya.
Sekarang, di sinilah keajaiban terjadi. Teks tersebut melalui analisis fonetik, yang berarti diubah menjadi jenis tulisan khusus yang menangkap bagaimana seharusnya kata-kata dibunyikan saat diucapkan. Ini mencakup tekanan, nada, dan ritme untuk membuat ucapan terdengar alami.
Akhirnya, pada langkah terakhir, semua kerja keras itu membuahkan hasil. Transkripsi fonetik diubah menjadi ucapan nyata menggunakan gelombang suara. Berkat algoritme AI modern, ucapan yang dihasilkan saat ini terdengar jauh lebih alami dan mirip manusia dibandingkan mesin text-to-speech di masa lalu.
Cara Membuat Suara AI
Generator suara telah berkembang pesat sejak IBM merilis Shoebox pada tahun 1962. Sistem modern, seperti PlayHT, memiliki beragam suara sintetis dengan nada yang bervariasi, sehingga memungkinkan terciptanya suara yang paling realistis. Alat lain, seperti MurfAI, memungkinkan Anda menyesuaikan nada, nada, dan kecepatan. Dalam tutorial ini, kita akan menggunakan PlayHT untuk membuat suara AI.
Langkah 1: Membuat Akun
Langkah pertama dalam proses ini adalah membuat akun PlayHT gratis. Mulailah dengan menavigasi ke halaman beranda, lalu klik tombol coba gratis di kanan atas layar.
Anda dapat mendaftar menggunakan akun Google atau memasukkan nama dan email Anda. Gunakan metode pilihan Anda, lalu klik daftar untuk melanjutkan.
Pada langkah berikutnya, pilih apakah Anda berencana menggunakan PlayHT sebagai individu atau perusahaan.
PlayHT akan menanyakan pertanyaan tentang bagaimana Anda akan menggunakan perangkat lunak di beberapa layar berikutnya.
Setelah pilihan Anda dibuat, dan akun Anda dibuat, Anda dapat mulai menjelajahi antarmuka.
Langkah 2: Menjelajahi Antarmuka
Mari kita kenali antarmukanya sebelum kita membuat suara pertama kita:
- Buat file baru: Di sinilah Anda akan membuat proyek pertama Anda.
- File terbaru: Daftar proyek terbaru Anda.
- File: Tempat semua file Anda berada.
- Kloning suara: Anda dapat mengunggah audio suatu suara, lalu mengkloningnya untuk digunakan dalam perangkat lunak.
- Akses API: Untuk mengintegrasikan PlayHT ke aplikasi lain
- Penagihan: Kelola akun Anda.
- Pemilih bahasa: Bahasa Inggris adalah satu-satunya pilihan saat ini, tetapi bahasa lain sedang dalam pengerjaan.
- Jumlah kata: Memungkinkan Anda melihat berapa banyak kata tersisa yang tersedia.
- Hasilkan semua paragraf: Digunakan untuk menghasilkan suara AI.
- Impor video: Tambahkan sulih suara ke video yang diunggah.
- Perintah teks: Input teks untuk pembuatan suara AI.
- Kontrol audio: Sesuaikan garis waktu suara Anda, dan atur ulang klip.
- Ekspor proyek: Simpan proyek Anda per paragraf atau sebagai satu file wav.
Langkah 3: Menghasilkan Suara AI Pertama Anda
Menghasilkan suara AI dengan PlayHT itu sederhana. Anda dapat membuat skrip Anda sendiri atau menggunakan chatbot AI untuk membantu Anda. Dalam tutorial ini, kita akan menggunakan ChatGPT untuk menghasilkan teks untuk suara kita. Mulailah dengan mengklik tombol buat file baru untuk membuat proyek baru untuk suara kita.
Selanjutnya, kita akan memilih suara sintetis untuk proyek tersebut. Untuk melakukan ini, klik ikon suara tepat di atas prompt teks.
Jendela popup baru akan muncul, memungkinkan Anda mengambil sampel salah satu dari lebih dari 130 suara AI. Untuk memilih salah satu, cukup klik (1), pilih kecepatan pemutaran (2), pilih untuk menerapkan suara ke semua paragraf dalam proyek Anda (3), lalu konfirmasi perubahan (4).
Kami akan memilih Hudson karena dia terdengar paling realistis dan memiliki suara naratif yang bagus untuk naskah kami.
Gunakan ChatGPT untuk Menghasilkan Skrip Video
Sekarang setelah suara kita dipilih, kita perlu membuat beberapa teks. Kami akan meminta ChatGPT untuk membuat skrip video pendek yang memberikan fakta menarik tentang anjing. Kami menggunakan perintah berikut: Berikan skrip video singkat untuk menampilkan 5 fakta yang tidak diketahui tentang anjing .
Setelah skrip dibuat, kita perlu memasukkan beberapa teks untuk proyek kita. Kami akan mulai dengan menempelkan intro skrip kami ke PlayHT: Halo, pecinta anjing! Hari ini, kita akan mengungkap lima fakta menarik dan kurang diketahui tentang sahabat manusia, anjing! Jadi, ambil camilannya, duduk santai, dan mari selami!
Untuk menghasilkan suara, klik ikon putar di sebelah kiri prompt teks.
PlayHT akan menghasilkan teks menggunakan suara Hudson. Tergantung pada jumlah teks yang Anda gunakan, proses pembuatannya bisa memakan waktu hingga beberapa menit. Setelah selesai, Anda dapat melihat pratinjau suaranya dengan mengeklik tombol putar (1) di sebelah kanan layar. Jika Anda tidak puas dengan hasilnya, Anda dapat mengklik tombol buat ulang (2) untuk mencoba lagi.
Begini bunyi paragraf pertama:
Meskipun kedengarannya cukup bagus, perlu sedikit penyesuaian. Jeda pada suaranya terdengar kurang tepat, jadi kami akan melakukan beberapa penyesuaian.
Meregenerasi Keluaran
PlayHT memungkinkan Anda membuat perubahan pada input teks, lalu membuatnya kembali. Ini berguna ketika hasilnya tidak memenuhi standar Anda. Tip yang bagus adalah menambahkan tanda hubung di antara kalimat untuk menciptakan jeda yang alami. Dengan generator suara AI, ada kecenderungan teks dibuat terburu-buru, sehingga menghasilkan kalimat yang tidak wajar. Jadi, untuk memperbaikinya, kami akan mengubah perintah awal kami menjadi: Halo pecinta anjing! – Hari ini, kita akan mengungkap lima fakta menarik dan kurang diketahui tentang sahabat manusia – anjing! – Jadi, ambil hadiahnya, duduk santai, dan mari selami!
Berikut hasilnya:
Langkah 4: Kloning Suara
Fitur keren lainnya dari PlayHT adalah kemampuan untuk membuat suara AI Anda sendiri. Ia bekerja dengan mengunggah klip berdurasi 30 detik, lalu mengubahnya menjadi suara AI yang dapat digunakan untuk proyek Anda. Untuk memulai, klik tab kloning suara di antarmuka PlayHT.
Selanjutnya, klik tombol buat klon baru .
Karena kami menggunakan lisensi gratis, satu-satunya pilihan kami adalah memilih opsi instan , yang menghasilkan suara AI dari klip suara berdurasi 30 detik.
Selanjutnya, beri nama suara Anda (1), pilih jenis kelamin (2), unggah file audio (3), konfirmasikan bahwa Anda memiliki hak untuk menggunakan klip tersebut (4), dan klik buat (5).
Setelah klon dibuat, akan muncul di bawah tombol buat klon baru (1). Dari sana, Anda dapat menggunakannya (2), membagikannya (3), atau menghapusnya (4).
Untuk melihat bunyinya, tambahkan perintah teks untuk mempratinjaunya. Sejujurnya, kami cukup terkesan dengan hasilnya:
Langkah 5: Mengekspor Proyek
Langkah terakhir dalam proses pembuatan adalah mengekspor file suara Anda. Anda dapat melakukan ini dengan salah satu dari dua cara: mengekspor satu paragraf dalam satu waktu atau semua paragraf dalam satu file. Bagi sebagian besar pembuat konten, masuk akal untuk mengekspor file secara terpisah. Dengan begitu, Anda dapat menambahkan potongan adegan dan efek lainnya di antara masing-masing adegan. Untuk mengekspor file Anda, klik tombol ekspor di kiri atas layar.
Menu tarik-turun akan muncul dengan dua opsi: setiap paragraf secara terpisah dan sebagai satu file audio .
Semua file diekspor sebagai file audio wav, yang dapat diimpor menggunakan perangkat lunak audio apa pun.
Praktik Terbaik untuk Generator Suara AI
Memahami beberapa praktik terbaik saat membuat klip untuk mendapatkan hasil maksimal dari generator suara AI adalah hal yang penting. Pertama, pisahkan kalimat dengan menambahkan tanda hubung (-). Hal ini membuat algoritme mengetahui bahwa harus ada jeda dan biasanya akan menghilangkan kalimat-kalimat yang berjalan terus-menerus. Demikian pula, koma dan titik koma dapat menambahkan jeda alami di antara kata-kata. Sebaliknya, hindari tanda hubung di antara kata-kata dalam sebuah kalimat. Misalnya, Anda akan menggunakan landlocked daripada landlocked .
Anda juga harus menambahkan spasi di antara akronim untuk membantu AI memahami bahwa harus ada huruf yang diucapkan secara individual, bukan kata-kata. Misalnya, daripada menggunakan AI , gunakanlah AI . Anda juga dapat menambahkan titik antar huruf dalam akronim. Untuk menghindari pengulangan kata, susun ulang teks Anda untuk menyertakan tanda baca, seperti koma, titik koma, atau tanda hubung. Cara lain untuk mengatasi pengulangan adalah dengan memecah kalimat menjadi lebih kecil. Hal ini mencegah AI menjadi bingung, yang biasanya berakhir dengan hasil yang tidak diinginkan.
Pemikiran Terakhir tentang Menciptakan Suara AI
Generator suara AI mengubah cara pembuat konten membuat audio. Melalui perangkat lunak kecerdasan buatan seperti PlayHT, Anda dapat membuat suara untuk podcast, video YouTube, video pemasaran, materi pelatihan, dan banyak lagi. Seiring kemajuan teknologi AI, masa depan generasi suara memiliki potensi yang luar biasa, membuka pintu menuju pengalaman yang lebih mendalam.
Bagi mereka yang tertarik menjelajahi aplikasi AI lainnya, blog kami memiliki banyak postingan untuk membantu Anda menjadi superstar AI dalam waktu singkat.
- Cara Membuat AI Art pada tahun 2023 (Tutorial Lengkap)
- 31 Cara Anda Dapat Menggunakan AI Saat Ini (Panduan 2023)
- Cara Menggunakan Photoshop AI Generative Fill pada tahun 2023 (Tutorial Lengkap)
- Cara Menggunakan Midjourney untuk Membuat AI Art pada tahun 2023 (Tutorial Lengkap)
Gambar Unggulan melalui Pro_Vector / Shutterstock.com