2023년에 AI 음성을 만드는 방법(튜토리얼)
게시 됨: 2023-09-08ChatGPT가 2022년 말에 등장한 이후 새로운 생성 AI(인공지능) 프로그램이 곳곳에서 등장하고 있습니다. 인공 지능의 가장 독특한 유형 중 하나는 AI 음성입니다. 이를 통해 텍스트 프롬프트를 사용하여 마케팅, 직원 교육 등을 위한 음성 클립을 만들 수 있습니다. 이번 포스팅에서는 인기 프로그램인 PlayHT를 사용하여 AI 음성을 만드는 방법을 보여드리겠습니다. 뛰어 들어 봅시다.
- 1 AI란 무엇인가?
- 2 AI 음성 생성이란 무엇입니까?
- 2.1 AI 음성 생성기는 어떻게 작동하나요?
- 3 AI 목소리 만드는 방법
- 3.1 1단계: 계정 생성
- 3.2 2단계: 인터페이스 탐색
- 3.3 3단계: 첫 번째 AI 음성 생성
- 3.4 4단계: 음성 복제
- 3.5 5단계: 프로젝트 내보내기
- AI 음성 생성기의 4가지 모범 사례
- AI 음성 생성에 대한 5가지 최종 생각
AI란 무엇인가?
인공지능은 인간이 일반적으로 수행하는 광범위한 작업을 컴퓨터가 수행할 수 있도록 하는 광범위한 기술입니다. 그러나 AI 시스템을 사용하면 이러한 작업에 시간이 훨씬 적게 걸립니다. AI에는 여러 유형이 있으며, 가장 일반적인 것은 좁은 AI입니다. 이러한 유형의 AI는 간단한 텍스트 프롬프트에서 이미지, 음성, 음악 및 텍스트를 생성하는 데 사용됩니다.
AI 음성 생성이란 무엇입니까?
AI 음성은 인간 목소리의 소리, 특징, 톤을 모방하여 컴퓨터에서 생성된 음성입니다. 텍스트로 시작하거나 자신의 목소리를 녹음하여 독특한 사람 소리를 만들어냅니다. AI의 텍스트 음성 변환 기술을 통해 제작자는 팟캐스트, 음성 해설을 위한 음성을 개발하거나 시각 장애인을 위한 보조 도구로 사용할 수 있습니다.
AI 음성 생성기는 어떻게 작동하나요?
AI 음성 생성기가 작동하려면 텍스트 전처리기, 음성 표기 및 음성 합성이 필요합니다. 첫 번째 단계인 텍스트 전처리는 원시 텍스트를 가져와서 모두 깔끔하고 체계적으로 만듭니다. 단어를 토큰이라는 작은 부분으로 나누고, 약어나 특수 문자와 같은 이상한 인공물을 수정하고, 숫자를 실제 단어로 바꿉니다.
그런 다음 두 번째 단계에서는 해당 토큰을 분석하고 동사, 명사, 형용사와 같은 태그를 지정합니다. 이는 시스템이 각 단어가 어떻게 사용되어야 하는지, 그리고 그것이 문맥에서 무엇을 의미하는지 이해하는 데 도움이 됩니다.
이제 마법이 일어나는 곳이 바로 여기입니다. 텍스트는 음성 분석을 거칩니다. 즉, 말했을 때 단어가 어떻게 발음되어야 하는지를 포착하는 특별한 종류의 글로 변환됩니다. 여기에는 말소리를 자연스럽게 만드는 강세, 어조, 리듬이 포함됩니다.
마지막으로, 마지막 단계에서 그 모든 노력이 결실을 맺습니다. 음성 표기는 음파를 사용하여 실제 음성으로 변환됩니다. 최신 AI 알고리즘 덕분에 오늘날 생성되는 음성은 과거의 텍스트 음성 변환 엔진보다 훨씬 더 자연스럽고 인간처럼 들립니다.
AI 음성을 만드는 방법
음성 생성기는 IBM이 1962년에 Shoebox를 출시한 이후 많은 발전을 이루었습니다. PlayHT와 같은 최신 시스템에는 다양한 톤의 다양한 합성 음성이 있어 가장 사실적인 음성을 생성할 수 있습니다. MurfAI와 같은 다른 도구를 사용하면 피치, 톤 및 속도를 조정할 수 있습니다. 이 튜토리얼에서는 PlayHT를 사용하여 AI 음성을 생성해 보겠습니다.
1단계: 계정 만들기
프로세스의 첫 번째 단계는 무료 PlayHT 계정을 만드는 것입니다. 먼저 홈 페이지로 이동한 다음 화면 오른쪽 상단에 있는 무료 체험 버튼을 클릭하세요.
구글 계정으로 가입하시거나, 이름과 이메일을 입력하시면 됩니다. 선택한 방법을 사용한 다음 가입을 클릭하여 계속하세요.
다음 단계에서는 PlayHT를 개인으로 사용할지 아니면 회사 환경에서 사용할지 선택하세요.
PlayHT는 다음 몇 화면에서 소프트웨어를 어떻게 사용할 것인지에 대한 질문을 할 것입니다.
선택이 완료되고 계정이 생성되면 인터페이스 탐색을 시작할 수 있습니다.
2단계: 인터페이스 탐색
첫 번째 음성을 생성하기 전에 인터페이스에 익숙해지도록 하겠습니다.
- 새 파일 만들기: 첫 번째 프로젝트를 만드는 곳입니다.
- 최근 파일: 가장 최근 프로젝트 목록입니다.
- 파일: 모든 파일이 있는 곳입니다.
- 음성 복제: 음성 오디오를 업로드한 다음 소프트웨어에서 사용하기 위해 복제할 수 있습니다.
- API 액세스: PlayHT를 다른 애플리케이션에 통합하기 위해
- 청구: 계정을 관리하세요.
- 언어 선택기: 현재 영어가 유일한 옵션이지만 다른 언어도 개발 중입니다.
- 단어 수: 사용 가능한 남은 단어 수를 확인할 수 있습니다.
- 모든 문단 생성 : AI 음성을 생성하는데 사용됩니다.
- 비디오 가져오기: 업로드된 비디오에 음성 해설을 추가합니다.
- 텍스트 프롬프트: AI 음성 생성을 위한 텍스트 입력입니다.
- 오디오 컨트롤: 음성의 타임라인을 조정하고 클립을 재정렬합니다.
- 프로젝트 내보내기: 프로젝트를 단락별로 또는 하나의 wav 파일로 저장합니다.
3단계: 첫 번째 AI 음성 생성
PlayHT로 AI 음성을 생성하는 것은 간단합니다. 자신만의 스크립트를 만들거나 AI 챗봇을 사용하여 도움을 받을 수 있습니다. 이 튜토리얼에서는 ChatGPT를 사용하여 음성 텍스트를 생성합니다. 새 파일 만들기 버튼을 클릭하여 목소리에 대한 새 프로젝트를 만듭니다.
다음으로 프로젝트에 대한 합성 음성을 선택하겠습니다. 이렇게 하려면 텍스트 프롬프트 바로 위에 있는 음성 아이콘을 클릭하세요.
130개 이상의 AI 음성 중 하나를 샘플링할 수 있는 새로운 팝업 창이 나타납니다. 하나를 선택하려면 해당 항목을 클릭하고(1) 재생 속도를 선택한 다음(2) 프로젝트의 모든 단락에 음성을 적용하도록 선택한 다음(3) 변경 사항을 확인합니다(4).
우리는 허드슨을 선택할 것입니다. 그가 가장 현실적으로 들리고 우리 대본에 대한 좋은 내러티브 목소리를 가지고 있기 때문입니다.
ChatGPT를 사용하여 비디오 스크립트 생성
이제 음성을 선택했으므로 텍스트를 생성해야 합니다. ChatGPT에 개에 대한 흥미로운 사실을 제공하는 짧은 비디오 스크립트를 만들어달라고 요청할 것입니다. 우리는 다음 프롬프트를 사용했습니다. 개에 관해 알려지지 않은 5가지 사실을 보여주는 간단한 비디오 스크립트를 제공하십시오 .
스크립트가 생성되면 프로젝트에 대한 일부 텍스트를 입력해야 합니다. 스크립트의 소개를 PlayHT에 붙여넣는 것부터 시작하겠습니다. 안녕하세요, 개 애호가 여러분! 오늘은 인간의 가장 친한 친구인 개에 관해 흥미롭지만 잘 알려지지 않은 5가지 사실을 밝혀내겠습니다! 그러니 간식을 먹고 편안히 앉아 시작해 보세요!
음성을 생성하려면 텍스트 프롬프트 왼쪽에 있는 재생 아이콘을 클릭하세요.
PlayHT는 허드슨의 음성을 사용하여 텍스트를 생성합니다. 사용하는 텍스트의 양에 따라 생성 프로세스에 최대 몇 분이 걸릴 수 있습니다. 완료되면 화면 오른쪽에 있는 재생 버튼 (1)을 클릭하여 음성을 미리 볼 수 있습니다. 결과가 만족스럽지 않으면 재생성 버튼 (2)을 클릭하여 다시 시도할 수 있습니다.
첫 번째 단락의 소리는 다음과 같습니다.
이것은 꽤 좋은 것처럼 들리지만 약간의 조정이 필요할 수 있습니다. 목소리의 끊어짐이 제대로 들리지 않으므로 몇 가지 조정을 가해 보겠습니다.
출력 재생성
PlayHT를 사용하면 텍스트 입력을 변경한 다음 다시 생성할 수 있습니다. 이는 출력이 표준에 미치지 못할 때 유용합니다. 좋은 팁은 문장 사이에 대시를 추가하여 자연스러운 일시 중지를 만드는 것입니다. AI 음성 생성기를 사용하면 텍스트를 성급하게 작성하여 부자연스러운 런온 문장을 만드는 경향이 있습니다. 따라서 이 문제를 해결하기 위해 원래 프롬프트를 다음과 같이 변경하겠습니다. 안녕하세요 개 애호가 여러분! – 오늘은 인간의 가장 친한 친구인 개에 관해 흥미롭지만 잘 알려지지 않은 다섯 가지 사실을 밝혀내겠습니다! – 그럼 간식을 먹고 편안히 앉아 시작해 보세요!
결과는 다음과 같습니다.
4단계: 음성 복제
PlayHT의 또 다른 멋진 기능은 자신만의 AI 음성을 생성하는 기능입니다. 30초 길이의 클립을 업로드한 다음 이를 프로젝트에 사용할 수 있는 AI 음성으로 변환하는 방식으로 작동합니다. 시작하려면 PlayHT 인터페이스에서 음성 복제 탭을 클릭하세요.
다음으로 새 클론 생성 버튼을 클릭합니다.
무료 라이센스를 사용하고 있으므로 유일한 옵션은 30초 사운드 클립에서 AI 음성을 생성하는 인스턴트 옵션을 선택하는 것입니다.
그런 다음 음성에 이름을 지정하고(1) 성별을 선택하고(2) 오디오 파일을 업로드하고(3) 클립 사용 권한이 있는지 확인한 다음(4) 만들기를 클릭합니다(5).
클론이 생성되면 새 클론 생성 버튼(1) 아래에 표시됩니다. 여기에서 해당 항목을 사용(2)하거나, 공유(3)하거나, 삭제(4)할 수 있습니다.
어떻게 들리는지 보려면 텍스트 프롬프트를 추가하여 미리 보세요. 솔직히 말해서, 우리는 그 결과에 꽤 감동받았습니다.
5단계: 프로젝트 내보내기
생성 프로세스의 마지막 단계는 사운드 파일을 내보내는 것입니다. 한 번에 한 단락씩 내보내거나 한 파일의 모든 단락을 내보내는 두 가지 방법 중 하나로 이 작업을 수행할 수 있습니다. 대부분의 제작자에게는 파일을 별도로 내보내는 것이 좋습니다. 이렇게 하면 각 장면 사이에 컷 장면과 기타 효과를 추가할 수 있습니다. 파일을 내보내려면 화면 왼쪽 상단에 있는 내보내기 버튼을 클릭하세요.
각 단락을 개별적 으로 또는 단일 오디오 파일로 두 가지 옵션이 있는 드롭다운 메뉴가 나타납니다.
모든 파일은 오디오 소프트웨어를 사용하여 가져올 수 있는 wav 오디오 파일로 내보내집니다.
AI 음성 생성기 모범 사례
AI 음성 생성기를 최대한 활용하기 위해 클립을 만들 때 몇 가지 모범 사례를 이해하는 것이 중요합니다. 먼저 대시(-)를 추가하여 문장을 구분합니다. 이를 통해 알고리즘은 일시 중지가 있어야 함을 알 수 있으며 일반적으로 연속 문장을 제거합니다. 마찬가지로, 쉼표와 세미콜론은 단어 사이에 자연스러운 일시 중지를 추가할 수 있습니다. 반면에 문장의 단어 사이에 하이픈을 사용하지 마세요. 예를 들어 land-locked 대신 landlocked 를 사용합니다.
또한 단어가 아닌 개별 음성 문자가 있어야 함을 AI가 이해할 수 있도록 약어 사이에 공백을 추가해야 합니다. 예를 들어 AI를 사용하는 대신 AI를 사용합니다. 약어의 문자 사이에 마침표를 추가할 수도 있습니다. 단어 반복을 방지하려면 쉼표, 세미콜론, 하이픈 등 구두점을 포함하도록 텍스트를 바꿔보세요. 반복을 해결하는 또 다른 방법은 문장을 더 작은 문장으로 나누는 것입니다. 이렇게 하면 AI가 일반적으로 바람직하지 않은 결과로 끝나는 혼란을 방지할 수 있습니다.
AI 음성 생성에 대한 최종 생각
AI 음성 생성기는 제작자가 오디오를 만드는 방식을 바꾸고 있습니다. PlayHT와 같은 인공 지능 소프트웨어를 통해 팟캐스트, YouTube 동영상, 마케팅 동영상, 교육 자료 등에 대한 음성을 만들 수 있습니다. AI 기술이 발전함에 따라 음성 생성의 미래는 엄청난 잠재력을 보유하고 있으며 더욱 몰입감 있는 경험의 문을 열어줍니다.
다른 AI 응용 프로그램을 탐색하는 데 관심이 있는 사람들을 위해 우리 블로그에는 즉시 AI 슈퍼스타가 되는 데 도움이 되는 많은 게시물이 있습니다.
- 2023년에 AI 아트를 만드는 방법(자세한 튜토리얼)
- 오늘날 AI를 사용할 수 있는 31가지 방법(2023년 가이드)
- 2023년 Photoshop AI 생성 채우기를 사용하는 방법(자세한 튜토리얼)
- 2023년 Midjourney를 사용하여 AI 아트를 만드는 방법(자세한 튜토리얼)
Pro_Vector / Shutterstock.com을 통한 주요 이미지