“비슷한 목소리 어디서 찾지”…애니 성우 AI가 대신할까?

- Advertisement -

Simpson Family / FOX

올해로 31주년, 장수 애니메이션인 ‘심슨 가족’ 제작진에겐 고민이 하나 있다. 회당 40만 달러(한화 4억 5600만 원 정도)의 오를 때로 오른 성우의 임금도 걱정이지만, 계약 불발 혹은 사망 시 대체자를 어떻게 찾느냐는 거다.

Simpson Family / FOX

실제로 지난 2013년, 심슨 가족의 바트 선생님 역할로 알려진 마르시아 월리스가 사망하자 제작진은 캐릭터를 하차시켰다. 마지막 에피소드에서 그간 녹음된 데이터를 편집해 한 마디만 내보냈고, 캐릭터 사망을 암시하는 장면을 송출했다. 완벽한 대체자를 찾아내지 못한 것.

그럼 앞으로 대체자를 찾지 못하면 계속 캐릭터를 하차시켜야 하는 걸까? 테크 미디어 와이어드(Wired)는 대안으로 AI(인공지능)가 있다고 설명했다.

캐나다의 AI 연구자 겸 미디어 프로듀서인 팀 맥스미스(Tim McSmythurs)는 “어떤 목소리든 흉내 낼 수 있는 스피치 모델을 구축했다”라고 설명했다. 그는 유튜브 채널을 통해 관련 영상을 여럿 업데이트하고 있다. 대표 영상은 영화 노팅힐에서 줄리아 로버츠 역을 호머가 대체하는 장면이다.

목소리 흉내는 텍스트와 함께 특정 사람의 두세 시간 음성 데이터를 훈련시키면 가능하다. 이후 주파수를 조금 더 조정하면 끝. 다만 AI이다 보니 실제 사람 목소리만큼 실감 나진 않는다. 감정이 전혀 실리지 않았기 때문. 팀은 “아무래도 AI라 완벽한 목소리를 만들어내긴 힘들다”라고 설명했다.

영국의 스타트업 SONANTIC은 AI 음성 기술을 한층 더 업그레이드했다. 목소리에 감정의 폭을 넓히는 기술을 개발한 것. 몇 시간 동안 다른 대사, 다른 감정 톤을 가지고 녹음을 하면 조금은 자연스러운 목소리를 구현할 수 있다는 거다.

창업자인 존 플린(John Flynn)은 “20개의 짧지만 구체적인 문장이 담긴 음성만 있다면 어느 정도 목소리 재현이 가능하다. 데이터가 더 많다면 음절별로 억양을 넣는 것도 가능하다”라고 말했다.

이미 해당 기술은 비디오 게임에서 활용되고 있다. ‘롤’ 게임 제작사인 옵시디언 엔터테인먼트(Obsidian Entertainment)와 협력하고 있고 인디 게임 스튜디오를 고객으로 두고 있다.

AI는 성우를 대신할 수 있을 뿐만 아니라 게임 제작사가 실제 성우를 영입하기 전 다양한 옵션을 시도할 수 있는 데이터로도 활용될 수 있다.

하지만 AI가 절대 사람의 목소리를 대체할 수 없다는 의견도 많다.

Simpson Family / FOX

매체는 심슨 애니메이션 제작사인 폭스 측이 AI 성우를 원하지 않을 것이라고 말했다. 이미 심슨 가족 성우들은 완벽하게 등장인물을 구현할 수 있을 정도로 높은 수준의 연기를 전달하고 있고, AI는 그 정도 레벨로 오르기 위해선 너무나 많은 반복과 작업이 필요하다는 거다.

저작권 문제도 있다. 펜실베니아 대학교 법학과 교수 제니퍼 로스만(Jennifer Rothman)은 “성우의 목소리, 녹음 데이터에 대한 저작권도 문제지만 무단 사용을 통제할 수 없게 될 것”이라고 비난했다.

테크플러스 에디터 전다운

tech-plus@naver.com​

- Advertisement -

Related Stories