
요즘 인공지능(AI)는 수많은 정보를 학습해서 다양한 콘텐츠를 만들어낸다. 예컨대 오픈AI(Open AI)의 달리(Dall-E)는 사용자가 텍스트를 입력하면 원하는 이미지를 단숨에 제작한다. 스테이블 디퓨전(Stable Diffusion), 미드저니(Midjourney)와 같은 인공지능 도구도 달리와 비슷한 방식으로 사실적인 이미지를 생성해 제공한다.
생성형 인공지능의 발전은 비단 이미지에 국한되지 않는다. 메타(Meta)와 구글은 각각 메이크어 비디오(Make A Video), 이메진 비디오(Imagen Video)라는 동영상 생성 인공지능 도구를 제작했다. 메타와 구글의 인공지능은 명령어를 영상으로 재구성한다. 최근에는 엔비디아(Nvidia)에서 공개한 3D 모델링을 만드는 인공지능도 있다.
아마존은 이와 다른 방식으로 인공지능을 활용하려 한다. ‘스토리텔링’이다. 물론 일부 미디어는 인공지능을 활용한 이른바 ‘로봇 기사’를 생성하고 있다. 허나 아마존이 새롭게 선보인 새로운 기능은 스토리텔링과 함께 그에 걸맞은 배경 이미지와 음악을 입힌다. 아마존은 이 기능을 자사 인공지능 비서 알렉사(Alexa)에 접목했다.

29일(현지시간) IT 매체 엔가젯(Engadget)은 아마존이 ‘크리에이트 위드 알렉사(Create With Alexa)’라는 새로운 기능을 발표했다고 전했다. 크리에이트 위드 알렉사는 앞서 언급한 요소를 조합해, 아이들이 좋아할 만한 동화를 만들어내는 신기능이다. 아이들은 그저 알렉사에 명령어를 내리거나 주어진 몇 가지 선택지를 고르기만 하면 된다.
크리에이트 위드 알렉사를 사용하려면 먼저 알렉사에 “알렉사, 이야기를 만들어줘”라는 음성 명령어를 내려야 한다. 그런 다음 장소, 캐릭터, 이름, 성향 등을 설정하고 테마를 고르면 된다. 크리에이트 위드 알렉사는 아직 초창기이기에 선택 가능한 테마 수가 제한적이다. 현재 고를 수 있는 테마는 물속, 마법 숲, 우주 탐험 등 세 가지다.
여기까지 끝내면 알렉사가 알아서 동화를 생성한다. 알렉사는 스토리텔링에 필요한 5~10줄 분량 텍스트를 만든다. 동시에 인공지능이 만든 이미지나, 사람이 제작한 이미지를 활용해 동화 내용에 부합하는 배경 이미지를 배치한다. 동화에 등장하는 캐릭터나 여러 객체를 적절한 곳에 배치하는 건 물론, 상황에 맞는 행동이나 표정을 짓도록 설정한다는 설명이다.

더해 알렉사는 동화 내용에 알맞은 배경 음악도 알아서 입힌다. 알렉사는 아마존이 보유한 방대한 음악 데이터베이스를 기반으로, 동화에 어울리는 음악을 만들어낸다고 한다. 종합하면 크리에이트 위드 알렉사는 텍스트, 이미지, 음악 등 모든 요소를 스스로 생성한 뒤, 아이들을 위한 짧은 애니메이션 동화를 만들어낼 수 있다.
여기서 한 가지 의문이 든다. 만약 알렉사가 부적절한 데이터베이스를 학습해서 아이들에게 보여주면 안 되는 이야기를 만들 수도 있지 않을까. 다행히 아마존은 불미스러운 동화가 생성되지 않도록 콘텐츠 필터링 기능을 추가했다고 전했다. 또 개인정보 보호 차원에서 부모의 동의가 없으면 아이들이 크리에이트 위드 알렉사를 사용하지 못하도록 조치했다.
아마존은 ‘가족을 위한 기술’을 만들기 위해 크리에이트 위드 알렉사를 선보였다고 밝혔다. 에샨 바트나가르(Eshan Bhatnagar) 알렉사 제품 총괄은 “아마존은 항상 알렉사가 가족에게 기쁨과 즐거움을 가져다주는 동반자가 되길 원했다”며 “그 목표를 발전시키기 위해 이 경험(크리에이트 위드 알렉사)를 만들게 됐다”고 말했다.

크리에이트 알렉사는 대형 디스플레이가 달린 스마트홈 아마존 ‘에코 쇼(Echo Show)’만 지원한다. 사용 지역도 제한적이다. 아직은 미국에서만 쓸 수 있고, 영어만 가능하다. 마존이 이 기능을 전 세계로 확대할진 미지수다. 아직 이에 대한 언급이 없었기 때문이다. 보통 빅테크가 내놓은 새로운 기능은 영미권 국가를 시작으로 다른 지역으로 확산한다.
허나 최근 아마존 추세를 보면 그렇게 될지 잘 모르겠다. 아마존은 실적 악화와 미래 불확실성을 이유로 최근 직원 1만여명을 해고하겠다고 밝혔다. 특히 올해 최대 100억달러 손실이 예상되는 알렉사 팀이 속한 부서도 주요 감축 대상이라고 알려졌다. 아마존은 감원과 함께 돈이 안되는 사업도 접고 있다. 그중에는 어린이용 화상통화 기기도 포함됐다.
한편 언뜻 알렉사 ‘음성 복제’ 기능이 떠오른다. 아마존은 몇 달 전 알렉사로 사람의 목소리를 재현하는 기능을 공개했다. 1분 내외 목소리 샘플만 있으면, 알렉사가 목소리를 그대로 흉내내는 기능이다. 아마존이 보여준 시연 영상을 보면, 아이가 “할머니 목소리로 책을 읽어줘”라고 하자, 알렉사는 정말 할머니의 목소리로 책을 낭독했다. 아마존은 각 기능을 선보일 때 마다 ‘가족’, ‘공감’ 같은 인간성을 표방했다.
테크플러스 에디터 윤정환
tech-plus@naver.com