주요 메뉴 바로가기 (상단) 본문 컨텐츠 바로가기 주요 메뉴 바로가기 (하단)

메타, 텍스트만 입력해도 음원을 만들어주는 AI 모델 출시

조회수  

(출처: Unsplash)

오늘날 AI의 영향력은 점차 확대되고 있다. 인간 고유의 영역이라 여겨졌던 예술 분야도 더 이상 예외는 아니다. 생성 AI 모델이 영화 대본을 작성하거나 미술 작품을 완성하는 일도 이젠 일상이 되어 가고 있다. 음악도 마찬가지다.

6월 12일(현지시간) 온라인 저널 매체 더 디코더(The Decoder)는 메타가 텍스트와 멜로디를 기반으로 새로운 음악을 생성해 주는 오픈소스 AI 모델을 출시했다고 보도했다.

해당 AI모델의 이름은 ‘뮤직젠(MusicGen)’. 메타에 의하면 뮤직젠은 1만 개의 고품질 라이센스 음악 트랙과 셔터 스톡 및 대규모 스톡 미디어 라이브러리인 폰드5(Pond5)의 39만 개 악기 전용 트랙 데이터를 학습했다고 한다. 학습한 라이센스 음악의 총 길이는 약 2만 시간이다.

뮤직젠은 지난 해 10월 메타가 공개한 엔코덱(Encodec)이라는 AI 기반 오디오 압축 기술을 기반으로 한다. 현재 사용자들은 머신러닝 데이터 및 모델을 공유하는 플랫폼인 허깅 페이스 API를 통해 음원 샘플을 직접 제작해볼 수 있다.

메타의 AI 연구 엔지니어인 펠릭스 크룩(Felix Kreuk)은 지난 6월 9일(현지시간) 자신의 트위터 계정을 통해 뮤직젠이 생성한 음원 샘플을 공개했다. 해당 샘플은 기존 클래식 음악에 몇 가지 비트와 악기 소리를 합쳐 80년대 팝송처럼 만든 것이었다.

총 두 가지 음원이 공개됐는데, 첫 번째 음원은 바흐의 토카타와 푸가를 베이스로 했다. 클래식 음악에 전자 드럼 비트를 섞어 80년대 팝 음악을 새롭게 생성한 것이다. 도입부에 나오는 ‘띠로리’ 멜로디로 유명한 이 곡은 각종 대중매체에서 절망적인 상황을 표현할 때 자주 사용되는 것으로 유명하다. 또 다른 음원 역시 모리스 라벨의 볼레로를 활용해 전자 비트를 섞어 만들었다.

펠릭스 크룩이 공개한 뮤직젠 음원 샘플 (출처: 펠릭스 트위터)

IT 매체 기즈모도(Gizmodo)는 가사가 포함된 음원 샘플 제작을 테스트했다고 전했다. 생일 축하 노래에 많이 사용되는 교향곡에 로파이(Lo-fi) 힙합 트랙을 섞어 음원을 제작한 후 가사를 추가했더니 가사 없는 동일한 샘플보다 다소 어색하게 완성됐다고 한다. 지금까지 음성이나 음악을 합성해 주는 여러 AI 모델이 공개되어 왔지만 대부분 완성도가 높지 않기 때문에 더 강력한 샘플링 기술이 필요하다고 덧붙였다.

구글도 이와 유사한 AI 모델을 출시한 바 있다. 지난 1월 구글은 텍스트 설명을 바탕으로 음악을 생성하는 AI 모델 ‘뮤직LM(MusicLM)’을 발표했다. 텍스트 외에 허밍, 휘파람 소리, 이미지 등을 입력해도 새로운 음원을 생성해 준다. 해당 AI 모델은 총 28만 시간 분량의 음악 데이터를 학습했다고 한다.

다만 구글은 뮤직LM의 파급력을 고려해 공개하지 않겠다고 발표했다. 테스트 중 약 1%가 기존 음악을 그대로 복제한 정황이 확인됐기 때문이다. 구글은 저작권이나 다른 윤리적 문제를 일으킬 수 있기 때문에 해당 모델을 공개하지 않은 것으로 분석된다. 대신 뮤직LM 관련 사이트를 만들어 여러 조건으로 생성한 샘플 음원을 공개했다.

(출처: Unsplash)

테크크런치는 메타의 뮤직젠을 구글 뮤직LM과 비교해 보는 테스트를 진행했다. 재즈와 피아노 음악 두 종류를 비교했는데 유사한 수준의 결과가 나타났다. 뮤직젠은 뮤직LM보다 늦게 출시됐으나 성능에서 큰 차이를 보이지 않았다고 설명했다.

여러 외신에서는 음악을 포함한 예술 분야와 관련된 생성 AI 모델이 출시될 때마다 공통적으로 저작권 문제를 우려하고 있다. 대부분 ‘기존’ 음악을 학습 데이터로 삼기 때문이다. 뮤직젠 역시 저작권 문제가 우려되는 상황이다.

메타 연구원은 해당 AI 모델 학습에 사용된 모든 음악이 권리자와의 법적 계약에 의해 보호된다고 설명했으나 관련 기준은 여전히 모호한 상황이다. 일부 예술가들은 허가 없이 대량의 라이선스 콘텐츠를 확보한다는 이유로 스태빌리티 AI(Stability AI)와 미드 저니(Midjourney)같은 이미지 생성형 AI를 고소한 사건도 있었다. 관련 AI 모델의 라이센스 확보 여부를 떠나 나쁜 의도를 가진 사용자들이 쉽게 도용할 가능성도 있기 때문에 관련 법안 마련을 주장하는 목소리가 커지고 있다.

테크플러스 에디터 김하영, 나유권

tech-plus@naver.com​

CP-2023-0021@fastviewkorea.com

댓글0

300

댓글0

[Techplus] 랭킹 뉴스

  • 낫싱이 선보인 첫 스마트워치 강점은 '가격’
  • 테크노 ‘팬텀 V 플립’, 갤럭시 Z5 절반 가격?
  • 스포티파이 ‘잼(Jam)’, 좋아하는 음원 실시간으로 동시 청취해봐
  • 구글 ‘픽셀 8 시리즈’ 카메라, 예상되는 다양한 기능은?
  • 게티 이미지, AI 이미지 생성 도구 출시…저작권은?
  • ‘도조 슈퍼컴 D1 칩 생산 늘린다’…테슬라, TSMC와 파트너십 확대

[Techplus] 공감 뉴스

  • 아이폰15 "문제 많네"...소비자 고민 더한다
  • 아이폰 15 프로 맥스, 10배 광학 줌 지원않는 이유는?
  • 요가도 해? 성장한 테슬라의 휴머노이드, 새로운 영상 공개
  • [용어로 읽는 IT] - 어떻게 줄였을까? 1.5mm 베젤 선보인 아이폰 15 프로
  • 소문과 다르네…취약한 아이폰 15 프로 모델 ‘내구성’
  • '저렴한 구독료 이젠 없다'…유튜브, 프리미엄 라이트 폐지

[Techplus] 인기 뉴스

  • 낫싱이 선보인 첫 스마트워치 강점은 '가격’
  • 테크노 ‘팬텀 V 플립’, 갤럭시 Z5 절반 가격?
  • 스포티파이 ‘잼(Jam)’, 좋아하는 음원 실시간으로 동시 청취해봐
  • 구글 ‘픽셀 8 시리즈’ 카메라, 예상되는 다양한 기능은?
  • 게티 이미지, AI 이미지 생성 도구 출시…저작권은?
  • ‘도조 슈퍼컴 D1 칩 생산 늘린다’…테슬라, TSMC와 파트너십 확대

[Techplus] 추천 뉴스

  • 아이폰15 "문제 많네"...소비자 고민 더한다
  • 아이폰 15 프로 맥스, 10배 광학 줌 지원않는 이유는?
  • 요가도 해? 성장한 테슬라의 휴머노이드, 새로운 영상 공개
  • [용어로 읽는 IT] - 어떻게 줄였을까? 1.5mm 베젤 선보인 아이폰 15 프로
  • 소문과 다르네…취약한 아이폰 15 프로 모델 ‘내구성’
  • '저렴한 구독료 이젠 없다'…유튜브, 프리미엄 라이트 폐지

공유하기