선명한 화질, 깨끗한 음질의 화상회의 시대 열린다

- Advertisement -

(Freepik)

올해 코로나19 여파로 화상회의에 대한 수요가 그 어느 때보다 높다. 앱 분석 업체 앱애니에 따르면 지난 3월 기업용 화상회의 앱의 다운로드 건수는 14일부터 21일까지 단 일주일 만에 6200만 건을 기록했다. 대표주자로 꼽히는 줌의 경우 4월 말 하루 회의 참석자 수가 3억 명을 돌파하기도 했다.

하지만 지금까지는 저품질, 잡음 등이 화상회의의 제일 큰 문제로 꼽혀왔다. 가장 기본이 돼야 할 의사소통 기능이 해결해야 할 과제로 남아있던 것이다.

출처: 엔비디아 유튜브

엔비디아는 5일(현지시간) 이런 문제들을 개선하기 위한 AI 기반의 플랫폼 ‘맥신’을 공개했다.

맥신은 화상회의·통화에 필요한 대역폭을 획기적으로 줄였다. 전체 화면을 스트리밍하는 대신 AI가 얼굴 포인트를 분석해 상대방이 보는 화면에서 재구성한다. 이를 통해 스트리밍에 필요한 대역폭은 감소되고 비디오 품질은 향상하는 효과를 얻게 되는 것이다.

엔비디아는 GAN(Generative Adversarial Network·생성적 대립 신경망)으로 알려진 AI 방식을 사용해 클라우드에서 얼굴을 부분적으로 재구성한다고 밝혔다. 이는 딥페이크에서 사용되는 것과 같은 기술이다.

출처: 엔비디아 유튜브

카메라 포커스를 조정해 프레임 중앙에 배치하거나 얼굴 방향을 바꿔 회의 참석자들이 대화에 집중할 수 있도록 했으며, 가상의 배경을 추가하거나 자신의 목소리 톤에 따라 움직이는 AI 아바타를 얼굴 대신 띄우는 것도 가능하다. 실시간 자막이나 번역 기능도 탑재됐다.

맥신은 소비자 플랫폼이 아닌 기업이 자체 소프트웨어를 개선할 수 있는 툴킷이다. 사전 테스트를 해볼 수 있도록 AI 개발자나 소프트웨어 파트너, 영상통화 앱 기업 등은 조기 접근 신청을 할 수 있게 했다.

출처: 엔비디아 유튜브

코로나19의 장기화로 인해 화상통화는 어느덧 우리 생활의 일부가 돼가고 있다. 전 세계 수백, 수천만의 사람들이 화상통화를 통해 일하고, 배우고, 놀고 있다.

시선 감지, 실시간 번역 등의 기능은 이미 다른 회사를 통해 구현된 바 있다. 하지만 맥신은 이제껏 화상회의의 고질적 문제로 꼽혀왔던 해상도 문제를 해결하고 각종 편의 기능을 제공함으로써 더 큰 변화를 불러올 것으로 기대되고 있다.

테크플러스 에디터 김다솜

tech-plus@naver.com

- Advertisement -

Related Stories