
2월 16일(현지 시간) IT 전문 매체 나인투파이브맥(9to5mac)에 따르면, 문자 메시지를 발신자의 음성으로 읽어주는 애플의 특허가 공개됐다. 해당 특허는 애플이 지난해 10월 미국 특허상표청(USPTO)에 제출했다.
애플이 제출한 특허에서는 관련 기술에 대해 자세히 다루고 있다. 이는 문자로 녹음된 음성을 보내는 것이 아니다. 발신자의 음성을 아이폰이 모방해 마치 그 사람의 목소리인 것처럼 내용을 읽어주는 기능이다.
발신자의 음성으로 문자를 읽어주는 이 기능은 휴대전화를 손에 들고 문자를 확인하기 어려운 경우에 유용할 것으로 보인다. 요리 중이거나 운전 중일 때, 많은 짐을 들고 있어 손이 모자랄 때를 비롯해 많은 상황에서 유용하게 쓰일 수 있다. 발신자의 음성으로 읊어주는 문자는 시리가 문자 내용을 대신 읽어주는 것보다 더욱더 쉽게 발신자를 파악할 수 있다는 점에서 더 의미있다.

애플의 특허에서 기반이 되는 기술은 ‘딥페이크’(Deepfake)와 유사한 ‘딥보이스(Deepvoice)’다. 딥페이크는 이미지를 합성하는 기술이다. 아마 많은 이들이 유명인의 얼굴을 합성하는 범죄로 딥페이크를 들어봤을 것이다. 이와 유사한 기술이 딥보이스인데, 딥페이크가 이미지를 합성한다면 딥보이스는 목소리를 합성하는 기술이다. 이 기술은 특정 목소리 데이터를 학습한 인공지능이 문자 음성 자동변환으로 음성을 모방한다.
한 가지 우려되는 지점은 있다. 사용자의 음성을 모방하려면 일단 음성 파일 공유가 선행돼야 한다. 사용자의 데이터를 축적해 음성을 모방하기 때문이다. 하지만 음성 데이터가 유출되면 얼마든지 범죄에 악용될 소지가 있다. 딥보이스 기술로 만든 음성은 실제 음성과 분간하기 쉽지 않다. 기술이 정교해질수록 실제 대상인지 진위 파악은 더 어려워진다. 사용자 음성을 그대로 복제해 보이스피싱 범죄에 악용되는 것도 충분히 예상 가능한 시나리오다.
한편, 애플의 특허는 아직 심사 단계에 있기에 최종 등록될 지는 아직 알 수 없다. 특허로 등록되더라도 애플 측에서 해당 기능이 불러올 수 있는 문제점이 해결되지 않을 수 있으며, 실제 제품에 적용될지도 아직 알 수 없다.
댓글 많은 뉴스