말이 글로 바뀌는 놀라움! 나오자마자 써본 ‘클로바노트’ 사용기

회의나 강연 녹취록을 풀어본 사람이라면 공감한다. 나중에 녹취를 풀려면 녹음 시간보다 훨씬 더 많은 시간을 작업에 투입해야 한다는 것 말이다. 잠시 한눈판 사이 놓쳐서 다시 듣고, 안 들려서 다시 듣고…쉬운 작업이 아니다. 전체를 확인할 것 없이 특정 부분만 보면 되는 사람도 음성을 검색할 수 없으니 직접 들어보고 찾아야 한다.

요즘엔 음성을 텍스트로 변환해주는 프로그램이 있어 잘만 활용하면 괜한 수고를 줄일 수 있다. 그중에서도 가장 최근 네이버에서 출시한 음성기록 서비스 ‘클로바노트’에 관심이 간다. 누구보다 빠르게 접하고 싶은 마음에 앱스토어에 들어가 바로 앱을 설치했다. 클로바노트의 실력이 궁금하다. 지금부터 함께 확인해보자.

클로바노트 앱은 애플 앱스토어와 구글 플레이스토어에 접속해 다운로드받으면 된다. PC웹도 지원하니 컴퓨터에서도 접속해 서비스를 이용할 수 있다.

네이버 아이디로 로그인한다

모바일앱 버전부터 살펴보자. 앱을 실행한 뒤 서비스를 이용하려면 로그인이 필요하다. 오직 네이버 아이디만 지원한다. 없으면 아이디를 만들어야 한다.

로그인하면 ‘이용 동의’ 화면을 만나게 된다. 서비스를 이용하려면 필수 약관이야 반드시 동의해야 한다. 아래 서비스 품질 향상을 위해 데이터 수집에 동의하는 약관은 선택 사항이다. 동의하지 않으면 매달 기본 사용 시간인 300분만 사용하며, 동의하면 기본 사용 시간에 300분이 추가된 600분을 무료로 이용하게 된다.

매달 기본 사용 시간 300분을 제공한다

네이버 측은 수집한 음성 데이터는 ‘비식별’ 처리해 누구의 음성인지 확인하지 못하게 한다고 설명했다. 클로바노트는 음성 데이터를 학습해 음성 인식 품질을 개선한다. 네이버는 앱을 많이 사용할수록 더 정확하게 음성을 인식한다고 덧붙였다.

접근권한으로 ‘오디오녹음’을 허용해야 한다.

그다음 관심 분야 설정을 해야 한다. 앱은 ‘종사하고 계신 분이나 자주 사용하는 분야를 설정하면 서비스 품질 개선에 도움이 됩니다’라고 설명한다. ‘정치·사회’, ‘경제·금융’, ‘IT·과학’ 등 총 10개 분야로 나눴다. 이 중 한 가지를 선택하면 되고 없으면 ‘기타’를 선택한다.

앱에서 직접 음성 녹음하거나 파일을 업로드한다

이제 본격적으로 서비스를 이용할 수 있다. 음성을 텍스트로 변환하려면 녹음된 파일이 있어야 한다. 홈 화면 아래 동그란 플러스(+) 버튼을 누르면 새 노트를 생성할 수 있다. 녹음 방법은 두 가지다. 앱에서 바로 녹음하는 ‘음성 녹음’과 이미 녹음된 파일을 불러오는 ‘파일 업로드’ 중에서 선택하면 된다.

‘음성 녹음’을 실행해봤다. 녹음은 최대 90분까지 가능하다. 녹음이 시작되면 전용 화면으로 전환되고 디지털 시계가 녹음 시간을 알려준다. 아래 마련된 버튼 3개는 왼쪽에서부터 녹음 종료, 정지, 북마크 순이다. 다른 건 일반적인 기능이고 북마크는 사용자에게 유용해 보인다. 책을 읽다 인상 깊은 페이지에 책갈피를 꽂아두듯 녹취 중간에 중요하거나 나중에 확인이 필요한 부분에 북마크 표시를 하면 된다. 앱을 켜놓고 녹취하다 원하는 부분에서 북마크 버튼을 클릭한다. 표시한 지점은 나중에 노트에서 확인할 수 있다.

나중에 확인이 필요한 부분에는 북마크 표시를 한다

녹음을 끝마치면 음성 종류를 선택하라는 창이 뜬다. 일반 대화, 회의, 강연, 개인 메모 등 제시 항목에서 하나를 선택하고 파일을 저장한다.

녹음이 끝나면 바로 변환 과정을 진행한다. 만약 음성 파일에 말소리가 담겨 있지 않으면 텍스트 변환 작업을 수행하지 않는다.

결과는 일단 만족스러웠다. 말한 내용은 거의 그대로 텍스트 변환됐다. 인식 실수도 있었지만 넘어갈 수 있는 수준이었다. 그런데 녹음 중간에 북마크 해둔 것 일부는 저장하고 일부는 반영하지 않은 것을 확인했다. 수정이 필요해 보인다.

음성 기록에서 변환된 내용을 확인한다

기존 녹음 파일을 가지고도 변환을 해봤다. 6분짜리 녹음 파일을 변환하는 데 약 10초면 음성 전체를 텍스트로 변환했다. 실제 녹취를 푸는 시간에 비하면 상당히 빠른 속도다. 음성 파일 길이가 길어질수록 유용할 것이다. 변환된 텍스트를 읽어보면 전체 맥락을 이해하는 데 문제가 없었다.

사소한 실수는 피할 수 없는 모양이다. △”아이폰12″를 “아이폰 시비”, “아이폰 시민” △”자급제폰”을 “자극적폰”, “작업 제품” △”유심”을 “주심”으로 번환하는 등 인식 실수가 발견됐다. 단어를 빠뜨리는 경우도 종종 있었다.

무엇보다 훌륭한 점은 사람을 구분한다는 점이다. 발화자 2명이 등장하는 음성 파일을 변환했고 혹시나 하는 마음에 대화를 일일이 대조해봤다. 결과는 인상적이었다. ‘참석자1’, ‘참석자2’와 같이 임의로 발화자에게 이름을 부여했고 각자 말한 내용을 정확하게 구분했다. 다만, 발화자의 말이 겹치지 않는 음성 파일이라는 점도 한몫했다.

앱은 발화자를 정확하게 구분해냈다

발화자가 여럿이거나 말하는 중간에 다른 사람의 말이 섞이면 인식률은 다소 떨어졌다. 4명이 참여한 토론 음성 파일을 변환해본 결과 이 같은 문제가 발견됐다. 말이 섞이는 순간 A가 한 말을 B가 한 것으로 잘못 인식하기도 했다. 그래도 대화 전체를 놓고 보면 토론에 참가한 4명이 하는 말을 잘 구분해냈다.

만약, 녹음 파일에서 특정 부분부터 녹취를 재생하고 싶다면 해당 텍스트를 클릭하면 된다. 녹취 내용이 방대하고 검색할 키워드가 따로 있다면 검색 기능을 활용해 찾으면 된다.

작업을 마친 음성 파일, 음성 기록, 메모 등은 다운받아서 따로 저장하거나 공유할 수 있다.

PC에서 확인한 음성 기록과 메모

지금까지 살펴본 건 모바일앱에서 가능한 기능이다. PC에서만 가능한 작업도 있다. 먼저 변환된 텍스트를 수정하려면 PC에서 서비스에 접속해야 할 수 있다. 녹취와 동시에 메모를 하려면 스마트폰과 PC가 동시에 필요하다. 모바일앱에서 녹음을 실행한 뒤 PC에 접속하면 새로 생성된 노트가 보인다. 이를 열고 들어가서 메모를 시작하면 된다. 중간에 떠오른 생각들을 적어 놓으면 좋다. 메모에는 녹취 시간도 함께 찍힌다. 메모를 클릭 한 번으로 해당 부분부터 음성 기록을 확인할 수 있다.

자주 쓰는 단어나 전문 용어를 미리 입력해둘 수도 있다. 등록된 단어에 대한 음성 인식할 때 인식률이 높아진다고 설명한다. 텍스트 변환 결과 오류가 있었던 단어를 추가했더니 이전과는 다르게 제대로 변환하는 것을 확인했다.

전문 용어나 자주 쓰는 단어를 등록하면 인식률이 높아진다고 설명한다

클로바노트는 녹취 풀 일이 많은 사람들에게 도움이 되는 서비스다. 변환 결과를 그대로 신뢰할만한 수준은 아니지만, 녹취 내용 전체를 텍스트로 변환한 뒤 잘못 인식된 부분만 찾아 수정하면 작업 시간은 훨씬 줄어들 것이다. 녹음 길이가 길어질수록 활용도는 더 높다. 청각장애가 있어 텍스트로 보는 것이 수월한 사람들에게도 도움이 될 것이다.

그밖에도 녹취 내용을 빠르게 파악하고 싶다거나 특정 키워드가 담긴 부분만 확인하고자 할 때 유용한 서비스로 보인다.

테크플러스 에디터 나유권

tech-plus@naver.com

- Advertisement -

LEAVE A REPLY

Please enter your comment!
Please enter your name here

 


랭킹 뉴스

실시간 급상승 뉴스 베스트 클릭



Related Stories