두꺼운 종이책, 긴 보고서…다 읽을 필요 없다?

- Advertisement -

두꺼운 종이책, 수천 페이지가 넘는 분량의 긴 보고서. 이런 방대한 양의 데이터를 누군가 대신 축약해준다면 얼마나 좋을까? 인공지능 연구소 오픈 AI(OPEN AI)는 공식 블로그를 통해 요약 전문 AI(인공지능)를 공개했다.

OPEN AI

AI는 10만 단어가 포함된 책을 요약하는 데 특화됐다. 비결은 챕터별 축약에 있다. 먼저, 분량이 짧은 부분을 요약한다. 분량이 긴 사건은 주요 사건으로 인식, 더 높은 수준으로 요약해 정렬한다. 그리고 축약한 내용들은 한번 더 정렬하고 완료한다.

연구소는 학습 이후 미국 내에서 가장 잘 팔린 도서 40권으로 정확도 테스트를 진행했다. 대부분 영미 고전 소설으로 이상한 나라의 앨리스, 오만과 편견, 로미오와 줄리엣, 노예 12년이였다.

공식 블로그에서 축약된 소설(영어)을 확인할 수 있는데, 어색하긴 하지만 놀라웠다. 사건을 중점으로 내용을 정렬해 정리됐다.

Tenor

이상한 나라의 앨리스를 예로 들어보자면, 소설에서 앨리스는 시계를 보면서 바삐 뛰어가는 토끼에게 궁금증이 생겨 토끼굴 속으로 따라 들어간다. 이 과정에서 소설은 토끼가 어떤 시계를 들었는지, 토끼의 생김새는 어떤지, 어디에 위치한 굴로 들어갔는지 등을 서술한다.

‘축약’을 중점에 둔 AI는 다르다. “그녀는 시계를 든 토끼를 보고 놀라 토끼굴을 따라내려간다”라고 설명할 뿐이다. 이런 축약법으로 원 소설엔 2만6449개의 단어가 있었지만, 축약 후엔 6024개로 확 줄었다. 작가가 설명하는 바대로 상상하며 보는 맛은 사라지지만, 내용을 한 눈에 파악하긴 딱이다.

then24

아직 어색한 부분도 있다. 객관적인 평가를 위해 연구팀은 두 명의 연구원을 선별해 AI 모델과 똑같은 책(40권)을 읽고 요약하게 한 다음 비교하는 과정을 거쳤다. AI는 앞 뒤 문장을 자연스럽게 이어지도록 하는 데 부족했다.

추리 소설의 경우, 사건을 해결하는데 꼭 필요한 실마리, 복선이 있기 마련인데 사람은 이를 잘 캐치하는 반면 AI는 그러지 못했다. 스토리를 이해하지 못하고 축약에만 집중해서다. 연구팀은 “장치해둔 복선을 기반으로 소설 끝의 반전을 이해할 수 있는 경우, AI의 축약본만 봤을 때 이해하기 어려울 것”이라고 설명했다.

Wired

하지만 소설이 아닌 보고서를 축약하는데 쓰인다면 꽤 유용하게 쓰일 지도 모르겠다. 정렬, 축약에 특화된 만큼 빠른 시간 내에 효율적으로 일을 처리할 수 있겠다. 물론, 중요한 부분을 빼먹는 불상사가 일어날 가능성도 있지만 말이다.

IT매체 벤처비트(VentureBeat)는 관련 AI 모델을 공개하거나 오픈소스화할 계획이 있냐고 오픈AI에 물었지만, 연구팀은 “계획이 없다. 소스 코드 또는 교육 데이터 세트 역시 공개하지 않을 것”이라고 답했다.

테크플러스 에디터 전다운

tech-plus@naver.com​

[fv0012]

- Advertisement -

Related Stories