길고 지루한 논문, 단 한 줄로 요약하는 AI 나왔다

너무 길고 장황한 글에는 꼭 이 같은 댓글이 달린다. “재미있네요. 너무 길어서 다 읽진 않았습니다만..”

어느 순간부터는 긴 글 끝에 글쓴이가 직접 ‘세줄요약’을 하는 것이 매너(?)가 된 듯도 하다. 사람 사는 건 어딜가나 다 똑같다고, 지구 건너편 학자들도 너무 긴 논문들에는 ‘tl;dr’이란 태그를 달아둔다고 한다. Too long, didn’t read. 너무 길어서 읽지 않았다는 뜻이다. 하지만 앞으로는 이같은 태그를 달 일이 줄어들 지도 모르겠다.

freepik

미국 시애틀에 있는 앨런인공지능연구소(AI2)는 논문과 문헌을 검토하는 데 소요되는 시간을 단축시키기 위해 극단적인 압축력을 제공하는 AI기반의 연구지원 툴을 공개했다. AI2는 마이크로소프트의 공동창업자인 폴 앨런이 지난 2014년 설립한 연구소다.

해당 도구는 AI2가 만든 과학논문 검색엔진 ‘시멘틱 스콜라(Semantic Scholar)’에 적용됐다. 시멘틱 스콜라는 월 700만 명의 학자들이 이용 중인 사이트다.

새로운 툴은 장문의 논문을 단시간에 한 문장으로 요약하는 기능으로 많은 연구자들에게 호응을 얻고 있다. 특히 모바일 기기에서 논문을 검토해야 하거나 많은 양의 논문 중 필요한 정보를 찾아낼 때 유용하다는 평이다.

지난 몇 년간 다양한 문서 요약 프로그램이 개발됐다. 이런 프로그램들은 통상 두 가지 접근법 중 하나를 사용한다. 첫 번째는 핵심 키워드를 선별해 이 단어들을 조합하는 방식이다. 또 다른 하나는 자연어 생성 알고리즘을 사용해 몇 가지 키워드만 가지고 새롭게 문장을 만들어내는 방법이 있다.

시멘틱 스콜라의 새로운 툴은 후자의 방식을 채택, 모든 요약 도구 중 가장 높은 압축률을 달성한 것으로 알려졌다. 과학 논문은 평균 5000단어로 이뤄져 있는데, 시멘틱 스콜라의 도구를 거치면 21단어로 요약이 가능하다. 238분의 1 수준으로 압축하는 것이다. 비슷한 다른 시스템의 압축률이 36분의 1인 것을 생각하면 놀라운 수치다.

해당 툴을 시험한 시애틀 워싱턴대학의 정보과학자 제빈 웨스트는 “이런 종류의 도구가 가까운 미래에 학술적 검색의 표준이 될 것이라 예상한다. 필요성에 비춰보자면 오히려 이렇게 오랜 시간이 걸렸다는 것이 놀라울 정도”라며 “아직 완벽하지는 않지만 확실히 옳은 방향으로 나아가는 단계”라고 말했다.

현재 해당 툴은 영어로 작성된 논문만 읽을 수 있다. 연구팀은 추후 다양한 언어를 지원할 예정이라고 밝혔다. 또 데모사이트를 개설해 누구나 자신들의 코드를 이용할 수 있도록 했다. (scitldr.apps.allenai.org)

데모사이트에서 에디터의 글도 요약해보았다

*다음은 위에까지의 내용을 파파고를 통해 영문으로 번역한 후 데모사이트에서 한 줄 요약을 얻어내 다시 한글로 번역한 결과다.

논문과 문헌 검토에 걸리는 시간을 단축하기 위해 극도의 압축을 제공하는 AI 기반 연구 지원 도구.

테크플러스 에디터 김다솜

tech-plus@naver.com​​

- Advertisement -

LEAVE A REPLY

Please enter your comment!
Please enter your name here

 




Related Stories