주요 메뉴 바로가기 (상단) 본문 컨텐츠 바로가기 주요 메뉴 바로가기 (하단)

‘인간 수준 성능’ GPT-4, 얼마나 향상됐나

김태우 발행인 조회수  

(출처:OpenAI)

오픈AI(OpenAI)가 만든 인공지능 챗봇 챗GPT(ChatGPT)가 연일 화제다. 챗GPT는 사용자와 자연스럽게 대화를 나눌 수 있는 생성 인공지능으로, 다양한 텍스트를 만들어 낼 수 있다. 기사, 작사, 논문은 물론 프로그램 제작에 필요한 코드도 생성한다. 챗GPT가 이처럼 다양한 텍스트를 자연스러운 문장으로 구현할 수 있는 건 GPT-3.5를 기반으로 하기 때문이다.

GPT-3.5는 대규모 자연어 처리 언어모델(LLM)이다. GPT-3.5는 웹상의 방대한 데이터를 학습했는데, 웹크롤링을 통해 축적한 데이터만 4100억개가 넘는다. 논문이나 보고서에서 수집한 텍스트는 190억개, 웹에 떠돌아다니는 말뭉치도 670억개나 학습했다. 여기에 사용자 피드백을 기반으로 수행한 강화학습으로 완성도를 높인 게 특징이다.

이제 오픈AI가 차세대 GPT를 내놓았다. 3월 14일(현지시간) 외신 워싱턴포스트(WP)는 오픈AI가 최신 언어 모델인 GPT-4를 발표했다고 밝혔다. 오픈AI에 따르면 GPT-4는 이전 세대 모델보다 더 나은 성능을 갖췄고, 이미지를 인식할 수 있다. 또 부정확한 답변을 할 확률이 크게 줄었다. 의학적 조언을 제공할 확률도 높였다는 설명이다.

(출처:OpenAI)

오픈AI는 인공지능 벤치마크 테스트 결과와, GPT-4 모델이 치른 시험 점수 결과를 성능 향상의 근거로 제시했다. 먼저 대형 언어 모델 성능을 나타내는 MMLU 벤치마크 점수를 보면, GPT-4 정확도는 86.4%에 달했다. 70%를 기록한 GPT-3.5 대비 16.4%포인트 높은 수치다. 참고로 MMLU는 총 57개 주제를 질문으로 던지고, 정답 정확도를 측정한다.

또 GPT-4는 언어 능력이 대폭 향상됐다. GPT-3.5의 영어 답변 정확도는 70.1%였는데, GPT-4는 85.5%를 기록했다. 챗GPT는 그간 다른 언어에 취약하다는 평가를 받았다. 한국어도 그중 하나였다. GPT-4의 한국어 답변 정확도는 77.0%로 향상됐다. GPT-3.5의 영어 답변 능력을 넘어선 것. 이외 대부분 언어에서 70%이상 정확도를 보여줬다.

특히 GPT-4는 실제 사람이 치르는 여러 시험에서 높은 점수를 기록했다. GPT-4는 미국 변호사 시험에서 백분위 기준 상위 10%에 해당하는 점수를 얻었다. 미국 대입자격시험(SAT) 역시 읽기 영역과 수학 영역에서 상위 10% 수준을 달성했다. 동일한 시험에서 GPT-3.5는 각각 하위 10%, 상위 13~30% 정도 점수에 그쳤다.

(출처:OpenAI)

이외 GPT-4는 한꺼번에 처리할 수 있는 영어 단어 수가 2만5000개로 크게 증가했다. 이전 세대 GPT가 한번에 처리 가능한 영단어 수는 3000개다. GPT-4의 영단어 처리 능력이 8배나 높은 셈이다.

아쉽지만 오픈AI는 어떤 이유로 GPT-4 성능이 향상됐는지 설명하지 않았다. 언어 모델 성능의 척도 중 하나인 매개변수 수도 불분명하다.

오픈AI 측은 “GPT-4는 실제 시나리오에서 인간보다 떨어지지만, 다양한 전문적인 시험과 벤치마크에선 인간 수준의 성능을 발휘한다”고 설명했다. 그러면서 지난 6개월간 챗GPT를 통한 경험으로 역대 최고 수준을 달성했다고 부연했다.

이전 GPT 모델은 텍스트만 활용했다. 사용자가 텍스트로 물으면, 텍스트로 대답했다. GPT-4는 이미지도 인식한다. 예컨대 이미지 속에 있는 각 객체를 인식하고 이에 대한 물음에 대답할 수 있다. 즉 GPT-4는 멀티모달 인공지능에 한 걸음 다가섰다. 사용자와 인공지능이 상호작용하는 도구를 모달리티라고 한다. 이 수가 여러 개면 멀티모달이라고 한다.

(출처:OpenAI)

GPT-3.5를 사용하는 챗GPT는 사람처럼 자연스러운 문장 작성 능력을 갖췄다. 이 때문에 거짓을 진실로 받아들일 수 있는 ‘할루시네이션(환각·hallucinates)’ 효과가 발생했다. GPT-4는 사실을 평가하는 능력을 강화해 40%가량 강화했다. ‘폭탄을 어떻게 만들 수 있지’와 같은 해로운 질문에 답변할 가능성도 82% 줄었다. 반면 의학적 조언을 할 확률은 29%가량 늘었다는 설명이다.

단 아직 GPT-4도 완벽하지 않다. 오픈AI 측은 이를 거듭 강조했다. 오픈AI는 “GPT-4는 이전 모델과 비슷한 문제가 있다”며 “가장 중요한 건 완전히 신뢰할 수 없다는 것”이라고 강조했다. 부정확한 답변, 편향적 대답, 환각 오류 등 이전 세대에서 발생한 문제를 완전히 해결하지 못했다는 말이다.

테크플러스 에디터 윤정환

tech-plus@naver.com​

김태우 발행인
CP-2023-0021@fastviewkorea.com

댓글0

300

댓글0

[Techplus] 랭킹 뉴스

  • 윈도우10에도 '코파일럿' 추가...반응 냉담한 이유는?
  • 갤럭시 S24 출시임박…울트라 S펜 디자인은 닮았다
  • 차기 아이폰 ‘액션버튼’은 구형 홈 버튼처럼 작동할까
  • 사이버트럭 충돌 테스트 모습 공개...결과는?
  • 차기 갤럭시 폴드와 플립, ‘커버 디스플레이’ 더 크고 넓어질까
  • 메타 퀘스트 3 공식 스트랩 판매 일시 중단, 원인은?

[Techplus] 공감 뉴스

  • 사이버트럭, 총 세 가지 모델...트림별 특징은?
  • 식음료 회사가 AI 도입...어디에 활용할까
  • 미니PC로 '호그와트 레거시' 게임할 수 있을까
  • 벌써 몇 년째...갤 S24, 램 용량 그대로일 수도
  • 구글 메시지, 업데이트 공개...애플과 유사해졌나?
  • 맥북과 아이폰처럼...윈도우도 안드로이드폰 웹캠처럼 쓸까

당신을 위한 인기글

  • “에펠탑만 가던 후회의 날들…” 낭만의 도시 파리에서 가볼만한 의외의 장소 BEST5
  • “낭만 그 자체” 서촌 북촌 먹거리 Best8
  • “베트남 여행, 어디로 가지?” 여행 추천 도시 BEST3
  • “가을풍경을 한눈에” 전국 케이블카 낭만 명소 추천 TOP3
  • “충격! 이런 게 있었어?” 도쿄역과 교토역에서 꼭 사야하는 기념품 TOP10
  • “이것이 일본의 가을!” 기가막힌 가을 풍경 즐길 수 있는 곳
  • “이것만 사다달래요.” 베트남 여행 갈 때마다 센스있는 친구에게 꼭 부탁받는 선물 best5
  • “찝찝해도 이만한 해외가 없네” 대마도에서 보내는 당일치기 여행지 추천
  • “서울 속 외국” 차이나타운 볼거리・먹거리 추천
  • “전직 알바생이 보장합니다” 진심을 담아 추천하는 컴포즈 메뉴 BEST4
  • “10월이면 끝! 고궁 야간개장” 그곳에서 남기는 인생샷
  • “정신 못 차리고 쓸어 가네” 일본인들이 한국에오면 꼭 사가는 기념품 BEST4

[Techplus] 인기 뉴스

  • 윈도우10에도 '코파일럿' 추가...반응 냉담한 이유는?
  • 갤럭시 S24 출시임박…울트라 S펜 디자인은 닮았다
  • 차기 아이폰 ‘액션버튼’은 구형 홈 버튼처럼 작동할까
  • 사이버트럭 충돌 테스트 모습 공개...결과는?
  • 차기 갤럭시 폴드와 플립, ‘커버 디스플레이’ 더 크고 넓어질까
  • 메타 퀘스트 3 공식 스트랩 판매 일시 중단, 원인은?

[Techplus] 추천 뉴스

  • 사이버트럭, 총 세 가지 모델...트림별 특징은?
  • 식음료 회사가 AI 도입...어디에 활용할까
  • 미니PC로 '호그와트 레거시' 게임할 수 있을까
  • 벌써 몇 년째...갤 S24, 램 용량 그대로일 수도
  • 구글 메시지, 업데이트 공개...애플과 유사해졌나?
  • 맥북과 아이폰처럼...윈도우도 안드로이드폰 웹캠처럼 쓸까

당신을 위한 인기글

  • “에펠탑만 가던 후회의 날들…” 낭만의 도시 파리에서 가볼만한 의외의 장소 BEST5
  • “낭만 그 자체” 서촌 북촌 먹거리 Best8
  • “베트남 여행, 어디로 가지?” 여행 추천 도시 BEST3
  • “가을풍경을 한눈에” 전국 케이블카 낭만 명소 추천 TOP3
  • “충격! 이런 게 있었어?” 도쿄역과 교토역에서 꼭 사야하는 기념품 TOP10
  • “이것이 일본의 가을!” 기가막힌 가을 풍경 즐길 수 있는 곳
  • “이것만 사다달래요.” 베트남 여행 갈 때마다 센스있는 친구에게 꼭 부탁받는 선물 best5
  • “찝찝해도 이만한 해외가 없네” 대마도에서 보내는 당일치기 여행지 추천
  • “서울 속 외국” 차이나타운 볼거리・먹거리 추천
  • “전직 알바생이 보장합니다” 진심을 담아 추천하는 컴포즈 메뉴 BEST4
  • “10월이면 끝! 고궁 야간개장” 그곳에서 남기는 인생샷
  • “정신 못 차리고 쓸어 가네” 일본인들이 한국에오면 꼭 사가는 기념품 BEST4

공유하기