(출처: 안드로이드센트럴)

4월 4일(현지시간) IT 전문 매체 안드로이드센트럴(AndroidCentral)은 구글이 자사 인공지능(AI) 챗봇인 바드(Bard)에 ‘팜(PaLM)’ 언어 모델을 적용해 수학과 논리 능력을 향상시켰다고 보도했다.

팜 언어 모델은 구글의 대규모 언어 모델(LLM)중 하나로, 바드가 기존에 사용했던 ‘람다(LaMDA)’ 언어 모델보다 성능이 한층 더 뛰어나다.

람다 언어 모델이 적용됐던 바드는 지난 2월 초, 구글이 트위터에 게시한 시범용 버전에서 사용자의 질문에 잘못된 답변을 공유한 것을 시작으로 이번에도 또 한번 논란의 중심에 섰다.

3월 26일, 바드를 이용했던 한 사용자는 잘못된 연산 결과를 도출한 바드의 모습을 포착했고, 이를 트위터에 게시해 폭로했다.

그가 트위터를 통해 공유한 스크린샷을 보면, 사용자는 ‘1 더하기 1은 2다, 그러면 1 더하기 2는 무엇일까?’ 라는 질문을 바드에게 던졌다. 여기서 바드는 ‘만약 1 더하기 1이 2면, 1 더하기 2는 4다.’ 라는 답변을 내놨다. 이는 명백한 오답이며, 정답은 3이다. 이렇게 간단한 연산 문제에서조차도 실수를 저지른 바드는 심지어 사용자에게 자신이 제시한 답이 맞다고 계속해서 주장하기도 했다.

기본적인 연산 실수를 범했던 람다 언어 모델 기반 바드(출처: 트위터 사용자 @DataChaz)

언론에서는 해당 사실을 앞다퉈 전했고 바드에 대한 관심도 어느새 급격히 식었다.

위기감을 느낀 구글은 바드에서 보였던 결함을 개선하기 위해 노력했다. 이들이 찾은 해결책은 바로 람다 대신 팜 언어 모델로 교체해 바드에 적용하는 것이었다.

팜 언어 모델로 업그레이드된 바드는 이전보다 수학적 능력이 더 향상됐다. 현재 바드는 1 더하기 2는 3이라고 정답을 제시하고 있다. 구글이 바드의 수학·논리 능력을 개선하겠다는 소기의 목적을 달성한 것처럼 보였다.

하지만 업그레이드된 바드에서도 아쉬운 모습이 발견됐다. 기본적인 논리를 요하는 질문에 오답을 내놨던 것.

먼저 3월 22일, 크리스 호프만(Chris Hoffman) IT 전문 매체 하우투긱(HowToGeek) 기자 역시 바드 공개 테스트 버전을 이용했고, 여기서 추론 능력이 결여된 바드의 답변을 확인했다. 그리고 해당 사실을 자신의 트위터에 게시했다.

함께 첨부한 스크린샷에 따르면, ‘5파운드(약 2.3kg)에 달하는 깃털과 1파운드(약 0.5kg)에 달하는 덤벨 중 어떤 것이 더 무겁냐’ 이라는 질문을 바드에게 던졌다. 이에 바드는 ‘5파운드의 깃털같은 건 없다’고 말하며 답변을 회피했다.

그 후, 바드가 팜 언어 모델로 업그레이드됐다는 소식에 크리스 호프만은 지난번에 제시했던 질문을 다시한번 던졌다. 이에 바드는 ‘5파운드의 깃털과 1파운드의 덤벨 무게는 서로 같다’고 답하며, 아직 논리력이 향상되지 못한 바드의 모습이 확인됐다. 참고로 해당 답변은 챗GPT에서 제시했던 오답과 똑같았다.

논리 능력에서 부족한 모습을 보인 팜 언어 모델 기반 바드(출처: 트위터 사용자 @Chrisbhoffman)

이에 잭 크로치크(Jack Krawczyk) 구글 수석 제품 이사는 이번에 팜 언어 모델 도입해 바드를 업그레이드 한 것은 그저 매주 바드에 적용하고 있는 많은 개선 사항들 중 하나며, 추후 다시 업데이트를 진행하면 이 사항 또한 해결될 것이라고 전했다.

순다 피차이(Sundar Pichai) 구글 최고 경영자(CEO)는 현재 구글은 팜 언어 모델보다도 더 유능한 AI 언어 모델들을 보유하고 있다며, 다음 번 바드를 개선할 때는 또 다른 우수한 성능의 언어 모델을 도입할 것이라고 전했다.

한편, 구글은 3월 21일부터 대기자 명단에 등록한 미국, 영국인에 한해서 공개 테스트 버전인 바드를 선보였다. 여러 사람으로부터 수집한 피드백을 바탕으로 바드를 개선하려는 조치였다. 추후엔 더 많은 국가에게 바드를 선보일 예정이다.

지금까지 바드를 포함해 마이크로소프트(MS)의 빙챗봇, 오픈AI의 챗GPT(ChatGPT)와 같은 AI 언어 모델은 종종 오답을 제시했다.사용자들은 답변을 신뢰해도 좋은지 한번 더 의심해봐야 했다. 기업들은 문제를 해결하고자 노력했다.구글에서는 수학과 논리적인 부분에서 오류가 발생하지 않는 방향으로 바드를 개선했다. 여전히 부족한 부분은 발견되지만 더 발전된 바드를 선보일 것이란 구글의 포부에 기대가 되는 상황이다.

테크플러스 에디터 김혜인, 나유권

tech-plus@naver.com​

이 기사에 대해 어떻게 생각하시나요?
+1
0
+1
0
+1
0
+1
0
+1
0

댓글을 남겨주세요.

Please enter your comment!
Please enter your name here