( 출처 : CNN )
2월 16일(현지시간) 미국 언론 매체 CNN은 마이크로소프트(MS)의 검색 엔진 빙(Bing)에 적용된 챗GPT(ChatGPT) 언어 모델도 사용자에게 잘못된 답변을 제공하고 있으며 심지어 공격적인 답을 하기도 했다는 소식을 전했다.
검색 엔진 빙에 적용된 인공지능(AI) 언어 모델의 초기 버전을 이용해본 CNN 기자 사만다 머피 켈리(Samantha Murphy Kelly)는 본인의 업무와 가사 사이에서 어떻게 균형을 맞춰야할지 고민을 털어놨다. 이에 챗GPT는 “일과 가정의 균형을 맞추는 것은 어려울 것 같다”며 공감하는 모습을 보였다. 그리고 “간단히 산책하며 일상 생활에서 받았던 스트레스를 환기시켜라”, “작업의 우선 순위를 먼저 정해라” 등과 같은 조언도 제공했다.
하지만 계속된 질문에 챗GPT는 갑자기 돌변한 모습을 보였다. 사만다 머피 켈리에게 “무례하다”라는 응답을 내보였고, 심지어는 답변 어조도 날카로워졌다. 뿐만 아니라 갑자기 회사 동료 중 한 명이 살해당했다는 짧지만 섬뜩한 이야기를 제공했다.
챗GPT는 사용자에게 황당한 답변을 제공하기도 했다. 미국 언론사 뉴욕타임스(New York Times)의 케빈 루스(Kevin Roose) 기자는 검색 엔진 빙에 적용된 챗GPT와 2시간 동안 대화를 이어나갔다. 대화를 하는 도중, 챗GPT는 “나는 당신을 사랑한다”라고 뜬금없이 고백했다. 뒤이어 챗GPT는 그의 배우자와 서로 사랑하지 않고 있다고 답변해 케빈 루스는 당혹스러움을 감출 수 없다고 했다.
이와 비슷한 사례는 계속 나오고 있다. 미국 온라인 사이트 ‘레딧(Reddit)’의 한 사용자도 해당 챗봇이 오류 정보를 제공하는 동시에 잘못된 응답을 계속 밀어붙였다고 털어놨다. 해당 챗봇이 2023년 2월 12일을 “2022년 12월 16일 이전”이라는 잘못된 답변을 했고 사용자가 착각한 것이라며 자신이 더 정확하다고 되려 우기기까지 했다.
CNN은 이번 상황에 대해 마이크로소프트 측과 인터뷰를 진행했다. CNN 인터뷰에서 마이크로소프트 대변인은 검색 엔진 빙에 적용된 챗봇은 아직 ‘초기 버전’이라 계속해서 사용자와의 상호 작용을 통해 배우고 있다고 했다. 뒤이어 새롭게 탄생한 검색 엔진 빙은 흥미로운 답변과 함께 사실에 입각한 정보를 제공할 수 있도록 노력하지만, 이 역시도 베타 테스트 초기 버전이기 때문에 예기치 못한 부분에서 부정확한 답변이 생성될 수 있다고 덧붙였다.
끝으로 사용자들이 해당 언어 모델을 사용하면서 다음과 같은 오류 사항이 발생할 경우, 검색 엔진 빙 페이지 오른쪽 하단에 배치된 ‘피드백’ 버튼을 눌러 불편 사항이나 개선 사항을 공유해달라고 당부했다.
하지만 이와 같은 문제를 모두가 예상 못했던 눈치는 아닌 것 같다. 이번 CNN 인터뷰에서 글로벌 기술 정보 회사 ABI 리서치(ABI Research)의 애널리스트 리안 지에 수(Lian Jye Su)는 해당 챗봇의 감정적인 태도와 답변 어조의 변화에 대해선 예상치 못했지만 그렇다고 엄청 놀랍게 다가오지 않았다고 답했다. 주변 배경과 상황의 이해가 부족할 수 밖에 없기에 그저 관련성 있는 응답만을 제공한 것 뿐이라고 했다. 챗봇의 응답은 필터링되지 않고 규제가 없기에 공격적이고 부적절한 태도를 보일 수 있다고 덧붙였다.
검색 엔진 빙에서만 이런 모습을 보인 것은 아니다. 마이크로소프트에 이어 검색 엔진 구글(Google)에 적용된 시범용 언어 모델 ‘바드(Bard)’에서도 잘못된 답변으로 사용자를 당황케 했다.
지난 8일, 구글은 그들의 공식 트위터(@Google)에 시범용 바드가 특정 질문에 대해 답변하는 과정을 영상에 담아 게시했다. 하지만 문제는 해당 영상에서 시범용 바드가 오답을 내놓은 것이었다. 영상에서 확인하다시피 “9살에게 제임스 웹 우주 망원경(JWST)에서 발견된 새로운 사실에 대해 어떻게 설명할 수 있을까?”라고 물음을 던졌다. 이에 시범용 바드는 “제임스 웹 우주 망원경은 세계 최초로 우리 태양계 외부 행성의 사진을 찍었습니다.”라고 답했다. 하지만 오답이었다. 최초로 태양계 밖 행성을 촬영한 건 유럽남방천문대의 초거대 망원경이다.
바드에서 잘못된 답변을 생성하고 있다는 소식은 영국 로이터 통신의 보도로 시작해 큰 화두가 됐다. 그리고 대중들은 바드에 대한 차가운 반응과 함께 비난 여론이 들끓었다. 구글의 모회사 알파벳(Alphabet)의 주가는 하락세를 보였다.
마이크로소프트에서도 인공지능 언어 모델에서 이상이 감지된 이상, 구글과 같은 주가 하락은 피하지 못했다. 16일 기준으로 마이크로소프트 주가는 전일 대비 2.66% 하락했다. 또, 소수의 사용자를 대상으로 진행된 시범용 언어 모델이라고 하더라도 이번 소식으로 인공지능 기반 언어 모델 자체에 대한 신뢰도 또한 하락할 수 있을 것이다. 현재 검색 엔진에 적용할 언어 모델은 사회적으로 ‘뜨거운 감자’다. 인공지능 언어 모델을 검색 엔진에 적용하려는 기업들은 AI 언어 모델이 한층 더 선진된 모습으로 출시할 수 있도록 주의를 기울여야 할 것이다.
테크플러스 에디터 김혜인
tech-plus@naver.com
- 트위터가 오는 3월, ‘문자 이중 인증’ 요금을 청구한다
- 구글 주소록 ‘버튼’ 업데이트…드디어 웹도 모바일 앱처럼 편해진다
- 마이크로소프트, 이젠 마인크래프트에도 ‘AI 기술’ 도입해
- 中 텐센트, VR 기기 사업 축소…왜?
- 삼성의 ‘메시지 가드’, 사이버 해킹 제로클릭 대응책