인공지능 챗봇 ‘챗GPT’ (출처 : OpenAI)
챗GPT(ChatGPT)는 미국의 인공지능 개발사 오픈AI(OpenAI)가 개발한 대화형 인공지능 챗봇이다. 다른 사람과 채팅하는 것처럼 요청 사항이나 질문을 글로 입력하면 이를 분석해 적절한 답변을 내놓는다.
따라서 챗GPT는 글을 읽고 이해하는 챗봇이라고 볼 수 있다. 그런데 조만간 챗GPT가 사람처럼 보고 들을 뿐만 아니라 말까지 할 수 있을 것이라는 소식이 전해졌다.
오픈AI는 9월 25일(현지시간) 챗GPT에 음성과 이미지 기능을 도입하겠다고 공식 블로그를 통해 밝혔다. 텍스트 입력 대신 음성으로 대화를 나눌 수 있고 이미지나 사진으로 요청 사항을 전달하는 것도 가능해질 예정이다.
■ 글로만 대화 나누던 챗GPT와 ‘말’로 이야기한다
챗GPT 음성 기능으로 제공받을 수 있는 정보나 답변은 기존 챗봇 방식과 동일하다. 정보를 전하는 수단이 글이냐 말이냐의 차이다. 오픈AI는 이야기, 레시피, 연설, 시, 설명 등 5가지 분야에서 챗GPT가 음성으로 답변을 제시하는 모습을 시연했다.
챗GPT의 목소리는 5가지 중 선택할 수 있다. 여기에는 모두 실제로 존재하는 성우의 목소리를 사용했다. 오픈AI는 다양한 답변을 실제 성우의 목소리로 재생하기 위해, 샘플 목소리를 몇 초 분량만 준비해도 똑같은 목소리로 말할 수 있는 새로운 텍스트-음성 변환 모델을 도입했다고 밝혔다. 또한 오픈소스 음성인식 시스템 ‘위스퍼(Whisper)’를 도입해 사용자가 말한 내용을 챗GPT가 인식할 수 있도록 텍스트로 변환한다고 덧붙였다.
하지만 음성을 이용한 서비스는 이미 많다. 삼성 빅스비, 구글 어시스턴트, 애플 시리 등 웬만한 음성 비서 서비스가 유사한 기능을 지원한다. 챗GPT가 기존 서비스와 경쟁하려면 더 유익한 기능을 제공하거나 편의성에 신경 써야 할 테다. 예를 들어 기존 서비스는 사용자가 음성으로 호출하는 게 가능하지만, 챗GPT 음성 기능은 모바일 앱을 직접 실행해야 한다.
■ 챗GPT, 사용자가 보여준 사진 보고 조언까지?
오픈AI는 챗GPT에 이미지 기능이 도입되면 사용자가 업로드한 이미지나 사진을 보고 분석할 수 있을 것이라고 알렸다. 이미지를 인식하는 기능은 구글 렌즈나 삼성 빅스비 비전과 비슷하다. 챗GPT는 사진을 보고 도움이 필요한 상황을 분석해 적절한 해결법을 제시하는 게 가능하다. 예를 들어 제품이 고장 난 원인을 분석하거나, 냉장고에 남은 식재료를 보고 가능한 요리법을 찾거나, 복잡한 그래프를 분석해 업무에 활용할 수 있다.
챗GPT에게 사진을 보여주며 문제를 해결하는 과정 (출처 : OpenAI)
사진이 복잡하다면 그리기 도구를 통해 챗GPT가 봐야 할 부분을 강조할 수도 있다. 오픈AI가 공개한 이미지 기능 활용 사례에서, 사용자가 자전거 사진을 찍어 올리면서 안장을 낮추는 방법을 묻자 챗GPT는 레버를 풀고 안장을 내리라고 조언했다.
이어서 사용자는 안장 아랫부분 사진을 다시 찍었다. 레버로 추정되는 부분에 그리기 도구로 원을 그린 다음 이 부분이 레버가 맞냐고 다시 물어봤다. 그러자 챗GPT는 사용자의 자전거 안장에는 레버가 아닌 볼트 방식이 사용됐다며, 도구를 이용해 나사를 풀어야 높이 조절이 가능하다고 답변했다. 이후 공구 상자 사진을 찍어 보여주자 그중에서 4mm 드라이버를 찾으라는 조언까지 덧붙였다.
오픈AI는 챗GPT의 이미지 인식 기능이 사진, 스크린샷, 텍스트와 이미지가 모두 포함된 문서 등 다방면에 활용할 수 있다고 주장했다. 단, 이미지 기능으로 특정 사람에 대한 정보를 검색하는 건 불가능하다. 오픈AI는 개인 정보를 보호하기 위해 사람을 분석하고 직접적으로 기술하는 기능을 제한했다고 밝혔다.
■ 새 기능은 유료 구독자에게 제공…챗GPT 활용도 늘어날 전망
공지에 따르면 이번에 공개한 음성과 이미지 기능은 2주에 걸쳐 배포될 예정이다. 챗GPT ‘플러스’ 혹은 ‘엔터프라이즈’ 유료 요금제를 구독하는 사용자라면 음성과 이미지 기능을 사용할 수 있다. 음성 기능은 안드로이드와 iOS 운영체제가 탑재된 기기에서 사용 가능하며, 이미지 기능은 모든 플랫폼에서 쓸 수 있다.
오픈AI는 음성과 이미지 기능을 통해 일상생활에서 챗GPT를 더 다양하게 활용할 수 있다고 주장했다. 여행하면서 유명 관광지의 랜드마크 사진을 찍은 다음 챗GPT에게 자세한 설명을 듣거나, 시험지 사진을 찍고 궁금한 문제에 동그라미를 그린 다음 챗GPT에게 해설을 부탁하는 식으로 활용 가능하다.
테크플러스 에디터 이병찬
tech-plus@naver.com
댓글0