(출처: 테크고잉(TechGoing))
7월 18일(현지시간) 마이크로소프트가 인공지능(AI) 챗봇인 빙챗(BingChat)에 이미지 검색 기능을 출시한다고 밝혔다. 한 달 동안 테스트 되고 있던 ‘비주얼 서치(Visual Search)’ 기능이다. 이제 사용자들은 빙챗에 업로드한 이미지에 대한 결과를 요청할 수 있다.
마이크로소프트는 오픈AI(OpenAI)의 GPT-4 모델을 기반하는 빙챗에 누구나 이미지를 찍거나 업로드하고 웹에서 관련 이미지에 대한 결과를 얻을 수 있다고 설명했다. 빙챗의 ‘비주얼 서치’는 이미지의 맥락을 이해하고, 해석하고, 질문에 답변한다.
이에 대한 짤막한 예시도 함께 제공했다. 여행 중에 우연히 발견한 건물에 대한 정보가 궁금하다면 단순히 찍고 빙챗으로 검색하면 된다. 집에서 냉장고를 본 후 점심에 대한 아이디어를 얻고 싶은 사용자도 냉장고에 있는 재료를 촬영해서 빙챗에 물어볼 수 있다.
마이크로소프트 빙챗 이미지 검색 기능 (출처: future)
‘비주얼 서치’ 기능은 지난달 약 한 달 동안 테스트한 기능이었지만 이번에 정식 도입됐다. 지난달 미카일 파라킨(Mikhail Parakhin) 마이크로소프트 광고와 웹 서비스 책임자는 전체 마이크로소프트 사용자 중 약 5%만이 해당 기능을 사용하도록 배포했다고 밝힌 바 있다.
션 엔디콧(Sean Endicott) IT 매체 윈도우센트럴(WindowCentral)의 뉴스작가이자 앱 편집자가 직접 빙챗의 비주얼 서치 기능을 사용해본 후기를 전했다. 그 결과 빙챗은 이미지에 대한 모든 정보를 정확하게 파악하지는 못했다. 하지만 그는 대부분의 인공지능처럼 빙챗 비주얼 서치의 기능도 향상될 것이라고 덧붙였다.
마이크로소프트가 비주얼 서치 기능을 정식 도입한 것은 결국 구글의 인공지능 챗봇인 바드(Bard)의 영향을 받은 것으로 보인다. 최근 구글은 바드에 이미지 정보를 스스로 이해하고 답변하는 ‘이미지 프롬프트’ 기능을 추가했다. 해당 기능은 이미 기존 구글에 있던 구글렌즈 기능을 바드에 통합한 것이다. 사용자가 이미지를 등록하면 바드는 해당하는 이미지에 대한 정보를 답변해준다.
구글렌즈로 이미지 검색할 수 있는 구글 바드 (출처: 구글)
시각적인 이미지는 우리 삶에서 굉장히 중요한 부분으로 자리 잡고 있다. 이미지로 검색하는 기능 자체가 사실 새로운 것이 아니다. 이미 전부터 구글은 구글렌즈를 통해 찍거나 라이브러리에 있는 사진을 검색하는 기능을 제공해왔다. 마이크로소프트도 2018년부터 빙 서치(Bing Search)에서 이미지 검색 기능을 사용할 수 있게 제공했다.
하지만 이런 기능들이 챗봇에 도입되는 것은 또 다른 이야기다. 대부분의 챗봇들은 아직 텍스트에 기반한 명령 정도를 수행하는 데 그친다. 지난해 혜성처럼 등장한 후 가장 주목받는 인공지능 챗봇인 챗GPT도 아직 텍스트로만 답변을 수행한다. 앤트로픽(Anthropic)의 클로드(Claude)도 마찬가지. 이런 점을 미뤄볼 때 마이크로소프트와 구글은 다른 경쟁사들보다 앞서있는 편이다.
기업 간 인공지능 경쟁은 날이 갈수록 심화되고 있다. 마이크로소프트 뿐만 아니라 많은 기업들은 누구보다 진보된 인공지능을 개발하기 위해 치열하다. 그만큼 다양한 기업들이 인공지능 챗봇에도 많은 기능들을 앞다퉈 도입하고자 하고 있다.
생성형 인공지능 미드저니로 제작된 이미지 (출처: 아르스테크니카(Arstechnica))
텍스트 요청만 수행하던 인공지능 챗봇은 이미지를 인식하고 답변하는 기능으로 확장되고 있다. 그리고 곧 많은 기업들은 인공지능 챗봇에서 생성형 인공지능(Generative AI) 도구를 구현할 방법을 목표로 두고 있다. 대표적인 생성형 인공지능 도구에는 스태빌리티AI(StabilityAI)의 미드저니(Midjourney)가 있다. 생성형 인공지능은 단순히 이미지에 대한 정보를 제공하는 것에 그치지 않는다. 사용자가 명령어를 입력하면 생성형 인공지능은 원하는 이미지를 직접 만들어 제공한다.
올해 초 출시된 마이크로소프트의 빙챗은 다양한 기능들을 추가하며 빠르게 성장했다. 앞으로 빙챗 사용자들은 단순히 텍스트 검색에서 벗어나 비주얼 서치 기능을 통해 궁금한 이미지에 대한 심층적인 정보를 얻게 될 전망이다. 텍스트로만 질문에 한계를 느끼던 많은 사용자에게 유용할 기능이다. 해당 기능은 곧 데스크톱이나 모바일 빙 앱에 모두 제공될 예정이다. 마이크로소프트는 정확한 일자를 밝히지 않았다.
테크플러스 에디터 최현정
tech-plus@naver.com
댓글0