주요 메뉴 바로가기 (상단) 본문 컨텐츠 바로가기 주요 메뉴 바로가기 (하단)

AI 몰라도 OK! 슥슥 그리면 이미지 만들어 준다

조회수  

스테이블 두들 (출처 : Stability AI)

전문 지식을 갖추지 않아도 손쉽게 AI로 이미지를 만드는 도구가 등장했다. AI 이미지 생성 모델로 유명한 스테이블 디퓨전(Stable Diffusion)의 개발사 ‘스태빌리티 AI(Stability AI)’가 7월 13일(현지시간) 간단한 스케치를 이미지로 바꾸는 서비스 ‘스테이블 두들(Stable Doodle)을 출시했다.

스테이블 두들은 최신 스테이블 디퓨전 모델을 사용하는 이미지 생성 도구다. 흰 배경에 사용자가 원하는 그림을 대강 그리고 ‘생성’ 버튼을 누르면 AI가 윤곽을 분석해 이미지를 완성한다.

■ 스테이블 디퓨전과 차이는? ‘매우 쉬워진 난이도’

기존에도 스테이블 디퓨전을 통해 이미지를 생성하는 게 가능했다. 원하는 이미지를 글로 묘사하면 내용을 분석해 자동으로 그려준다. 하지만 사용하기 어렵다는 게 단점이다.

스테이블 디퓨전은 PC에 설치하는 과정부터 막막하다. 일단 사전 준비를 위해 소프트웨어 개발자나 들어봤을 법한 ‘깃(Git)’, ‘파이썬(Python)’을 설치해야 한다. 일반 프로그램처럼 실행 파일(exe)로 설치하는 것도 아니다. 명령 프롬프트(CMD)를 열고 명령어를 입력해야 한다. 이렇게 스테이블 디퓨전을 설치한 뒤에는 자신이 원하는 이미지에 적합한 학습 모델을 구해 적용해야 한다.

스테이블 디퓨전으로 이미지를 생성하는 모습 (출처 : Stability AI)

이미지를 만드는 과정도 복잡하다. 만들고 싶은 이미지를 묘사하는 명령어(프롬프트)는 정해진 기준에서 따라 작성해야 한다. 제외하고 싶은 특징이 있다면 ‘네거티브 프롬프트(Negative prompt)’ 란에 입력한다. 실사화 정도를 조절하는 수치, 해상도에서부터 얼마나 많은 이미지를 생성할 것인지도 직접 지정한다. 조건들을 상세하게 입력할수록 마음에 드는 이미지를 빠르게 만들 수 있다. 하지만 설정값과 명령어 등 미리 공부해야 할 내용이 너무 많다.

스테이블 두들은 전문 지식을 요구하지 않는다. 그렇다고 그림을 잘 그려야 되는 것도 아니다. 마우스로 대강 그리면 나머지는 스테이블 두들이 알아서 처리해 준다. 만화가나 일러스트레이터가 사용할 법한 태블릿도 필요 없다.

스테이블 두들에도 명령어를 입력하는 칸은 있다. 여기에 원하는 이미지 스타일을 단어나 문장으로 묘사하면 된다. 하지만 꼭 입력할 필요는 없다. 적절한 명령어를 모르거나 여러 스타일을 적용해 보고 싶은 경우 ‘No Style’ 버튼을 누르면 된다.

사전 훈련된 스테이블 디퓨전 XL과 T2I-어댑터로 동작한다 (출처 : Stability AI)

스태빌리티 AI의 설명에 따르면 스테이블 두들은 자사의 스테이블 디퓨전 XL 이미지 생성 기술을 사용한다. 그리고 텐센트 ARC가 개발한 T2I-어댑터를 도입해 스케치한 내용을 분석하고 적절한 이미지를 산출한다. 기존 방법에서 사용자가 직접 명령어를 입력하는 과정을 T2I-어댑터가 대신하는 셈이다.

■ 홈페이지에서 써볼 수 있어…고급 기능은 ‘유료’

스테이블 두들은 클립드롭(ClipDrop) 사이트를 통해 사용할 수 있다. 클립드롭은 올해 3월 스태빌리티 AI가 AI 스타트업 Init ML과 함께 인수한 플랫폼이다.

명령어 : 언덕 위의 성, 겨울, ‘애니메이션’ 스타일 (출처 : Stability AI)

기본 기능은 무료다. 이미지를 하루 400장까지 생성할 수 있다. 대신 무료로 생성한 이미지에는 클립드롭 로고 모양 워터마크가 붙는다. 이미지 해상도는 최대 1024×1024로 제한된다. 클립드롭의 이미지 업스케일러 기능을 사용하면 최대 2배(2048×2048)로 늘리는 게 가능하다.

유료 버전에서는 이미지 생성 제한이 하루 1500장으로 늘어난다. 해상도 제한이 해제되며, 이미지 업스케일러로 확대 가능한 배율은 최대 16배까지 늘어난다. 비용은 월 구독 요금제 기준으로 한 달에 1200원이다.

■ 스테이블 디퓨전 어렵게 느꼈다면 ‘두들’ 추천해

스테이블 두들의 장점은 쉬운 난이도다. 기존 방식보다 간단하게 재미있는 이미지를 만드는 게 가능하다. 스테이블 디퓨전처럼 상세한 설정은 불가능하다 보니 원하는 이미지가 바로 나오지 않을 수 있다. 이 경우 대상을 설명하거나 분위기, 그림체를 지정하는 명령어를 입력하면 좋다.

스테이블 디퓨전보다 자유도가 떨어지다 보니 수요는 적을 듯하다. 하지만 재미 삼아 가볍게 쓰는 용도에는 스테이블 두들이 훨씬 적합하다. 사용이 간단하고, 소프트웨어를 사전에 설치하지 않아도 되기 때문이다. 고화질 이미지를 만들고 싶다면 유료 버전을 사용해야 하지만 크게 부담되는 가격은 아니다.

테크플러스 에디터 이병찬

tech-plus@naver.com​

CP-2023-0021@fastviewkorea.com

댓글0

300

댓글0

[Techplus] 랭킹 뉴스

  • 낫싱이 선보인 첫 스마트워치 강점은 '가격’
  • 테크노 ‘팬텀 V 플립’, 갤럭시 Z5 절반 가격?
  • 스포티파이 ‘잼(Jam)’, 좋아하는 음원 실시간으로 동시 청취해봐
  • 구글 ‘픽셀 8 시리즈’ 카메라, 예상되는 다양한 기능은?
  • 게티 이미지, AI 이미지 생성 도구 출시…저작권은?
  • ‘도조 슈퍼컴 D1 칩 생산 늘린다’…테슬라, TSMC와 파트너십 확대

[Techplus] 공감 뉴스

  • 아이폰15 "문제 많네"...소비자 고민 더한다
  • 아이폰 15 프로 맥스, 10배 광학 줌 지원않는 이유는?
  • 요가도 해? 성장한 테슬라의 휴머노이드, 새로운 영상 공개
  • [용어로 읽는 IT] - 어떻게 줄였을까? 1.5mm 베젤 선보인 아이폰 15 프로
  • 소문과 다르네…취약한 아이폰 15 프로 모델 ‘내구성’
  • '저렴한 구독료 이젠 없다'…유튜브, 프리미엄 라이트 폐지

[Techplus] 인기 뉴스

  • 낫싱이 선보인 첫 스마트워치 강점은 '가격’
  • 테크노 ‘팬텀 V 플립’, 갤럭시 Z5 절반 가격?
  • 스포티파이 ‘잼(Jam)’, 좋아하는 음원 실시간으로 동시 청취해봐
  • 구글 ‘픽셀 8 시리즈’ 카메라, 예상되는 다양한 기능은?
  • 게티 이미지, AI 이미지 생성 도구 출시…저작권은?
  • ‘도조 슈퍼컴 D1 칩 생산 늘린다’…테슬라, TSMC와 파트너십 확대

[Techplus] 추천 뉴스

  • 아이폰15 "문제 많네"...소비자 고민 더한다
  • 아이폰 15 프로 맥스, 10배 광학 줌 지원않는 이유는?
  • 요가도 해? 성장한 테슬라의 휴머노이드, 새로운 영상 공개
  • [용어로 읽는 IT] - 어떻게 줄였을까? 1.5mm 베젤 선보인 아이폰 15 프로
  • 소문과 다르네…취약한 아이폰 15 프로 모델 ‘내구성’
  • '저렴한 구독료 이젠 없다'…유튜브, 프리미엄 라이트 폐지

공유하기