최근에 구글에서 엄청난 AI 이미지 합성 도구를 선보였습니다. 바로 구글 위스크(Whisk)라는 제미나이(Gemini) 와 이마젠3(Imagen3)의 기능을 결합한 도구인데요. 본 포스팅에서는 위스크 사용 방법 및 후기 그리고 주의사항까지 다루어보도록 하겠습니다.
구글 위스크(Whisk) AI는 무엇일까?
구글에서 출시한 위스크(Whisk) AI는 구글 랩스(Google Labs)에서 실험 중인 이미지 생성 및 합성 서비스로 현재 구글 로그인만으로 누구나 자유롭게 무료로 사용하실 수 있는 서비스입니다.
기존에 구글랩스에서 출시한 이미지 생성 AI인 이미지FX와는 조금 다르게 피사체/스타일/장면에 해당하는 이미지를 첨부하거나 프롬프트로 이미지를 생성 및 조합하여 하나의 이미지를 새로 생성할 수 있습니다.
역시 구글이라는 말이 나올만큼 정말 혁신적인 서비스로, 이제 더 이상 포토샵도 필요 없다는 말이 나올 정도로 극찬을 받고 있는데요. 본 포스티에서는 간단하게 위스크 사용법과 생성 예시를 소개해드리고자 합니다.
구글 위스크 사진 합성 전 준비사항
네이버나 구글에 구글 위스크(https://labs.google/fx/ko/tools/whisk)를 검색하여 최상단에 있는 구글랩스 홈페이지로 들어가신 후 간단히 구글 계정으로 로그인 후 무료로 사용하실 수 있는데요.
첫 화면으로 들어가면 위와 같은 화면이 뜨게 되며, 구글 위스크를 이용하기 위해서 [처음부터 새로 시작]을 눌러주시면 이제 원하는 이미지를 생성, 조합하여 합성하실 수 있습니다.
저는 예시를 들기 위해 미리 이미지FX에서 이미지 두 장을 생성해서 진행하였는데요. 챗GPT에게 원하는 이미지에 맞는 프롬프트(명령어)를 달라고 하여 인형 재질의 고양이, 시바견의 프롬프트를 부탁했습니다.
참고로 이미지FX도 구글랩스에서 실험 중인 무료 이미지 생성 도구로 이마진3라는 모델을 사용 하는 도구인데요. 위와 같이 영어로 된 프롬프트를 입력하고 사이즈를 선택 후 만들기를 하면 4장의 사진을 만들어 줍니다.
저는 위 이미지 중 맘에 들은 사진 한 장씩 총 두 장을 다운 받았고, 이제 이걸 이용해서 구글 위스크에서 새로운 사진을 조합해서 합성 사진(?)을 만들어 보도록 하겠습니다.
물론 반드시 사전에 이미지가 필요한 것은 아니고 위스크에서도 직접 프롬프트를 생성해서 이미지를 생성할 수도 있으나, 좀 더 원하는 결과물에 잘 도달하기 위해서 이렇게 진행하였으니 참고하시기 바랍니다.
구글 위스크에는 크게 피사체와 장면 스타일 총 3가지 구성 요소를 조합할 수 있게 세팅 되어 있습니다. 저처럼 원하는 이미지를 직접 첨부할 수도 있고, 프롬프트로 바로 이미지를 생성하여 조합할 수도 있는데요.
[피사체]는 말 그대로 메인이 되는 인물/사물 등의 개체(대상)를 뜻하고, [장면]은 생성하고자 하는 배경을, [스타일]은 생성하고자 하는 이미지의 느낌이나 포인트라고 이해하시면 될 것 같습니다.
구글 위스크(Whisk) 이미지 합성하기
각 구성 요소는 두 가지 이상도 첨부가 가능하며, 저 같은 경우는 아까 생성한 인형 두 개를 피사체로 하여, 장면 및 스타일은 구글 위스크에서 기본으로 제공하는 것 중 맘에 드는 것을 선택하여 진행하였습니다.
별도의 프롬프트는 입력하지 않았고, 첫 번째 줄의 결과 이미지는 시바견 인형 피사체에 장면 이미지와 도시락 느낌의 스타일을 적용하여 생성하였고, 두 번째 줄은 두 개의 피사체와 도시락 스타일을 적용하여 생성해보았습니다.
결과물은 첫 번째는 시바견 모양의 메인 음식 등이 식탁을 위에서 내려보는 장면에 여러 사람들이 식사를 준비 중인 모습이 나왔고, 두 번 째는 시바견과 고양이 모양의 귀여운 도시락 스타일의 이미지가 생성되었습니다. 특히 두번째 결과물이 너무 퀄리티가 좋아서 놀랐네요.
혹시 사람도 합성을 잘 해줄까 해서 새롭게 이미지 조합을 해보았는데요. 역시나 이미지FX에서 생성한 20대 중반미모의 여성과 아까 만든 고양이 인형을 피사체로 하여, 길거리 모델 사진을 장면으로, 스타일은 피사체 이미지의 느낌이 좋아 같은 사진을 사용해보았습니다.
이번에는 프롬프트[Full body huging a doll one hand smile another hand take a pose as V]도 입력해보았는데요. 제가 원했던 이미지는 피사체가 전신이 나오고 한 손으로는 인형을 안고 있고 한 손으로는 브이를 하는 사진이었습니다.
아쉽게도 첨부한 이미지가 상반신만 있어서 그런지 전신 이미지는 출력하지 못했지만 첨부한 장면 구도와 이미지의 분위기를 그대로 연출하고, 한 손에는 인형을, 한 손에는 브이를 하는 20대 중반 여성의 사진이 잘 생성되었습니다.
위스크 이용 시 주의 및 참고사항
어떠신가요? 잘만 이용하면 정말 포토샵이 필요 없을 정도로 유용한 도구 아닌가요? 일단 저는 간단히 결과물을 보여 드리기 위해 중간에 생략된 내용들도 있어서 끝으로 위스크 이용 시 주의 및 참고 사항을 안내해드리고 마치려고 합니다.
인물 사진을 합성하려고 할 때 첨부된 파일이 아무리 한국 여성이어도 이미지 생성을 하면 외국인이 나오는 경우가 99%인데요. 구글의 정책 때문인지는 몰라도 생성된 결과물의 프롬프트를 보면 Korean young women이 아닌 그냥 Young Women으로 되어 있는 것을 확인 하실 수 있을 겁니다.
구글 위스크는 생성된 이미지를 수정할 수 있는 기능이 있는데, 이 때 해당 이미지 프롬프트 보기를 하여 Korean이라고 내용을 추가하여 수정 및 재생성하면 위 예시처럼 원하는 이미지에 가까운 사진이 생성되니 참고하시기 바랍니다.
아마도 위스크 작동 방식이 첨부한 파일을 구글AI가 이미지를 스캔하고 판독하여 프롬프트로 변환하고, 해당 프롬프트들을 결합하여 하나의 새로운 프롬프트를 재생성하여 이미지를 만들어주는 방식이어서 발생하는 문제인 거 같습니다.
그리고 생성된 이미지는 상업적 사용이 가능하지만, 구글 정책 상 특정 카테고리 콘텐츠 생성(폭력, 음란물, 지식재산권 침해 등)은 불가능 하며, 아동이 포함되거나 유명인이 포함된 이미지 역시 생성이 불가능합니다.
하지만 이 또한 AI 도구의 허점이 있어 이를 프롬프트를 우회하는 방식 등으로 악용하여 억지로 생성할 수도 있는데요. 이러한 이미지를 사용하여 생기는 법적 책임은 절대 자유롭지 못하기 때문에 주의하시기 바랍니다.
마치며
이상으로 구글랩스에서 선보인 이미지 합성 AI 도구인 구글 위스크(Whisk)의 실 사용 예시 및 후기와 주의사항 등에 대해서 알아보았습니다. 이것 저것 결과물을 만들어보시면서 연습해보시면 정말 그 활용도가 엄청날 거 같다고 생각하니 반드시 한번 사용해보시길 추천 드립니다.