- ※ ‘진짜임? 해볼게요’는 기자가 요즘 화제인 현상, 공간, 먹거리부터 트렌드까지 직접 경험하고 진짜인지 확인하는 리얼 체험기다.
인공지능(AI) 이미지 생성 모델 ‘나노바나나’가 만들어낸 이미지. 이재명 대통령과 도널드 트럼프 미국 대통령이 함께 컴퓨터 게임을 하는 모습이다. 나노바나나 생성 이미지
이번엔 8월 21일 방한한 빌 게이츠 게이츠재단 이사장의 사진을 사용해봤다. 금세 보도사진 같은 이미지가 만들어졌다. 조금만 더 다듬는다면 가짜 뉴스로 오해받을 만한 완성도였다.
최근 소셜네트워크서비스(SNS)와 온라인 커뮤니티를 중심으로 나노바나나에 대한 관심이 뜨겁다. X(옛 트위터)에는 “(생성한 이미지 수준이) 말도 안 되게 현실적이다(It’s insanely real)” “결과가 충격적이었다(The results were shocking)” 같은 극찬이 이어진다.
기자는 나노바나나의 인물 묘사력, 자연스러운 합성 능력 등을 확인하고자 여러 시도를 해봤다. 언어도 한국어와 영어 두 가지를 사용했다. 그 결과 “한미 정상이 함께 게임하는 모습을 만들어 달라”는 요청의 경우 한국어를 사용할 때 훨씬 완성도 높은 결과물이 나왔다.
언어에 따라 이미지 완성도 차이
요즘 누리꾼 사이에서 화제인 피겨 이미지 생성은 조금 달랐다. 넷플릭스 애니메이션 ‘케이팝 데몬 헌터스’(케데헌)에 등장하는 K팝 그룹 ‘헌트릭스’ 멤버들 이미지를 올리고 영어로 “Create a hyper-realistic photo of a collective figure placed on a computer desk, with its packaging box visible in the background(컴퓨터 책상 위에 놓인 피겨를 초현실적인 사진으로 만들고, 뒤편에는 포장 상자가 보이게 해줘)”라고 입력하자 약 16초 만에 그럴 듯한 결과물이 나왔다. 반면 같은 요청을 한국어로 바꿔 시도했을 때는 세 차례를 거듭 주문해도 원하는 이미지가 나오지 않았다.어떤 언어와 프롬프트 조합이 잘 작동할지는 예측하기 어려웠지만, 나노바나나가 인물 외형을 정확히 유지한 채 원하는 장면을 자연스럽게 만들어내는 능력을 가진 것은 분명해 보였다.
기자는 성능 차이를 확인하고자 이미지·영상 생성 AI로 유명한 ‘미드저니’와 오픈AI의 ‘달리(DALL·E)’를 각각 사용해봤다.
미드저니에 이 대통령과 빌 게이츠 이사장 사진을 올리고 “두 사람이 컴퓨터 게임을 하는 장면을 만들어줘”라고 입력하자 요청 내용과 전혀 다른 남녀 커플 이미지가 나왔다. 같은 요청을 영어로 시도하자 이번에는 이 대통령이나 빌 게이츠 이사장과 전혀 닮지 않은 외국인 남성 둘이 등장했다. 월 10달러(약 1만3800원)를 결제해야 쓸 수 있는 유료 모델인데도 결과물이 기대에 못 미쳤다. 반면 ‘헌트릭스 피겨 제작’ 요청의 결과물은 실제인물처럼 보였다.
‘미드저니’(왼쪽)와 ‘달리’에 이재명 대통령과 빌 게이츠 이사장 사진을 넣고 “두 사람이 컴퓨터 게임을 하는 장면을 만들어줘”라고 입력하자 각각 생성된 이미지. 미드저니 생성 이미지·달리 생성 이미지
구글이 선보인 AI 모델이라고?
달리는 기자가 월 20달러(약 2만7600원)를 내고 구독 중인 챗GPT를 통해 사용했다. 참고로 챗GPT 무료 가입자도 달리를 이용할 수 있다. 결과물을 보면 실존 인물 합성 요구의 경우 얼굴이 비정상적으로 크거나 전체 비율이 어색한 이미지가 많이 생성됐다. 피겨 이미지 요청 때도 헌트릭스 멤버 3명 중 1명만 인식하는 한계를 드러냈다. 결과적으로 나노바나나가 실사처럼 자연스러운 인물 합성, 장면 기억, 배경 변경 정확도 등에서 가장 뛰어난 결과를 보여줬다. 현재 무료인 것도 강점이다.원하는 이미지를 실사처럼 만드는 이 AI 모델을 누가 만들었는지는 그간 알려지지 않았다. 다만 업계에 그 주인공이 구글일 것이라는 이야기만 파다했다. 8월 20일(이하 현지 시간) 구글 제미나이 API(응용프로그램 인터페이스) 책임자 로건 킬패트릭은 자신의 X 계정에 바나나 이모지를 올렸다. 같은 날 구글 딥마인드 소속 제품 매니저 나이나 라이싱하니와 구글 랩스·제미나이 부문 부사장 조시 우드워드도 나란히 SNS에 바나나 사진과 이모지를 게시해 대중의 호기심을 샀다. 마침내 8월 26일 순다르 피차이 구글 최고경영자(CEO)가 X에 “Our image editing model is now rolling out in @Geminiapp-and yes, it’s 🍌🍌(우리의 이미지 편집 모델이 지금부터 제미나이 앱에서 순차적으로 적용된다. 맞다, 바로 그 🍌🍌다)”라고 발표했다. 이후 나노바나나는 제미나이 애플리케이션(앱)을 통해 사용할 수 있게 됐고, 해당 모델 관련 내용도 구글 블로그에 업로드됐다.
최병호 고려대 인공지능연구소 교수는 나노바나나에 대해 “손가락 개수나 맥락 오류 같은 기술적 한계가 존재하지만 향후 물리엔진을 이미지 생성에 접목하고 유튜브 플랫폼에서 수집한 데이터를 활용한다면 시장 전체를 뒤흔들 가능성이 크다”고 전망했다.