올 초 '챗GPT' 신드롬에서 비롯된 생성형 인공지능(AI)의 열기가 날로 뜨거워지고 있습니다. 국내외 다양한 사업자들이 초거대 언어모델(LLM)을 활용한 자체 솔루션을 개발하고 있는 동시에 기존 솔루션을 응용한 서비스들도 잇따라 등장하고 있습니다.
그 결과 인공지능은 검색과 번역에서 더 나아가 이미지 생성에까지 나서며 사람의 영역을 위협하고 있습니다.
가장 최근 등장한 이미지 생성 서비스는 카카오브레인의 '칼로'입니다. 칼로 웹 서비스는 카카오브레인의 초거대 AI 아티스트 '칼로 2.0' 모델을 기반으로 합니다. 약 3억개 규모의 텍스트-이미지 데이터셋을 학습한 칼로 2.0은 이미지의 공간감과 입체감, 세밀함을 더해 실사에 가까운 고품질 이미지를 그릴 수 있다고 카카오브레인은 설명합니다.
얼마나 수준급의 그림을 그려주는지 궁금해 직접 칼로 웹사이트에 접속해보았습니다. 입력어는 '바닷가에서 놀고 있는 7세 남아, 3세 여아' 입니다. 네. 그렇습니다. 바다를 가자고 봄부터 노래를 불러대는 딸래미를 생각하며 그들이 모래사장에서 놀고 있는 모습을 상상하며 그림을 요청했죠.
하지만 결과는....실망스러웠습니다. 우선 바닷가지만 바닷물을 튀겨가며 놀고 있는 그 흔한 이미지는 등장하지 않았습니다. 입력어에 '물놀이를 하고 있는'을 추가해봤습니다. 원하는 구도의 모습은 구현됐지만, 이번에는 이목구비와 손, 발 등의 형태가 이상합니다. 이상함을 넘어 괴랄합니다. 국적에 제한을 두지 않은 탓인지 서양 아이들이 우선으로 생성됐습니다. '한국'이라는 키워드를 추가하고 나서야 동양계 어린이들이 나타났습니다. 물론 눈, 코, 입은 이상했고요.
카카오브레인 칼로 웹 서비스를 통해 그려본 '바닷가에서 놀고 있는 한국 남매'의 모습. 얼굴이 매우 부자연스럽다. (사진=칼로 웹서비스)
이 같은 현상을 카카오브레인 관계자에게 문의해봤습니다. "손이나 이목구비는 미세한 오차만 있더라도 큰 오류로 인식이 된다"는데요. "학습의 정도가 균등하지 않아 생성한 결과물의 품질 완성도가 다소 격차가 있을 수 있다"며 "생성 모델의 결과물이 더 정교해질 수 있도록 다양한 실험을 하고 있고 조만간 가시적인 결과로 업데이트 할 예정"이라고 설명합니다.
이번에는 업스테이지의 'AskUp(아숙업)'을 사용해보기로 했습니다. 지난 3월 카카오톡 채널을 통해 아숙업을 공개한 업스테이지는 4월 이미지 생성 베타서비스도 오픈했는데요.
칼로에 요청했던대로 아숙업에도 '바닷가에서 물놀이하고 있는 남매 그려줘'라고 요구를 했습니다. 그랬더니 아이들의 뒷 모습과 함께 '물놀이를 즐기는 남매를 그려드릴게요! 이렇게 그려볼까요? 즐거운 물놀이 장면이었으면 좋겠네요!'라는 친절한 해설이 따라옵니다.
챗봇이라는 아숙업의 특성상 좀 더 친근한 접근이 가능했습니다. 추가 지시 사항을 채팅창에 대화를 하듯 입력하니 사람과 이야기를 하고 있는 듯한 착각이 들기도 했는데요. 이목구비 모습을 확인하기 위해 '아이들 얼굴이 보이게 그려줘'라고 했더니 이번에는 '이렇게 얼굴이 보이는 남매를 그려보았어요. 행복한 물놀이 장면이네요1 즐거운 시간을 보내시길 바랄게요.'라고 피드백이 왔습니다. 아숙업이 그린 아이들의 눈, 코, 입은 칼로보다는 자연스러웠지만 실사화된 애니메이션 느낌이 강했습니다.
업스테이지의 아숙업으로 그려본 '바닷가에서 놀고 있는 한국 남매'의 모습. 전반적으로 자연스러운 느낌이지만 이목구비는 만화 주인공마냥 붙여넣기를 한 것 같다. (사진=아숙업)
마지막으로는 챗GPT를 선제 도입한 마이크로소프트의 빙 이미지 크리에이터를 써봤습니다. 한국어를 인식할까 싶어 영어로 명령어를 입력해봤는데요. 결과는 칼로와 크게 다르지 않았습니다. 배경은 조금 달랐지만 역시나 이목구비는 형체가 불분명할 정도로 일그러졌습니다.
아무래도 아직까지 사진과 같은 사람의 모습을 완벽히 구현해내는 방법은 어려운 과제인듯 합니다.