Generative AI/Text to Image

[글또] Midjourney로 5분만에 AI 그림을 생성해보자

성중 2023. 3. 17. 17:26

2022 예술대회에 우승해 논란이 되었던 스페이스 오페라 극장 (Midjourney 생성)

Stable Diffusion에 이어 ChatGPT까지, 최근 생성형 AI(Generative AI)로 세상이 떠들썩합니다

 

글을 쓰고 그림을 그리고 코드를 짜는 AI, 최근 몇 달간 무서운 속도로 성장해 인간 고유의 영역이었던 창작까지 수행하며 개발자 뿐만 아니라 많은 지식 노동자, 예술가들에게 막연한 불안감을 주는 분위기입니다

 

저 역시 생각이 많아졌습니다. 당장의 커리어 고민부터 시작해 기술적 특이점이 온 세상에서 인간의 존재 의의는 무엇일까? 라는 철학적 물음 까지요 🤔

 

나름대로 내린 결론은, 사람은 AI에게 대체되는 것이 아니라 AI를 활용하는 사람에게 대체될 것이라는 생각입니다. AI를 응용하고 결합해 새로운 가치를 창출하는 것도 결국 사람이고, 그러한 AI 활용 능력과 인간 자체에 대한 이해가 더 중요해지지 않을까 조심스레 예측하고 있습니다

 

그런 의미에서 AI 활용 첫 걸음으로 Midjourney를 사용해 AI 그림을 생성 보았는데요, 보면서 쉽게 따라해볼 수 있도록 상세한 과정을 정리해 보았습니다!

 


Stable Diffusion을 중심으로 그림 인공지능이 우후죽순 생겨나며 발전 속도 역시 가속화되고 있습니다. Midjourney는 독립적인 인공지능 연구소이자 해당 연구소에서 개발한 그림 인공지능 소프트웨어로, 현재 오픈 베타 단계에 있어 디스코드 봇을 경유해 사용해볼 수 있습니다

 

먼저 Midjourney 사이트에 접속해줍니다

 

Midjourney🔽

 

Midjourney

An independent research lab exploring new mediums of thought and expanding the imaginative powers of the human species.

www.midjourney.com

 

Midjourney

우측 하단의 Join the Beta를 선택해 줍니다

 

Join the Discord

초대를 수락하고 디스코드 서버에 입장할 수 있습니다

 

계정당 25회 정도의 무료 생성 횟수 제한이 있어, 그 이상 사용하려면 미등록 계정으로 입장 후 매번 새로운 이메일을 생성해 인증해야 하는 번거로움이 있습니다 😅 얼마 전까지는 이메일도 필요 없었는데

 

Find a Newbies Channel

서버 입장이 되었다면 좌측의 아무 newbies-(숫자) 채널에 입장해줍니다

 

Use the /imagine Command

해당 채널 입력창에 prompt 옵션이 있는 /imagine 커맨드를 입력해줍니다. 여기서 prompt란 AI 그림 생성을 위한 키워드라고 볼 수 있는데, 원하는 그림을 위해서 어떤 키워드가 어떤 결과를 가져오는지 이해하고 prompt를 잘 입력하는 것이 매우 중요합니다 

 

저는 "Frogs and Rabbits Gathering and Writing", "모여서 글 쓰는 개구리와 토끼들"을 한 번 입력해보겠습니다 👀

 

Process the Job

채널에서 바로 확인하거나, 우측 상단의 받은 편지함 > 멘션에서 결과를 모아 볼 수 있습니다

 

Upscale or Create Variations

?? 왜인지 토끼는 없고 개구리들만 가득한 그림이 나왔습니다. 여기서 9개의 선택지가 주어지는데, 좌측 상단부터 1~4번 그림이며 U는 Upscale(퀄리티 상승) V는 Variation(약간의 변조), 🔁는 완전히 새로 생성을 의미합니다. 중복 선택도 가능합니다

 

저는 U3, V4, 🔁를 선택해 보았습니다

 

🔁: 새로운 스타일로 4가지 이미지를 추가로 제시해줍니다
V4: 약간의 변조가 적용된 결과를 4가지 제시해줍니다
U3: 하나의 이미지가 제시되며, 묘하게 이상했던 개구리들도 정상이 되었습니다

4개씩 제시된 이미지는 다시 9가지 선택이 가능하고, Upscale 이미지에는 평가 및 Make Variations / Light Upscale Redo / Beta Upscale Redo 선택지가 주어집니다. 다시 변조를 주거나 각각 다른 Upscale 모델을 적용하는 것이라고 하네요

 

모두 선택해 보았습니다

 

Make Variations: 구도는 비슷한데 개구리들 생김새가 조금씩 다른 느낌입니다
Beta Upscale Redo: 처음 Upscale 이전으로 돌아간 느낌입니다
Light Upscale Redo: 조금 더 아방가르드(?)해졌습니다. 가장 마음에 드네요

 


가장 많이 사용되는 Midjourney를 사용해 보았는데요, 이 외에도 다양한 그림 생성 AI가 존재합니다. 경우에 따라 상업적 이용도 가능하지만 이미 상업적으로 보호된 저작물에서 파생된 이미지나, 악의적인 키워드를 사용할 여지도 있어 사용자의 책임감 있는 AI 활용 역시 매우 중요하다는 생각이 드네요

 

AI 시대가 인류에게 위기라는 이야기가 종종 들리는데, 위기는 위험과 기회를 모두 포함하는 말이라고도 합니다. 저는 이번 글을 작성하며 단순히 서비스를 사용하는 것을 넘어, AI를 개발 생산성을 위해 활용하거나 응용 API를 프로덕트에 결합하는 경험도 공유해보고 싶다는 생각이 들었는데요, AI 시대에서 사람은 어떤 가치를 창출할 수 있을까요? 함께 고민해보고 싶습니다 🤓

 

Reference

 

Midjourney Quick Start Guide

Learn how to use the text-to-image service, Midjourney on Discord or the web to create custom images from simple text prompts.

docs.midjourney.com

 

The State of AI & Art 2022

AI도 예술이 될 수 있는가? 지난 벌어진 text-to-image AI에 대한 이야기, 그리고 AI와 Art의 미래에 대한 이야기

velog.io

 

GPT 시대, 인간의 쓸모. 잉여가 되기 싫다면...

모두의 연구소에서 정지훈 박사의 Chat GPT와 stable Diffusion 강의를 듣고 왔다. Chat GPT에 온...

blog.naver.com