Stable Diffusion에 이어 ChatGPT까지, 최근 생성형 AI(Generative AI)로 세상이 떠들썩합니다
글을 쓰고 그림을 그리고 코드를 짜는 AI, 최근 몇 달간 무서운 속도로 성장해 인간 고유의 영역이었던 창작까지 수행하며 개발자 뿐만 아니라 많은 지식 노동자, 예술가들에게 막연한 불안감을 주는 분위기입니다
저 역시 생각이 많아졌습니다. 당장의 커리어 고민부터 시작해 기술적 특이점이 온 세상에서 인간의 존재 의의는 무엇일까? 라는 철학적 물음 까지요 🤔
나름대로 내린 결론은, 사람은 AI에게 대체되는 것이 아니라 AI를 활용하는 사람에게 대체될 것이라는 생각입니다. AI를 응용하고 결합해 새로운 가치를 창출하는 것도 결국 사람이고, 그러한 AI 활용 능력과 인간 자체에 대한 이해가 더 중요해지지 않을까 조심스레 예측하고 있습니다
그런 의미에서 AI 활용 첫 걸음으로 Midjourney를 사용해 AI 그림을 생성해 보았는데요, 보면서 쉽게 따라해볼 수 있도록 상세한 과정을 정리해 보았습니다!
Stable Diffusion을 중심으로 그림 인공지능이 우후죽순 생겨나며 발전 속도 역시 가속화되고 있습니다. Midjourney는 독립적인 인공지능 연구소이자 해당 연구소에서 개발한 그림 인공지능 소프트웨어로, 현재 오픈 베타 단계에 있어 디스코드 봇을 경유해 사용해볼 수 있습니다
먼저 Midjourney 사이트에 접속해줍니다
Midjourney🔽
우측 하단의 Join the Beta를 선택해 줍니다
초대를 수락하고 디스코드 서버에 입장할 수 있습니다
계정당 25회 정도의 무료 생성 횟수 제한이 있어, 그 이상 사용하려면 미등록 계정으로 입장 후 매번 새로운 이메일을 생성해 인증해야 하는 번거로움이 있습니다 😅 얼마 전까지는 이메일도 필요 없었는데
서버 입장이 되었다면 좌측의 아무 newbies-(숫자) 채널에 입장해줍니다
해당 채널 입력창에 prompt 옵션이 있는 /imagine 커맨드를 입력해줍니다. 여기서 prompt란 AI 그림 생성을 위한 키워드라고 볼 수 있는데, 원하는 그림을 위해서 어떤 키워드가 어떤 결과를 가져오는지 이해하고 prompt를 잘 입력하는 것이 매우 중요합니다
저는 "Frogs and Rabbits Gathering and Writing", "모여서 글 쓰는 개구리와 토끼들"을 한 번 입력해보겠습니다 👀
채널에서 바로 확인하거나, 우측 상단의 받은 편지함 > 멘션에서 결과를 모아 볼 수 있습니다
?? 왜인지 토끼는 없고 개구리들만 가득한 그림이 나왔습니다. 여기서 9개의 선택지가 주어지는데, 좌측 상단부터 1~4번 그림이며 U는 Upscale(퀄리티 상승) V는 Variation(약간의 변조), 🔁는 완전히 새로 생성을 의미합니다. 중복 선택도 가능합니다
저는 U3, V4, 🔁를 선택해 보았습니다
4개씩 제시된 이미지는 다시 9가지 선택이 가능하고, Upscale 이미지에는 평가 및 Make Variations / Light Upscale Redo / Beta Upscale Redo 선택지가 주어집니다. 다시 변조를 주거나 각각 다른 Upscale 모델을 적용하는 것이라고 하네요
모두 선택해 보았습니다
가장 많이 사용되는 Midjourney를 사용해 보았는데요, 이 외에도 다양한 그림 생성 AI가 존재합니다. 경우에 따라 상업적 이용도 가능하지만 이미 상업적으로 보호된 저작물에서 파생된 이미지나, 악의적인 키워드를 사용할 여지도 있어 사용자의 책임감 있는 AI 활용 역시 매우 중요하다는 생각이 드네요
AI 시대가 인류에게 위기라는 이야기가 종종 들리는데, 위기는 위험과 기회를 모두 포함하는 말이라고도 합니다. 저는 이번 글을 작성하며 단순히 서비스를 사용하는 것을 넘어, AI를 개발 생산성을 위해 활용하거나 응용 API를 프로덕트에 결합하는 경험도 공유해보고 싶다는 생각이 들었는데요, AI 시대에서 사람은 어떤 가치를 창출할 수 있을까요? 함께 고민해보고 싶습니다 🤓
Reference