V1 비디오 모델을 소개합니다 2025년 6월 19일 오전 1시 35분 안녕하세요, 여러분! 아시다시피, 저희는 지난 몇 년간 이미지에 집중해 왔습니다. 하지만 여러분이 모르셨을 수도 있는 사실은, 저희는 이 기술의 필연적인 종착지가 실시간 오픈월드 시뮬레이션이 가능한 모델이라고 믿는다는 점입니다. 그게 무엇이냐고요? 기본적으로, 실시간으로 이미지를 생성하는 AI 시스템을 상상해 보세요. 여러분은 3D 공간 안에서 움직이라고 명령할 수 있고, 환경과 캐릭터들도 함께 움직이며, 모든 것과 상호작용할 수 있습니다. 이를 위해서는 여러 구성 요소가 필요합니다. 시각 자료(저희의 첫 이미지 모델), 그 이미지를 움직이게 만드는 것(비디오 모델), 공간을 스스로 이동하는 능력(3D 모델), 그리고 이 모든 것을 빠르게 처리하는 능력(실시간 모델)이 필요합니다. 내년에는 이 조각들을 개별적으로 만들고, 출시하고, 그런 다음 천천히 하나의 통합된 시스템으로 합치는 과정이 포함될 것입니다. 처음에는 비용이 많이 들 수 있지만, 생각보다 더 빨리 모든 사람이 사용할 수 있는 기술이 될 것입니다. 그렇다면 오늘은 어떤 날일까요? 오늘, 저희는 다음 단계로 나아갑니다. 커뮤니티 전체에 저희 비디오 모델의 버전 1(V1)을 출시합니다. 기술적 관점에서 이 모델은 디딤돌에 해당하지만, 지금 당장은 여러분께 구체적으로 무엇을 제공해야 할지 알아내야 했습니다. 저희의 목표는 모든 사람이 탐험할 수 있도록 재미있고, 쉽고, 아름다우며, 저렴한 것을 제공하는 것입니다. 저희는 견고한 균형점을 찾았다고 생각합니다. 비록 많은 분들이 더 많은 Fast-Minutes(빠른 생성 시간)를 위해 최소 한 단계 이상의 요금제 업그레이드가 필요하다고 느끼시겠지만요.
오늘의 비디오 워크플로우는 "이미지-투-비디오(Image-to-Video)"라고 불릴 것입니다. 이는 여러분이 평소처럼 미드저니에서 이미지를 만들되, 이제 "Animate" 버튼을 눌러 움직이게 할 수 있다는 의미입니다. "자동(automatic)" 애니메이션 설정이 있는데, 이는 여러분을 위해 "모션 프롬프트"를 만들어 "그냥 움직이게" 해줍니다. 아주 재미있죠. 그리고 "수동(manual)" 애니메이션 버튼이 있어, 여러분이 시스템에게 사물이 어떻게 움직이고 장면이 어떻게 전개되기를 원하는지 직접 묘사할 수 있습니다.
"높은 모션(High motion)"과 "낮은 모션(Low motion)" 설정이 있습니다. - 낮은 모션은 카메라가 대부분 고정된 상태에서 피사체가 느리거나 계획된 방식으로 움직이는 잔잔한 장면에 더 적합합니다. 단점은 때때로 전혀 움직이지 않는 결과물이 나올 수도 있다는 것입니다.
- 높은 모션은 피사체와 카메라 모두, 모든 것이 움직이기를 원할 때 가장 좋습니다. 단점은 이 모든 움직임이 때때로 어색한 오류를 낳을 수 있다는 점입니다.
적절해 보이는 것을 선택하시거나 두 가지 모두 시도해 보세요.
마음에 드는 비디오가 생기면, 한 번에 약 4초씩 총 4번까지 "연장(extend)"할 수 있습니다. 또한 미드저니 외부에서 업로드한 이미지를 애니메이션으로 만들 수 있도록 했습니다. 프롬프트 바에 이미지를 드래그하여 "시작 프레임"으로 표시한 다음, 어떻게 움직이길 원하는지 모션 프롬프트를 입력하여 묘사하세요. 부디 이 기술들을 책임감 있게 사용해 주시기를 부탁드립니다. 올바르게 활용된다면, 이는 단지 재미있을 뿐만 아니라 정말 유용하거나 심지어 심오할 수도 있습니다. 오래된 세계와 새로운 세계를 갑자기 살아 움직이게 만드는 것처럼요. 이러한 모델을 제작하는 실제 비용과 저희가 부과하는 가격을 예측하기는 어렵습니다. 저희는 지금 당장 여러분께 접근성을 제공하기 위해 최선을 다할 것이며, 다음 달 동안 모든 분들이 이 기술을 사용하는 것을 지켜보면서 (혹은 서버가 완전히 바닥날 가능성도 보면서) 저희가 지속 가능한 비셔니스를 운영할 수 있도록 모든 것을 조정할 것입니다.
출시 시점에는 웹에서만 우선적으로 제공합니다. 비디오 작업은 이미지 작업보다 약 8배의 비용이 청구되며, 각 작업은 4개의 5초짜리 비디오를 생성합니다. 놀랍게도, 이는 비디오 하나가 업스케일 비용과 거의 같다는 것을 의미합니다! 다시 말해 비디오 1초당 "이미지 한 장 정도의 비용"이 드는 셈입니다. 이는 놀랍고도 경이로운 사실이며, 이전에 시장에 출시되었던 것들보다 25배 이상 저렴합니다. 이는 시간이 지남에 따라 더욱 개선될 것입니다. 또한 "Pro" 구독자 이상을 위한 비디오 릴랙스 모드(video relax mode)를 테스트할 예정입니다. 이번 출시를 즐겨주시길 바랍니다. 더 많은 것들이 다가오고 있으며, 저희는 비디오 모델을 구축하는 과정에서 많은 것을 배웠다고 느낍니다. 이러한 배움 중 다수는 앞으로 몇 주 또는 몇 달 안에 저희 이미지 모델에도 다시 적용될 것입니다. 이 여정에 함께해 주셔서 감사합니다. 그리고 즐거운 시간 보내세요! by 미드저니 CEO, David Holz |
드디어 공개된 미드저니 영상 AI, 직접 써 본 후기와 공식 발표 전문
안녕하세요, AI 실험실의 이종원입니다.
2025년 6월 19일, 전세계적으로 수많은 크리에이터가 기다려온 미드저니(Midjourney)의 영상 생성 AI 모델이 드디어 베일을 벗었습니다. 이미 시장에는 Sora, Runway, 그리고 구글 Veo3+Flow 등 훌륭한 영상 AI들이 자리를 잡고 있어, 미드저니가 과연 어떤 퀄리티로 이 경쟁에 뛰어들지 개인적으로 무척 궁금했는데요. 기대에 미치지 못하면 어쩌나 하는 우려와 달리, 정말 압도적인 퀄리티의 모델을 선보이며 모두를 놀라게 했습니다.
백문이 불여일견입니다. 먼저 공식 소개 영상을 통해 그 놀라운 결과물을 확인해 보시죠.
첫인상: 웹 UI의 변화와 놀라운 발전 속도
이번 업데이트로 미드저니 웹사이트에도 흥미로운 변화가 생겼습니다. 사이트의 'Explore' 탭에 접속하면, 이전에는 생성된 이미지들이 기본으로 보였지만 이제는 'Video'가 기본값이 되었습니다. 미드저니가 앞으로 나아갈 방향을 명확히 보여주는 변화입니다.
이미지도 물론 훌륭한 매체이지만, 움직임이 더해진 영상이 주는 힘이 얼마나 강력한지 다시 한번 느끼게 됩니다.
여기서 한 가지 더 놀라운 점을 발견했습니다. 출시된 지 만 하루가 조금 넘은 지금(6월 20일 저녁), 불과 반나절 전에 생성된 영상들보다 현재 생성되는 영상들의 퀄리티가 눈에 띄게 좋아졌습니다. 이는 모델이 실시간에 가깝게 학습하며 빠르게 발전하고 있음을 시사합니다. 앞으로의 퀄리티 상승이 더욱 기대되는 부분입니다.
고질적 문제를 해결하다: 주목할 만한 생성 사례
제가 직접 미드저니에서 생성된 흥미로운 영상 몇 가지를 골라 영상으로 편집해 보았습니다.
일반적으로 영상 생성형 AI는 다음과 같은 고질적인 문제들로 인해 아직 한계가 명확했습니다.
하지만 미드저니는 이번 업데이트를 통해 이러한 문제들을 거의 완벽하게 해결한 것으로 보입니다. 특히 일관성 유지가 까다로워 AI에게는 가장 어려운 영역으로 꼽혔던 애니메이션, 아트, 크리에이티브 분야에서 이 모든 과제를 훌륭하게 소화하고 있습니다. 아래 공유해 드리는 영상에서 그 놀라운 안정성과 표현력을 직접 확인해 보시죠.
핵심 장점: 쉬운 사용법과 저렴한 비용
기존 유료 구독자라면 별도의 과정 없이 바로 영상 생성을 시작할 수 있습니다. 저도 웹 UI를 통해 직접 사용해 보니, 기존에 만들었던 이미지 아래에 생긴 'Animate' 버튼을 누르는 것만으로 매우 직관적이고 쉽게 영상을 만들 수 있었습니다.
그리고 미드저니 영상 모델의 가장 큰 장점 중 하나는 바로 저렴한 생성 비용입니다. 시장의 다른 서비스들과 비교했을 때 놀라울 정도로 합리적인 가격 정책을 내세웠는데, 이는 아래 번역해 드리는 공식 발표문에서 더 자세히 확인할 수 있습니다.
미드저니 공식 발표 전문 (번역)
아래는 미드저니의 CEO, 데이비드 홀츠(David Holz)가 발표한 영상 모델 출시에 대한 공식 공지 전문입니다. 그들의 비전과 기술적 배경을 이해하는 데 큰 도움이 될 것입니다.
V1 비디오 모델을 소개합니다
2025년 6월 19일 오전 1시 35분
안녕하세요, 여러분!
아시다시피, 저희는 지난 몇 년간 이미지에 집중해 왔습니다. 하지만 여러분이 모르셨을 수도 있는 사실은, 저희는 이 기술의 필연적인 종착지가 실시간 오픈월드 시뮬레이션이 가능한 모델이라고 믿는다는 점입니다.
그게 무엇이냐고요? 기본적으로, 실시간으로 이미지를 생성하는 AI 시스템을 상상해 보세요. 여러분은 3D 공간 안에서 움직이라고 명령할 수 있고, 환경과 캐릭터들도 함께 움직이며, 모든 것과 상호작용할 수 있습니다.
이를 위해서는 여러 구성 요소가 필요합니다. 시각 자료(저희의 첫 이미지 모델), 그 이미지를 움직이게 만드는 것(비디오 모델), 공간을 스스로 이동하는 능력(3D 모델), 그리고 이 모든 것을 빠르게 처리하는 능력(실시간 모델)이 필요합니다.
내년에는 이 조각들을 개별적으로 만들고, 출시하고, 그런 다음 천천히 하나의 통합된 시스템으로 합치는 과정이 포함될 것입니다. 처음에는 비용이 많이 들 수 있지만, 생각보다 더 빨리 모든 사람이 사용할 수 있는 기술이 될 것입니다.
그렇다면 오늘은 어떤 날일까요? 오늘, 저희는 다음 단계로 나아갑니다. 커뮤니티 전체에 저희 비디오 모델의 버전 1(V1)을 출시합니다.
기술적 관점에서 이 모델은 디딤돌에 해당하지만, 지금 당장은 여러분께 구체적으로 무엇을 제공해야 할지 알아내야 했습니다.
저희의 목표는 모든 사람이 탐험할 수 있도록 재미있고, 쉽고, 아름다우며, 저렴한 것을 제공하는 것입니다. 저희는 견고한 균형점을 찾았다고 생각합니다. 비록 많은 분들이 더 많은 Fast-Minutes(빠른 생성 시간)를 위해 최소 한 단계 이상의 요금제 업그레이드가 필요하다고 느끼시겠지만요.
오늘의 비디오 워크플로우는 "이미지-투-비디오(Image-to-Video)"라고 불릴 것입니다. 이는 여러분이 평소처럼 미드저니에서 이미지를 만들되, 이제 "Animate" 버튼을 눌러 움직이게 할 수 있다는 의미입니다.
"자동(automatic)" 애니메이션 설정이 있는데, 이는 여러분을 위해 "모션 프롬프트"를 만들어 "그냥 움직이게" 해줍니다. 아주 재미있죠. 그리고 "수동(manual)" 애니메이션 버튼이 있어, 여러분이 시스템에게 사물이 어떻게 움직이고 장면이 어떻게 전개되기를 원하는지 직접 묘사할 수 있습니다.
"높은 모션(High motion)"과 "낮은 모션(Low motion)" 설정이 있습니다.
적절해 보이는 것을 선택하시거나 두 가지 모두 시도해 보세요.
마음에 드는 비디오가 생기면, 한 번에 약 4초씩 총 4번까지 "연장(extend)"할 수 있습니다.
또한 미드저니 외부에서 업로드한 이미지를 애니메이션으로 만들 수 있도록 했습니다. 프롬프트 바에 이미지를 드래그하여 "시작 프레임"으로 표시한 다음, 어떻게 움직이길 원하는지 모션 프롬프트를 입력하여 묘사하세요.
부디 이 기술들을 책임감 있게 사용해 주시기를 부탁드립니다. 올바르게 활용된다면, 이는 단지 재미있을 뿐만 아니라 정말 유용하거나 심지어 심오할 수도 있습니다. 오래된 세계와 새로운 세계를 갑자기 살아 움직이게 만드는 것처럼요.
이러한 모델을 제작하는 실제 비용과 저희가 부과하는 가격을 예측하기는 어렵습니다. 저희는 지금 당장 여러분께 접근성을 제공하기 위해 최선을 다할 것이며, 다음 달 동안 모든 분들이 이 기술을 사용하는 것을 지켜보면서 (혹은 서버가 완전히 바닥날 가능성도 보면서) 저희가 지속 가능한 비셔니스를 운영할 수 있도록 모든 것을 조정할 것입니다.
출시 시점에는 웹에서만 우선적으로 제공합니다. 비디오 작업은 이미지 작업보다 약 8배의 비용이 청구되며, 각 작업은 4개의 5초짜리 비디오를 생성합니다. 놀랍게도, 이는 비디오 하나가 업스케일 비용과 거의 같다는 것을 의미합니다! 다시 말해 비디오 1초당 "이미지 한 장 정도의 비용"이 드는 셈입니다. 이는 놀랍고도 경이로운 사실이며, 이전에 시장에 출시되었던 것들보다 25배 이상 저렴합니다. 이는 시간이 지남에 따라 더욱 개선될 것입니다. 또한 "Pro" 구독자 이상을 위한 비디오 릴랙스 모드(video relax mode)를 테스트할 예정입니다.
이번 출시를 즐겨주시길 바랍니다. 더 많은 것들이 다가오고 있으며, 저희는 비디오 모델을 구축하는 과정에서 많은 것을 배웠다고 느낍니다. 이러한 배움 중 다수는 앞으로 몇 주 또는 몇 달 안에 저희 이미지 모델에도 다시 적용될 것입니다.
이 여정에 함께해 주셔서 감사합니다. 그리고 즐거운 시간 보내세요!
by 미드저니 CEO, David Holz
맺음말: 새로운 가능성과 앞으로의 계획
미드저니의 영상 모델 출시는 단순히 새로운 기능 하나가 추가된 것을 넘어, 창작의 패러다임을 또 한 번 바꿀 거대한 흐름의 시작이라고 생각합니다. 특히 기존 생성형 AI 영상의 고질적인 문제들을 해결하며 보여준 안정성은, 앞으로 전문적인 아트, 애니메이션, 영상 콘텐츠 제작에 AI가 얼마나 깊숙이 들어올 수 있을지 그 가능성을 명확히 보여주었습니다.
앞으로도 AI 실험실에서는 당분간 미드저니 영상 생성과 관련된 새로운 소식과 깊이 있는 활용법을 지속적으로 공유해 드릴 예정입니다.
또한, 많은 분들께서 꾸준한 관심을 보여주신다면, 이전 성원에 힘입어 '미드저니 원데이 클래스'를 다시 개설하는 것도 긍정적으로 검토해 보겠습니다.
새로운 도구로 열릴 무한한 창작의 가능성을 함께 탐험해 나갔으면 합니다. 감사합니다.
글쓴이: 이종원 jwlee@wedesignx.com
UX/UI 디자인 컨설턴시 ‘wedesignexperience.(위디엑스)’ 대표. 삼성전자, LG전자, 현대자동차 등과 협력해 온 사용자 경험(UX)을 기반으로 생성형 AI, 신기술 응용 연구 전문가입니다. 기술이 인간을 향하도록 방향을 제시하며, 그 최전선에서 얻은 인사이트를 나눕니다.
[더 알아보기]
웹 사이트
관계 사이트
UX/UI 디자인 & 생성형 AI 프로젝트, 컨설팅 의뢰: 위디엑스 – https://wedesignx.com
온/오프라인 디자인 & AI 교육 플랫폼: 디자인엑스클래스 – https://designxclass.com
크리에이티브 & 커머셜 AI 스튜디오: 아키타입 – https://akitype.com