이미지 편집 혁신, 메타의 새로운 동맹, 그리고 Grok 5의 도전

2025. 8. 25.

님, 안녕하세요!

AI 트렌드 Bold Flick의 예순 아홉 번째 소식이에요!

이번 주는 알리바바가 공개한 이미지 편집 모델, 메타와 미드저니의 전략적 제휴, 그리고 일론 머스크가 직접 언급한 Grok 5 소식을 담았어요! 기술의 세밀함부터 거대한 비전까지, 꼭 짚어봐야 할 변화를 짧지만 알차게 전해드립니다.

#Alibaba #Qwen #AI이미지편집 #QwenImageEdit #텍스트편집

Qwen-Image-Edit, 알리바바 200억 파라미터 기반

오픈소스 이미지 편집 모델 공개

<텍스트 교정부터 스타일 변환까지…세밀함과 효율성을 동시에 잡은 AI 편집기> by.VQZ

알리바바 산하 Qwen 팀이 새로운 오픈소스 이미지 편집 모델 ‘Qwen-Image-Edit’을 발표했어요. 이 모델은 기존 Qwen-Image(200억 파라미터)를 기반으로 확장된 버전으로, 단순한 이미지 생성에서 나아가 정밀한 이미지 편집을 지원하는 게 특징이에요. 특히 텍스트 교정 능력을 그대로 계승하면서, 시맨틱(의미 단위) 편집과 외형(픽셀 단위) 편집을 동시에 수행할 수 있어요.

Qwen-Image-Edit은 입력 이미지를 Qwen2.5-VL(시맨틱 제어)과 VAE Encoder(시각적 외형 제어)에 동시에 전달해, 의미와 시각 요소를 균형 있게 조정해요. 덕분에 객체 회전, 스타일 변환 같은 큰 변화부터, 간판 추가, 작은 오브젝트 제거, 텍스트 수정 같은 세밀한 작업까지 자연스럽게 구현할 수 있어요.

실제 데모에서는 Qwen의 마스코트 카피바라를 다양한 MBTI 성격 유형에 맞춰 편집해 이모지팩 IP를 제작했어요. 또 사물의 90도·180도 회전 뷰 합성, 인물 사진의 스튜디오 지브리풍 변환, 간판 삽입 시 반사광 자동 생성, 세부 텍스트 색상 교체 등 고급 편집이 가능하다는 걸 보여줬어요.

특히 강점으로 꼽히는 부분은 정확한 텍스트 편집 능력이에요. 기존 이미지의 폰트, 크기, 스타일을 깨뜨리지 않고 중국어·영어 텍스트를 그대로 교정할 수 있어요. 실제로 복잡한 서예 작품에서 잘못 생성된 한자를 단계적으로 박스 지정해 수정하며, 최종적으로 완전한 교정본을 만들어내는 사례도 시연했어요.

업계 평가에서도 Qwen-Image-Edit은 Seedream, GPT Image, FLUX 같은 경쟁 모델들을 넘어서는 SOTA(State of the Art) 성능을 기록했다고 해요. 알리바바는 이번 모델이 이미지 생성의 다음 단계인 AI 기반 편집 표준을 이끌 것으로 기대하고 있어요.

#Meta #Midjourney #AI이미지 #AI비디오 #AI제휴

Meta, 미드저니와 손잡다!
AI 이미지·영상 모델 공동 개발 위한

라이선스 제휴 체결

<Sora·Flux·Veo와 경쟁 구도 속 차세대 생성형 AI 제품 강화> by.VQZ

메타(Meta)가 이미지 생성 스타트업 미드저니(Midjourney)와 파트너십을 맺고, 해당 기술을 라이선스 형태로 자사 AI 모델과 제품에 도입한다고 발표했어요. 이번 제휴는 메타가 자사 AI 생태계에 최고 수준의 이미지·영상 생성 능력을 결합하기 위한 전략적 행보로 해석돼요.

메타는 이미 Imagine(이미지 생성)과 Movie Gen(프롬프트 기반 영상 생성) 같은 자체 AI 툴을 보유하고 있지만, 오픈AI의 Sora, 블랙포레스트랩의 Flux, 구글의 Veo 등과 비교해 경쟁력이 다소 부족하다는 평가를 받아왔어요. 미드저니와의 협력은 이러한 격차를 줄이고 차세대 제품군을 강화하는 핵심 카드로 보입니다.

미드저니는 2022년 설립 이후 빠르게 성장하며 사실적이면서 독창적인 스타일로 AI 이미지 시장을 선도했어요. 2023년에는 연간 매출 2억 달러에 달할 것으로 전망됐으며, 구독료는 월 10달러부터 120달러까지 다양해요. 지난 6월에는 첫 AI 영상 모델 V1도 공개해 이미지뿐 아니라 영상 영역까지 확장을 시작했죠.

이번 계약의 세부 조건은 공개되지 않았지만, 메타는 인재 확보와 AI 투자를 공격적으로 이어오고 있어요. 최근에는 AI 연구자에게 최대 1억 달러 규모의 보상을 제안했고, Scale AI에 140억 달러 투자, Play AI(음성 AI 스타트업) 인수 등도 진행했어요. 다만, 미드저니는 여전히 외부 투자 없이 독립 운영을 유지한다는 점을 강조했어요.

제휴 시점은 미드저니가 디즈니·유니버설 등으로부터 저작권 침해 소송을 당한 지 두 달 만이라 더욱 주목받아요. 다만 최근 판례가 AI 기업들의 손을 들어주는 경우가 많아, 법적 불확실성보다는 AI 이미지·영상 생성 시장에서의 협력 효과가 더 크게 부각되고 있습니다.

#AI #Grok5 #AGI #xAI #엘론머스크

Grok 5 AGI 시대 여는 신호탄일까?

<머스크가 던진 파문> by.D-Caf

Elon Musk가 트위터(X)에서 “Grok 5가 진짜 AGI가 될 가능성이 있다. 이런 느낌은 처음”이라고 밝혔습니다. 단순한 성능 개선이 아니라 범용 인공지능(AGI)으로의 도약을 스스로 확신했다는 발언이죠.

아직 구체적인 정보는 공개되지 않았습니다. 파라미터 규모나 학습 데이터, 출시 일정도 베일에 가려져 있어요. 하지만 Musk의 발언만으로도 xAI 내부에서 어떤 변화를 체감하고 있는지 짐작할 수 있습니다.

이 트윗이 더 주목받는 이유는 조직 운영 방식의 변화와도 연결되기 때문입니다. Musk는 xAI에서 연구자(researcher)라는 직함을 없애고 모두를 엔지니어(engineer)로 부르겠다고 했습니다. 이에 대해 Meta의 수석 과학자 Yann LeCun은 “혁신을 막을 수 있는 결정”이라고 우려를 표했죠. 반대로 Musk는 Meta 출신 인재들이 xAI로 합류하고 있다며 자신감을 강조했습니다.

결국 Grok 5는 기술 발표라기보다 방향성에 대한 선언에 가깝습니다. AGI라는 큰 목표를 향해 나아가겠다는 메시지인 동시에 연구와 개발 중 무엇에 무게를 두어야 할지 묻는 화두이기도 합니다.

머스크가 말한 “AGI의 가능성”이 현실로 다가올지는 앞으로의 검증에 달려 있겠지만 분명한 건 Grok 5가 AI 업계 안팎에서 새로운 대화를 열었다는 점이에요. 이제 남은 건 그 약속이 실제 성과로 이어질 수 있을지 지켜보는 일뿐이겠죠.