3D 공간을 이해하는 AI?

2025. 6. 2.

3D 공간을 이해하는 AI?

님, 안녕하세요!

AI 트렌드 Bold Flick의 쉰 일곱 번째 소식이에요!

이번 주도 기술이 진짜 미쳤습니다 사진 한 장으로 표정 바꾸고 배경 바꾸는 AI에
Windows가 아예 AI 에이전트가 되겠다고 선언하고 이젠 공간까지 이해하는 AI까지 등장했어요 이미지 생성은 더 똑똑해지고 운영체제는 더 능동적으로 바뀌고 AI는 평면을 넘어서 입체로 갑니다!

자 이제 커피 한 잔 들고 진짜 ‘현실이 된 SF’ 구경하러 가보시죠 ☕

#FLUX1 #BFL #BlackForestLabs #이미지생성AI #멀티모달 #AI이미지편집 #Kontext

Black Forest Labs, ‘FLUX.1 Kontext’ 출시

<텍스트와 이미지 동시 입력, 초고속 편집·생성까지 가능한 AI 모델> by.VQZ

Black Forest Labs가 새로운 이미지 생성·편집 AI 모델 시리즈 ‘FLUX.1 Kontext’를 공개했어요. 단순 텍스트 프롬프트 기반 이미지를 넘어, 기존 이미지를 인식하고 수정하거나, 특정 스타일을 반영한 새로운 장면을 만들어내는 등 훨씬 다채로운 활용이 가능한 멀티모달 이미지 생성 도구예요.

기존 모델과 가장 큰 차별점은 바로 '인컨텍스트 이미지 처리' 기능이에요. 텍스트뿐 아니라 이미지도 함께 입력으로 받아들이고, 특정 인물이나 스타일을 유지한 채 다양한 장면 변형이 가능해요. 예를 들어 사진 속 인물의 표정만 바꾸거나, 같은 캐릭터가 등장하는 전혀 다른 배경의 이미지를 반복 생성하는 것도 가능하죠. 여기에 최대 8배 빠른 생성 속도까지 갖췄어요.

이번 발표에는 두 가지 모델이 포함됐어요. Kontext [pro]는 로컬 편집, 텍스트 기반 이미지 생성, 반복 편집 등을 지원하는 범용형 모델이고, Kontext [max]는 프롬프트 충실도, 타이포그래피 품질 등이 강화된 실험형 모델이에요. 두 모델 모두 다양한 플랫폼(KreaAI, Freepik, LeonardoAI 등)에서 바로 사용할 수 있어요. 그리고 개발자들을 위한 테스트 인터페이스 ‘BFL Playground’도 함께 공개돼, 기술 검토부터 활용 데모까지 쉽게 진행할 수 있어요.

이번 FLUX.1 Kontext 출시는 OpenAI의 GPT-4o, Midjourney 등과 같은 기존 이미지 생성 도구들과 차별화된 방향을 보여줘요. 특히 동일 캐릭터·스타일의 일관된 유지, 반복 편집 안정성, 고속 처리 속도 등은 실무 활용에서 큰 경쟁력이 될 수 있어요.

##Windows11 #AI에이전트 #CopilotPC #MCP #Windows #MicrosoftBuild2025

Windows, AI 에이전트 OS로 진화 중

<로컬 처리·모델 커스터마이징·MCP 통합까지…에이전트 중심 플랫폼 선언> by.VQZ

마이크로소프트가 Build 2025에서 Windows를 ‘AI 에이전트 중심 운영체제’로 본격 전환할 전략을 공개했어요. 단순한 AI 기능 추가가 아니라, 개발자 생태계를 위한 기반부터 앱 작동 방식, 보안 구조, OS 전반까지 AI 중심으로 재설계하는 수준의 발표였어요. 핵심은 하나예요: 앞으로 Windows는 수동적인 툴이 아니라, 능동적으로 작동하는 에이전트 플랫폼이 되겠다는 거죠.

이번 발표에서 가장 주목할 기능은 ‘Windows AI Foundry’. 기존 Copilot Runtime을 확장해, 오픈소스 모델 탐색, 로컬 커스터마이징, 텍스트·비전 AI API 사용, 파인튜닝까지 지원하는 통합 플랫폼이에요. 특히 NPU 최적화 모델 런타임인 Windows ML은 AMD, Intel, NVIDIA, Qualcomm 등 주요 칩셋에 맞춰 자동 조정돼요. 여기에 간단한 명령으로 모델을 미세 조정할 수 있는 LoRA(저순위 적응) 기능도 ‘Phi Silica’ 모델에 적용됐어요.

또 하나의 키워드는 ‘MCP(Model Context Protocol)’. 앞으로의 앱들은 MCP를 통해 에이전트와 상호작용하며, 기능을 공유하거나 자동화를 위한 명령을 처리하게 될 거예요. 예를 들어 Zoom, Goodnotes 같은 앱은 자체 기능을 ‘App Actions’ 형태로 노출해 다른 에이전트들이 호출 가능하도록 만들 수 있죠. 이로써 Windows는 단순한 실행환경이 아니라, 앱과 에이전트가 협력하는 ‘맥락형 컴퓨팅 허브’가 될 가능성을 보여주고 있어요.

이외에도 Post-quantum cryptography, 가상화 보안 엔클레이브 SDK, WSL 오픈소스화, WinGet/PowerToys 개선 등 개발자 경험 개선을 위한 다양한 업데이트가 함께 발표됐어요. 이제는 AI 기능을 ‘호출’하는 게 아니라, OS 그 자체가 에이전트처럼 움직이는 시대를 준비하고 있다는 점이 인상적이에요.

#AI #3D생성 #SpAItial #공간AI #VR #로보틱스

현실도 가상도 아닌 ‘공간’을 아는 AI

<SpAItial 공간지능 기반 AI 모델 SFM 공개> by.D-Caf

세상에! 이제 AI가 단순히 글을 쓰고 그림을 그리는 걸 넘어서 ‘공간’까지 이해한다고 합니다.
바로 SpAItial이라는 이름의 신생 AI 스타트업이 그 주인공인데요 “AI야 이 방 좀 만들어줘~” 했더니 진짜 3D로 방 구조부터 조명까지 다 만들어버리는 시대가 열린 거죠

이게 바로 Spatial Foundation Model (SFM)

SpAItial이 개발한 이 SFM은 기존 텍스트/이미지 중심 AI와 달리 3D 공간 전체를 ‘이해하고’ 생성할 수 있는 모델이에요 쉽게 말해 그냥 사진 한 장만 던져줘도
그걸 입체적으로 복원하고 공간을 시뮬레이션할 수 있죠

누가 만들었냐고요? 이 팀 구성이 아주 빵빵합니다 TU 뮌헨의 Matthias Niessner 교수, 전 구글의 Ricardo Martin-Brualla, 전 메타의 David Novotny

AI 그래픽스, 3D 연구에선 이름만 들어도 “와” 소리 나오는 분들이죠

게임의 맵 생성, 실시간 공간 반응, 영화나 애니메이션의 장면 자동 세팅 VR/AR 컨텐츠의 몰입형 인터랙션 환경, 로보틱스 공간 내비게이션 및 행동 시뮬레이션 등

한 마디로 “AI가 공간을 짜고 행동까지 예측하는 세상”을 만드는 중이에요

현재 SpAItial은 초기 모델을 실험 중이고 더 많은 산업에 적용할 수 있게 준비하고 있어요 곧 기업 파트너도 모집하고 실사용 사례도 공개할 예정이라니 이거 AI계의 픽사 하나 나오는 거 아니냐는 기대감이 커지고 있어요

이제는 AI가 말도 하고 그림도 그리고, 공간도 만든다고요? 상상은 우리가 현실화는 AI가 해주는 시대 SpAItial이 보여줄 다음 장면이 벌써 궁금하네요 😎

📈앤트로픽, '바이브 코딩' 앞세워 5개월 만에 매출 3배로 증가

🤖"AI, 인간처럼 의사소통 능력 자발적으로 개발할 수 있어"

🙀오픈AI, 챗GPT 'AI 슈퍼 비서' 계획 담긴 내부 문서 공개..."강력한 경쟁자는 메타"

👍메타, AI로 인스타·왓츠앱 위험성 평가…"업데이트 속도↑"

🌍구글, 인터넷 없이 작동하는 AI 개발 앱 공개

오늘의 'Bold Flick'은 여기까지!

다음 뉴스레터에서는 더욱 놀랍고 흥미로운 AI 소식으로 찾아뵐게요.

언제나 Bold Flick을 사랑해주셔서 감사합니다! 💙

궁금한 점이 있거나 더 알고 싶은 주제가 있다면 언제든 말씀해 주세요.

여러분의 피드백이 저희에게 큰 힘이 된답니다!

AI 소식을 전하는 뉴스레터 BoldFlick을구독하고 이메일로 받아보세요

AI, Tech Insights 최신 AI와 기술 트렌드를 간결하게 정리한 뉴스레터

이전 뉴스레터

Kanana 1.5 “한국어 LLM 이제 내가 국룰이다” 선언

2025. 5. 29.

다음 뉴스레터

회의록 이제 ChatGPT가 자동으로 써준다구요?

2025. 6. 9.

AI 소식을 전하는 뉴스레터 BoldFlick

AI, Tech Insights 최신 AI와 기술 트렌드를 간결하게 정리한 뉴스레터