검색 없이 배우는 AI 그리고 말하는 아바타까지!

2025. 5. 12.

님, 안녕하세요!

AI 트렌드 Bold Flick의 쉰 한 번째 소식이에요!

이번 주도 참 많은 기술이 쏟아졌습니다.
“검색 없이 훈련하는 AI”, “말하는 디지털 아바타”, “AI가 나 대신 영상 찍기”까지…
예전엔 공상과학 영화 속 장면 같았던 기술들이 이제는 정말 우리가 매일 사용하는 도구가 되어가고 있어요. AI가 스스로 정보를 배우고 사람처럼 말하고 얼굴까지 대신해주는 시대. 어느새 상상이 현실이 되고, 현실은 점점 더 놀라워지고 있습니다.
커피 한 잔과 함께 가볍게 훑어보시면 다음 대화 주제가 한두 개쯤은 생길지도 몰라요 ☕

#알리바바 #제로서치 #AI검색 #훈련비용절감 #LLM훈련

알리바바, AI가 직접 검색하는 '제로서치' 기술 공개

<실제 검색 없이 훈련비용 90% 절감…검색 API 없는 시대 연다> by.VQZ

알리바바가 검색 엔진을 사용하지 않고도 정보를 학습할 수 있는 새로운 AI 훈련 기법 ‘제로서치(ZeroSearch)’를 발표했어요. 이 기술은 검색 API 없이도 검색 과정을 시뮬레이션해, 대형 언어 모델이 정보를 스스로 찾고 추론할 수 있게 합니다.

기존에는 구글이나 Bing 같은 실제 검색 API를 호출해 문서를 수집하고 학습에 활용했지만, 제로서치는 AI가 생성한 문서를 검색 결과처럼 활용하면서도 실제 모델보다 비슷하거나 더 나은 성능을 보였어요. 여기에 사용된 커리큘럼 전략은 점차 난이도를 높이며 AI의 정보 처리 능력을 개선하는 데 핵심적인 역할을 했습니다.

비용 절감도 놀라워요. API 호출 없이 훈련 데이터를 만들 수 있어서 기존 방식 대비 최대 88%의 비용을 줄일 수 있었고, 구글 검색 기반으로 훈련한 모델과 비교해도 성능 차이가 거의 없었어요.

14B 파라미터 모델은 실제 검색 기반 모델을 능가했고, 7B 모델도 유사한 성능을 보였어요. 다양한 크기의 오픈소스 모델에서 일관된 성능을 낸다는 점도 제로서치의 강점이에요.

연구팀은 이 방식을 통해 소규모 연구팀도 고비용 API 없이 자체적으로 훈련 가능한 AI 개발이 가능해질 것이라고 밝혔어요. 알리바바는 제로서치 모델과 관련 데이터를 Hugging Face에 오픈소스로 공개했어요.

정보를 찾는 방식 자체를 재정의하는 이 기술은, AI 훈련의 효율성과 접근성을 새롭게 바꿔놓을 수 있는 게임체인저로 평가됩니다.

#미드저니 #OmniReference #Midjourney #V7기능

미드저니, ‘Omni Reference’ 기능 도입…

AI 이미지에 사람·사물 그대로 넣는다

<V7에서만 가능한 캐릭터 참조 기능…텍스트 조합이 관건> by.VQZ

미드저니(Midjourney)가 버전 7에서만 제공되는 새로운 기능 ‘Omni Reference’를 공개했어요. 이 기능을 사용하면 참조 이미지 속 인물, 동물, 사물, 탈것 등을 AI 이미지에 직접 반영할 수 있어요. 쉽게 말해, 원하는 대상을 불러와 새로운 이미지 안에 배치하는 기능이에요.

기능 사용은 간단해요. 미드저니 웹사이트나 디스코드의 이미지 업로드 바에서 ‘Omni Reference’ 항목에 이미지를 드래그해 넣으면 끝이에요. 한 번에 하나의 이미지만 사용할 수 있고, 이후 해당 이미지를 바탕으로 원하는 장면이나 스타일을 텍스트로 묘사하면 AI가 조합해서 생성해줘요.

주의할 점도 있어요. Omni Reference는 V6.1 기반 기능들과 호환되지 않으며, GPU 시간은 일반 이미지의 두 배를 소모해요. 또 줌, 패닝, 영역 수정 등 일부 편집 기능과도 현재는 호환되지 않아요. 스타일 가중치나 세부 설정도 함께 조정해주는 것이 결과 품질에 도움이 됩니다.

‘--ow’ 파라미터를 통해 참조 이미지가 얼마나 강하게 반영될지를 조절할 수 있어요. 기본값은 100이며, 보통 400 이하를 추천해요. 값이 너무 높으면 이미지가 불안정해질 수 있어요. 웹에서는 슬라이더로 간편하게 조절 가능해요.

참조 이미지만으로는 부족할 수 있어요. 텍스트 프롬프트로 장면의 분위기, 스타일, 세부 특징까지 함께 설명하는 것이 중요합니다. 스타일을 바꾸고 싶다면 프롬프트 앞뒤에 원하는 스타일을 반복해서 언급하는 것도 팁이에요.

현재 Omni Reference는 Fast Mode, Draft Mode, --q 4 등 일부 모드에서는 사용할 수 없고, 콘텐츠 검열 시스템에 따라 프롬프트가 차단될 수 있어요. 하지만 차단된 작업은 GPU 크레딧이 차감되지 않으니 걱정할 필요는 없어요.

#AI #AI아바타 #HeyGen #영상자동화 #다국어콘텐츠 #디지털페르소나

말하는 AI 아바타 이제 누구나 만든다!

<HeyGen으로 나만의 디지털 페르소나 만들기> by.D-Caf

영상 한 편 만들려고 카메라 켜고 조명 세우고 편집까지 하던 시대는 이제 안녕!
HeyGen이 선보인 AI 비디오 아바타 서비스는 텍스트만 입력하면 나 대신 영상 속에서 말해주는 AI 캐릭터를 뚝딱 만들어줍니다.

100개가 넘는 아바타, 40개 이상의 언어

HeyGen은 수십 개의 프로페셔널 아바타 모델을 보유하고 있고요 한국어를 포함해 40개 이상의 언어와 300개가 넘는 음성을 지원해서 글로벌 콘텐츠 제작도 문제없어요.
실제 인물처럼 입 모양도 음성과 정확히 싱크되고, 표정과 제스처도 굉장히 자연스럽죠. 게다가 ‘AI Lip Sync’를 통해 내가 업로드한 영상에 원하는 언어로 더빙한 듯 입 모양까지 싱크 맞춰주는 기능도 가능해요!

나만의 아바타도 만들 수 있다고?!

여기서 끝이 아닙니다.
HeyGen은 'AI Selfie Avatar' 기능을 통해 내 사진 몇 장만 업로드하면 나만의 디지털 휴먼 캐릭터도 만들 수 있어요.
그리고 그 캐릭터가 내가 쓴 대본을 따라 말도 해주고 움직이기도 하죠.
이 기능은 특히 유튜버, 마케터, 강사들 사이에서 영상 제작 시간을 단축하는 데 매우 효과적으로 쓰이고 있어요.

영상 제작의 끝판왕

간단한 텍스트 입력만으로 제품 소개 영상, 교육 콘텐츠, 프레젠테이션까지
실시간 편집 없이 고퀄리티 영상을 생성할 수 있다는 게 이 서비스의 핵심 강점이에요.
더 이상 촬영 장비나 편집 기술 없이도 누구나 전문적인 영상 콘텐츠를 제작할 수 있다는 점에서 크리에이터, 마케터, 커뮤니케이션 팀에게는 완전한 게임 체인저로 떠오르고 있습니다.

AI가 만든 디지털 휴먼이 진짜 사람처럼 말하고 행동하는 이 시대 여러분은 HeyGen을 어떻게 활용해보고 싶으신가요?