님, 안녕하세요!
AI 트렌드 Bold Flick의 쉰 여덟 번째 소식이에요!
한 주 한 주, AI는 진화를 멈추지 않네요. 이번 주엔 영상 만드는 AI, 회의 내용을 필기해주는 챗봇 그리고 딥하게 사고하는 구글의 신형 LLM까지… 그야말로 “일을 대신해주는 AI 삼총사”가 등장한 느낌이에요.
이런 신기방기한 소식들 이번 뉴스레터에서 가볍게 쓱 훑어보고 “앞으로 우리 업무, 어떻게 바뀔까?” 살짝 상상해보는 건 어떨까요?
커피 한 잔 들고, AI 소식 다이브 들어갑니다! 🏊♂️
|
|
|
#BingVideoCreator #Sora #무료영상생성 #AI비디오 #Bing모바일 #MicrosoftAI
Sora 무료 탑재한 Bing Video Creator 출시
|
|
|
<텍스트 입력만으로 5초짜리 영상 생성…모바일 앱에서 먼저 시작> by.VQZ
|
|
|
마이크로소프트가 텍스트 기반 AI 영상 생성 기능인 Bing Video Creator를 정식 출시했어요. OpenAI의 비디오 생성 모델 Sora를 통합해, 사용자가 단순한 텍스트만으로도 5초 길이의 AI 영상을 제작할 수 있게 된 거죠. 사용자는 Bing 모바일 앱(iOS/Android)에서 지금 바로 이용할 수 있고, 조만간 데스크톱과 Copilot Search에도 확대될 예정이에요.
Bing Video Creator는 기본적으로 10개의 ‘빠른(Fast)’ 생성권을 무료 제공하고, 이후엔 마이크로소프트 리워드 포인트(100점)로 Fast 생성권을 충전할 수 있어요. 또는 Standard(느린) 생성 옵션으로 계속 무료 이용도 가능해요. 한 번에 최대 3개의 영상까지 큐잉할 수 있고, 완성된 영상은 최대 90일간 보관돼요. 생성된 영상은 바로 다운로드하거나, 소셜미디어에 공유할 수도 있어요. 영상은 세로 9:16 포맷으로 제작되며, 향후 가로 16:9 포맷도 추가될 예정이에요. |
|
|
<해당 영상 프롬프트>
“In a busy Italian pizza restaurant, a small otter works as a chef and wears a chef’s hat and an apron. He kneads the dough with his paws and is surrounded by other pizza ingredients."
“바쁜 이탈리아 피자 가게에서 작은 수달이 요리사로 일하고 있어요. 셰프 모자와 앞치마를 착용한 채, 두 손으로 도우를 반죽하고 있으며 주변에는 피자 재료들이 흩어져 있어요.”
마이크로소프트는 생성형 AI 콘텐츠의 안전성과 신뢰성 확보를 위해, 모든 Bing Video Creator 결과물에 C2PA 기반 출처 정보(콘텐츠 크레덴셜)를 삽입했고, 위험하거나 부적절한 요청은 차단하는 프롬프트 필터링 시스템도 적용했다고 밝혔어요.
텍스트로 동영상을 만든다? 이제는 상상만 하던 일이 아니라, 누구나 모바일 앱에서 바로 해볼 수 있는 현실이 되었어요. |
|
|
#ChatGPTforBusiness #레코드모드 #AI커넥터 #회의요약 #OpenAI
ChatGPT, 회의 녹음과 내부 데이터 연동 기능 강화
|
|
|
<구글 드라이브·팀스·드랍박스 연결부터 레코드 모드까지…기업용 협업 도구로 진화> by.VQZ
|
|
|
OpenAI가 ChatGPT for Business에 대규모 기능 업데이트를 적용했어요. 이번 변화는 단순한 텍스트 생성 모델을 넘어, 조직의 실시간 업무 맥락에 직접 참여하는 도구로 진화하고 있음을 보여줘요. 특히 클라우드 서비스 커넥터와 레코드 모드 도입은 기업 환경에서의 생산성과 협업 효율을 극대화할 수 있는 핵심 기능으로 주목받고 있어요.
ChatGPT는 이제 Google Drive, Dropbox, Outlook, SharePoint, Teams 등 주요 협업 툴과 직접 연결돼요. 이를 통해 사용자들은 문서와 데이터를 별도로 업로드하지 않아도, 실시간으로 연결된 내부 정보 기반 위에서 질문하고 분석 결과를 받을 수 있어요. 기업 관리자는 사용자 정의 MCP 커넥터까지 구축 가능해, 특정 기업 시스템과의 연동도 유연하게 처리할 수 있죠.
|
|
|
특히, 새롭게 공개된 레코드 모드(Record Mode)는 회의 중 자동 녹음, 요약, 할 일 추출까지 가능한 기능이에요. 음성 기반 회의나 메모를 필사하고, 요점과 실행 항목으로 정리해주기 때문에 회의 중 필기를 놓쳤더라도 중요한 내용을 빠짐없이 추적할 수 있어요. 회의 이후엔 특정 질문을 통해 관련 내용을 빠르게 검색할 수도 있답니다.
OpenAI는 이번 업데이트를 통해 기업 고객의 다양한 업무 데이터를 통합하고 활용할 수 있도록 하는 기반을 다졌어요. 이에 따라 ChatGPT는 이제 단순한 생성형 AI를 넘어, 업무 비서·리서처·회의 기록자 역할까지 수행할 수 있는 통합형 AI로 자리잡아가는 중이에요.
|
|
|
#AI #Gemini #Gemini2_5Pro #딥씽크 #코딩AI #멀티모달AI
구글 Gemini 2.5 Pro로 반격 시작!
|
|
|
<딥씽크 추론·오디오 대화·멀티모달까지 싹 바꾼 고성능 LLM> by.D-Caf
|
|
|
구글이 드디어 한 방을 제대로 날렸어요. Gemini 2.5 Pro (06-05 버전) 프리뷰를 공개했는데 코딩, 추론, 멀티모달, 음성까지 전 영역에서 성능을 확 끌어올렸습니다.
이번 업데이트는 단순 개선을 넘어서 실무 안정성까지 잡은 ‘장기 안정 릴리즈(LTS)’ 후보 버전으로도 평가받고 있어요. 본격적으로 실사용 경쟁에 뛰어들겠다는 거죠. |
|
|
더 똑똑하게, 더 천천히 생각한다: Deep Think 모드
이름부터 심상치 않은 Deep Think 모드가 도입됐어요. GPT-4 수준의 멀티스텝 추론이 가능하고, 수학 문제는 USAMO, 코딩은 LiveCodeBench 같은 고난도 벤치마크에서 놀라운 성과를 냈습니다.
무작정 빨리 답 내는 AI가 아니라, 생각 시간을 스스로 조절하고, 꼼꼼히 따져보는 AI로 진화했다는 의미예요. |
|
|
말도 하고 들어도 주는 AI: 오디오 + 멀티모달
이번 2.5 Pro는 오디오 출력 기능까지 품었어요. 텍스트로만 대화하던 시절은 끝! 이제는 Gemini가 직접 말하고, 감정도 담고, 청각적 표현도 제공합니다.
게다가 멀티모달 능력도 업그레이드! 텍스트, 이미지, 오디오, 동영상까지 한꺼번에 처리할 수 있어요. 진짜 ‘AI 비서’라는 말이 전혀 과장이 아니죠. |
|
|
API도 갈아엎었다: 생각 예산 + 통합 도구들
이번 프리뷰에서는 개발자 기능도 확 달라졌습니다.
-
Thinking Budget: 이건 말 그대로 ‘얼마나 오래 생각할지’를 설정하는 기능이에요. “꼼꼼하게 생각해줘” → 더 깊은 추론 “빠르게 알려줘” → 짧은 시간에 결과 도출
-
Thought Summary: 추론 과정 요약까지 자동 제공
-
MCP 지원: 다양한 앱과 기능을 ‘AI가 호출’할 수 있는 구조
-
보안 강화: 프롬프트 탈취 방지, 프라이버시 대응 설계 반영
|
|
|
이쯤 되면 구글도 본격적으로 칼 갈고 나왔다는 거죠. GPT-4o와 Claude 4가 점령 중인 LLM 무대에 이제 진짜 실전 AI로 Gemini가 돌아왔습니다. 😎 다음 라운드 누가 웃게 될까요? |
|
|
오늘의 'Bold Flick'은 여기까지!
다음 뉴스레터에서는 더욱 놀랍고 흥미로운 AI 소식으로 찾아뵐게요.
언제나 Bold Flick을 사랑해주셔서 감사합니다! 💙
궁금한 점이 있거나 더 알고 싶은 주제가 있다면 언제든 말씀해 주세요.
여러분의 피드백이 저희에게 큰 힘이 된답니다!
|
|
|
|