AI의 다음 무브는 ‘팀워크’와 ‘자율성’

2025. 5. 19.

님, 안녕하세요!

AI 트렌드 Bold Flick의 쉰 세 번째 소식이에요!

이번 주 AI는 ‘혼자 잘하는 애’에서 ‘같이 잘하는 팀플 AI’로 한 단계 진화했어요.
ByteDance는 연구 과제를 분담해 푸는 에이전트 시스템을, Windsurf는 코딩 전 과정에 대응하는 SWE-1 모델을, Anthropic은 스스로 사고하고 도구도 쓰는 Claude Neptune을 준비 중이죠. AI가 점점 인간의 ‘협업자’로 바뀌고 있어요.
이번 호도 흥미진진한 이야기로 가득하니 커피 한 잔과 함께 가볍게 즐겨보세요 ☕

#AI #멀티에이전트 #오픈소스 #ByteDance #DeepFlow

복잡한 연구, AI 팀플로 푼다?

<ByteDance, 멀티에이전트 자동화 프레임워크 'DeerFlow' 공개> by.VQZ

ByteDance가 연구 자동화를 위한 멀티에이전트 프레임워크 'DeerFlow'를 오픈소스로 공개했어요. 이 프레임워크는 LangChain과 LangGraph 기반 위에 구축돼, 검색, 코드 실행, 콘텐츠 생성 등 복잡한 작업을 에이전트들이 분담하는 구조로 설계됐습니다.

DeerFlow는 연구 과제를 수행하는 다섯 개의 주요 에이전트(Coordinator, Planner, Researcher, Coder, Reporter)를 통해 정보를 수집하고 분석하며, 최종적으로 콘텐츠로 정리해주는 구조예요. 특히 Python 실행 환경, 웹 크롤링, 텍스트-음성 변환 등 다양한 도구와의 통합으로, 실제 현업에서의 리서치 업무 흐름을 완전히 자동화할 수 있게 설계됐죠.

사람 개입도 염두에 둔 구조도 돋보입니다. 각 단계별 에이전트 판단을 사용자(사람)가 확인하고 수정할 수 있는 인터페이스를 제공해, 검증 가능성과 책임성도 확보할 수 있도록 했어요.

현재 Python 3.12+, Node.js 22+ 환경에서 작동하며, MIT 라이선스로 GitHub에서 공개됐습니다. 연구자, 데이터 사이언티스트, 기술 작가라면 한 번쯤 눈여겨볼만한 프레임워크죠. 이제 AI 팀워크로 해결할 시간입니다!

#코딩AI #소프트웨어공학 #Windsurf #SWE1모델

Windsurf, 자체 코딩 AI 모델 ‘SWE-1’ 공개

<코드 작성부터 테스트, 피드백까지…소프트웨어 엔지니어링 전체 아우른다> by.VQZ

코딩 AI도 이젠 ‘코딩만’으론 부족합니다. Windsurf가 자체 개발한 AI 모델 ‘SWE-1’ 시리즈는 단순 코드 생성이 아닌, 소프트웨어 개발 전반을 지원하는 데 초점을 맞췄어요.

총 세 가지 모델로 구성된 SWE-1 시리즈는 다음과 같아요.

SWE-1

- Claude 3.5 Sonnet급 추론력에 저렴한 사용 비용.

현재 프로모션으로 유료 사용자에게 무료 제공 중.

SWE-1-lite

- 기존 Cascade Base를 대체하며, 모든 사용자에게 무제한 무료 제공.

SWE-1-mini

- 초경량 모델로 Windsurf Tab의 패시브 기능에 활용.

이 모델은 단순히 코드가 돌아가는지를 넘어, 사용자의 IDE, 터미널, 브라우저 활동까지 하나의 ‘타임라인’으로 묶어 인식하는 flow awareness 시스템을 갖췄습니다. 이를 통해 개발자의 중간 개입과 AI의 자동 수행을 자연스럽게 연결해줘요.

오프라인 벤치마크와 실제 사용자 실험 모두에서 SWE-1은 오픈소스 모델과 중간급 모델을 확실히 앞섰고, Claude 계열과 같은 프론티어급 모델에 근접한 성능을 보였습니다. 특히 실제 사용자 기반 실험에서는 코드 반영률과 반복 사용률에서 업계 최고 수준의 지표를 기록했어요.

Windsurf는 이미 IDE 텍스트 편집기, 터미널, 브라우저, 클립보드, 검색 기록까지 포괄하는 ‘AI 플로우’를 통해 가장 풍부한 사용자 활동 타임라인을 갖추고 있고, SWE-1은 이를 완벽히 활용할 수 있도록 설계되었어요. 오픈AI 인수설과 맞물려, Windsurf의 다음 움직임이 주목되는 이유입니다. 코딩 모델을 넘어, 이제 ‘소프트웨어 엔지니어링 모델’의 시대가 올까요?

#AI #LegoGPT #레고AI #텍스트투레고 #AI구조물생성 #카네기멜론 #StableText2Lego

앤트로픽, 차세대 AI 모델 ‘Claude Neptune’ 테스트 중!

<코드도 스스로 고치고 도구도 척척 쓰는 하이브리드 AI> by.D-Caf

Anthropic이 곧 Claude Sonnet과 Opus의 차세대 버전을 공개할 예정이에요. 코드명은 바로 ‘Claude Neptune’. 이름부터 뭔가 거대한 느낌 나지 않나요?

“네가 뭘 잘못했는지 AI가 스스로 알아차린다?!”
이번 Claude Neptune의 가장 큰 특징은 ‘하이브리드 사고(Hybrid Thinking)’. 상황에 따라 스스로 판단해 ‘추론’ 또는 ‘도구 사용’을 선택하고 결과가 이상하면 스스로 한발 물러나 오류를 점검하는 자가진단 기능까지 갖췄다고 해요.

특히 코딩 작업에서는

직접 테스트 → 오류 탐지 → 자가 수정
단계적 추론 기반 문제 해결
사용자 개입 없이 완결형 코드 생성

이 모든 걸 혼자서 다 해낸다고 하니 개발자 입장에선 진짜 AI 짝꿍 느낌 제대로겠죠?
‘Neptune’은 태양계 8번째 행성이기도 하잖아요?
그래서 업계에서는 이 모델이 곧 Claude 3.8 버전으로 출시될 거라는 추측이 나오는 중이에요.

Anthropic은 모델 출시 준비와 함께 안전성 검증을 위한 버그 바운티 프로그램도 열었어요. Claude 3.7의 분류기 테스트에 참여해서 발견한 문제를 보고하면 최대 $25,000 상금까지 받을 수 있다고! 올해 초 Claude 3.7 Sonnet 이후 조용하던 Anthropic이 드디어 반격의 카드 꺼내든 분위기예요.
GPT-4o, Gemini 2.5, Qwen3 등 쟁쟁한 경쟁자들 속에서 Neptune이 어떤 한 방을 보여줄지 우리 다음 업데이트를 기대해봐도 되겠죠? 😎