🔍 핵심 요약
- 전 OpenAI CTO 미라 무라티가 설립한 '씽킹 머신즈 랩'이 지연 시간 없는 차세대 '상호작용 모델' 발표
- 기존 GPT 스타일의 '턴제(Turn-based)' 대화 구조를 탈피하여 인간의 대화 리듬을 재현하는 데 집중
- 멀티모달 스트리밍 아키텍처를 통해 인공지능과 인간 사이의 즉각적이고 자연스러운 흐름 구현 목표
상세 분석
전 OpenAI의 최고기술책임자(CTO)였던 미라 무라티(Mira Murati)가 설립한 인공지능 연구 스타트업 ‘씽킹 머신즈 랩(Thinking Machines Lab Inc.)‘이 인공지능 상호작용의 패러다임을 바꿀 연구 프리뷰를 공개했습니다. 이들은 기존의 대형 언어 모델(LLM)이 가진 고질적인 한계인 ‘턴제(Turn-based)’ 방식에서 완전히 벗어난 새로운 개념의 ‘상호작용 모델(Interaction Models)‘을 제시했습니다. 현재의 AI 시스템은 사용자가 입력을 마치면 모델이 이를 처리하고 응답을 생성할 때까지 기다려야 하는 동기식 구조를 따릅니다.
하지만 씽킹 머신즈는 인간이 대화할 때 느끼는 특유의 즉각성과 유동성을 구현하기 위해, 지연 시간을 극도로 낮춘 실시간 멀티모달 시스템을 개발하고 있습니다.
기술적으로 이 모델은 기존 포스트 GPT(post-GPT) 모델들이 겪는 추론 지연 현상을 획기적으로 해결하는 데 초점을 맞추고 있습니다. 씽킹 머신즈의 아키텍처는 사용자의 음성, 표정, 맥락 데이터를 실시간으로 동시 처리하며, 답변이 완성되기 전에도 상호작용을 시작할 수 있는 병렬 처리 구조를 지향합니다. 이는 단순히 처리 속도를 높이는 것을 넘어, AI가 사용자의 의도를 실시간으로 감지하고 적절한 타이밍에 개입하거나 반응하는 ‘인간다운 대화의 리듬’을 창출하는 것을 의미합니다.
특히 이번 연구 프리뷰는 인공지능이 도구를 넘어 실제 대화 파트너로서 기능하기 위해 필요한 ‘상호작용의 지능’이 무엇인지를 명확히 정의하고 있습니다.
무라티는 이번 모델이 일반 인공지능(AGI)으로 향하는 여정에서 사용자 경험의 비약적인 도약을 이끌어낼 핵심 기술임을 강조했습니다. 경쟁사인 OpenAI의 보이스 모드 등이 시도하고 있는 실시간성보다 한 단계 더 나아가, 입력과 출력이 동시에 이루어지는 완전 비동기식 상호작용을 통해 고객 서비스, 교육, 개인 비서 등 실시간 소통이 필수적인 산업 분야에서 파괴적인 변화를 예고하고 있습니다.
씽킹 머신즈의 이러한 행보는 기술적 지능의 양적 팽창보다 상호작용의 질적 혁신이 미래 AI 시장의 승부처가 될 것임을 시사하며, 인간과 기계의 협업 방식을 근본적으로 재정의하려 하고 있습니다.
시사점
포스트 OpenAI 시대의 시장 구도는 단순히 모델의 파라미터 수를 늘리는 ‘지능 경쟁’에서 사용자의 인지 지연을 없애는 ‘UX 혁신 경쟁’으로 전환되고 있습니다. 미라 무라티의 씽킹 머신즈는 ‘실시간성’과 ‘멀티모달’의 결합을 통해 기존 LLM이 도구로서 가졌던 한계를 깨고, 인간의 동료와 같은 존재감을 부여하는 데 성공할 것으로 보입니다. 이는 향후 지연 시간이 병목이었던 의료 및 실시간 원격 지원 산업의 판도를 바꿀 것입니다.



