구글, Gemini 'Interactions API' 정식 출시: 서버가 상태를 들고 에이전트를 굴린다
AI를 부를 때마다 대화 상태를 통째로 다시 넘기던 방식이 바뀝니다. 구글은 Gemini 모델과 에이전트를 다루는 통합 인터페이스 'Interactions API'를 정식(GA)으로 출시했습니다. 서버가 대화 상태를 직접 들고, 백그라운드로 비동기 실행하며, 원격 리눅스 샌드박스에서 에이전트를 굴리고, Flex 티어로 비용을 50% 줄입니다. ASAP은 이 발표를 1차 출처 기준으로 정리합니다.
서버가 상태를 들고 백그라운드로 실행한다
Interactions API는 Gemini 모델과 에이전트를 다루는 구글의 통합 인터페이스입니다. 서버가 대화 상태를 직접 들고, background=True로 비동기 실행하며, 내장 도구와 커스텀 함수를 함께 묶고 멀티모달 생성을 지원합니다. 2025년 12월 공개 베타로 시작해 이번에 정식(GA)으로 전환됐습니다.
Managed Agents, 원격 리눅스 샌드박스에서 일한다
Managed Agents는 에이전트가 추론하고 코드를 실행하고 웹을 탐색하고 파일을 다루는 원격 리눅스 샌드박스를 제공합니다. Deep Research는 속도형과 심층형 두 버전으로 나뉘어 협업 계획과 네이티브 차트, 인포그래픽을 만듭니다. 내장 도구인 구글 검색과 구글 지도를 커스텀 함수와 결합하고, 도구 결과는 텍스트와 함께 이미지를 반환합니다.
Nano Banana 2와 Lyria 3로 이미지와 음악을 만든다
미디어 생성은 이미지 모델 Nano Banana 2, 음악 모델 Lyria 3, 다중 화자 표현형 음성을 포함합니다. 스키마는 '역할에서 단계로(From Roles to Steps)'로 바뀌어 각 동작이 타입이 정해진 단계가 됩니다. Python과 JavaScript SDK를 지원하고 LiteLLM, Eigent, Agno와 연동합니다.
Flex 50% 절감, 유료 55일 보관, 레거시 유지
Flex 티어는 비용을 50% 줄이고, 유료 티어는 데이터를 55일 보관합니다. Interactions API는 Google AI Studio와 공식 문서 전반에서 기본값이 됩니다. 기존 generateContent API는 완전히 지원된다고 구글은 밝혔습니다.
의미: API가 '단발 호출'에서 '상태 가진 런타임'으로
Interactions API는 AI 호출 방식이 매번 상태를 다시 넘기는 단발 호출에서 서버가 대화와 작업을 들고 가는 런타임으로 옮겨감을 보여줍니다. 에이전트가 샌드박스에서 직접 코드를 돌리고 백그라운드로 오래 일하는 구조라, 앱은 결과만 받아오면 됩니다. 다만 서버 상태와 55일 보관은 데이터 거버넌스를 함께 따져야 합니다.
정리
구글이 Gemini용 통합 인터페이스 Interactions API를 정식 출시했습니다. 서버 상태와 백그라운드 실행, Managed Agents 리눅스 샌드박스, Nano Banana 2와 Lyria 3 미디어 생성, Flex 50% 절감과 55일 보관이 핵심입니다. AI API가 단발 호출에서 상태 가진 런타임으로 넘어갑니다.
출처: 구글 Gemini Interactions API 정식 출시 발표(2025년 12월 공개 베타 후 GA; 서버 상태와 background=True 비동기 실행, Managed Agents 원격 리눅스 샌드박스, 구글 검색·지도 내장 도구와 커스텀 함수 결합, Deep Research 속도형·심층형, Nano Banana 2·Lyria 3·다중 화자 TTS, Flex 티어 비용 50% 절감, 유료 티어 55일 보관, Python·JavaScript SDK, 레거시 generateContent 완전 지원) 기반 ASAP 정리.
AI·테크 이슈,
가장 빠르게
단순 소식을 넘어, 맥락과 구조까지 파고듭니다
Ai Soon As Possible · asapai.co.kr
