구글의 새로운 Gemini Spark 에이전트는 단순한 채팅을 넘어 사용자 대신 구매를 수행하는 등 생태계 전반에서 작업을 자율적으로 완료하는 것을 목표로 합니다.
구글의 새로운 Gemini Spark 에이전트는 단순한 채팅을 넘어 사용자 대신 구매를 수행하는 등 생태계 전반에서 작업을 자율적으로 완료하는 것을 목표로 합니다.

구글은 인공지능의 미래가 질문에 답하는 것이 아니라 작업을 완료하는 데 있다고 베팅하고 있습니다. I/O 2026 컨퍼런스에서 이 회사는 사용자가 오프라인일 때도 구글 서비스 전반에서 작동하도록 설계된 지속형 AI 에이전트인 Gemini Spark를 중심으로 한 일련의 신제품을 공개하며 자율 시스템 세계를 향한 가장 야심찬 행보를 보였습니다.
순다르 피차이 구글 및 알파벳 CEO는 브리핑에서 "우리는 사람들이 매일 사용하는 제품에서 실질적인 가치를 보고 싶어 하는 주기에 와 있습니다"라고 말했습니다. 그는 Spark를 통해 구글 클라우드에서 24시간 내내 작동하는 에이전트로부터 가치가 창출되므로 "작동을 확인하기 위해 노트북을 계속 열어둘 필요가 없습니다"라고 주장했습니다.
이 에이전트는 구글의 새로운 Gemini 3.5 Flash 모델로 구동되며 Antigravity라는 프레임워크 내에서 실행되어 Gmail, Docs, Calendar와 같은 애플리케이션 전반에서 다단계 워크플로우를 실행할 수 있습니다. 이 서비스는 새로운 Google AI Ultra 플랜 구독자에게 제공될 예정이며, 이 플랜은 Pro 플랜보다 5배 높은 사용량 제한과 20TB 저장 공간을 제공하며 월 100달러부터 시작합니다.
이번 발표로 구글은 마이크로소프트, OpenAI, Anthropic과 함께 결정적인 AI 에이전트를 구축하기 위한 치열한 경쟁에 뛰어들었습니다. 구글은 소비자 서비스와의 깊은 통합과 올해 계획된 1,800억 달러에서 1,900억 달러에 달하는 막대한 자본 지출이 대화형 AI에서 자율 행동으로 전환되는 시장에서 결정적인 우위를 점하게 할 것이라고 믿고 있습니다.
에이전트가 진정으로 유용해지려면 현실 세계, 특히 상거래와 상호작용해야 합니다. 구글은 이를 위해 에이전트 결제 프로토콜(AP2)과 범용 커머스 프로토콜(UCP)이라는 두 가지 새로운 프로토콜을 도입했습니다. AP2는 AI 에이전트가 사용자가 정의한 범위 내에서 안전하게 구매를 수행할 수 있도록 설계된 시스템으로, 구글은 이 보호 장치를 청소년에게 첫 체크카드를 주는 것에 비유했습니다.
이 시스템은 사용자, 판매자 및 결제 처리자 사이에 검증 가능한 링크를 생성합니다. 이는 올해 초 발표된 오픈 소스 표준인 UCP를 기반으로 구축되었으며, 에이전트와 커머스 시스템에 공통 언어를 제공합니다. UCP 기술 위원회에는 이제 아마존, 메타, 마이크로소프트와 같은 라이벌들이 포함되어 있어 에이전트 주도 커머스를 위한 공유 프레임워크의 필요성에 대한 광범위한 업계의 공감대를 시사합니다. 또한 구글은 이번 여름 검색, Gemini, YouTube, Gmail 전반에서 작동하며 가격과 거래를 추적하는 범용 장바구니(Universal Cart)를 출시할 예정입니다.
에이전트 중심의 발표와 함께 구글은 AI를 콘텐츠 제작에 더 쉽게 활용할 수 있도록 하는 도구도 출시했습니다. 새로운 디자인 및 이미지 생성 앱인 Google Pics는 Canva 및 Anthropic의 Claude Design과 직접 경쟁하도록 포지셔닝되었습니다. Nano Banana 2 모델로 구동되는 Pics를 사용하면 사용자는 구글 문서와 유사하게 간단한 텍스트 프롬프트를 사용하거나 이미지 요소에 직접 의견을 남겨 복잡한 그래픽을 생성하고 편집할 수 있습니다.
비디오의 경우, 구글은 Gemini Omni 모델을 YouTube Shorts에 통합하고 있습니다. 이 기능을 통해 크리에이터는 텍스트, 이미지 및 오디오 프롬프트를 사용하여 비디오를 생성하고 리믹스할 수 있습니다. 이 시스템은 장면 전반에 걸쳐 캐릭터 일관성을 유지하면서 복잡한 편집을 자동으로 처리하도록 설계되었습니다. YouTube는 워터마크 및 AI 생성 리믹스에 대한 옵트아웃 제어를 포함한 크리에이터 보호를 강조했습니다.
Spark를 통한 구글의 전략은 경쟁사와 차별화됩니다. OpenAI의 에이전트는 주로 브라우저를 사용하고 Anthropic의 Claude Cowork는 사용자의 데스크톱에서 작동하는 반면, Spark는 구글의 자체 Workspace 앱 및 타사 서비스와의 구조화된 API 통합을 통해 작동합니다. 이 방식은 화면 읽기 방식보다 더 높은 신뢰성과 속도를 약속하지만, Spark의 기능이 초기에는 구글이 연결된 생태계로 국한된다는 것을 의미하기도 합니다.
이러한 자율 시스템의 신뢰성은 업계 전체의 중요한 과제로 남아 있습니다. 사용자의 의도를 오해하는 에이전트는 심각한 결과를 초래할 수 있으며, 구글은 출시 시점에 모든 금융 거래에 대해 명시적인 사용자 승인을 요구함으로써 이 위험을 완화하고 있습니다. Gemini Spark의 진정한 시험대는 작업을 수행할 수 있는지 여부가 아니라, 사용자가 작업을 맡길 만큼 충분히 신뢰하느냐에 달려 있습니다.
본 기사는 정보 제공 목적으로만 작성되었으며 투자 조언을 구성하지 않습니다.