텐센트, AI 비용 61% 절감을 위해 에이전트 메모리 오픈 소스 공개

텐센트 클라우드가 토큰 소비를 최대 61%까지 줄일 수 있는 오픈 소스 에이전트 메모리 기술을 출시했다. 이는 복잡한 AI 에이전트를 경제적으로 실행 가능하고 더 유능하게 만드는 데 있어 중요한 진전이다. 5월 14일 발표된 이 조치는 길고 복잡한 작업에서 문맥을 유지하고 정보를 회상해야 하는 AI 시스템의 증가하는 요구를 겨냥한 것이다.

회사 측의 발표에 따르면, 이 솔루션은 단기 기억 압축과 장기 개인화 기억 기능을 모두 제공하여 긴 작업 시나리오를 타겟팅한다. 장기 기억 기능은 지난 4월 무료 사용을 위해 출시되었으나, 이번 새로운 오픈 소스 출시는 단기 기억 압축 구성 요소에 중점을 두고 있다.

멀티태스크 연속 세션 실험에서 텐센트는 자사의 솔루션이 작업 성공률을 높이는 동시에 토큰 소비를 최대 61%까지 줄였다고 보고했다. 대규모 언어 모델은 처리된 토큰 수에 따라 비용을 청구하며, 대화 기록이 긴 복잡한 작업은 비용이 매우 많이 들 수 있기 때문에 이는 개발자들에게 주요한 운영 비용 문제를 해결해 준다.

이러한 움직임은 단순한 비용 절감 그 이상이다. 복잡하고 여러 단계의 작업을 처리할 수 있는 차세대 AI를 가능하게 하는 것에 관한 것이다. 이는 메모리와 저장 공간이 핵심 병목 현상이자 주요 성장 분야가 되고 있는 시장에서 개발자들의 관심을 끌기 위한 전략이며, 텐센트를 AI 공간의 핵심 조력자로 위치시킨다. 이는 마이크론 테크놀로지(Micron Technology, NASDAQ: MU)와 샌디스크(SanDisk, NASDAQ: SNDK) 같은 기업들에게도 이익이 된다.

AI 에이전트의 '건망증' 문제

더 유용하고 자율적인 AI를 만드는 데 있어 가장 큰 장애물은 메모리 문제다. 현재 세대의 대부분의 AI 에이전트는 사실상 건망증을 앓고 있다. 이들은 즉각적인 데이터에 의존하며 객체나 정보 조각이 즉각적인 입력 범위에서 벗어나면 문맥을 잃는다. 이는 이전 상호 작용이나 환경 상태를 회상해야 하는 복잡한 추론이나 장기 작업을 수행하는 것을 방해한다. 베이징 인공지능 로봇 혁신 센터(Beijing Innovation Center of Humanoid Robotics)에서 최근 선보인 '와이즈 카이우(Wise KaiWu)' 에이전트에서 강조된 것처럼, 업계는 동적 메모리 시스템으로 이 문제를 해결하기 위해 노력하고 있다. 이들의 에이전트는 공간 및 개인화 메모리를 도입하여 로봇이 수동적인 실행자에서 사용자 및 그들의 선호도를 기억할 수 있는 능동적인 보조자로 진화하도록 돕는다.

텐센트의 에이전트 메모리는 소프트웨어 측면에서 동일한 과제에 도전한다. 단기 회상(방금 무엇을 이야기했는가?)과 장기 개인화(이 사용자는 누구이며 무엇을 선호하는가?)를 위한 프레임워크를 제공함으로써 개발자가 더욱 연속적이고 문맥 인식적인 애플리케이션을 구축할 수 있도록 한다. 이 기능은 AI를 단순한 챗봇에서 가정용, 상업용 또는 산업용 환경에서 진정한 비서 역할을 할 수 있는 정교한 에이전트로 발전시키는 데 필수적이다.

AI 군비 경쟁의 새로운 전선

텐센트의 소프트웨어 출시는 AI 인프라를 중심으로 한 훨씬 더 큰 하드웨어 붐 내에서의 전략적 플레이이다. AI의 폭발적인 성장은 모델이 실행되는 특수 메모리와 데이터를 보관하는 방대한 저장 공간에 대해 전례 없는 수요를 창출하고 있다. 샌디스크의 최근 실적은 AI 추론 시스템, 벡터 데이터베이스 및 에이전트 AI 워크로드에 사용되는 NAND 플래시 스토리지 수요에 힘입어 매출이 전년 대비 251% 급증한 59억 달러를 기록했음을 보여주었다. 이 회사의 CEO는 NAND가 규모에 맞는 실시간 사용을 위해 AI 모델을 접근 가능하게 유지하는 '유일하게 경제적으로 실행 가능한 솔루션'이 되고 있다고 언급했다.

이러한 하드웨어 수요는 마이크론 테크놀로지와 같은 업체들이 엔비디아의 AI 플랫폼에 필수적인 자사 제품에 대해 급증하는 수요를 목격하고 있는 고대역폭 메모리(HBM) 칩으로까지 확장된다. 샌디스크는 420억 달러 이상의 다년 공급 계약을 체결했으며, 이는 주요 고객들이 장기적으로 저장 용량을 확보하고 있음을 시사한다. AI의 물리적 구성 요소에 대한 이러한 강렬한 수요는 하드웨어를 보다 효율적으로 사용하는 것을 목표로 하는 텐센트와 같은 소프트웨어 솔루션의 중요성을 강조한다. 토큰 소비를 줄임으로써 에이전트 메모리는 기본 인프라의 운영 강도를 직접적으로 낮춘다.

텐센트의 오픈 소스 전략은 개발자 커뮤니티 내에 자사 기술을 내재화하여 더 광범위한 텐센트 클라우드 생태계의 채택을 유도하기 위해 설계되었다. 에이전트 메모리 도구 자체는 무료이지만, 이를 사용하면 다른 유료 클라우드 서비스의 소비가 늘어날 수 있다. 이러한 움직임은 AI 에이전트를 위한 데이터를 효율적으로 관리, 저장 및 회상하는 능력이 핵심 경쟁 우위가 되어 클라우드 서비스 제공업체부터 기초를 구축하는 반도체 및 스토리지 기업에 이르기까지 전체 기술 스택에 걸쳐 기업들의 성과를 견인하는 광범위한 산업 트렌드를 반영한다.

이 기사는 정보 제공만을 목적으로 하며 투자 조언을 구성하지 않습니다.