Tencent Cloud está abriendo el código de una pieza clave de su tecnología de agentes de IA, un movimiento destinado a reducir drásticamente los costes operativos y desafiar un cuello de botella fundamental en el desarrollo de una IA más sofisticada.
Tencent Cloud está abriendo el código de una pieza clave de su tecnología de agentes de IA, un movimiento destinado a reducir drásticamente los costes operativos y desafiar un cuello de botella fundamental en el desarrollo de una IA más sofisticada.

El lanzamiento por parte de Tencent Cloud de su tecnología de código abierto Agent Memory, que promete reducir el consumo de tokens hasta en un 61 por ciento, marca un paso significativo en la carrera por hacer que los agentes de IA complejos sean económicamente viables y más capaces. La medida, anunciada el 14 de mayo, se dirige a la creciente necesidad de sistemas de IA que puedan mantener el contexto y recordar información en tareas largas y complejas.
La solución se centra en escenarios de tareas de larga duración al proporcionar capacidades de compresión de memoria a corto plazo y memoria personalizada a largo plazo, según el anuncio de la compañía. Mientras que la función de memoria a largo plazo se lanzó para uso gratuito en abril, el nuevo lanzamiento de código abierto se centra en el componente de compresión de memoria a corto plazo.
En experimentos de sesiones continuas multitarea, Tencent informó que su solución redujo el consumo de tokens hasta en un 61 por ciento, al tiempo que mejoró las tasas de éxito de las tareas. Esto aborda un importante coste operativo para los desarrolladores, ya que los modelos de lenguaje de gran tamaño cobran en función del número de tokens procesados, y las tareas complejas con largos historiales de conversación pueden resultar prohibitivamente caras.
Este movimiento es algo más que un simple ahorro de costes; se trata de habilitar la próxima generación de IA capaz de manejar tareas complejas de varios pasos. Posiciona a Tencent como un habilitador clave en el espacio de la IA, compitiendo por la atención de los desarrolladores en un mercado donde la memoria y el almacenamiento se están convirtiendo en cuellos de botella críticos y áreas de crecimiento importantes, beneficiando a empresas como Micron Technology (NASDAQ: MU) y SanDisk (NASDAQ: SNDK).
Una barrera crítica para crear una IA autónoma y más útil es el problema de la memoria. La mayoría de los agentes de IA de la generación actual sufren efectivamente de amnesia; dependen de datos instantáneos y pierden el contexto una vez que un objeto o una pieza de información ya no está en su entrada inmediata. Esto les impide realizar razonamientos complejos o tareas de larga duración que requieren recordar interacciones previas o estados ambientales. Como destacó el reciente debut del agente "Wise KaiWu" del Centro de Innovación de Beijing para la Robótica Humanoide, la industria está presionando para resolver esto con sistemas de memoria dinámica. Su agente introduce memoria espacial y personalizada para ayudar a los robots a evolucionar de ejecutores pasivos a asistentes proactivos que pueden recordar a los usuarios y sus preferencias.
Tencent's Agent Memory aborda este mismo desafío desde una perspectiva de software. Al proporcionar un marco tanto para el recuerdo a corto plazo (¿de qué acabamos de hablar?) como para la personalización a largo plazo (¿quién es este usuario y qué prefiere?), permite a los desarrolladores crear aplicaciones más continuas y conscientes del contexto. Esta capacidad es crucial para pasar la IA de simples chatbots a agentes sofisticados que puedan funcionar como verdaderos asistentes en entornos domésticos, comerciales o industriales.
El lanzamiento de software de Tencent es una jugada estratégica dentro de un auge de hardware mucho mayor centrado en la infraestructura de IA. El crecimiento explosivo de la IA está creando una demanda sin precedentes tanto de la memoria especializada en la que se ejecutan los modelos como del vasto almacenamiento que requieren para los datos. Las ganancias recientes de SanDisk mostraron que los ingresos se dispararon un 251 por ciento interanual hasta los 5900 millones de dólares, impulsados por la demanda de su almacenamiento flash NAND utilizado en sistemas de inferencia de IA, bases de datos vectoriales y cargas de trabajo de IA agéntica. El CEO de la compañía señaló que NAND se está convirtiendo en la "única solución económicamente viable" para mantener los modelos de IA accesibles para el uso en tiempo real a escala.
Esta demanda de hardware se extiende a los chips de memoria de alto ancho de banda (HBM), donde actores como Micron Technology están viendo una demanda creciente para sus productos, que son esenciales para las plataformas de IA de Nvidia. SanDisk ha asegurado acuerdos de suministro plurianuales por valor de más de 42.000 millones de dólares, lo que indica que los grandes clientes están asegurando la capacidad de almacenamiento a largo plazo. Esta intensa demanda de los bloques de construcción físicos de la IA subraya la importancia de las soluciones de software como la de Tencent, que tienen como objetivo utilizar ese hardware de manera más eficiente. Al reducir el consumo de tokens, Agent Memory disminuye directamente la intensidad operativa de la infraestructura subyacente.
La estrategia de código abierto de Tencent está diseñada para integrar su tecnología dentro de la comunidad de desarrolladores, impulsando la adopción de su ecosistema más amplio de Tencent Cloud. Si bien la herramienta Agent Memory en sí es gratuita, su uso puede llevar a un mayor consumo de otros servicios en la nube de pago. Este movimiento refleja una tendencia más amplia de la industria en la que la capacidad de gestionar, almacenar y recordar datos de manera eficiente para los agentes de IA es una ventaja competitiva clave, impulsando el rendimiento de las empresas en toda la pila tecnológica, desde los proveedores de servicios en la nube hasta las empresas de semiconductores y almacenamiento que construyen los cimientos.
Este artículo es solo para fines informativos y no constituye asesoramiento de inversión.